AI Engineer | Medical ASR | Production Planning (MPS/MRP/SCM)

從製造業管理到 AI 工程—— 把 Domain Know-how 落地為生產級系統

張育源 Yu-Yuan Chang

融合 8 年製造業決策視野與資深 AI 開發經驗,專精於醫療 ASR、LLM/RAG 與企業級模型部署。

  • 與 9 間醫療院所合作開發醫療 ASR 系統
  • 建置 Whisper / AdaLoRA / Multi-GPU 訓練與即時串流架構
  • 曾管理 600 億級產線排程與跨部門數位轉型專案
個人照片
年營收規模全球產銷管理 600 億+
醫療院所 AI 語音辨識合作開發 9 間
跨國業務、團隊管理與 AI 工程資歷 8+ 年

About Me

擁有超過 8 年製造業產銷管理與全球業務經驗,曾任副課長管理並領導公司「生產計畫排程團隊」,負責年營收逾新台幣 600 億元的生產排程。主導 VMI 專案、跨部門自動化排程系統等多項數位轉型計畫。

於英國取得資料分析碩士(Distinction),將工業工程的優化邏輯與現代數據科學對接,發展出兼具產業洞察與算法開發的跨維度視野。

現任工研院 AI 工程師,專攻醫療 ASR 微調(Whisper/LoRA)與 Multi-GPU 訓練優化,致力於將 AI 技術轉化為能解決複雜業務問題的落地方案。

Career Path

從供應鏈決策到算法研發:技術與產業經驗的深度交織,構築不可替代的跨領域價值。

2015 – 2019

油機工業 / 善化工業

國際業務

負責全球客戶開發與維護,累積跨國溝通與商務談判實戰經驗。

Global Sales B2B Cross-Cultural

2020 – 2023

燁輝企業

生產計畫副課長

統籌年營收 600 億元產線排程,帶領生產計畫排程團隊,主導 VMI 專案與自動化排程系統。

MPS VMI Team Lead Excel VBA

2023 – 2024

倫敦大學瑪麗皇后學院

資料分析碩士(Distinction)

強化機器學習、預測建模與商業智慧能力,完成從管理職到技術職的跨域轉型。

Machine Learning Python Data Science

2025 – Present

工業技術研究院(ITRI)

AI 工程師

專注醫療語音辨識,負責模型微調、分散式訓練與即時串流服務開發,與 9 間醫療院所合作。

ASR PyTorch Whisper Multi-GPU

AI Projects

涵蓋醫療語音辨識、推薦系統、RAG 應用到前端 AI 工具,展現從研究到工程的完整技術實力。

01

Medical ASR Fine-tuning

Distributed Training Production Ready

Problem

醫療環境雜訊大、專業術語多,通用 ASR 模型無法滿足臨床精準度要求。

Solution

以 Whisper Large V3 Turbo 為基礎,透過 AdaLoRA 微調並建置多 GPU 分散式訓練環境與即時 WebSocket 服務。

Impact

醫療專業術語字錯率(CER)顯著降低,支援多院區即時語音辨識服務。

Whisper AdaLoRA PyTorch HuggingFace WebSocket Multi-GPU
02

Self-Refining Framework for ASR

Research Implementation Data Augmentation

Problem

醫療語音標註資料取得困難且成本高昂,限制模型訓練的規模與效果。

Solution

參考聯發科論文,實作 ASR ↔ TTS 閉環自我精化系統,透過合成資料提升模型效能。

Impact

大幅降低對真實標註資料的依賴,六階段管線涵蓋 46 個可重用工具模組。

Whisper TTS LoRA Silero VAD OpenCC NeMo
03

Corpus Annotation Pipeline

Data Engineering 9 Hospitals

Problem

9 間醫療院所的原始語音資料格式不一、品質參差,無法直接用於訓練。

Solution

整合 Stable-Whisper 強制對齊、Meta Denoiser 降噪與幻覺偵測,建立端到端標註流程。

Impact

產出標準化高品質 ASR 訓練資料集,支援多種對齊引擎自動化處理。

Stable-Whisper Meta Denoiser NeMo FFmpeg HuggingFace Datasets
04

Recommender System Analysis

Academic Research Benchmarking

Problem

推薦系統面臨資料稀疏性與冷啟動問題,不同場景下最佳演算法難以判斷。

Solution

以 MovieLens 20M 為基礎,實作 7+ 種演算法(CF、SVD、ALS、MLP、Autoencoder 等)並系統性比較。

Impact

產出完整比較研究報告,含冷啟動場景模擬與視覺化效能分析。

PyTorch scikit-learn NumPy Pandas Matplotlib Jupyter
05

MedicalQA-RAG

Full-Stack AI Multi-LLM

Problem

醫療專業知識分散於大量文件中,臨床人員難以快速查閱正確資訊。

Solution

整合 LangChain、Qdrant 向量資料庫與多 LLM 後端,建立 RAG 醫療問答系統。

Impact

實現文件檢索到智慧問答的完整流程,可自動生成健康教育報告。

LangChain Qdrant OpenAI API Streamlit ChromaDB RAG
06

AI Pipeline Designer & Image Enhancer

Frontend UX Design

Problem

非技術使用者難以組合複雜的影像處理步驟,缺乏直覺化的 AI 工具。

Solution

以 React 19 + TypeScript 打造視覺化管線設計介面,整合 Gemini API 進行智慧影像處理。

Impact

使用者可透過拖拉操作組合處理步驟,由 AI 自動執行優化。

React 19 TypeScript Vite TailwindCSS Gemini API

Skills

Core Expertise

Medical ASR

Whisper TTS Silero VAD NeMo LoRA / AdaLoRA Meta Denoiser

Data Pipeline Engineering

Stable-Whisper FFmpeg HuggingFace Datasets Forced Alignment VAD

Model Fine-tuning & Training

PyTorch HuggingFace PEFT Multi-GPU / DDP WandB

LLM & RAG Applications

LangChain OpenAI API Qdrant Streamlit RAG

Supporting Skills

Frontend

React TypeScript Astro Vite Tailwind CSS

Backend & Infra

Python Cloudflare Workers D1 Docker SQLite Git

Data Analytics & BI

SQL R Tableau Plotly Pandas NumPy scikit-learn

Production & Business

MPS MRP SCM VMI Global Sales Team Leadership

聯絡我

尋找能將 AI 技術精準對接業務場景的工程專家?歡迎與我聯繫,共同探討技術落地的更多可能。