AI Engineer | Medical ASR | Production Planning (MPS/MRP/SCM)

從製造業管理到 AI 工程—— 把 Domain Know-how 落地為生產級系統

張育源 Yu-Yuan Chang

融合 8 年製造業決策視野與資深 AI 開發經驗，專精於醫療 ASR、LLM/RAG 與企業級模型部署。

與 9 間醫療院所合作開發醫療 ASR 系統
建置 Whisper / AdaLoRA / Multi-GPU 訓練與即時串流架構
曾管理 600 億級產線排程與跨部門數位轉型專案

查看代表作品下載履歷聯絡我

個人照片

年營收規模全球產銷管理 600 億+

醫療院所 AI 語音辨識合作開發 9 間

跨國業務、團隊管理與 AI 工程資歷 8+ 年

About Me

擁有超過 8 年製造業產銷管理與全球業務經驗，曾任副課長管理並領導公司「生產計畫排程團隊」，負責年營收逾新台幣 600 億元的生產排程。主導 VMI 專案、跨部門自動化排程系統等多項數位轉型計畫。

於英國取得資料分析碩士（Distinction），將工業工程的優化邏輯與現代數據科學對接，發展出兼具產業洞察與算法開發的跨維度視野。

現任工研院 AI 工程師，專攻醫療 ASR 微調（Whisper/LoRA）與 Multi-GPU 訓練優化，致力於將 AI 技術轉化為能解決複雜業務問題的落地方案。

Career Path

從供應鏈決策到算法研發：技術與產業經驗的深度交織，構築不可替代的跨領域價值。

2015 – 2019

油機工業 / 善化工業

國際業務

負責全球客戶開發與維護，累積跨國溝通與商務談判實戰經驗。

Global Sales B2B Cross-Cultural

2020 – 2023

燁輝企業

生產計畫副課長

統籌年營收 600 億元產線排程，帶領生產計畫排程團隊，主導 VMI 專案與自動化排程系統。

MPS VMI Team Lead Excel VBA

2023 – 2024

倫敦大學瑪麗皇后學院

資料分析碩士（Distinction）

強化機器學習、預測建模與商業智慧能力，完成從管理職到技術職的跨域轉型。

Machine Learning Python Data Science

2025 – Present

工業技術研究院（ITRI）

AI 工程師

專注醫療語音辨識，負責模型微調、分散式訓練與即時串流服務開發，與 9 間醫療院所合作。

ASR PyTorch Whisper Multi-GPU

AI Projects

涵蓋醫療語音辨識、推薦系統、RAG 應用到前端 AI 工具，展現從研究到工程的完整技術實力。

Medical ASR Fine-tuning

Distributed Training Production Ready

Problem

醫療環境雜訊大、專業術語多，通用 ASR 模型無法滿足臨床精準度要求。

Solution

以 Whisper Large V3 Turbo 為基礎，透過 AdaLoRA 微調並建置多 GPU 分散式訓練環境與即時 WebSocket 服務。

Impact

醫療專業術語字錯率（CER）顯著降低，支援多院區即時語音辨識服務。

Whisper AdaLoRA PyTorch HuggingFace WebSocket Multi-GPU

Deep Dive

Self-Refining Framework for ASR

Research Implementation Data Augmentation

Problem

醫療語音標註資料取得困難且成本高昂，限制模型訓練的規模與效果。

Solution

參考聯發科論文，實作 ASR ↔ TTS 閉環自我精化系統，透過合成資料提升模型效能。

Impact

大幅降低對真實標註資料的依賴，六階段管線涵蓋 46 個可重用工具模組。

Whisper TTS LoRA Silero VAD OpenCC NeMo

Deep Dive

Corpus Annotation Pipeline

Data Engineering 9 Hospitals

Problem

9 間醫療院所的原始語音資料格式不一、品質參差，無法直接用於訓練。

Solution

整合 Stable-Whisper 強制對齊、Meta Denoiser 降噪與幻覺偵測，建立端到端標註流程。

Impact

產出標準化高品質 ASR 訓練資料集，支援多種對齊引擎自動化處理。

Stable-Whisper Meta Denoiser NeMo FFmpeg HuggingFace Datasets

Deep Dive

Recommender System Analysis

Academic Research Benchmarking

Problem

推薦系統面臨資料稀疏性與冷啟動問題，不同場景下最佳演算法難以判斷。

Solution

以 MovieLens 20M 為基礎，實作 7+ 種演算法（CF、SVD、ALS、MLP、Autoencoder 等）並系統性比較。

Impact

產出完整比較研究報告，含冷啟動場景模擬與視覺化效能分析。

PyTorch scikit-learn NumPy Pandas Matplotlib Jupyter

Deep Dive

MedicalQA-RAG

Full-Stack AI Multi-LLM

Problem

醫療專業知識分散於大量文件中，臨床人員難以快速查閱正確資訊。

Solution

整合 LangChain、Qdrant 向量資料庫與多 LLM 後端，建立 RAG 醫療問答系統。

Impact

實現文件檢索到智慧問答的完整流程，可自動生成健康教育報告。

LangChain Qdrant OpenAI API Streamlit RAG

Deep Dive

AI Pipeline Designer & Image Enhancer

Frontend UX Design

Problem

非技術使用者難以組合複雜的影像處理步驟，缺乏直覺化的 AI 工具。

Solution

以 React 19 + TypeScript 打造視覺化管線設計介面，整合 Gemini API 進行智慧影像處理。

Impact

使用者可透過拖拉操作組合處理步驟，由 AI 自動執行優化。

React 19 TypeScript Vite TailwindCSS Gemini API

Deep Dive

Skills

Core Expertise

Medical ASR

Whisper TTS Silero VAD NeMo LoRA / AdaLoRA Meta Denoiser

Data Pipeline Engineering

Stable-Whisper FFmpeg HuggingFace Datasets Forced Alignment VAD

Model Fine-tuning & Training

PyTorch HuggingFace PEFT Multi-GPU / DDP WandB

LLM & RAG Applications

LangChain OpenAI API Qdrant Streamlit RAG

Supporting Skills

Frontend

React TypeScript Astro Vite Tailwind CSS

Backend & Infra

Python Cloudflare Workers D1 Docker SQLite Git

Data Analytics & BI

SQL R Tableau Plotly Pandas NumPy scikit-learn

Production & Business

MPS MRP SCM VMI Global Sales Team Leadership

聯絡我

尋找能將 AI 技術精準對接業務場景的工程專家？歡迎與我聯繫，共同探討技術落地的更多可能。