== 協助解決商業痛點的資料分析與視覺化 ==
• 將概念轉化為可互動的資料工具,提升資料探索與產品驗證效率:
負責將未成型的產品概念轉化為可串接資料並即時互動的原型工具,透過 Streamlit 開發可視化分析介面,使內部與客戶能直覺式操作資料、驗證假設,快速比對產品構想與實際資料間的落差,進而調整開發方向。此外,也協助尚未完全數位化的構想,先行探索資料應用的潛力,了解數位化後可能帶來的效益與優化空間。
• 降低 AWS 成本管理難度:
設計 AWS 帳務分析儀表板,讓管理層能快速掌握維運各專案所使用的雲端成本,提升決策效率。
== 機器學習應用與概念驗證 ==
• 開發時間序列預測模型:
參與公司首個時間序列預測產品,從資料清理、特徵工程到模型監控,確保預測結果穩定且可解釋。
• 在 POC 中導入機器學習:
以內部研發或客戶需求出發,設計適合的隨機函數產生模擬資料,快速建立 POC(概念驗證)環境,讓內部或客戶能夠測試機器學習應用的可行性,加速技術落地。
• 文本資料處理經驗:
曾建立中文 NER(命名實體識別)模型,強化產品的文本處理與自動化能力,支援特定業務需求。
== 資料工程與簡易後端開發應用 ==
• 建構自動化資料流程:
與後端團隊合作開發自動化資料爬取系統,整合數十個開放資料來源,確保模型訓練與分析能獲取即時且穩定的資料。
• 維護 ETL 與 Data Pipeline:
與後端團隊合作設計 ETL 與 Data Pipeline ,設計PTX 交通資料的定時自動化爬取模組,確保內部產品持續獲取最新資料。
• 簡易後端開發應用:
開發 API 服務,串接資料處理與模型推論,讓機器學習應用能夠順利部署並融入業務流程。
== 標準化 MLOps 流程 ==
• 標準化 MLOps 流程,提升開發與維運效率:
推動公司內部 MLOps 標準化,建立從資料流、模型實驗、模組化、部署到監控的完整開發流程,導入 Machine Learning Canvas 來明確規劃專案需求與執行步驟,並運用 Airflow、DVC、MLflow、MinIO、PostgreSQL、FastAPI、Evidently、GitLab CI/CD 等工具,確保模型能夠高效開發、穩定部署與長期維運。
• 組織 MLOps 角色分工:
設計 MLOps 協作規則,確保商業開發、專案經理、軟體工程師、資料科學家、資料工程師、測試人員在機器學習專案中的責任與流程清晰,提升開發與部署效率。
== 客戶資料分析專案 ==
• 道路速率分析:
透過資料分析評估城市道路的速率,幫助企業在交通規劃與路況管理上做出更精確的決策。
• 銷售資料分析報告:
針對食品廠商的銷售資料進行分析,提供詳細的報告,協助業務部門理解關鍵影響因素並改善銷售策略。
• 物流預測能力展示(PoC):
進行物流需求預測的概念驗證(PoC),展示公司在需求預測與數位轉型上的技術能力。
== 團隊經驗 ==
• 帶領資料科學團隊:
負責組成與領導 3 人的資料科學團隊,建立技術討論文化,設計並推動可傳承的開發流程,確保專案在團隊內部能夠穩定、高效執行。
• 提升團隊協作效率:
制定並推行資料科學專案開發文件標準,促進模型模組化及程式碼風格一致化,有效降低維護與協作成本,提升整體團隊效能。
== 技術培訓與知識分享 ==
• 負責全公司新進人員基礎培訓:
培訓 Python 開發標準、虛擬環境設定、Container 應用與 Docker 入門,讓新進人員快速上手。
• 促進跨部門協作與理解:
分享探索性資料分析(EDA)、MLOps 概念與實作,以及專案文件標準化,讓其他部門更了解資料科學團隊的能力與工作內容,促進協作與理解。
• 指導實習生:
工作 8 年期間陸續指導 3 名實習生參與專案,協助他們累積實務經驗並了解專業工作流程。
== 雲端服務使用經驗 ==
• 維持雲端服務穩定:負責公司內 AWS 服務的營運管理,管理 IAM、EC2、S3、CloudFront、彈性 IP、憑證等基礎服務,確保應用穩定運行。