林士傑

具備資料分析建模與產品管理背景,專注於語言模型應用、MLOps 系統建置與深度學習模型開發,具備端到端 AI 解決方案實作經驗。曾獨立開發 LLM 語言機器人與 BTC 價格預測平台,導入 Airflow、MLflow、Prometheus 等工具實現訓練自動化與監控可視化。熟悉 PyTorch 與語意建模,能結合 DL 模型與 Prompt Engineering 有效解決 NLP 任務。
📂 GitHub: github.com/SamJim0729

  內湖區, 台北市, 台灣  


資料科學專案 Data Science Projects

個人實作專案

Aug 2024 -  Now

  • BTC 月趨勢預測 MLOps 系統建置 
    • 資料準備運用 AWS 定時自動化抓取 API 資料,並設計資料流程定期導入 MySQL 資料庫
    • 特徵處理:應用 Time Shift 技術,Pearson 相關、XGBoost 進行變數篩選;結合 Evidently 即時監控特徵資料飄移
    • 模型訓練 使用 XGBoost 模型,搭配 Bagging、Optuna 進行超參數調整,測試集 R² 達 0.5,展現具預測能力的月趨勢模型
    • MLOps 流程整合 Airflow 任務排程、MLflow 模型管理、Prometheus 監控與 Grafana 儀表板;告警透過 Slack 通知 
    • 可擴展性:透過 Docker Compose 管理所有專案容器
  • 桌球館 Line BOT 機器人:
    • 應用場景:設計專為桌球館服務的語言模型助理,支援用戶透過對話即時查詢場地價格、課程服務等資訊
    • 流程設計:整合 LangChain 與 OpenAI,結合 Function Calling 與 Prompt Engineering,有效降低幻覺並提升指令精度
    • 部署架構:系統部署 AWS 平台,結合 API Gateway、webhook 回應機制與 DynamoDB,實現穩定具備對話記憶的服務功能 
  • 長文本新聞分類 NLP 任務專案  
    • 資料處理 設計段落切割與摘要策略,結合 LLM 與 Prompt Engineering,處理不同長度文本並維持語意完整性
    • 摘要品質:以 BERTScore 評估摘要效果,平均 F1 分數達 0.78,兼顧語意涵蓋與壓縮效率
    • 模型訓練:採用 BGE-m3 語意嵌入與 BiLSTM 架構,完成 20 類別新聞分類,測試集 F1 分數達 0.89
  • 玉山人工智慧挑戰賽專案:
    • 任務目標:針對長文本檢索任務,優化文本切分(Chunking)策略以提升語意片段的一致性與檢索精度
    • 流程設計:設計滑動窗格與語意導向切分機制,確保每段 chunk 保有語意完整性並適用於後續向量轉換
    • 向量檢索:結合 BGE-m3 生成語意嵌入,並使用 FAISS 建立高效向量資料庫,優化文本匹配準確率與查詢速度
  • 圖像辨識專案:
    • 任務目標:比較卷積神經網路 CNN 與視覺 Transformer (ViT) 在食物圖像分類任務中的效能,探討不同模型架構適用性
    • 資料處理:進行圖像標準化(resize、normalization)、資料增強(data augmentation)與訓練/驗證集切分
    • 模型訓練: 採用 efficentnet_b0 (CNN)  與 vit_b_16 (ViT) 兩種預訓練模型,統一相同資料集與訓練策略 (Optimizer、Learning Rate Scheduler、Epoch 等)。實驗結果顯示,ViT 準確率略優於 CNN,但 CNN 在效能與資源效率上更適合前端輕量化部署 

技能進修 Training & Certification  

資展國際大數據班

Feb 2024 - July 2024

  • 雙北房價預測平台 :
    • 模型預測:使用 CatBoost、LightGBM 與 XGBoost 進行房價預測,透過 Optuna 進行超參數調整,並以 Stacking 模型融合策略提升預測準確率
    • 智能助理:整合 LLM + RAG 架構與 Function Calling,提供標推薦、比鄰設施查詢等相關功能
    • 數據呈現:透過 Tableau 製作區域房價歷史視覺化儀表板,並嵌入網頁平台供用戶互動查詢

工作經歷 Work Experience

資深主任  •  台灣客服科技股份有限公司

Aug 2018 - Mar 2024

(一) 數據分析建模與業務洞察 
1.提升電銷成功率專案:建立電商高潛力客戶預測模型,透過特徵工程與統計檢定篩選變數,並以隨機森林進行建模與重要度分析,成功提升銷售成功率 2%,並找出具影音與遊戲偏好的族群為關鍵目標用戶。 
2.提升客戶自助率分析 運用 NLP 工具(jieba 分詞與 TF-IDF 向量化)分析客服對話文本,結合 KMeans 演算法進行主題分群 ,歸納客戶無法自助處理的核心問題,提供前端服務管道改善建議,每年成功降低客服通話量 3–5 萬通
3.建立客服主題預測邏輯,提前預測客戶來電原因並提供即時應對資訊,每通來電平均縮短通話時間 10 秒,顯著提升服務效率

(二) RPA 專案規劃 & 智能客服系統
1.協助釐清跨部門流程瓶頸,制定測試流程與腳本,加速流程優化協助公司 RPA 專案規劃,成功協助部署二專案,節省人力 120 小時/月(人力招募自動化、電話行銷續約查核流程)  
2.建立智能客服異常監控機制,自動化排程爬取使用量數據,對(平均值 + 標準差閾值)進行異常偵測,並透過 Email 實作自動告警,確保服務穩定性  
3.管理智能客服團隊,負責智能客服團隊之專案管理,跨部門溝通協調與廠商作業進度控管,確保系統功能優化與如期交付。 


學歷

Sep 2010  -  Jun2014

輔仁大學大學部

統計系

大學專題:
主題: 人民幣存匯款政策開放對新台幣匯率之影響與預測模型分析。
內容: 建立匯率預測模型,透過回歸分析與時間序列模型,探討政策前後匯率變動趨勢與影響因素。

Sep 2014 - Jun 2016

輔仁大學研究所

應用統計所

碩士論文:
主題: 時間延遲類神經網路應用於多變量製程異常辨識。內容: 探討 TDNN 模型對多變量常態與多項分配的異常辨識能力,與 MARS、SVM 等方法比較表現,結果顯示 TDNN 正確率較高。

國際研討會發表:
ICIC 2015 (大連): 應用類神經網路與 MARS 辨識製程變異源,準確率達 60–70%。
CISIS & IMIS 2016 (福岡): 比較 ANN、MARS 與 SVM 方法於製程變異辨識,SVM 表現最佳,準確率超過 70%。

技能


  • 程式語言: Python
  • 機器學習:PyTorch、Scikit-learn、Optuna
  • 語言模型:LangChain、Prompt Engineering、RAG

  • 模型管理:MLflow

  • 數據工程:Airflow、Docker、Docker Compose

  • 系統監控:Prometheus、Alertmanager、Slack

  • 資料視覺:Tableau、Grafana

  • 應用整合:Line Bot、Flask

  • 雲端服務:AWS(Lambda、S3、API Gateway等)

  • 版本控制:Git、GitHub

  • 資料庫:MySQL、MongoDB、Pinecone、FAISS

語言


  • 中文 - 精通
  • 英文 - 多益615分