Avatar of Chin Ya Chang.
Chin Ya Chang
AI Senior Software Engineer
ProfilCV
Postingan
19Koneksi
Cetak
Avatar of the user.

Chin Ya Chang

AI Senior Software Engineer
現任AI小組-軟體工程師,執行中央氣象署機器學習專案,進行:影像生成、數值預測、數據校正、推薦系統、文字生成等任務。 主要接觸衛星、雷達、地理資訊、機房管理等資料,使用深度學習建立多種模型架構:CNN、VAE、GAN、GNN等。 近期專注於大型語言模型(LLM)的應用,涵蓋 OLLAMA、LMStudio 和 anythingLLM 的檢索增強生成(RAG)及 API 實作亦設置環境並搭配UI以供客戶使用LLAMA2、Taiwan-LLaMa等Chatbot。 專案中,以Docker為主建立、維護開發環境、部屬至客戶環境中。 曾於儀器製造業的研發部門擔任資料分析師,負責大數據分析與應用機器學習進行數據校正。 碩士於環境工程系的"健康風險分析實驗室"完成學位,運用統計軟體R, Python, ArcGIS, VBA進行數據爬蟲、大數據分析、地理資訊繪圖、使用者UI的設計。
Logo of the organization.
International Integrated Systems, Inc.(IISI)
Logo of the organization.
私立中原大學 Chung Yuan Christian University
Taipei, 台灣
Taiwan

Latar Belakang Profesional

  • Status sekarang
    Sudah bekerja
    Terbuka untuk peluang
  • Profesi
    Software Engineer
    Python Developer
    Machine Learning Engineer
  • Bidang
    Intelegensi Artifisial/Pemelajaran Mesin
    Software
    Layanan Informasi
  • Pengalaman Kerja
    4-6 tahun (relevan 4-6 tahun)
  • Management
    Tidak ada
  • Skil
    Python
    PyTorch
    Machine Learning
  • Bahasa
    English
    Menengah
  • Pendidikan tertinggi
    Master

Preferensi pencarian kerja

  • Jenis pekerjaan yang diinginkan
    Full-time
    Tertarik bekerja jarak jauh
  • Jabatan pekerjaan yang diinginkan
    AI工程師、機器學習工程師、深度學習工程師、資料科學家、Machine Learning Engineer、Deep Learning Engineer、Data Scientist
  • Lokasi pekerjaan yang diinginkan
    New Taipei City, Taiwan
    Taipei, Taiwan
    Taiwan
  • Bekerja lepas
    Pekerja lepas paruh waktu

Pengalaman Kerja

Logo of the organization.

Senior Software Engineer

07/2020 - Sekarang
New Taipei, Banqiao District, New Taipei City, Taiwan
執行中央氣象署-人工智慧專案,負責機器學習專案執行規劃、模型開發、部署及維護。 1. 影像生成 - 降雨圖影像預測 - 以衛星頻道資料為輸入,將PERSIANN-CNN架構改寫並創建Autoencoder,修改為U-NET、DCGAN、VQVAE、DANET等架構。 - 採用Resblock、GhostBottleNeck、ConvNext等通用模組及注意力機制如StripPooling、MixedPoolingModule、SelectiveKernel。 - 在模型訓練時,運用1~3D卷積層與weight standardization進行權重分配。 - 使用Microsoft nni進行超參數調整,並搭配Explainable AI方法解析模型的訓練過程。 - 此專案文獻於2022年已刊登於美國氣象協會,預計將於2024年投稿至JAXAIPWG11th Workshop of International Precipitation Working Group(IPWG-11),此階段產品已較前作增加了22%的準確度,並減少了70%的RMSE 2. 影像生成 - 空軍雷達圖影像預測 - 使用向日葵8號衛星資料作為輸入,預測未來10分鐘的降雨分布圖 - 已Autoencoder架構為主,使用2D, 3D的卷積層、通用模組及注意力機制 適當插入於模型中 - 調整訓練、模型設置的超參數,以達到最佳訓練效果 3. 圖形辨識 - 颱風強度偵測 - 進行颱風雲圖的接收以及輸出估計的颱風強度 - 透過多輸入的自編碼架構,以Softmax Regression作為主要分類與回歸模型,並整合通道注意力機制模組(SKNET)以優化表現 - 該模型在颱風強度偵測方面的準確度與其他傳統研究成果相近,並持續進行強化 4. 數值預測 - 系統監控與異常偵測 - 在系統監控與異常偵測領域,構建時序模型,預測主機狀態並即時通報異常 - 由特徵工程增加變數後,利用特徵檢定法如SelectKBest進行篩選 - 該模型經由與後端監控用agent及tracker整合後,準確度從50%提升至95% 5. 推薦系統 - 異常主機上下游關聯探索 - 關聯分析模型使用PyTorch Geometric構建圖神經網絡(GNN),將人際關係投射至系統中。 - 該模型在客戶環境部署後,可達到90%的準確度,有效找出異常來源的關聯主機並使用API與網頁端同步呈現該運算結果。 6. 數據分群 & 文字解析 - 錯誤訊息推薦系統 - 分群法使用聚類分析如:層次聚類、DBSCAN等。 - 使用NLP的前處理方法,讀取報告日誌,將英文、中文字訊息進行分詞、拆解、去除無用詞等,最後轉換為向量,再進行分群,提出可能解決方案。 7. 數值校正 - 小型專案,皆搭配automl工具實行(Optuna, TPOT) - 太陽照射量數據校正,原始資料準確度約60%以下,經模型校正後準確度為92% - 水位探測是異常檢測,準確度為94% 8. 自然語言處理 & 大型語言模型應用 - 產製預報文字 - 使用測站數值以及氣象資訊文字作為輸入,在進行前處理後,使用程式建立一連串可誘導LLM模型的對話內容,使輸出較固定的預報文字 - 將以NLP處理方法進行文字的前處理與數值上的配對 - 參考Google RAG的資訊探索方法,將正確資訊傳遞給IISI-INANA(CHAT-GPT),使其協助產製正確預報文字 9. 大型語言模型應用 - LLAMA開源模型應用 - 藉由huggingface將LLM模型(LLAMA2,Taiwan-LLaM)設置在本地環境中 - 搭配github開源的UI介面,將LLM導入供使用其聊天功能、文字產製 10. 建立、部屬、維護研發環境 - Docker、Anaconda - 將完成專案打包並部屬至客戶環境中供使用 - 維持可使用NvidiaGpu及JupyterLab的開發環境

Data analysis engineer

05/2018 - 06/2020
2 yrs 2 mos
New Taipei City, Taiwan
1. 程式設計 - 針對公司出產的不同儀器,設計其異常檢驗程式 - 改寫數據轉碼程式,維持資料傳送的安全性 - 配合研發及計畫案所需,將資料進行視覺化並產出必要資料 - 搭配資料庫(SQL, noSQL)使用大量儀器資料進行大數據分析 2. 數據校正 - 機器學習 - 使用統計檢定以及特徵工程進行統合檢驗 - 利用統計模型進行品質檢驗、使用機器學習校正數據 - 使用機器學習方法進行儀器數據校正,將數值準確獨維持在90%以上 - 使用XGBoost, NGboost, LightGBM等方法 3. 網路爬蟲 - 編寫爬蟲程式爬取機器學習所需資料,包含使用selenium, bs4等方法 - 搭配對應API進行資料爬取與彙整 4. 文書作業 - 負責撰寫標案中與儀器比對、維護分析的報告

Edukasi

Logo of the organization.
Master (S2)
環境工程
2016 - 2017
Deskripsi
於大四期間申請學碩雙連制度,故碩士為一年畢業,主要於健康風險分析實驗室完成研究所學位,主要運用統計軟體R和Python進行大數據分析和地理資訊繪圖。
Logo of the organization.
Sarjana Teknik
環境工程
2012 - 2016