淡江大學統計系
文化大學推廣部 一系列投資理財課程 林成
NTC 大數據養成班成員、想見科技實習生
類神經網路 Data Scientist Engineer 2018.7~2019.7
NUWA 女媧科技 NLP 工程師 2019.11~2020.11
NTC.im 人才培訓中心 講師 2019~now Python 程式基礎, Python 網路爬蟲, MongoDB,
influxDB 累積授課時數: 104 小時/ 累積學生人數: 209 人
TSDC 淡江大學 Python 進階 業界講師 2020
TSDC 淡江大學 帶領學生做專案 2020-2021.7
大數據家教班 講師(Python、爬蟲等實務) 2020
痞客邦比賽 2019.7
緯創軟體 資料工程師 2021.12-2023.3
緯創資通 內部訓練講師 2022
城邦媒體控股集團 資料工程師 2023.4-2024.8
醫濟學甲志工
2023.4~2024.8
資料工程師
1. Airflow 維運&開發優化:
確保數據管道的穩定性和可靠性,修復任何故障和錯誤
排程維護
資料補值、備份
優化排程節省成本
開發維護ETL(與各廠商客戶合作 klook/kkday/台灣旅圖/bridgewell/ forestbeauty/ ijysheng/ keraia/ meowservant/Rakuten/skm/ yessoymilk… 必要時與客戶開會
2. 專案:痞客邦手機版 生活甜甜圈(結合部落格文章與景點、實價登錄等在地資訊提供給使用者):
操作錄影:https://drive.google.com/file/d/14sEdPiiGsiDpSD7a89VwbYdN9O6pHH3b/view?usp=drive_link
1. 店家優惠資訊資料新增(跨部門合作)
2. 產生文章&google POI點資訊 (維護功能)
3. 加入生活甜甜圈自定義類別 (維護功能)
4. 快速產生一個地點店家資訊與文章連結的評估、規劃、實作
5. 從資料中分離出地址(優惠券、文章)
6. 地址轉經緯度(優惠券、文章)
7. 產出外國語系
8. 實價登錄數據算法優化
9. 加入新地點(建案、交通、景點,etc.(維護功能)
10. 其他:程式優化、提供相關的資料、跨部門溝通
使用工具:python pandas、selenium/airflow/gcp dataproc、composer
3. 爬蟲、資料處理&資料更新、回補:
1. google POI 地點資訊 、 房產文章 、台灣實價登錄 、熊本實價登 錄、imdb電影(python selenium)
2. 製作推薦文章資料的快取機制api(gcp app engine/redis)
3. 優化爬蟲並規劃爬蟲機制:selenium grid,etc.
4.其他
發現服務運行方式並規劃縮減資源&規劃可以優化的地方
(ex.rhino、app engine、k8s,etc.)
知識分享:與團隊分享如何操作gcp上的功能、datapipeline的機制
主機維運:多台主機的資源維護
pa code設計:提供給前端工程師讓pm可以追蹤成效
2021.12~2023.3
資料工程師
2019.11~2020.11
2018.7~2019.7
專案完成項目:
1. ETL: 爬取各大網站文章並清理入庫
2. 使用文字雲觀察新聞討論話題(資料視覺化)
3. 讓文章生成標籤(可用於行銷中的廣告推播)
使用技術:
Python :BeautifulSoup、Requests、Selenium: 爬蟲網站
MongoDB: 存入資料庫
Jieba: 建詞庫斷詞、計算 Term Frequency - Inverted Document Frequency(NLP)
Opencc: 繁簡體轉換
WordCloud / matplotlib.pyplot 生成文字雲 https://codepen.io/2375_takasugi/full/GRmJgqd
Flourish:呈現視覺化 https://public.flourish.studio/story/906725/
程式語言
基本(使用過): SPARK、HADOOP、Hive、Hue、Scala、ELK、Java
初階~中階: PHP、R、HTML/CSS/JS、Angular
熟悉: SAS、PYTHON、TYPESCRIPT
作業系統使用經驗
linux centos / ubuntu、windows、ios
平台使用經驗GCP: app engine / pubsub/ dataflow/ cloud functions/ firestore/ storage/ big query /data proc/ firebase/ Hosting/ cloud run/ dataproc/ composer
百度雲影像辨識
AWS: MinIO
資料庫
MongoDB、Redis、MySQL、Postgres
資料分析(Tableau、SAS、R、Python)
資料爬蟲、資料視覺化、資料清洗、迴歸分析、存活分析、類別資料分析、時間數列分析、
實驗設計、抽樣調查、無母數分析、影像辨識、NLP
感謝您願意撥出您寶貴的時間,閱讀我的履歷