feb 2024 - Presente
Nangang District, Taipei City, Taiwan
主要負責資料的收集、資料清洗和資料的分析與評估
1.資料收集:使用Python來爬蟲網路美國論壇reddit上的文章,然後用MySQL建立資料庫來管理reddit內容。目前總共已經可以持續性爬取39萬筆資料。
2.資料分析:使用Python進行清料的清理和自然語言處理,已投入到深度學習的模型中
3.資料結果評估:將reddit的內容進行詞頻分析、Topic model和情緒分析,可以確認出reddit網站上貼文和留言之間關係,最終可以得知何種貼文會產生何種留言