隨著大數據時代的開展,網路上充斥著許多資訊,而從眾多資料中分析並萃取見解,便是數位時代的關鍵能力之一,也就是資料科學家(Data Scientist)的核心工作內容。《哈佛商業評論》更在十年前指出資料科學家(Data Scientist)是「21 世紀最性感工作」。
資料科學家都在做什麼?薪資待遇怎麼樣?如果想應徵資料科學家需要具備什麼能力?本篇文章將和大家分享資料科學家工作內容、需具備的技能及相關工作資訊。
資料科學家(Data scientist)的定義 資料科學家顧名思義,實驗對象針對「資料」本身,尋找商業問題並落地解決。不過一個數據團隊中的資料工程師、資料分析師跟資料科學家乍看之下十分類似,三者其實具有不同工作內容。
資料工程師(Data Engineer)工作主要以架構並維持資料庫平台為主,方便公司儲存繁雜資料,資料分析師(Data Analyst)負責數據分析,利用 SQL、Excel 等工具針對一串資料解釋,而資料科學家(Data Scientist)像是資料領域的組長,需從資料中分析、處理及建模數據,同時具備統籌資料、發現問題、著手解決問題的能力。
資料科學家工作內容 資料科學家的工作領域橫跨多面向,先是制定資料分析的策略,從網路、手機、感測器中找到需要解決的問題,此過程也稱作資料驅動(Data Driven),再用 Python、R 程式語言把數據建模,最後將模型部署,應用於日常工作中。因為繁複的工作量,資料科學家可以說是集結統計學、程式設計及機器學習知識於一身的職位,同時需要大量跨部門工作,和團隊夥伴溝通工作事項。
具體來說,資料科學家在執行專案時,工作步驟大致如下:
與客戶溝通資料分析目的,尋找資料分析的需求及目標 規劃資料搜集方法,定義資料清理的邏輯 拆解問題並提出假說,進行驗證 建立資料模型,更新與優化 安排專案的優先順序 資料科學家的薪資待遇與工程師相似,剛從大學畢業的資料科學家,起薪約每月 40k 至 50k,不過各公司規模起薪不一,年資 1 至 2 年以上,月薪能達到 80k 至 90k,如果年資為 5 年以上,年薪則可能破百。職場資訊社群平台 Glassdoor 有數據顯示,2022 年台灣資料科學家的平均年薪為 116 萬,而目前資料科學家職位仍屬於新興職缺,人才供不應求,為未來時代的重要工作之一。
推薦職缺
資料科學家工作必備 9 大技能 如果看完上述介紹,對於資料科學家感到興趣,以下為應徵資料科學家時,需要具備的 9 大技能,分成硬實力和軟實力兩種類別:
💡 硬實力分為以下 7 項:
P ython 與 R 程式語言(Python Coding/R Programming) 資料科學家雖然主要工作並非程式撰寫,但需要整理大量數據資料,因此須利用 Python 與 R 程式語言,作為統計運算、整理數據資料的輔助工具。 SQL資料庫管理系統操作能力(Database/Coding) 資料科學家有 60% 皆在清理數據,由於工作內容涵蓋清理大量資料,因此具備 SQL 技能、程式語言技能,才能幫助自己在茫茫大海的資料庫中,快速準確找到需要的訊息。 數據分析及處理能力(Data analysis) 清理完數據後,資料科學家需從數據中萃取提煉有用的資訊,解決最初資料分析的商業目標,所以對數字須具備一定程度的敏銳度與洞察力。 資料視覺化能力(Data Visualization) 為了方便解釋數據分析完的結果,資料科學家須把資料視覺化,由淺入深地解讀給公司高層主管以及客戶,讓他們能理解數據分析產出後的資訊意涵。 機器學習與人工智慧技術(Machine Learning and AI) 資料科學家有時候也會利用機器學習與人工智慧模型,包括選取演算法、微調超參數等工作,檢驗模型是否能解決商務問題。 高級數學與統計學知識(Mathematics and statistics) 不管是在做統計分析還是機器學習的模型,資料科學家都會用到大量的微積分、線性代數、機率論,因此高級數學與統計能力也是資料科學家必須掌握的能力之一。 行銷理論與實務經驗(Marketing theory and practical experience) 由於資料科學家最終產出的模型與解決方案,將直接影響公司的營運和行銷方向,所以具備行銷基本概念,對於公司後續的行銷策略能大大加分!
💡 軟實力分為以下 2 項:
跨部門交流與溝通能力(Communication skills and Teamwork) 由於資料科學家工作涵蓋的範疇大,需要與資料分析師、資料工程師,還有各部門團隊夥伴多方溝通需求並優化模型,因此若能有效率且順利地跨部門溝通,能幫助推動業務進度。 具有喜好洞察數據、觀察商業問題的特質 資料科學家的工作無不圍繞在數據本身,每天工作需要長時間清理、建模數據,因此面試官在提問時,也會在面談中觀察求職者是否具備強烈好奇心,對於數據抱有熱情。
資料科學家工作的履歷與面試技巧 💡 資料科學家履歷 3 大加分要件
過去經驗朝「結果導向」撰寫,而非「任務導向」 由於許多資料科學家皆具備 R、Python 等程式語言技能,因此在履歷上,不用太著墨利用這些程式語言所執行的專案,而是把專案的成果寫出來,展現定義及解決問題的能力。 在專案中提及「非結構化」資料 非結構化資料指的是語音檔、影像檔、PDF 檔案等沒有固定欄位及形式的資料,比起結構化資料,較難以分析清理。求職者若在描述過往從事的專案中,放入處理非結構化資料的說明,能夠展現出自己不僅能處理一般資料集的能力! 強調自己的「溝通技能」 因資料科學家需進行大量跨部門溝通工作,建議求職者可於過去經驗中,提及與其他部門合作交流的經驗,彰顯溝通表達能力。
💡 資料科學家面試 3 大技巧
經驗題:利用 STAR 原則,強調 Situation 的挑戰性及量化 Result 數據 面試官可能詢問求職者,過去在資料科學領域的專案經驗,此時,求職者便能利用 STAR 原則:Situation(情境)、Task(任務)、Action(行動)及 Result(結果),並且在描述情境時,講清楚問題的挑戰性,最後將結果以數字量化,反映出具體的商業目標。 行為題:面試前整理好「故事庫」,失敗經驗也沒關係! 為了確保求職者具備「溝通」能力,面試官可能會問「過去有沒有和資料分析師遇到衝突?當時如何解決」、「如果對方看不懂數據,如何說服他並採取你整理的結果?」等問題。建議求職者預先準備多則故事,遇到問題時直接以實戰故事分享,即便是失敗經驗也無妨,可從失敗經驗中提取學到的事情,增強說服力。 機器學習技術問題:多網羅面試題庫,精簡扼要描述 碰到「為何在某場景使用 A 模型而不用 B 模型?」這類問題時,建議求職者在回答時,把自己選擇的機器模型亮點提出,濃縮成2至3個句子即可,清楚讓面試官知道你選擇的理由及策略。
資料科學家工作的職涯發展 資料科學家的專業可應用在 5 個層面:具有「大數據分析」、「資料科學自動化」、「雲端和資料科學」、「自然語言處理」及「物聯網」產品或服務的產業中。如果是社會新鮮人剛踏入資料科學家領域,剛開始的工作目標較著重於你開發的演算法能否讓工作流程更順暢、優化公司數據指標,接著進入較資深的資料科學家職位,目標漸漸朝向決策性質,像是如何用資料科學讓公司的商業風險降低等問題。簡單來說,資料科學家的職涯有點像是打怪的過程,會從一開始處理較為簡單的單一問題,漸漸轉變為解決集結各種小問題的核心風險、價值問題。
舉例來說,假設你在某 SaaS 產品工作,剛開始會先預估產品成效或實驗優化成效等,最後可能會逐步進階至產品週期成效預估、各國續訂率,甚至是整體產品風險等跨領域問題。因此建議對於資料科學家有興趣的求職者,除了進修程式技術,也可增強專案經理、行銷知識、用戶體驗等方面的跨領域視野,結合技術與知識解決商業問題。
不管是還在大學或研究所學習,抑或是社會新鮮人,正思索職涯目標的你,相信看完這篇文章之後,可以讓你更了解資料科學家需要的軟硬實力,掌握資料科學家的工作內容,順利應徵上理想職位!
隨人工智慧風潮橫掃各行各業,催生出大量新興 AI 職位和需求。該怎麼找 AI 工作機會、躋身高薪 AI 產業?一覽 Cake 完整的 AI 職缺情報 ,應徵你夢寐以求的 AI 工作 !
透過 Cake AI 人工智慧主題職缺專頁 ,快速掌握人工智慧相關職缺與求職攻略
推薦職缺