【機器人核心研發】強化學習軟體工程師 (Robot Reinforcement Learning Engineer)

Job updated about 1 month ago
The employer was active 2 days ago

Job Description

【你的任務:訓練機器人的虛擬大腦】 你將負責機器人控制最前沿的領域:Deep Reinforcement Learning (DRL)。 你的工作場域不在工廠,而在物理模擬器 (Physics Simulator) 中。你需要設計獎勵函數 (Reward Function),讓機器人在虛擬世界中學會對抗地心引力、適應崎嶇地形,並成功將這套「大腦」移植到真實的機器人身上。

【工作內容 (Responsibilities)】

  1. 強化學習演算法開發
    • 設計並訓練基於學習的運動控制策略 (Learning-based Locomotion Policy),使用 PPO (Proximal Policy Optimization) 或 SAC 等演算法,讓機器人自主學會平衡與移動。
  2. 物理模擬環境建置
    • 熟練操作高效能物理引擎(如 NVIDIA Isaac Gym, MuJoCo, Bullet),搭建多樣化的地形與動態干擾場景,進行大規模並行訓練 (Massively Parallel Training)。
  3. Sim-to-Real 遷移技術
    • 解決「模擬」與「現實」的鴻溝 (Reality Gap)。運用 Domain Randomization (域隨機化)System Identification 技術,確保虛擬訓練的策略能強健地運行在真實硬體上。
  4. 整合與優化
    • 將訓練好的神經網路模型 (Inference Model) 部署至邊緣運算裝置 (Jetson/Orin),並與底層控制迴路 (Low-level Control) 進行整合。

Requirements

【我們在尋找這樣的你 (Requirements)】

  • 學術背景:資工、電機、應用數學或 AI 相關系所碩士/博士。
  • 核心技能
    • 精通 Python 與深度學習框架 (PyTorch 或 TensorFlow)。
    • 熟悉深度強化學習理論 (RL Theory),理解 Value Function, Policy Gradient, Actor-Critic 架構。
  • 模擬器經驗
    • 具備 Isaac Gym (必備)、MuJoCo 或 Gazebo 的開發經驗,能撰寫自定義的 Environment 與 Task。
  • 數學基礎
    • 熟悉線性代數、機率統計與剛體動力學 (Rigid Body Dynamics)。

【加分條件 (這些是我們的許願清單)】

  • 曾參與 RoboCupDARPA SubT 或類似機器人 AI 競賽經驗。
  • 熟悉 Transformer 架構在機器人控制上的應用。
  • 具備 C++ 整合部署經驗 (TensorRT, ONNX Runtime)。
  • 發表過 ICRA, IROS, NeurIPS 等頂級會議論文。

【為什麼選擇我們? (Why Us)】

  • 直接挑戰 AI 的最後一哩路:這裡沒有單調的數據清洗工作。你面對的是真實物理世界的挑戰,你的 Code 會直接決定機器人會不會跌倒。
  • 開放的研究文化:我們鼓勵閱讀最新的 Paper,並快速驗證新的演算法 (如 Diffusion Policy)。在這裡,我們像實驗室一樣探索未知,但擁有企業級的執行力。
3
No requirement for relevant working experience
40,000 ~ 150,000 TWD / month
Personal Invitation Link
This is your personal referral link for job invitation. You'll receive an email notification when someone applied for the position via your job link.
Share this job
People who applied for this job also applied for
Logo of the organization.
Full-time
Mid-Senior level
1
50K ~ 150K TWD / month
Logo of 三鋒科技工業股份有限公司.

About us

賦予鋼鐵「觸覺」與「靈魂」—— 我們正在打造下一代機器人的感知中樞。

【關於我們 About Us】 「新創的靈魂,巨人的肩膀 —— 在精密機械重鎮,做最前沿的硬體挑戰。」

我們是一支位於台中的極早期硬體新創團隊(Early-stage Hardware Startup),背後擁有知名工具機大廠「三鋒機器」的強力挹注

不同於傳統設備製造,我們專注於機器人最核心、也最困難的領域。我們相信,未來的機器人不再是冰冷、只能執行固定路徑的自動化設備,而是具備「感知力」、能與人類細膩協作的智慧個體。而我們的任務,就是為這些機器人打造最靈敏的「神經系統」與最強健的「肌肉」。

在這裡,我們結合了新創公司的「敏捷與瘋狂」,以及三鋒機器的「穩健與資源」。這是一場有強大後援的技術長征。

【我們在做什麼 What We Do】 我們致力於解決機電整合領域中最具挑戰性的課題:

  • 極致的感知: 在高雜訊環境下,透過獨家的解耦演算法與類比電路設計,實現微牛頓等級的受力偵測。
  • 精密的驅動: 開發高功率密度、高響應速度的馬達驅動模組,讓機器人的動作如人類般流暢。
  • 軟硬體的完美融合: 從應變規的貼片工藝 (Strain Gauge)、FOC 馬達控制演算法,到 EtherCAT 通訊協定,我們掌握全端技術。

【為什麼加入我們 Why Join Us?】 如果您厭倦了在大公司當一顆隨時可被替換的螺絲釘,這裡將是您的最佳舞台:

  1. 夢幻開局 (Best of Both Worlds): 我們擁有三鋒機器的集團資源支持。 這意味著您不必擔心新創公司常見的資金斷鏈問題。我們有能力添購高階示波器、開發板,並擁有母公司強大的精密加工與供應鏈人脈,讓您的設計能迅速轉化為高品質的實體,研發過程無後顧之憂。
  2. 定義產品,而不只是執行規格: 您的每一個 Code Commit、每一條 PCB Layout、每一個機構設計,都將直接定義產品的靈魂。您是研發者,也是決策者。
  3. 技術含金量極高: 我們不做低階代工。在這裡,您將挑戰 DSP 訊號處理、FEA 有限元素分析與即時控制系統 (RTOS) 的極限。這是一份能讓您的履歷在幾年後身價翻倍的工作。
  4. 遠離塵囂,專注研發: 我們位於台中,生活成本親民,擁有比竹科更宜人的生活品質,同時享有台中精密機械聚落的強大地緣優勢。
  5. 擁抱黑客精神 (Hacker Spirit): 我們尊重專業,討厭繁文縟節。我們不在乎您的打卡時間,只在乎您解決問題的創意與執行力。

【我們期待的夥伴 Who We Are Looking For】 我們不看重您的年資是 2 年還是 20 年,我們看重的是:

  • Problem Solver: 面對 Datasheet 上沒寫的問題,您會感到興奮而非恐懼。
  • Cross-disciplinary: 機構懂一點電路,軟體懂一點力學。我們喜歡具備「T型人才」特質的夥伴。
  • Honest & Open: 在這裡,技術爭辯是日常。我們鼓勵「有憑據的吵架」,因為真理越辯越明。