在 Canner,我們正在打造突破性的 AI 與數據基礎架構解決方案,讓數據不再只是靜態資產,而是企業決策的核心動力。加入我們的研發團隊,你將參與開發和推動 Wren AI (https://github.com/Canner/WrenAI)。Wren AI 是 Canner 的旗艦開源專案,讓大型語言模型 (LLM) 能夠直接查詢企業數據,為 AI Agent 提供精確的語意查詢能力。我們的開源庫已連續數週蟬聯 GitHub Top Trending,目前累積 15k+ 顆星,成為全球主流的 GenBI 解決方案,並被 fintech、e-commerce、enterprise SaaS 等領域的全球企業實際採用。這代表了全球開發者對這項技術的高度認可與需求。這個角色,你會用 Rust 在 Apache DataFusion 之上打造 Wren AI 的語意查詢引擎,並在資料源整合、query 優化等核心技術面向上發揮影響力。你會同時參與開源社群的維護與企業客戶需求的開發,並與全球 contributor 在 GitHub 上協作。如果你熱衷於數據基礎架構、查詢引擎及大規模 AI 應用的開發,這將會是參與業界最前沿技術發展的絕佳機會。職責 (Responsibilities)Context Layer Query Engine 開發在 Apache DataFusion 之上,用 Rust 打造語意引擎:MDL parsing、query planning、optimization、execution維護引擎的多重發佈目標:PyO3 bindings、WebAssembly build、Python SDK、CLI跟 framework integrations(LangChain、CrewAI、Pydantic-AI 等)對齊 APISQL Parsing Dialect Translation處理 20+ 資料源的 SQL dialect 差異,確保引擎產出的 SQL 每個來源都能正確執行結合 DataFusion 內建 unparser 與 sqlglot(Python SQL parsing toolkit)補齊 dialect gaps設計 capability negotiation:決定哪些 operator 下推、哪些回 local 執行把 dialect bug 與缺失 feature 回饋給 Apache DataFusion 與 sqlglot upstreamData Source Integration用各資料源的 native driver(psycopg、snowflake-connector-python、google-cloud-bigquery、trino-python-client 等)打造、重構連線層處理 driver 層級差異:type mapping、time zones、authentication(OAuth / key-pair / IAM)、SSL/TLS、proxy、retry用 Arrow / DuckDB / opendal 高效讀取 file-based sources(S3 / GCS / Local Files / MinIO)Data Flow Optimization高效地把 query 結果從 driver 搬到 client:Arrow-based streaming、batching、column pruning、pagination設計合理的 connection pooling、prepared statement caching、query cancellation處理長時間 query:timeout、partial results、back-pressure用 OpenTelemetry traces 與 custom metrics 找出並修正瓶頸
3 years of experience required
No management responsibility