Cake Job Search

Advanced filters
Off
Songshan District, Taipei City, Taiwan
Logo of 裕順資訊有限公司.
為什麼大家喜歡在 RichWell Co.Ltd. 上班? 1.彈性上班-早上不趕打卡,想多睡一點、避開通勤人潮都OK。2.特休多多-不用等滿一年就能休假,我們比法規更大方,放假就是要爽爽的。3.獎金福利讚 年終、績效獎金該有的都有,努力絕對不白費。4.生日小驚喜,公司記得你的每個重要時刻。5.定期聚餐/Team Building 不只是工作夥伴,更是一起成長的戰友,吃吃喝喝感情更緊密。6.技術課、內部分享會,想學什麼我們都支持,讓你持續進化不退化! About the roleWe are building a reliability-first platform. Over the next 12 months, we will stabilize our Windows-based services, strengthen observability, and progressively containerize into Kubernetes. You will be a key contributor driving self-service operations and data-driven reliability across the stack. What you’ll do• Operational automation: Build self-service runbooks for Windows services (AWX/Rundeck), implement Ansible/PowerShell DSC workflows, health checks, and safe rollbacks implementations.• Observability: Standardize metrics/logs/traces (Prometheus/Grafana, windows_exporter, OpenTelemetry; ELK/Loki). Create golden-signal dashboards and actionable alerts.• Reliability engineering: Participates in on-call, handle incidents and post-incident reviews (PIR), and lead game days to institutionalize SOPs.• Resilience: Design and implement backup disaster recovery, capacity planning, and performance tuning.• Long-term: Drive service containerization and Kubernetes adoption (Helm/Kustomize, Argo CD/Flux, ConfigMap/Secrets) with a strong focus on security and compliance.
Windows Server
Site Reliability Engineer
Prometheus/Grafana
1.6M ~ 2.2M TWD / year
4 years of experience required
No management responsibility
Logo of 新芽網路股份有限公司.
❗️投遞履歷請一律至專屬的職缺網頁:https://25sprout.teamdoor.io/s/ML8ElGFS 目前此職缺為常態徵才,直接透過 Cake平台投遞將不會回覆唷 我們正在尋找一位 Mid-level SRE(Site Reliability Engineer),成為團隊的可靠後盾。你的任務是確保系統穩定運行、雲端環境高效管理、流程持續自動化,讓用戶體驗更順暢、工程師開發更專注。如果你熱愛新技術,喜歡動手解決問題,也樂於與不同角色協作,歡迎加入我們一起:) ▍你的工作將包括: Linux 作業系統管理與維運(RedHat / Debian / Ubuntu 等)網站/應用環境建置與維護(LAMP / LNMP)CI/CD 流程整合與最佳化(Jenkins / GitLab CI/CD)憑證、金鑰與機密管理(SSL/TLS、Vault 等)雲端平台資源管理(AWS EC2 / S3 / RDS、Azure、GCP 等)建置監控與告警系統,確保服務高可用性(Prometheus / Grafana / ELK)自動化工具與基礎架構即程式碼導入(Terraform / Ansible / CloudFormation)
60K ~ 70K TWD / month
3 years of experience required
No management responsibility
Logo of Cake Recruitment Consulting.
【Company Highlights】 致力於提供高效、創新的解決方案,滿足客戶在科技和商業上的各種需求。憑藉豐富的經驗和專業知識,支持客戶在數字化轉型、 軟體開發、IT基礎設施管理及其他關鍵領域的需求 除了技術精實穩定的團隊,也提供讚讚的福利! 包含:彈性上下班制度、優於法規的特休制度、具競爭力的獎金制度、定期聚餐與團隊活動、貼心的生日與節日驚喜、持續學習與成長支持, etc.【Responsibilities】 主導應用程式部署管線的開發與實作,採用 Infrastructure as Code (IaC) 工具,並著重使用 Ansible、Kubernetes (K8s) 以及透過 Jenkins/ArgoCD 建立 CI/CD 流程。與 CTO 及基礎架構團隊密切合作,制定技術策略,確保平台架構與產品路線圖一致。規劃與優化監控與遙測能力,採用 Prometheus/Grafana 技術堆疊及 OpenTelemetry 標準,確保系統全方位可觀測性。SRE 團隊 的技術藍圖與開發計畫(包含災難復原架構與執行)與公司整體願景與技術規劃對齊。透過自動化推動系統的可持續擴展,並持續優化系統架構,以提升可靠性、交付速度與運行效率。領導與指導 SRE 團隊,建立積極主動、責任感與資源掌控的團隊文化。
SRE
On-Premise
Kubernetes
1.8M ~ 2.5M TWD / year
6 years of experience required
Managing 1-5 staff
Logo of Cake Recruitment Consulting.
【Company Hihglights】 致力於提供高效、創新的解決方案,滿足客戶在科技和商業上的各種需求。憑藉豐富的經驗和專業知識,支持客戶在數字化轉型、 軟體開發、IT基礎設施管理及其他關鍵領域的需求 除了技術精實穩定的團隊,也提供讚讚的福利! 包含:彈性上下班制度、優於法規的特休制度、具競爭力的獎金制度、定期聚餐與團隊活動、貼心的生日與節日驚喜、持續學習與成長支持, etc. 【Responsibilities】 運用 SRE 最佳實踐,確保平台基礎架構的高可用性與可擴展性。 建置並維護 Jenkins 與 ArgoCD 的 CI/CD 部署流程,提升交付效率與穩定性。 使用 Ansible 和 Kubernetes 等基礎架構即程式化(IaC)工具進行應用程式部署。 建立以 Prometheus 與 Grafana 為核心的監控與觀測系統,確保系統可視性。 設計並執行災難備援與備份方案,保護關鍵系統安全。 推動系統自動化以支援可持續擴展,提升整體系統效能與開發速度。 負責產品環境的 on-call 支援,快速解決關鍵系統問題。 管理 Windows/Linux 伺服器與網路設定,確保系統穩定運作。 維運網站伺服器環境,如 IIS 與 Nginx。 積極與技術與非技術團隊協作,展現高責任感與主動解決問題的能力。
SRE
K8S
IDC
1M ~ 2.5M TWD / year
3 years of experience required
No management responsibility
Logo of Cake Recruitment Consulting.
We are looking for an experienced Site Reliability Engineer (SRE) to build and maintain a reliable, scalable, and resilient platform infrastructure. The ideal candidate will have strong expertise in automation, infrastructure as code (IaC), monitoring, and system scalability.【Responsibility】Develop and maintain automated deployment pipelines using IaC tools (e.g., Ansible, Kubernetes, Jenkins, ArgoCD). Implement and manage monitoring and telemetry solutions with Prometheus and Grafana to ensure system visibility and performance optimization. Design and execute Disaster Recovery (DR) and backup strategies to enhance system resilience. Improve system scalability and reliability through automation and proactive performance optimizations. Continuously evolve the infrastructure by identifying and implementing improvements that enhance reliability and deployment speed.
On-Premise
DevOps
SRE
1.2M ~ 1.7M TWD / year
3 years of experience required
No management responsibility

Cake Job Search

Join Cake now! Search tens of thousands of job listings to find your perfect job.