Site Reliability Engineer
Xiaomi.com
Office
新加坡
Full Time
Site Reliability Engineer新加坡社招全职职位 ID:A66694职位描述 - 负责保障手机部和销服海外业务的稳定性、可靠性及高效运行,确保服务始终保持高可用的状态
- 海外业务技术支持,负责资源交付、故障处理、容量管理、资源管理、监控管理及质量分析等核心运维工作
- 负责并审查技术架构设计,评估业务架构合理性,主动盘点和识别风险,并推动或主导消除风险工作
- 负责深入分析系统不足,定位系统瓶颈和可优化方向,制定可落地方案,以提高系统稳定性,保障低成本、高可用的系统运行
- 负责7*24小时OnCall,及时响应、跟踪和解决线上突发问题,确保业务持续稳定
- 设计和开发自动化平台和服务,提高运维和交付效率,减少重复性人工操作职位要求 - 计算机科学或相关领域的学士学位
- 精通Python、Go或Shell脚本,具备独立开发模块或平台的能力
- 熟悉云计算服务,具有多云或混合云平台管理经验者优先(如阿里云、Azure、AWS等)
- 熟悉互联网架构和常用的基础设施,具备网络、负载均衡、中间件、高可用容灾架构的深刻理解
- 能接受新加坡区域办公,具有良好的团队合作精神、责任心强、且具备自我驱动和积极主动的工作态度
- 具备良好的系统化思维和业务理解能力,能够从业务目标出发提出稳定性和架构优化方案投递
