公司福利
周末双休五项社会保险年终奖免费培训交通补贴午餐补贴有晋升空间节日礼物年度旅游
岗位说明
工作职责
1. 负责系统日常监控和故障处理,保证业务系统的高并发和高可用性,遇到故障及时定位并找出解决办法;
2. 负责系统相关变更方案的制定,私有化平台变更及业务上线支持,协调变更时间窗,组织评审变更方案及应急预案,并跟踪闭环;
3. 提供驻场运维支持服务,跟后端支持团队一起,积极推动产品和服务的持续提高;
4. 根据用户需求,部署测试及功能上线支持保障工作,跟进问题处理并及时有效跟客户沟通,提供快速有效的沟通和反馈;
5. 负责现场各AI线上应用必要正样本、负样本的采集、汇总,支持算法的持续迭代;
6. 负责技术运维相关的文档、手册、流程编写整理。
职位要求
1. 大学本科及以上学历,计算机或相关专业,3年以上中大型系统运维经验;
2. 熟悉docker容器,镜像,网络,存储,持久化,监控;需要有生产环境k8s/kubernetes等容器编排工具运维经验;有大规模分布式集群运维经验者优先;
3. 熟悉文件存储、对象存储、云磁盘,有实际运维经验,swift,cinder,ceph有一定的了解;
4. 熟悉linux系统管理与维护;
5. 掌握常用业务监控方式,熟练使用prometheus等监控工具使用;
6. 具备很强的责任感,具备故障排查能力,多线程工作能力,有很好的技术敏感度和风险识别能力。具备良好的客户服务意识,善于团队协作,能够承受较大的工作压力,以结果和行动为准则, 努力追求成功。