、负责海量数据处理的分布式平台稳定性建设;
2、搭建体系化的稳定性运维保障服务,不断加强平台的风险防控、故障恢复处理能力,包括但不仅限于线上演习、预案设计、链路梳理&压测、监控告警等活动;
3、设计并实现可靠的运维保障工具服务,提高平台的链路排查分析效率;
4、有自动化运维开发者优先。
岗位要求:
1、本科以上电子、计算机相关专业,5年以上分布式服务开发、测试、运维经验;
2、熟悉多线程、Socket编程,熟悉TCP、UDP、SSL\TLS、HTTP、MQTT、CoAP等协议;
3、熟悉Redis、MQ、Mysql等中间件及数据库;
4、有大型分布式服务的稳定性运维保障经验优先考虑;
5、有很强的分析问题和解决问题的能力,一定的架构设计与优化能力。