13年运维/运维开发经验,涵盖云原生架构、DevOps体系建设、自动化平台开发,具备全栈能力(Python / Go / Vue)。
主导多家企业(华大基因、恒大、网宿科技)K8s集群建设与CI/CD体系落地,运维管理标准化与降本增效。
具备团队管理经验,曾担任运维主管,制定流程规范、研发自动化工具、推动监控告警自愈、实现智能化运维管理。
精通Shell / Python / Golang开发及前端Vue,能快速开发内部运维工具与管理平台,降低人工运维成本。
项目:运维智能化平台开发(AI运维助手) | 2024.08 — 2025.06 | 项目负责人
技术栈:Python / LangChain / FastAPI / Vue3 / Prometheus / K8s
项目描述与职责:
▷主导设计并开发基于LLM(大语言模型)的智能运维助手,集成故障诊断、日志分析、根因推荐三大核心能力。
▷构建Prometheus指标数据向量化索引,支持自然语言查询告警历史与系统健康状态,响应准确率达85%以上。
▷开发自动化故障处置引擎:接收告警 → 诊断 → 生成处置方案 → 可选自动执行,大幅降低人工On-call响应时间(平均缩短65%)。
▷整合K8s运维操作API,实现Pod重启、弹性扩缩容、配置变更等高频运维操作的自动化闭环。
▷系统上线后,L1级告警自动处置率达72%,月均节省人工运维工时约200小时。
项目:DevOps自动化发布平台建设 | 2022.04 — 2023.12 | 主导开发
技术栈:Jenkins / GitLab / Argo CD / Helm / K8s / Python / Vue
项目描述与职责:
▷从零开始设计并实现公司级DevOps发布平台,支持多集群(K8s)、多环境(dev/test/staging/prod)的一键式CI/CD流程。
▷引入Argo CD实现GitOps持续部署,配置蓝绿发布与金丝雀发布策略,支持秒级回滚,生产环境发布事故率降低80%。
▷开发自定义Jenkins共享库,统一200+微服务的构建规范,构建成功率从75%提升至97%。
▷集成代码质量门禁(SonarQube)、镜像安全扫描(Trivy)、CMDB自动资产录入,实现全流程审计与合规。
▷平台覆盖全公司300+应用服务,日均发布次数由人工时代的5次提升至自动化后的50+次。
可兼职时间
可兼职地点
0条评论 雇主评价