个人简历
章鹏杰 运维工程师 | DevOps 工程师 邮箱:874878956@qq.com | 手机:13826582737 | 博客:https://blog.zzppjj.top (opens new window)
# 个人简介
具有9年运维和DevOps经验,精通Linux系统、容器化管理(Docker、Kubernetes)、CI/CD流程自动化、云平台(阿里云、腾讯云等)管理、监控与日志系统搭建与优化。具备金融行业、高并发系统等高可用环境经验,擅长自动化运维,提升系统稳定性与业务连续性。致力于推动技术革新,提升交付效率并优化运维流程。
# 核心技能
- 容器化与编排:熟练使用Docker、Kubernetes(K8s)进行应用部署、集群管理、容器优化。
- CI/CD流程与自动化:精通Jenkins、GitLab CI、Nexus、Ansible等工具,提升自动化运维和代码交付效率。
- 云平台管理:熟悉阿里云、腾讯云、华为云等平台,能够进行多云环境管理、弹性扩展及资源优化。
- 监控与日志系统:精通Prometheus、Grafana、Zabbix、ELK等系统,配置报警机制,确保服务稳定性。
- 数据库管理与优化:精通MySQL、Redis、MongoDB等数据库的高可用部署、调优与备份恢复。
- 脚本与工具开发:熟练使用Shell、Python进行自动化脚本开发,优化日常运维任务。
- 系统安全与高可用:熟悉网络安全、数据备份、灾备系统,确保系统安全性与高可用性。
- 开源贡献:熟练使用claude code codex等ai编程智能体来完成代码编写,有开发过版本管理系统,github地址:https://github.com/opsre/version_manager
# 工作经验
# 青牛智胜科技有限公司 — 运维工程师
2023/09 - 至今
负责中国银行项目的全生命周期运维,包括生产、测试与双中心环境的部署与管理,确保高可用性与系统稳定。
部署并优化腾讯云与TKE容器平台,提升系统弹性与资源利用率,支持高并发业务场景。
优化MySQL、Redis等中间件的配置,提升系统性能,降低响应时间30%。
负责监控、日志系统的搭建与维护,使用Prometheus与Grafana实现实时数据监控与告警,保证生产环境无重大故障。
编写并优化自动化部署脚本,推动CI/CD流程的标准化与自动化,提升交付效率。
问题处理:在生产环境出现突发故障时,迅速定位并解决问题,减少系统宕机时间30%。通过使用日志分析与监控工具,迅速找出并解决了容器服务的性能瓶颈,确保了系统恢复到最佳状态。
# 高盈国际创新科技(深圳)有限公司 — 运维工程师
2021/09 - 2023/08
- 管理100+台生产服务器,确保系统稳定运行并及时响应突发事件,提升系统SLA至99.95%。
- 搭建并优化私有云与公有云平台,管理服务器实例、网络、存储及CDN,提升资源利用率。
- 使用Jenkins与Ansible编写自动化脚本,部署应用并实现多环境自动化部署,提升发布效率。
- 配置并优化Zabbix与ELK日志系统,实时监控关键指标并自动化处理告警,降低故障恢复时间。
- 管理数据库系统,优化MySQL与Redis性能,支持高并发请求。
- 问题处理:在项目发布过程中,发现多台生产服务器因配置问题导致负载过高,快速进行故障排查与优化,通过调整负载均衡配置和数据库调优,成功降低了系统响应时间40%,确保了上线无缝进行。
# 易宝(北京)信息技术有限公司(深圳分公司) — 运维工程师
2019/06 - 2021/09
- 管理IDC机房的Linux与Windows服务器,确保日常运维与系统稳定运行。
- 主导公司网站架构优化,提升数据库性能并优化Tomcat、Nginx等中间件配置,确保高效运行。
- 完成Jenkins CI/CD流程的搭建与优化,提升软件发布效率50%。
- 实施线上业务容器化迁移,提升系统可扩展性与稳定性。
- 编写Shell脚本优化日常运维,减少人工操作并提高工作效率。
- 问题处理:解决了公司服务器突发的磁盘故障问题,通过备份恢复和在线修复,确保了数据完整性和服务不中断,及时恢复了生产环境。
# 大众医疗医药科技有限公司 — 运维工程师
2015/10 - 2019/03
- 负责Jenkins CI/CD流程管理与优化,显著提升了软件发布的效率与质量。
- 管理与优化监控系统,确保操作系统、网络与应用的实时监控,解决故障问题。
- 负责服务器系统的配置与管理,确保本地数据中心的持续运行和数据安全。
- 实施自动化脚本管理系统与网络设备,提升了运维效率。
- 问题处理:在多个生产环境出现高负载故障时,快速识别瓶颈并通过调优应用配置与数据库参数,优化了系统性能,减少了50%的资源消耗。
# 项目经验
# 中国银行智能问答与智能外呼信创国产化改造项目
2023/09 - 2023/12
- 独立完成智能问答与外呼系统的部署、配置与优化,提升系统响应速度40%。
- 使用Ansible实现自动化部署,减少人工配置时间80%,确保系统快速上线。
- 配置并优化Nginx、MySQL、Redis、Rabbitmq、ES等中间件,提升系统性能。
- 搭建并优化日志系统,实现日志收集与故障预警,确保系统稳定运行。
- 问题处理:在生产环境中,智能外呼系统出现了消息丢失现象,通过细致排查发现了软网关配置问题,及时调整并优化了消息队列配置,恢复了系统的稳定性。
# 高性能回测云计算SaaS软件服务平台
2022/03 - 2023/06
- 负责Docker与Kubernetes环境下应用的部署,提升平台稳定性并实现自动化部署。
- 配置并优化RabbitMQ、Redis、MongoDB等中间件,提升数据处理能力。
- 实施Prometheus与Grafana监控方案,确保平台的实时监控与故障预警。
- 配置Jenkins CI/CD流水线,实现多环境自动化部署,提升发布效率。
- 问题处理:在SaaS平台上线初期,发现性能瓶颈导致回测平台响应缓慢,通过对数据库进行分表分库及Redis缓存优化,解决了系统性能瓶颈问题,提升了回测速度50%。
# 电商网站环境迁移与优化
2020/09 - 2020/12
- 主导电商平台服务环境迁移,优化服务器配置,提升资源利用率30%。
- 使用Docker Compose优化部署过程,减少部署时间50%。
- 配置Zabbix与Grafana进行实时监控,确保系统稳定性。
- 问题处理:在环境迁移过程中,出现了服务宕机问题,通过分析日志和排查网络配置,迅速恢复了服务并调整了网络拓扑,确保后续无类似问题。
# 教育经历
电子科技大学 — 计算机科学与技术 本科 2019/09 - 2021/01
湖北职业技术学院 — 通信技术 大专 2012/09 - 2015/06
# 证书与认证
- CKA(Certified Kubernetes Administrator)
# 个人作品与技术博客
- 博客:https://ops.zzppjj.top (opens new window)
- 记录技术成长,分享运维与DevOps相关经验。
|