蛮子哥 蛮子哥
首页
  • linux
  • windows
  • 中间件
  • 监控
  • 网络
  • 存储
  • 安全
  • 防火墙
  • 数据库
  • 系统
  • docker
  • 运维工具
  • other
  • elk
  • K8S
  • ansible
  • Jenkins
  • GitLabCI_CD
  • ArgoCD
  • 随笔
  • 面试
  • 工具
  • 收藏夹
  • Shell
  • python
  • golang
友链
  • 索引

    • 分类
    • 标签
    • 归档
    • 首页 (opens new window)
    • 关于我 (opens new window)
    • 图床 (opens new window)
    • 评论 (opens new window)
    • 导航栏 (opens new window)
周刊
GitHub (opens new window)

蛮子哥

业精于勤,荒于嬉
首页
  • linux
  • windows
  • 中间件
  • 监控
  • 网络
  • 存储
  • 安全
  • 防火墙
  • 数据库
  • 系统
  • docker
  • 运维工具
  • other
  • elk
  • K8S
  • ansible
  • Jenkins
  • GitLabCI_CD
  • ArgoCD
  • 随笔
  • 面试
  • 工具
  • 收藏夹
  • Shell
  • python
  • golang
友链
  • 索引

    • 分类
    • 标签
    • 归档
    • 首页 (opens new window)
    • 关于我 (opens new window)
    • 图床 (opens new window)
    • 评论 (opens new window)
    • 导航栏 (opens new window)
周刊
GitHub (opens new window)
  • 随笔

  • 面试

    • 运维10道基础面试题
    • http状态码
    • 高级运维工程需要掌握的技能
    • 2023年6月运维面试问题总结
    • Kubernetes运维方面的项目经验
    • 运维常见故障排查
    • 面试故障回答案例
    • 运维面试题一
    • 个人简历
    • 问题案例展示
    • 运维面试题二
    • 面试回答技巧
    • kubernetes面试问题总结
      • 发布模式介绍和对比
    • 工具

    • 美食

    • 生活
    • 面试
    蛮子哥
    2023-06-11
    目录

    kubernetes面试问题总结

    # kubernetes pod监控怎么添加

    在生产环境中,我通常使用 Prometheus Operator + Grafana + Alertmanager 监控 Kubernetes Pod。对于业务应用,我要求开发暴露 /metrics 接口,通过 ServiceMonitor 自动发现采集;对于集群资源监控,通过 cAdvisor、kube-state-metrics 和 Node Exporter 获取 Pod、Node、Deployment 等指标;Grafana 负责展示 CPU、内存、QPS、响应时间、重启次数等关键指标,并配置 Pod OOM、频繁重启、资源使用率超过80%等告警规则,通过企业微信或钉钉通知,实现业务运行状态的实时监控和故障预警。

    # Kubernetes 污点(Taint)有哪几种模式?

    Kubernetes 污点共有三种模式:

    • NoSchedule:禁止没有容忍的 Pod 调度到节点,但不影响已运行 Pod。
    • PreferNoSchedule:软限制,尽量不调度,如果没有其他节点仍可能调度过去。
    • NoExecute:最严格,既禁止新 Pod 调度,也会驱逐当前节点上没有容忍配置的 Pod。

    在生产环境中,我通常使用 NoSchedule 隔离数据库、Redis、ES 等专用节点,使用 NoExecute 处理节点故障和业务迁移场景。这样既能实现资源隔离,也能提高集群稳定性。****

    Node Affinity 和 Taint 都是 Kubernetes 的调度策略,但方向不同。Node Affinity 是 Pod 主动选择节点,适用于业务分区、可用区部署、环境隔离等场景;Taint 是节点主动拒绝 Pod,适用于 GPU、数据库、日志平台等需要资源强隔离的场景。生产环境中我通常将两者结合使用:通过 Node Affinity 保证业务 Pod 调度到目标节点,通过 Taint/Toleration 防止其他业务误调度到这些节点,实现资源隔离和精准调度。例如 OpenSearch、VictoriaLogs、Redis 等基础设施节点都会采用 Label + Affinity + Taint 的组合方案。这样既能保证业务正确调度,又能避免资源争抢,提高集群稳定性。

    微信 支付宝
    上次更新: 2026/06/15, 01:53:28

    ← 面试回答技巧 发布模式介绍和对比→

    最近更新
    01
    victorialogs配置关键字告警
    06-03
    02
    kubernetes部署jaeger
    05-30
    03
    grafana高可用部署
    05-26
    更多文章>
    Theme by Vdoing | Copyright © 2019-2026 | 点击查看十年之约 | 鄂ICP备2024072800号
    • 跟随系统
    • 浅色模式
    • 深色模式
    • 阅读模式