2023年6月运维面试问题总结

# 1.ipvs和iptables区别

IPVS 是一个负载均衡器，用于将传入的网络流量分发到后端的多个服务器上。

iptables 是一个防火墙工具，用于配置和管理网络包过滤规则，实现网络安全策略和流量控制。

尽管它们可以用于网络流量控制和转发，但其主要功能和实现方式是不同的。

# 2.k8s flannel和calico区别

Flannel使用Overlay网络模型，而Calico使用基于路由的方法。
Flannel通常使用层次化的网络模型（如VXLAN或IPSec），而Calico使用路由表和ACL来处理容器之间的流量。
Flannel在设置和操作上相对较简单，适合较小规模的集群，而Calico则更适合需要更复杂网络策略和安全性的大规模集群。

# 3.请介绍一下Liveness Probe、Readiness Probe和Startup Probe的区别和用途。

Liveness Probe（存活探针）用于检测应用程序是否仍然运行正常。如果存活探针失败，Kubernetes将重启容器，尝试恢复应用程序的正常运行状态。
Readiness Probe（就绪探针）用于检测应用程序是否已准备好接受流量。如果就绪探针失败，Kubernetes将停止将流量发送到该容器，直到它重新变为就绪状态。
Startup Probe（启动探针）是在容器启动过程中进行检查的一种探针。它可以用于判断应用程序是否在启动过程中已准备就绪。如果启动探针失败，Kubernetes将重启容器。

# 4.Liveness Probe和Readiness Probe常见配置方式

HTTP探测：通过向容器内的HTTP端点发送HTTP请求来进行探测。可以指定路径、端口和期望的响应状态码范围。例如，配置一个Liveness Probe的HTTP探测可以发送GET请求到/health路径，并期望返回状态码200。
TCP探测：通过建立TCP套接字连接来进行探测。可以指定容器内的IP地址和端口。如果连接成功，探测将被视为成功。这种方式适用于无法使用HTTP进行探测的情况。
Exec探测：通过在容器内部执行指定的命令来进行探测。可以指定要执行的命令及其参数。如果命令成功执行并返回退出状态码为0，探测将被视为成功。这种方式适用于需要自定义逻辑进行探测的情况

# 5.k8s创建一个pod主要流程

Kubernetes创建一个Pod的主要流程如下：

编写Pod配置文件: 首先，需要创建一个描述Pod的配置文件，通常使用YAML或JSON格式。在配置文件中定义Pod的名称、容器镜像、资源要求、环境变量、挂载卷等信息。
使用kubectl创建Pod: 使用kubectl命令行工具来创建Pod。通过运行类似以下的命令来提交配置文件：
```
kubectl create -f pod.yaml
```
1
这将向Kubernetes API服务器发送请求，请求创建一个新的Pod。
API服务器验证和处理: Kubernetes API服务器接收到创建Pod的请求后，会首先验证该请求的合法性。它会检查Pod的配置文件是否符合语法规范、名称是否唯一等。
调度器分配节点: 如果验证通过，调度器（Scheduler）将被触发。调度器负责将Pod调度到集群中的节点上。它会考虑节点的资源可用性、亲和性策略、节点标签匹配等因素来做出决策。
容器镜像拉取: 在选择的节点上，Kubernetes会尝试拉取Pod配置文件中定义的容器镜像。如果镜像不存在于节点上，它将从注册中心（如Docker Hub）下载镜像到节点上的本地存储。
创建Pod和容器: 一旦容器镜像就绪，Kubernetes会在节点上创建Pod，并在Pod内部创建容器。这包括创建容器的Linux命名空间、网络命名空间、IPC命名空间等，以及配置容器的资源限制、环境变量等。
Pod状态监控: Kubernetes会监控Pod的状态。它会定期向Pod中的容器发送探测请求（例如Liveness Probe），以检查容器的健康状态。如果容器出现故障，Kubernetes将采取相应的操作，例如重新启动容器或调度到其他节点。
Pod调度和重调度: 如果发生节点故障或资源不足等情况，Kubernetes可能会重新调度Pod。它会选择一个新的节点，并在新节点上重新创建Pod和容器，以确保应用程序的高可用性和可靠性。

以上是Kubernetes创建一个Pod的主要流程。整个过程涉及多个组件（如API服务器、调度器）的协作，以及对容器镜像、节点资源和健康状态的管理。

# 您为什么加入我们

我比较看重公司的技术发展方向和业务稳定性。我了解到贵公司目前在云原生、自动化运维、系统稳定性建设这块投入比较大，这和我过去的工作经历比较匹配。

我自己有多年 Linux、Kubernetes、CI/CD、监控告警、日志平台建设经验，也做过生产问题排查、发布流程优化、容器平台维护等工作。我希望能在新的平台里，把之前积累的运维体系建设经验真正落地，同时也进一步提升自己在云原生和自动化方向的能力。

另外我也比较认可团队协作和长期发展的工作环境，希望能稳定地和团队一起把平台做得更成熟。

# 您希望从公司获得什么样的成功

我希望主要有三个方面的成长：

第一是技术深度。我目前已经有比较完整的传统运维和 DevOps 经验，但希望继续深入云原生、Kubernetes 平台治理、服务网格、自动化运维体系这些方向。

第二是架构能力。以前更多偏平台运维和故障处理，未来我希望能够更多参与基础架构设计，比如高可用架构、稳定性建设、发布体系优化、成本优化等。

第三是业务理解能力。我认为优秀运维不仅是维护服务器，更重要的是理解业务运行逻辑，通过技术手段帮助业务提升稳定性和效率。

# 您现有的职业技能/未来潜力可以为公司的发展做出那些贡献

我觉得我能提供的价值主要有几个方面：

# 第一，稳定性建设经验

我有多年生产环境运维经验，处理过很多线上故障，比如：

Kubernetes 集群问题
日志阻塞
Redis 内存告警
发布异常
服务不可用
网络故障排查

我比较重视“先恢复业务，再分析根因”的思路，能够快速定位和推进问题处理。

# 第二，自动化和效率提升

我做过：

CI/CD 自动化发布
Jenkins/GitLab CI 流水线
Kubernetes 自动化部署
Prometheus + Grafana 监控体系
ELK/OpenSearch 日志平台

能够帮助团队减少重复操作，提高发布效率和稳定性。

# 第三，云原生与平台能力

我对 Kubernetes、Docker、Ingress、Gateway API、服务治理等有比较深入实践，能够参与：

容器平台建设
运维标准化
集群稳定性优化
发布体系建设

# 第四，AI智能体应用能力（这是你很大的加分项）

我目前也在结合 AI 智能体提升运维效率，比如：

AI 辅助故障分析
自动生成运维脚本
日志分析
接口自动化处理
运维平台开发

我认为未来 AI + 运维会越来越重要，这方面我也会持续投入。

# 您对加入我们公司有那些方面的顾虑

我目前主要关注两个方面：

第一是团队协作和技术氛围。因为运维很多工作需要跨团队配合，我比较希望团队之间沟通机制比较顺畅。

第二是技术发展方向。我希望未来能持续接触云原生、自动化、平台化相关内容，因为这也是我长期发展的重点方向。

除此之外，我对新的环境还是比较开放的，更希望能够尽快融入团队并创造价值。

# 场景一：Pod 卡在 Pending，你以为是资源不够？

前几天，测试团队反馈新上线的服务一直起不来，kubectl get pod 看到状态是 Pending。第一反应：是不是节点资源不够？赶紧 kubectl describe pod xxx 一看：

Events:
  Type     Reason            Age   From               Message
  ----     ------            ----  ----               -------
  Warning  FailedScheduling  2m    default-scheduler  0/5 nodes are available: 5 Insufficient cpu.

1
2
3
4

看起来确实是 CPU 不够。但奇怪的是，集群明明还有两台空闲节点，CPU 使用率不到30%。这时候很多人就懵了：“资源明明够啊，为啥调度不过去？”

真相其实是：QoS 和 PriorityClass 在背后搞鬼。

我们项目里为了保障核心服务，给某些 Pod 设置了高优先级（PriorityClass）。而这个新上线的服务没配，结果被调度器直接“降级”了——即使有资源，也得等高优先级任务跑完再说。

排查命令：

# 查看当前集群所有 PriorityClass
kubectl get priorityclass

# 查看 Pod 是否绑定了 PriorityClass
kubectl get pod <pod-name> -o jsonpath='{.spec.priorityClassName}'

1
2
3
4
5

解决办法：

如果是非核心业务，可以临时调低其他高优 Pod 的副本数；
或者给这个新服务也配上合适的 PriorityClass；
更彻底的做法是：在命名空间级别设置 ResourceQuota + LimitRange，避免资源被无限制抢占。

💡 小提醒：别只看 kubectl describe 的 Events 表面信息。有时候“Insufficient cpu”只是障眼法，真正原因是亲和性（affinity）、污点（taint）或调度插件策略。

# 🌪️ 场景二：服务间歇性 503，日志却一切正常？

这是最让人抓狂的问题之一。用户访问接口，偶尔返回 503 Service Unavailable，但 kubectl logs 看应用日志，完全正常，连 error 都没有。重启 Pod？暂时好了，几小时后又来。

一开始以为是应用 Bug，后来发现：根本不是应用的问题，而是 conntrack 表溢出了！

K8s 默认用 iptables 做 Service 转发，而 iptables 依赖内核的 conntrack 模块记录连接状态。当并发连接数暴增（比如大促、压测、爬虫攻击），conntrack 表满了，新连接直接被丢弃，表现为“服务不可达”，但容器本身毫无感知。

怎么确认？

登录到 Pod 所在节点，执行：

# 查看当前 conntrack 连接数
sysctl net.netfilter.nf_conntrack_count

# 查看最大限制
sysctl net.netfilter.nf_conntrack_max

1
2
3
4
5

如果 count 接近 max（默认一般是 65536），基本就是它了。

解决方案：

临时扩容（应急）：

sysctl -w net.netfilter.nf_conntrack_max=262144

长期优化：
- 改用 IPVS 模式（性能更好，不依赖 conntrack）；
- 或者调整 kube-proxy 配置，启用 strictARP: true + 合理设置 conntrack 参数；
- 对外暴露的服务，前面加一层 Nginx 或 LVS 做连接收敛。

📌 血泪教训：有一次我们没注意，大促当天凌晨 conntrack 满了，导致支付回调失败，损失几十万订单。从此以后，监控里必加 nf_conntrack_count 指标。

# 场景三：PVC 挂载失败，Pod 卡在 ContainerCreating

这种情况太常见了。你写了个 StatefulSet，挂了个 PVC，结果 Pod 一直卡在 ContainerCreating，describe 一看：

MountVolume.SetUp failed for volume "pvc-xxx" : mount failed: exit status 32

或者：

Unable to attach or mount volumes: unmounted volumes=[data], unattached volumes=[...]: timed out waiting for the condition

这时候很多人第一反应是：“存储后端挂了？” 但其实，90% 的情况是 StorageClass 配置问题或权限不对。

举个真实例子：我们用的是 NFS 作为后端存储，StorageClass 里写了 mountOptions: ["vers=4.1"]，但某台 NFS 服务器只支持 vers=3。结果新 Pod 调度到那台机器上就挂载失败。

排查步骤：

看 PV 和 PVC 是否绑定成功：
```
kubectl get pvc -n your-ns
kubectl get pv
```
1
2
如果 PVC 状态是 Pending，说明没找到匹配的 PV。

检查 StorageClass 是否存在且配置正确：

kubectl get storageclass
kubectl describe storageclass your-sc-name

1
2

手动在节点上测试挂载（关键！）：登录到目标节点，用 root 执行：
```
mount -t nfs -o vers=4.1,nolock,proto=tcp your-nfs-server:/path /mnt/test
```
1
如果报错，就能定位是网络、权限还是协议问题。
如果是云厂商（如 AWS EBS、阿里云云盘），还要检查：
- 节点是否在同一可用区（AZ）？
- IAM 权限是否允许挂载？
- 磁盘是否已被其他实例占用？

修复建议：

统一 StorageClass 的 mountOptions；
对 NFS 存储，建议用 nolock,intr,soft 参数避免死锁；
生产环境尽量用 CSI 驱动，而不是 in-tree 插件（已废弃）。

# 🌐 场景四：DNS 解析时有时无，nslookup 正常但 curl 失败？

这个问题特别诡异。你在 Pod 里执行 nslookup kubernetes.default，返回 IP 正常；但 curl http://my-service 却超时。

很多人以为是 CoreDNS 崩了，其实更可能是 DNS 缓存 + ndots 陷阱。

K8s 默认给 Pod 的 /etc/resolv.conf 加了 ndots:5，意思是：如果域名中点少于 5 个，就先尝试拼接 search domain（比如 my-service.namespace.svc.cluster.local）。但如果 search domain 太多，或者网络延迟高，就会导致 DNS 查询超时重试，最终失败。

验证方法：

# 进入 Pod
kubectl exec -it your-pod -- sh

# 查看 resolv.conf
cat /etc/resolv.conf

# 手动测试带完整域名的解析（绕过 ndots）
nslookup my-service.namespace.svc.cluster.local

# 对比短域名
nslookup my-service

1
2
3
4
5
6
7
8
9
10
11

如果短域名慢或失败，长域名正常，基本就是 ndots 问题。

解决方案：

应用层改用 FQDN（完整域名）：比如代码里写 http://my-service.namespace.svc.cluster.local:8080；

调整 Pod 的 dnsConfig：

spec:
  dnsConfig:
    options:
      - name: ndots
        value: "1"
      - name: timeout
        value: "2"

1
2
3
4
5
6
7

升级 CoreDNS 到最新版，并开启缓存插件（cache 30）；
监控 CoreDNS 的 latency 和 error rate，用 Prometheus + Grafana 做告警。

🧠 冷知识：K8s 1.27+ 已支持 dnsPolicy: ClusterFirstWithHostNet，对 hostNetwork Pod 更友好。

# 场景五：节点 NotReady，kubelet 日志全是 “PLEG is not healthy”

某天早上收到告警：多个节点状态变成 NotReady。登录节点一看，systemctl status kubelet 显示 active (running)，但 kubectl get node 就是 NotReady。

查 kubelet 日志：

journalctl -u kubelet -n 100 | grep -i pleg

输出：

PLEG is not healthy: pleg was last seen active 3m ago

PLEG（Pod Lifecycle Event Generator） 是 kubelet 用来监听容器生命周期变化的组件。它卡住，通常是因为 容器运行时响应太慢。

我们当时用的是 containerd，排查发现：

节点上跑了太多 Pod（200+）；
containerd 的 oom_score_adj 没调，被系统 OOM killer 干掉过一次；
磁盘 IO 高，导致 containerd 状态同步延迟。

处理流程：

先隔离节点，防止调度新 Pod：

kubectl cordon node-name
kubectl drain node-name --ignore-daemonsets --delete-local-data --force

1
2

重启 containerd 和 kubelet：

systemctl restart containerd
systemctl restart kubelet

1
2

优化配置：
- 给 containerd 设置更高的 oom_score_adj（比如 -999）；
- 限制单节点 Pod 数量（通过 kubelet 的 --max-pods=110）；
- 使用 SSD 磁盘，避免 IO 瓶颈。

✅ 经验：生产环境单节点 Pod 数别超过 100，否则 kubelet 容易卡死。别信“理论上支持 110”，那是理想值。

# 场景六：镜像拉取失败，但本地 docker pull 正常？

kubectl describe pod 显示：

Failed to pull image "registry.corp.com/app:v1": rpc error: code = Unknown desc = failed to pull and unpack image: failed to resolve reference "...": pull access denied

但你在节点上手动 crictl pull registry.corp.com/app:v1 却成功了！

原因：Pod 没配 imagePullSecrets！

K8s 拉镜像时，会用 Pod 所在命名空间下的 secret 来认证。如果你没显式指定 imagePullSecrets，它就用默认的（通常是空的）。

解决办法：

创建 secret：

kubectl create secret docker-registry regcred \
  --docker-server=registry.corp.com \
  --docker-username=user \
  --docker-password=pass \
  -n your-ns

1
2
3
4
5

在 Deployment 中引用：

spec:
  imagePullSecrets:
    - name: regcred

1
2
3

💥 坑点：Helm chart 里经常漏掉 imagePullSecrets，导致内网部署失败。建议在 values.yaml 里统一配置。

# 🛠️ 我的私藏排错工具箱

最后分享几个我常用的“暗黑”命令，关键时刻能救命：

绕过容器直接抓包（不用进 Pod）：

kubectl debug node/<node> -it --image=nicolaka/netshoot -- tcpdump -i eth0 port 80

查看 Pod 被哪个控制器管理：

kubectl get pod <pod> -o jsonpath='{.metadata.ownerReferences}'

快速导出所有事件（按时间排序）：

kubectl get events --sort-by=.metadata.creationTimestamp -A

检查 kubelet 是否上报心跳：

kubectl get --raw='/api/v1/nodes/<node>/proxy/stats/summary'

诊断镜像（自己打包的）：

FROM alpine:3.18
RUN apk add --no-cache curl jq bind-tools net-tools iproute2 tcpdump
CMD ["sleep", "infinity"]

1
2
3

用法：

kubectl run diag --image=my-diag-tools -it --rm --restart=Never -- sh

# 总结：排错不是玄学，是系统工程

K8s 排错，说难也难，说简单也简单。关键在于：

别慌：先看状态（STATUS），再看事件（Events），最后看日志（Logs）；
分层排查：从 Pod → Node → Network → Storage → Control Plane，一层层剥；
善用工具：kubectl + journalctl + tcpdump + Prometheus，组合拳打满；
预防大于治疗：做好监控、告警、资源限制、健康检查，很多问题根本不会发生。

生产环境没有“不可能”，只有“还没遇到”。你今天省下的一个探针配置，可能就是明天半夜三点的夺命连环 call。

上次更新: 2026/06/15, 01:53:28

← 高级运维工程需要掌握的技能 Kubernetes运维方面的项目经验→