Kubernetes Pod 核心机制全景图：从生命周期、调度分配到底层 Cgroup 剖析

导语：在 Kubernetes 的日常排错与架构设计中，必须穿透 YAML 配置的表象，直击系统底层运作逻辑。本文结合生产实践，系统性拆解 Pod 生命周期、探针配置、资源调度规划、底层 Cgroup 隔离引擎、异构算力纳管以及核心系统自举机制。文章采用“生活化比喻引入 + 纯技术原理解析”的双轨解耦结构，剥离抽象概念，还原 K8s 运行底色，为您提供一份全景式的硬核排障与架构备忘录。

核心知识点导读

Pod 生命周期与状况机制：精准区分 Phase（宏观阶段）与 Condition（微观可用性），破除状态误判陷阱。
探针（Probes）配置规范：明确 Startup、Readiness、Liveness 的核心边界，防范接口复用导致的集群雪崩。
PID 1 信号黑洞防御：解析容器优雅停机失败根因，提供基于 Exec 替换与 Tini 进程管理器的底层解法。
存储与网络层陷阱规避：剖析 emptyDir 的 Mount Overlay 覆盖机制与内存溢出风险；探讨强状态对局业务的平滑升级架构。
资源容量与 QoS 调度体系 (新增)：透视 CPU 毫核精准定义，推演 Requests/Limits 容量规划标准打法，深度解析基于参数推导的资源驱逐优先级（QoS）。
底层 Cgroup 引擎演进与排障 (新增)：拆解 Linux Cgroup v1/v2 目录树，揭秘 Cgroup Driver（cgroupfs/systemd）冲突导致的节点 NotReady 根因；提供针对 CPU Throttling 与 OOMKilled 的底层内核文件抓包实战。
宏观调度链路与异构资源纳管 (新增)：推演 Node Allocatable 到 Pod 绑定的调度过滤流，实战扩展资源（Extended Resources）的定义语法与 Device Plugin 自动上报机制。
系统平台自举与应用解耦 (新增)：揭秘 API Server 诞生的静态 Pod（Static Pod）与影子机制；通过 Downward API 实现业务应用零侵入获取容器级元数据。

一、 Pod 的生命周期：状态（Phase）与状况（Condition）的本质区别

排查 K8s 故障的第一步，是准确区分宏观的阶段（Phase）和微观的条件（Condition）。

💡 【一分钟通俗理解：打工人的入职流】

如果把 K8s 集群比作大公司，Pod 就是新入职的打工人。

Phase（状态）：是系统在汇报员工大体在干嘛，比如 HR在找工位（Pending）、坐在工位敲代码（Running）、项目做完下班了（Succeeded）、被开除了（Failed）。
Condition（状况）：则是 HR 手里的**“入职通关打卡表”**。员工即便坐在了工位上（Running），也不代表能立刻接单。必须确认工位分配了没？岗前培训做了没？业务软件打开了没？只有打卡表上所有项目打勾（Ready为True），才能正式对外工作。

⚙️ 【底层原理解析：核心技术剖析】

1. Phase（Pod 阶段）
Pod 的生命周期是一个不可逆的单向状态机，包含 5 种官方定义的 Phase：

Pending：API Server 已接受 Pod 创建请求，但 Pod 未被调度到节点，或镜像正在下载。
Running：Pod 已绑定到节点，所有容器已创建，至少一个容器正在运行、启动或重启。
Succeeded：Pod 中的容器全部正常终止（退出码 0）。
Failed：至少一个容器异常终止（退出码非 0）。
Unknown：Kubelet 通信丢失，无法获取状态。

2. Condition（Pod 状况）
Condition 是包含在 Pod status 字段中的数组，决定了 Pod 是否真正可用。核心字段包括：

PodScheduled：调度器是否已成功将 Pod 绑定到节点。
Initialized：所有的 Init 容器是否都已成功执行并退出。
Ready：决定了 Pod 能否对外提供服务。如果为 False，K8s 会将该 Pod 的 IP 从 Service 的 Endpoints 中动态剔除。

⚠️ 生产避坑指南：

CrashLoopBackOff 或 ImagePullBackOff 不是官方的 Phase，它们是 Running 或 Pending 阶段下的具体报错原因（Reason）。
遇到平台自定义的 FileSizeExceeded: False 或原生的 DiskPressure: False 时，False 代表没有发生异常压力，属于健康状态。

二、探针（Probes）：决定 Pod 生死的”三大组件”

💡 【一分钟通俗理解：餐厅厨师与监工】

把应用程序当成餐厅厨师，K8s 派了三个监工来管理他：

启动探针（Startup）—— 开工确认员：问厨师“你换好衣服备好料了吗？”在确认开工前，别人不准打扰他。
就绪探针（Readiness）—— 接单调度员：每隔几秒问“你现在忙得过来、能接新客吗？”如果厨师去上厕所了，调度员就暂时不给他派单，等他回来再派（只切流量，不杀进程）。
存活探针（Liveness）—— 生死判官：每隔几秒戳厨师“你还有呼吸吗？”如果没反应，直接拖出去换新厨师（重启容器）。

⚙️ 【底层原理解析：探针底层机制与规范】

StartupProbe：专为慢启动容器设计。探测成功前，禁用其他所有探针。成功一次后即刻退出当前 Pod 生命周期。
ReadinessProbe：控制流量路由控制器。探测失败时，Endpoints Controller 会将该 Pod IP 从匹配的 Service 中移除；恢复后重新加入。此探针失败绝不触发容器重启。
LivenessProbe：监控进程僵死状态。探测失败时，kubelet 会向容器发送系统终止信号，并根据 restartPolicy 重启容器。

⚠️ 生产避坑指南：/healthz 滥用导致的雪崩
严禁将 Readiness 和 Liveness 指向同一个包含了外部依赖检查的 /healthz 接口！

Liveness 接口设计：必须极其轻量（如 /ping 仅返回 200），绝对不要检查外部依赖（如 MySQL、Redis）。只要当前应用进程还在响应，就证明容器存活。
Readiness 接口设计：必须深入检查外部依赖。连不上数据库时应返回 503 等错误码，让 K8s 及时切走流量。
雪崩场景：如果两者共用查库接口，当数据库网络抖动 10 秒时，Liveness 会判定应用死机，进而将整个集群的容器全部强杀重启，引发业务彻底瘫痪。

三、 PID 1 信号黑洞：进程无法优雅退出的根本原因

💡 【一分钟通俗理解：聋哑前台与业务员】

容器就像一家公司，PID 1（一号进程）是前台，你的业务进程是里屋干活的业务员。K8s 要断电时会提前 30 秒向公司前台发广播（下达撤离信号）。如果你的启动命令写得不好，相当于雇了一个**“又聋又哑的保安（Shell 进程）”**当前台。保安听到广播，却不会转告给里屋的业务员。业务员一直干到第 30 秒，被物业冲进来暴力拉闸，导致处理一半的数据丢失。

⚙️ 【底层原理解析：信号传递与进程管理机制】

Linux PID Namespace：K8s/Docker 在停止容器时，只会向容器内的 PID 1 进程发送 SIGTERM 信号。默认提供 terminationGracePeriodSeconds（30 秒）宽限期，超时后内核发送 SIGKILL 强制终止。
Shell 屏蔽机制：若 Dockerfile 采用 Shell 模式（如 CMD java -jar app.jar），系统底层会被解析为 /bin/sh -c ...。此时 /bin/sh 将霸占 PID 1，而原生 Shell 进程默认不会将其收到的系统信号转发给其衍生的子进程。

💻 【实战代码演示：优雅停机解法】

方案 1：Exec 进程替换大法（推荐）
使用 exec 指令，令业务进程直接接管并替换 Shell 成为 PID 1 进程。

1
2
3

#!/bin/sh
# 前置准备工作...
exec java -jar app.jar  # 夺舍 PID 1，直接接收内核操作系统信号

方案 2：修改 Dockerfile 为 Exec 数组格式

1 2	`# 正确写法（直接拉起业务进程作为 PID 1）： CMD ["java", "-jar", "app.jar"]`

方案 3：引入 Tini 初始化管理器（适配多进程容器）
tini 专为容器化环境设计，可完美接管 PID 1，负责透明转发信号并清理僵尸进程。

1
2
3

RUN apk add --no-cache tini
ENTRYPOINT ["/sbin/tini", "--"]
CMD ["java", "-jar", "app.jar"]

四、存储的伪装者：`emptyDir` 目录共享陷阱

💡 【一分钟通俗理解：被白板盖住的草稿本】

emptyDir 是 K8s 动态下发给项目组的一块“公共空白黑板”。容器 A 自带了一个写满配置的草稿本，如果容器 A 决定把这块公共黑板挂在原先放草稿本的位置。结果就是：原来的草稿本被黑板彻底盖住了，容器只能面对空空如也的黑板发呆。

⚙️ 【底层原理解析：Mount Overlay 覆盖机制】

生命周期挂载：emptyDir 是随着 Pod 生命周期动态分配在 Node 磁盘或内存上的空目录。
底层挂载逻辑：在 Linux 文件系统 Mount 机制中，不存在“目录内容自动合并”逻辑，仅存在“覆盖/隐藏（Overlay）”机制。当容器将 Volume 挂载到其内部含有原生镜像文件的路径（如 /etc/nginx）时，该路径下的所有原生文件都会被底层文件系统隐藏。若只需覆盖单个文件而不隐藏目录，必须启用 volumeMounts.subPath 属性。

五、架构降维探讨：强状态业务如何平滑升级？

与无状态 Web 服务不同，强状态长连接业务（如多人在线对战游戏服务器），无法使用 Deployment 原生的 RollingUpdate（滚动更新），否则会强行阻断当前活跃的 TCP 连接。落地此类架构需依赖以下机制组合：

⚙️ 【底层原理解析：强状态 Pod 编排逻辑】

状态隔离 (State Allocation)：业务网关将玩家路由至某 Pod 后，修改该 Pod 元数据，将其打上 Allocated（已分配）标记，从公共调度池中逻辑摘除。
防驱逐标记 (Safe to Evict)：利用 K8s Annotation 为活跃 Pod 动态注入 cluster-autoscaler.kubernetes.io/safe-to-evict: "false"，强迫 HPA 与 Cluster Autoscaler 绕过该节点。
主动退场机制 (Active Lifecycle Management)：应用服务端集成 K8s SDK，在对局彻底结束且 TCP 队列清空后，由应用层主动调用 API Server 发送 ReadyForShutdown 信号（如配合 Agones CRD 控制器），进而执行资源的最终回收。

六、资源调度与 QoS 体系：Requests、Limits 与毫核的博弈

💡 【一分钟通俗理解：披萨切片与工位租赁】

计算 CPU 毫核（m）：把 1 个核心的算力想象成一张大比萨。对于胃口小的微服务，K8s 会将比萨精准切成 1000 个小块（1000m）。如果你点 250m，得到的就是极其精确的四分之一张比萨算力。
Requests 与 Limits 机制：想象你带团队去租联合办公区。Requests 是你签合同“长租的固定工位”，无论你用不用，老板必须给你留着（资源保底）；Limits 则是“允许临时蹭用的弹性座位”，只要大厅有空位你最多可以去坐，但一旦总人数超标，多出来的人会被赶走（触发节流限速）。
QoS（赶人优先级）：当大楼电力严重不足时，保安按阶级赶人：完全不花钱蹭网的（BestEffort）最先被赶；只交基础费但喜欢多带人来的中产团队（Burstable）其次；花大价钱且承诺不超员的顶级 VIP（Guaranteed）最安全。

⚙️ 【底层原理解析：容量规划与 QoS 评定】

CPU 的绝对资源定义：在 K8s 中，1 CPU 严格等价于云平台 1 vCPU 或裸金属机 1 个超线程。不论宿主机是 2 核还是 48 核，申请 250m（0.25核）所获得的时间分片算力是��对一致的。
Requests 核心逻辑：作为调度器（Scheduler）进行 Node 调度的唯一依据。节点的总 Requests 累加绝不能超越物理极限。
Limits 核心逻辑：作为容器运行时（Runtime）的硬限制。注意：CPU 是可压缩资源，触及 Limit 时仅触发进程节流（Throttling），应用变卡；Memory 是不可压缩资源，触及 Limit 时系统会直接触发 OOMKilled，强制终结进程。
QoS Class 判定法则：
- Guaranteed：所有容器的 Requests 严格等于 Limits（含 CPU 和内存）。
- Burstable：非 Guaranteed 且至少为一个容器设置了 Requests 或 Limits。
- BestEffort：所有容器完全未配置任何资源请求与限制。

💻 【实战代码演示：资源分配与调优避坑】

标准 Java 业务的最佳实践（Burstable 评级，预防 OOM 频发）：

resources:
  requests:
    cpu: "250m"      # 依据日常平稳态监控均值 + 20% 冗余设定
    memory: "512Mi"  
  limits:
    cpu: "1"         # 依据压测峰值设定，允许突破弹性极限
    memory: "512Mi"  # 【强烈建议】内存 Limits 应当等同于 Requests 避免级联驱逐

提示：Java 应用必须配合 -XX:MaxRAMPercentage=75.0 等启动参数，让 JVM 感知容器的 Limit 上限，避免进程申请过多堆内存被内核强杀。

七、资源隔离引擎：Cgroup 架构、驱动演进与抓包排障

💡 【一分钟通俗理解：大厦配电室与双重账本冲突】

Cgroup 现场：K8s 的资源限制本质就是大厦的“物业配电总控制室”。K8s 在控制室建立了一个名为 kubepods 的主柜子，里面按阶级抽屉（QoS）分类，存放了所有租户的用电合同（Limits 数字）。
驱动冲突引发 NotReady：如果物业财务总监 A（Kubelet）习惯用 Excel 记账（cgroupfs），而出纳员 B（Containerd）习惯用账本记账（systemd），底层两套数据不互通，账目必定混乱崩溃，整个节点系统就会罢工。

⚙️ 【底层原理解析：Cgroup 层级树与驱动演进机制】

Cgroup 底层投射：YAML 配置最终由 Kubelet 翻译为 Linux 伪文件系统 /sys/fs/cgroup 目录下的硬件指标管控文件。Requests CPU 对应 cpu.shares（权重比），Limits CPU 对应 cpu.cfs_quota_us 配合 cpu.cfs_period_us（绝对硬通货算力）。
Cgroup v1 与 v2 演进：老旧的 Cgroup v1 将资源分散挂载为多棵树（CPU、Memory 互相独立），跨子系统协调困难。而现代内核默认启用的 Cgroup v2（如 Ubuntu 22.04）使用 Unified Hierarchy（统一层级树），从根本上避免了僵尸页（Page Cache）逃逸等问题。
Cgroup Driver 一致性：为避免运行时隔离失效或节点频繁处于 NotReady 状态，必须强制 kubelet 与容器运行时（Containerd/CRI-O）采用相同的驱动。Kubernetes 官方目前强烈推荐统一使用原生系统的 systemd 驱动。

💻 【实战代码演示：Cgroup 抓包与驱动平滑升级】

1. 排障：深入 Cgroup v2 案发现场抓包
面对 CPU 使用率极低但应用剧烈卡顿的假象，直击内核底层调度的拒绝记录：

# 验证进程 CPU 节流 (Throttling) 次数
cat /sys/fs/cgroup/kubepods.slice/kubepods-burstable.slice/pod<UID>/<ContainerID>/cpu.stat
# 关注 nr_throttled 字段，若数值在每秒激增，证明 CPU Limit 设定过小或并发突增严重

# 验证 OOM 内核强杀判定
cat /sys/fs/cgroup/kubepods.slice/kubepods-burstable.slice/pod<UID>/<ContainerID>/memory.events
# 关注 oom_kill 字段，若大于 0，无需查阅业务日志，直接判定为内存溢出被系统击杀。

2. 演进：腾笼换鸟平滑切换 Cgroup Driver
不可在活跃节点原地热修改驱动。需通过滚动驱逐机制切换为 systemd：

# 1. 驱逐业务负载，排空节点
kubectl drain <node-name> --ignore-daemonsets --delete-emptydir-data
# 2. 停服并修改 containerd 与 kubelet 配置文件中的 cgroup_driver = systemd
systemctl stop kubelet containerd
# 3. 启动应用并解封节点
systemctl start containerd kubelet
kubectl uncordon <node-name>

八、宏观调度链路与异构算力（扩展资源）纳管

💡 【一分钟通俗理解：酒店摸底与私有游戏机资产登记】

资源摸底：酒店每建成一栋楼（Node），楼管会向总台（API Server）汇报可用的床位。为了保障保安的生活，总台会在账本上扣除掉保安专用的床位，剩下的才供游客预订。
异构扩展资源：酒店原本只认“床位”，如果你买了一批 PS5 游戏机放进房间，总台是不知道的。你需要手动拿着文件去总台登记：“这里有 5 台特殊的 sony.com/ps5 资产”。以后只要客人的订单上写了要 PS5，总调度器就会自动帮他分配，并实时扣减库存账本。

⚙️ 【底层原理解析：Allocatable 与 Opaque Integer 扩展机制】

调度核心公式：调度器执行 Filter（过滤）与 Score（打分）的依据是 Node Allocatable 预留容量。公式为：Allocatable = Capacity - KubeReserved - SystemReserved。如果节点 Requests 触顶，即便当前 CPU 处于 0% 负载，新的 Pod 仍将陷入 Pending。
扩展资源 (Extended Resources)：Kubernetes 允许接入非标硬件（如 GPU、RDMA、硬件加密狗等）。此类资源必须遵循 Fully Qualified Domain Name（如 mycorp.com/dongle）命名规范，并在内核中被定义为不透明整数（Opaque Integer Resources），严禁请求小数值（如 0.5）。
Device Plugin 架构：针对真实硬件（如 NVIDIA GPU），业界标准通过部署 DaemonSet 模式的设备插件自动发现硬件拓扑，并通过 gRPC 接口热更新 Kubelet 容量清单，无需人工干预。

💻 【实战代码演示：API 注册扩展资源】

当接入纯逻辑隔离资源（如私有软件许可 License）时，可通过 JSON Patch 操作 Node 对象的 Status：

# 启动本地代理
kubectl proxy &

# 发送 PATCH 请求修改节点账本，通告 2 个硬件加密狗资源
# 避坑：JSON Patch 规范要求路径中的 '/' 必须转义为 '~1'
curl --header "Content-Type: application/json-patch+json" \
--request PATCH \
--data '[{"op": "add", "path": "/status/capacity/mycorp.com~1dongle", "value": "2"}]' \
http://localhost:8001/api/v1/nodes/<node-name>/status

在 Pod 中申请消费该自定义资源（Limits 与 Requests 必须保持一致）：

1
2
3

resources:
  limits:
    mycorp.com/dongle: 1

九、平台自举与应用解耦：静态 Pod 与 Downward API

💡 【一分钟通俗理解：创始人特批通行证与特种兵身份卡】

静态 Pod (Static Pod)：普通员工必须通过公司 HR 系统（API Server）录入才能分配工位。但 HR 系统自己还没搭建时谁来招人？公司创始人拿着“特批文件（YAML）”直接交给保安（Kubelet），保安无条件让他们入驻大楼。为了让其他人查到他们的存在，系统上线后会生成一份“影子档案”。
Downward API：如果把应用程序比作蒙面空投的特种兵，由于被关在黑盒（容器）里，他无法知道自己代号是什么、在哪个战区。K8s 会在他跳伞前塞一张信息卡片，他落地一掏口袋，就能知道自己的名字、IP 甚至是被分配了多少子弹额度。

⚙️ 【底层原理解析：Kubelet 私有守护与元数据反向注入】

平台自举枢纽：静态 Pod
静态 Pod 完全脱离 API Server 调度控制，仅通过 Kubelet 定期扫描主机本地文件路径（如 --pod-manifest-path=/etc/kubernetes/manifests）进行自我管理。Kubeadm 正是利用此特性，由 Kubelet 原地拉起 kube-apiserver、etcd 等核心控制面组件，完成集群启动。同时，Kubelet 会反向向 API Server 创建只读的 Mirror Pod（镜像 Pod）以确保集群状态的全局可见性。删除 API 中的 Mirror Pod 无法真正消灭底层进程。
环境解耦机制：Downward API
实现应用进程与 Kubernetes 平台 API 彻底解耦的核心机制。可通过 env (环境变量) 或 volumeMounts (挂载卷) 模式，将 Pod 的 Metadata（Name、Namespace、Labels）或 Resource limits 零侵入地注入至容器内，为应用侧监控追踪、内存线程池动态计算提供内省能力。

💻 【实战代码演示：Downward API 变量注入】

通过 Downward API 获取资源限界并透传给业务代码：

apiVersion: v1
kind: Pod
metadata:
  name: my-web-app
  namespace: prod
spec:
  containers:
    - name: my-container
      image: nginx
      env:
        # 获取外部属性 (fieldRef)
        - name: MY_POD_NAME
          valueFrom:
            fieldRef:
              fieldPath: metadata.name
        # 获取底层容器资源限制额度 (resourceFieldRef)
        - name: MY_CPU_LIMIT
          valueFrom:
            resourceFieldRef:
              containerName: my-container
              resource: limits.cpu

📚 参考资料

Pod 生命周期与探针规范
- Kubernetes 官方文档：Pod Lifecycle
- Kubernetes 官方文档：配置存活、就绪和启动探针
底层隔离机制与 Cgroup 架构
- Linux 内核文档：Cgroup v2 规范设计
- Kubernetes 官方文档：迁移至 systemd Cgroup 驱动
调度、资源配额与硬件解耦
- Kubernetes 官方文档：扩展资源的通告机制
- Kubernetes 官方文档：通过 Downward API 暴露信息
容器基础组件
- GitHub：Tini - 极简的容器 init 系统

代码笔记

#云原生 #Kubernetes #架构设计

Kubernetes Pod 核心机制全景图：从生命周期、调度分配到底层 Cgroup 剖析

https://yangfanbin.cn/代码笔记/Kubernetes Pod 生命周期、探针配置与底层机制解析/

作者

Yang Fanbin

发布于

2026年3月9日

许可协议

写给程序员的 AI 概念极简图鉴：从神经网络到 AI Agent 的演进之路上一篇

一文看透「容器运行时」与「容器构建」：大白话拆解 containerd、runc 与 BuildKit 下一篇

Kubernetes Pod 核心机制全景图：从生命周期、调度分配到底层 Cgroup 剖析

Kubernetes Pod 核心机制全景图：从生命周期、调度分配到底层 Cgroup 剖析

核心知识点导读

一、 Pod 的生命周期：状态（Phase）与状况（Condition）的本质区别

💡 【一分钟通俗理解：打工人的入职流】

⚙️ 【底层原理解析：核心技术剖析】

二、 探针（Probes）：决定 Pod 生死的”三大组件”

💡 【一分钟通俗理解：餐厅厨师与监工】

⚙️ 【底层原理解析：探针底层机制与规范】

三、 PID 1 信号黑洞：进程无法优雅退出的根本原因

💡 【一分钟通俗理解：聋哑前台与业务员】

⚙️ 【底层原理解析：信号传递与进程管理机制】

💻 【实战代码演示：优雅停机解法】

四、 存储的伪装者：emptyDir 目录共享陷阱

💡 【一分钟通俗理解：被白板盖住的草稿本】

⚙️ 【底层原理解析：Mount Overlay 覆盖机制】

五、 架构降维探讨：强状态业务如何平滑升级？

⚙️ 【底层原理解析：强状态 Pod 编排逻辑】

六、 资源调度与 QoS 体系：Requests、Limits 与毫核的博弈

💡 【一分钟通俗理解：披萨切片与工位租赁】

⚙️ 【底层原理解析：容量规划与 QoS 评定】

💻 【实战代码演示：资源分配与调优避坑】

七、 资源隔离引擎：Cgroup 架构、驱动演进与抓包排障

💡 【一分钟通俗理解：大厦配电室与双重账本冲突】

⚙️ 【底层原理解析：Cgroup 层级树与驱动演进机制】

💻 【实战代码演示：Cgroup 抓包与驱动平滑升级】

八、 宏观调度链路与异构算力（扩展资源）纳管

💡 【一分钟通俗理解：酒店摸底与私有游戏机资产登记】

⚙️ 【底层原理解析：Allocatable 与 Opaque Integer 扩展机制】

💻 【实战代码演示：API 注册扩展资源】

九、 平台自举与应用解耦：静态 Pod 与 Downward API

💡 【一分钟通俗理解：创始人特批通行证与特种兵身份卡】

⚙️ 【底层原理解析：Kubelet 私有守护与元数据反向注入】

💻 【实战代码演示：Downward API 变量注入】

📚 参考资料

二、探针（Probes）：决定 Pod 生死的”三大组件”

四、存储的伪装者：`emptyDir` 目录共享陷阱

五、架构降维探讨：强状态业务如何平滑升级？

六、资源调度与 QoS 体系：Requests、Limits 与毫核的博弈

七、资源隔离引擎：Cgroup 架构、驱动演进与抓包排障

八、宏观调度链路与异构算力（扩展资源）纳管

九、平台自举与应用解耦：静态 Pod 与 Downward API