最近看到一篇很有意思的海外实战文章:一位来自德国的工程师,在真实 GPU 环境中,把 CNCF 项目 kagent 与 HAMi 跑在了一起,并验证了 AI Agent 如何直接管理 Kubernetes 中的 GPU 虚拟化资源。
这篇文章最有价值的地方,不是"介绍功能",而是完整记录了真实部署、踩坑、调试与验证过程。包括:
- 使用 HAMi 将一张 NVIDIA L40S 虚拟化为 10 张 vGPU
- 使用 kagent 让 AI Agent 直接调用 Kubernetes API
- Agent 自动创建 GPU Pod 并理解 HAMi GPU 分配结果
- 多 Agent 协作(A2A)
- 基于开源模型与 OpenAI-compatible API 完整运行
我们认为,这类真实工程实践,比单纯 benchmark 或功能介绍更能体现 AI Infra 的演进方向。
尤其值得关注的是:
Kubernetes 正在从"容器编排系统",逐渐演化为 AI Runtime 与 GPU Control Plane,而 HAMi 也开始进入 AI Agent、AI Infra、GPU 资源抽象等更大的技术叙事中。
以下为原文翻译。
HAMi 社区正式发布 HAMi v2.9.0。这是一个在异构设备虚拟化深度、调度器生态扩展与 Kubernetes 原生标准落地层面具有里程碑意义的版本。
v2.9.0 引入了昇腾 910C HAMi-core 模式、HAMi-DRA 正式可用、项目发布以及 Volcano vGPU 升级至 v0.19 等重磅特性,同时在可观测性、安全性、稳定 性等方面进行了系统性增强,共有 19 位新贡献者首次参与。
本文将对 v2.9.0 的主要更新进行详细说明。
在 Kubernetes 中管理 GPU 资源,长期以来存在一个"盲区"。你知道 GPU 在被使用,但要回答"哪个节点还有空闲?"、"这个工作负载是否真的在用分配到的 GPU?"、"集群整体 GPU 利用率趋势如何?"这些问题,往往需要在 kubectl get、Prometheus PromQL 和日志输 出之间反复切换。
今天,HAMi 社区正式推出 HAMi WebUI,一款将整个 GPU 集群呈现在单一可视化界面中的开源 GPU 监控仪表盘。
HAMi WebUI v1.1.0 现已作为首个正式主要版本发布,邀请你试用。
与 HAMi 核心调度器配合,WebUI 实现了完整的闭环:从 GPU 调度到可视化可观测性。
刚刚结束的 KubeCon + CloudNativeCon Europe 2026,释放出一个越来越明确的行业信号:
云原生正在快速从“应用运行平台”演进为 AI 基础设施的运行底座。
在阿姆斯特丹,围绕 Kubernetes、GPU、推理服务、Agentic AI 和异构算力调度的讨论,已经不再停留在概念层面,而是进入到更具体的工程实践、社区协作与基础设施范式演进阶段。
刚刚过去的 KCD Beijing 2026,是近年来规模最大的一次 Kubernetes 社区大会之一。
超过 1000 人报名参与,刷新历届 KCD 北京记录。
HAMi 社区不仅受邀进行了技术分享,也在现场设立了展台,与来自云原生与 AI 基础设施领域的开发者、企业用户进行了深入交流。
本次分享主题为:
从 Device Plugin 到 DRA:GPU 调度范式升级与 HAMi-DRA 实践
本文结合现场分享内容与 PPT,做一次更完整的技术回顾。附幻灯片下载:GitHub - HAMi-DRA KCD Beijing 2026。
下周,HAMi 将在 KubeCon + CloudNativeCon Europe 2026 的多项活动中亮相,包括 Project Pavilion 展台、技术分享、主舞台 Demo,以及会后 AI 相关活动。
作为 CNCF Sandbox 项目,HAMi 关注的 GPU 虚拟化、共享与调度问题,正在与 Kubernetes 生态中的 AI 基础设施议题发生越来越直接的交汇。KubeCon + CloudNativeCon Europe 2026 将于 3 月 23 日至 26 日在阿姆斯特丹举行,其中 3 月 23 日为 pre-event programming,3 月 24 日至 26 日为主会期。
HAMi 社区正式发布 HAMi v2.8.0。这是一个在 架构完整性、调度可靠性以及生态对齐 层面具有里程碑意义的版本。
v2.8.0 不仅引入了多项关键特性更新,也在 Kubernetes 原生标准对齐、异构设备支持、生产可用性与可观测性 等方面进行了系统性增强,使 HAMi 更加适合在长期运行、对稳定性和演进路径敏感的 AI 生产集群中使用。
本文将对 v2.8.0 的主要更新进行详细说明。
11 月 30 日,首场 HAMi Meetup 在上海圆满结束。本次活动以"不卷算力卷效率"为主题,近百位 AI 开发者、运维工程师、企业 IT 架构师齐聚现场,聚焦异构算力调度的核心命题。
