8 篇文章文档包含 "Kubernetes"

查看全部标签

我实测了：AI Agent 已经可以直接管理 Kubernetes GPU 资源

2026年5月28日 · 阅读需要 7 分钟

Mesut Oezdil

Author

作者： Mesut Oezdil / GitHub
原文： mesutoezdil.substack.com
GitHub Repo： kagentWithHami
中文翻译： Jimmy Song（原文发布于微信公众号）

引言

最近看到一篇很有意思的海外实战文章：一位来自德国的工程师，在真实 GPU 环境中，把 CNCF 项目 kagent 与 HAMi 跑在了一起，并验证了 AI Agent 如何直接管理 Kubernetes 中的 GPU 虚拟化资源。

这篇文章最有价值的地方，不是"介绍功能"，而是完整记录了真实部署、踩坑、调试与验证过程。包括：

使用 HAMi 将一张 NVIDIA L40S 虚拟化为 10 张 vGPU
使用 kagent 让 AI Agent 直接调用 Kubernetes API
Agent 自动创建 GPU Pod 并理解 HAMi GPU 分配结果
多 Agent 协作（A2A）
基于开源模型与 OpenAI-compatible API 完整运行

我们认为，这类真实工程实践，比单纯 benchmark 或功能介绍更能体现 AI Infra 的演进方向。

尤其值得关注的是：

Kubernetes 正在从"容器编排系统"，逐渐演化为 AI Runtime 与 GPU Control Plane，而 HAMi 也开始进入 AI Agent、AI Infra、GPU 资源抽象等更大的技术叙事中。

以下为原文翻译。

HAMi v2.9.0 发布：昇腾用户态切分、DRA 正式可用与调度生态扩展

2026年5月11日 · 阅读需要 14 分钟

HAMi 社区

HAMi 社区正式发布 HAMi v2.9.0。这是一个在异构设备虚拟化深度、调度器生态扩展与 Kubernetes 原生标准落地层面具有里程碑意义的版本。

v2.9.0 引入了昇腾 910C HAMi-core 模式、HAMi-DRA 正式可用、项目发布以及 Volcano vGPU 升级至 v0.19 等重磅特性，同时在可观测性、安全性、稳定性等方面进行了系统性增强，共有 19 位新贡献者首次参与。

本文将对 v2.9.0 的主要更新进行详细说明。

HAMi WebUI 正式发布：Kubernetes GPU 监控仪表盘

2026年4月13日 · 阅读需要 6 分钟

HAMi 社区

在 Kubernetes 中管理 GPU 资源，长期以来存在一个"盲区"。你知道 GPU 在被使用，但要回答"哪个节点还有空闲？"、"这个工作负载是否真的在用分配到的 GPU？"、"集群整体 GPU 利用率趋势如何？"这些问题，往往需要在 kubectl get、Prometheus PromQL 和日志输出之间反复切换。

今天，HAMi 社区正式推出 HAMi WebUI，一款将整个 GPU 集群呈现在单一可视化界面中的开源 GPU 监控仪表盘。

HAMi WebUI v1.1.0 现已作为首个正式主要版本发布，邀请你试用。

与 HAMi 核心调度器配合，WebUI 实现了完整的闭环：从 GPU 调度到可视化可观测性。

KubeCon EU 2026 回顾：HAMi 从展台到主论坛 Keynote Demo

2026年3月31日 · 阅读需要 11 分钟

HAMi 社区

刚刚结束的 KubeCon + CloudNativeCon Europe 2026，释放出一个越来越明确的行业信号：

云原生正在快速从“应用运行平台”演进为 AI 基础设施的运行底座。

在阿姆斯特丹，围绕 Kubernetes、GPU、推理服务、Agentic AI 和异构算力调度的讨论，已经不再停留在概念层面，而是进入到更具体的工程实践、社区协作与基础设施范式演进阶段。

从 Device Plugin 到 DRA：GPU 调度范式升级与 HAMi-DRA 实践回顾

2026年3月23日 · 阅读需要 5 分钟

HAMi 社区

刚刚过去的 KCD Beijing 2026，是近年来规模最大的一次 Kubernetes 社区大会之一。

超过 1000 人报名参与，刷新历届 KCD 北京记录。

HAMi 社区不仅受邀进行了技术分享，也在现场设立了展台，与来自云原生与 AI 基础设施领域的开发者、企业用户进行了深入交流。

本次分享主题为：

从 Device Plugin 到 DRA：GPU 调度范式升级与 HAMi-DRA 实践

本文结合现场分享内容与 PPT，做一次更完整的技术回顾。附幻灯片下载：GitHub - HAMi-DRA KCD Beijing 2026。

HAMi 即将亮相 KubeCon Europe 2026：构建 Kubernetes 中的 GPU 资源层

2026年3月19日 · 阅读需要 7 分钟

HAMi 社区

下周，HAMi 将在 KubeCon + CloudNativeCon Europe 2026 的多项活动中亮相，包括 Project Pavilion 展台、技术分享、主舞台 Demo，以及会后 AI 相关活动。

作为 CNCF Sandbox 项目，HAMi 关注的 GPU 虚拟化、共享与调度问题，正在与 Kubernetes 生态中的 AI 基础设施议题发生越来越直接的交汇。KubeCon + CloudNativeCon Europe 2026 将于 3 月 23 日至 26 日在阿姆斯特丹举行，其中 3 月 23 日为 pre-event programming，3 月 24 日至 26 日为主会期。

HAMi v2.8.0 发布：全面支持 DRA 与高可用调度，迈向标准化 GPU 资源管理

2026年1月20日 · 阅读需要 6 分钟

HAMi 社区

HAMi 社区正式发布 HAMi v2.8.0。这是一个在 架构完整性、调度可靠性以及生态对齐 层面具有里程碑意义的版本。

v2.8.0 不仅引入了多项关键特性更新，也在 Kubernetes 原生标准对齐、异构设备支持、生产可用性与可观测性 等方面进行了系统性增强，使 HAMi 更加适合在长期运行、对稳定性和演进路径敏感的 AI 生产集群中使用。

本文将对 v2.8.0 的主要更新进行详细说明。

第一届 HAMi Meetup 上海站回顾

2025年11月30日 · 阅读需要 5 分钟

HAMi 社区

11 月 30 日，首场 HAMi Meetup 在上海圆满结束。本次活动以"不卷算力卷效率"为主题，近百位 AI 开发者、运维工程师、企业 IT 架构师齐聚现场，聚焦异构算力调度的核心命题。

引言​

引言