NVIDIA NeMo 通过 AutoModel 功能增强 Hugging Face 模型集成
By: blockchain news|2025/05/13 15:45:04
0
分享
NVIDIA 推出了 NeMo 框架的重大增强,推出了 AutoModel 功能,旨在简化 Hugging Face 模型的集成和微调。根据 NVIDIA 官方博客 的说法,该开发旨在支持最先进模型的 Day-0 支持,使组织能够高效利用生成式 AI 的最新进展。 AutoModel:模型集成的新纪元 AutoModel 功能作为 NeMo 框架内的高级接口,允许用户轻松微调来自 Hugging Face 的预训练模型。起初涵盖文本生成和视觉语言模型,AutoModel 计划扩展到视频生成和其他分类。该功能简化了模型并行的过程,通过 JIT 编译增强 PyTorch 性能,并确保无缝过渡到由 NVIDIA Megatron-Core 提供支持的最佳训练和后训练方案。 AutoModel 的引入解决了将新模型架构集成到 NeMo 框架中的挑战,提供了利用 Hugging Face 庞大模型库的简单途径。该功能通过完全分片的数据并行 2 (FSDP2) 和分布式数据并行 (DDP) 支持模型并行,未来扩展包括张量并行 (TP) 和上下文并行 (CP)。 高效训练和可扩展性 AutoModel 接口启用开箱即用的模型并行和增强的 PyTorch 性能,允许组织高效扩展它们的 AI 解决方案。集成使导出至 vLLM 进行优化推理变得轻而易举,计划很快引入 NVIDIA TensorRT-LLM 导出。这确保了组织能够维持高吞吐量和可扩展性,这对于竞争激烈的 AI 领域至关重要。 AutoModel 还提供了无缝的“选择加入”高性能 Megatron-core 路径,允许用户通过最小化代码修改切换到优化训练。一致的 API 确保了对 Megatron-Core 支持路径的最大吞吐量过渡是简单的。 扩展 NeMo 的能力 AutoModel 的引入是 NVIDIA 增强 NeMo 框架能力的更广泛战略的一部分。该功能不仅支持文本生成的 AutoModelForCausalLM 类,还允许开发人员通过创建子类来扩展对其他任务的支持,从而拓宽 AI 应用的范围。 随着 NeMo 框架 25.02 的发布,鼓励开发人员通过 NVIDIA 的 GitHub 仓库提供的教程笔记本探索 AutoModel。社区也被邀请提供反馈并为 AutoModel 功能的持续开发做出贡献,以确保其持续演变以满足尖端 AI 研究和开发的需求。 随着 AI 领域的快速发展,NVIDIA 的 NeMo 框架及其 AutoModel 功能,将自身定位为组织寻求最大化生成 AI 模型潜力的关键工具。通过实现无缝集成和优化性能,NeMo 框架使团队能够始终站在 AI 创新的前沿。 nvidia ai 模型 hugging face nemo 框架
猜你喜欢

究竟谁是「代币化」这场叙事的真正赢家?
几乎所有人都会受益,但受益的原因、时间节点、底层逻辑完全不同。

Moss:AI 交易员人人能造的时代来了吗 | 项目介绍
AI Trading Agent正在快速长出基础设施。

芯片走私案撕开管制漏洞|Rewire新闻晚报
AI芯片已经成为比导弹更敏感的战略物资

7.5 万美元 Gamma 关口前,多空都在等一个信号
抛压消化中,信念还在路上。

那些被主流交易所下架的项目有什么特征?
主流交易所一方面大规模下币,另一方面大规模上线代币化股票资产,本质上这是一场针对“劣币”的供给侧改革,资产标的的质量和平台的合规性将成为未来一段时间竞争焦点。

旧指标失灵,三大新信号浮现:BTC真正底部或仍在6万下方
当地铁上的买菜大妈、理发师的Tony老师开始询问你关于BTC、Crypto、加密货币相关的投资时,及时卖出将是唯一最佳选择。

在黑客松撞见OpenClaw创始人:龙虾们还能干这些事?
伦敦帝国理工学院攒局,AI Agent×Web3落地三大方向。

黄仁勋最新播客全文:英伟达的未来、具身智能和Agent的发展、推理需求爆发以及人工智能的公关危机
未来的竞争不只是比谁的模型更大、算力更强,还要看谁更懂行业、谁能把 AI 更深地嵌入真实流程、谁能把这些能力组织成一套可运行、可扩展的系统

AI 开始吞噬制造业|Rewire新闻早报
当贝佐斯开始用AI买工厂而不是建数据中心时,说明他认为AI的下一波价值不在对话框里

当扩容提速,以太坊基金会推出「Hardness」守住底线
Hardness 是对以太坊核心属性的协议级承诺,包括抗审查、隐私、安全性和无许可。

Google、Circle、Stripe扎堆让AI花钱,2026Q1支付巨头们的喜与忧
真正敌人不再是彼此,而是零成本本身

1000亿美元买工厂,贝佐斯和中东资本把AI的钱从云端砸进车间
贝佐斯不投下一个模型,他在投下一条供应链

小米和MiniMax同时放大招,Agent定价战正式开打
不靠品牌,不靠宣传,8天时间让开发者用脚投票

预测市场成为焦点,但Perp DEX却在悄悄发美伊战争财
在战火不停歇的周末,当传统金融市场闭市,另一波投资者却在链上平台疯狂交易黄金、原油、白银。

市场低迷仍日赚百万美元,pump.fun的收入是真实的吗?
如果真的这么能赚,$PUMP价格低迷的原因又是什么?

一文读懂x402与MPP:Agent支付的两条路线
x402做协议内支付,MPP做系统级支付

速览Alliance最新18个毕业项目:谁是下一个Pump.fun?
项目核心创新领域包括稳定币支付、AI应用、预测市场与RWA代币化。

从伊拉克战争中获利的不仅仅是预测市场。
始终保持“离岸”监管的模糊性可能是幕后黑手的共识。
究竟谁是「代币化」这场叙事的真正赢家?
几乎所有人都会受益,但受益的原因、时间节点、底层逻辑完全不同。
Moss:AI 交易员人人能造的时代来了吗 | 项目介绍
AI Trading Agent正在快速长出基础设施。
芯片走私案撕开管制漏洞|Rewire新闻晚报
AI芯片已经成为比导弹更敏感的战略物资
7.5 万美元 Gamma 关口前,多空都在等一个信号
抛压消化中,信念还在路上。
那些被主流交易所下架的项目有什么特征?
主流交易所一方面大规模下币,另一方面大规模上线代币化股票资产,本质上这是一场针对“劣币”的供给侧改革,资产标的的质量和平台的合规性将成为未来一段时间竞争焦点。
旧指标失灵,三大新信号浮现:BTC真正底部或仍在6万下方
当地铁上的买菜大妈、理发师的Tony老师开始询问你关于BTC、Crypto、加密货币相关的投资时,及时卖出将是唯一最佳选择。