在当地时间周一揭幕的行业顶级会议SIGGRAPH(国际计算机协会计算机图形学和交互技术特别兴趣小组年度会议)上,“全球股王”英伟达推出一系列面向机器人开发者的世界模型 、应用库和基础设施。
其中 ,最引人关注的是参数量只有70亿的开源物理AI应用和机器人视觉推理模型Cosmos Reason 。
英伟达介绍称,自从OpenAI多年前发布CLIP模型以来,视觉语言模型已经改变了计算机视觉任务 ,例如物体与模式的识别等。然而,此前的模型无法解决多步骤任务,也难以应对模糊或新颖的现实体验。
凭借记忆和理解能力 ,Cosmos Reason能够使机器人和AI具身代理“像人类一样推理 ”,并在真实世界中采取行动 。
在英伟达给出的案例中,运行视觉推理模型的机器人手臂 ,成功根据“面包+烤面包机”的场景,推断出最合理的下一步动作是将面包放进烤面包机进行烘烤,并将思考逻辑转化成机器手臂的操作指令。
(来源:英伟达)
这项功能叫做“机器人规划与推理”。Cosmos Reason能够作为机器人的“大脑 ”,负责有意识、条理化的决策 。视觉推理模型能够解释环境 ,并在面对复杂指令时将其分解为任务并利用常识执行。
除此之外,这个模型还能用于一系列AI应用。例如自动化对大规模、多样化训练数据集进行整理 、标注,也能从海量视频数据中提取有价值的信息并进行归因分析 。
目前这个模型已经投入商业化运营。英伟达披露 ,公司内部的机器人和自动驾驶团队正使用这个模型进行数据整理与过滤、标注以及VLA(视觉语言动作)后训练。优步(Uber)也在使用该模型为自动驾驶训练数据进行标注与生成说明。
除此之外,麦格纳国际正在使用该模型开发全自动即时配送解决方案City Delivery,用来帮助车辆更快适应新城市环境 。VAST Data、Milestone Systems也在交通监控自动化 、视觉检测等领域应用该模型。
除了Cosmos Reason ,英伟达也在Cosmos世界模型中新增了Cosmos Transfer-2,用来加速从3D仿真等场景生成合成数据,以及一个经过蒸馏、更为注重速度优化的Cosmos Transfers版本。
英伟达也在周一更新了Omniverse软件开发工具包 ,并公布了新的神经重建库 。其中包括一种渲染技术库,允许开发者使用传感器数据在三维中模拟现实世界。
这一系列发布标志着AI芯片巨头正在加码进军机器人领域,试图将其培养成AI数据中心之外的下一个重要应用场景。
股票开户要多少钱才可以开:股票买卖怎么加杠杆-兴业银行回应“大额存款推名企实习”:推广中表述不完整 已暂停该项目
公司股票怎么买:如何开杠杆炒股-实探“9天8板”的利君股份:机器人业务尚在探索 短期股价上涨对经营无影响
配资炒股开户技巧:如何做股票杠杆-东山精密重大收购!存储器巨头官宣大动作 投资扩大至1500亿美元
如何买股票加杠杆:炒股杠杆如何计算-央行今日将开展4000亿元买断式逆回购操作 期限为6个月
新手如何学股票:股票收益排行榜前十名-看好中国资产!外资机构重点调研科技创新企业
新手如何开户怎么买股票:哪个公司股票好-金融监管总局发文规范“惠民保”:不得搞低价无序“内卷式”竞争
股票如何融资加杠杆:换手率股票软件app-马斯克拆台、微软抢先接入!GPT-5终于来了 一键生成网页、博士级智能 却因基准图错误遭吐槽
长富资本提示:文章来自网络,不代表本站观点。
2025年5月8日,金地集团(600383.SH)公告称,公司4月实现签约面积21.4万平方米,同比下降55.14%;实...
现货黄金向上触及3230美元/盎司关口,再次刷新历史新高。...
4月11日,商务部部长王文涛与世贸组织总干事伊维拉视频通话,双方围绕应对美加征所谓“对等关税”、维护多边贸易体制、发挥世...
文/吴治邦3月24日早盘,在2024年年底压哨实施完毕重整计划的*ST花王股价继续跌停。自2025年1月...
记者|赵阳戈年初,证监会就修改《证券发行与承销管理办法》部分条款向社会公开征求意见,市场也将注意力投向了...
记者辛圆3月25日,博鳌亚洲论坛旗舰报告《亚洲经济前景及一体化进程2025年度报告》(以下简称《报告》...