kaiyun.com 20亿小参数赶超英伟达旗舰模子，上海宇宙模子“裸考”登顶国外巨擘榜单

来源：未知作者：admin 发布时间：2026-06-04 16:13 浏览：190

5月30日，记者从智元机器东谈主获悉，旗下自研宇宙模子Genie Envisioner-Sim 2.0（简称GE 2.0）凭借优异的空洞露出，在环球宇宙模子评测基准World Arena（宇宙竞技场）“感知与作为反映”榜单中位列第一。

何为宇宙模子？浅薄来说，即是能清楚物理宇宙法例的AI大模子，比如机器东谈主有了宇宙模子的能力，就知谈杯子掉地上会碎、水往低处流、积木搭太高会倒等知识。

World Arena是现时宇宙模子行业的国外巨擘评测基准，由清华大学联结普林斯顿大学、香港大学、北京大学等8所环球顶尖高校打造，主要分为“感知与作为反映”和“数据引擎”两个中枢赛谈，通过16项细分野心和3类机器东谈主实操任务，来窥探具身智能对物理法例、三维感知、作为预判等清楚能力，具备很强的学术公信力和产业参考价值。

乐动中国手机app官网

本次智元GE 2.0参与的是“感知与作为反映”赛谈评测，与英伟达最新模子DreamDojo、清华联结斯坦福的Ctrl-World团队等国表里AI顶尖团队径直竞争并最终夺冠。

智元GE 2.0多项野心处于向上地位。

记者从流露的技能文档中获悉，GE 2.0仅用20亿（2B）参数的模子，终结比英伟达、微软等超大参数的旗舰模子后果更优秀，也考证了在东谈主形机器东谈主诈欺方面，轻量化模子的适配性不逊于超大参数模子。

值得一提的是，智元团队并莫得有意为比赛作念针对性优化，仅仅用通用版块稍加转化就参赛了，高出于“裸考”拿冠军，开云kaiyun中国官网入口诠释GE 2.0自己泛化能力很强。

GE 2.0到底横暴在何处？机器东谈主能在“大脑”里搭建一个虚构场景，不错反复尝试各式作为，犯了错也不会的确弄坏蛋，等熟练掌执妙技后，再搬到执行宇宙中使用。这么既省钱又安全，还能大大加快机器东谈主的学习经由。

技能文档还提到了GE 2.0多个升级之处，比如万古序推演能力冲破、数据回流反哺机制、的确宇宙高度一致性等方面。

智元GE 2.0的技能图示。

许多宇宙模子有个通病，掂量的时候一长，画面就会变拖沓、变形，kaiyun.com就像作念梦到后头越来越离谱。GE 2.0天然也难以透彻根绝这一问题，但画面明晰度下落的速率远低于同业居品。万古序推演能力冲破，使得GE 2.0掂量到50秒的场景，画质已经比不少模子前10秒还要好。

智元研发团队作念了无数对比测试还发现，GE 2.0模拟出来的终结和的确宇宙中的露出高度吻合。不仅合座胜利率对得上，团队还一一案例作念了顾惜比对，用数据图表严格考证了这极少。这也意味着，机器东谈主在虚构宇宙里学会的妙技，搬到执行中或者率也能用。

同期，GE 2.0还内置了一个“裁判”系统，能自动判断每次虚构老到的质地上下，把好的训戒自动挑出来，反馈给机器东谈主的“活动大脑”，帮它学得更快。实验终结标明，这种“自我进化”的面貌如实让机器东谈主处理多个任务的能力更强。

记者获悉，GE 2.0并非是单一模子，而是从具身数据到智能体平台全栈自研系统的一部分。

4月中旬，智元上线环球首个掩饰具身智能全域计议的的确场景数据集AGIBOT WORLD 2026，100%荟萃自营业空间、旅馆、商超级的确宇宙。紧接着，Genie Sim 3.0仿真平台发布，一句话即可生成虚构宇宙，将环境构建速率从小时级镌汰至分钟级。另外，VLA基座大模子GO-2和宇宙模子GE 2.0一谈构建出可交互、可训练、可评估的虚构物理宇宙。

搭建好数据和仿的确基础后，智元发布零代码诈欺平台Genie Studio Agent（精灵责任室智能体），将视觉感知、畅通放手、导航野心、视觉讲话活动模子和强化学习器具链等复杂能力，封装成开箱即用的科罚决策。

基于这一全栈自研系统kaiyun.com，平时东谈主只需在平台上通过拖拽面貌，即可搭建属于我方的机器东谈主诈欺。