·

滚球波胆

滚球波胆

滚球官网 极佳视界物理AGI双金字塔体系: 数据与算法怎么撑起Scaling Law?

发布日期:2026-05-25 01:11 来源:未知 作者:admin 浏览次数:

滚球官网 极佳视界物理AGI双金字塔体系: 数据与算法怎么撑起Scaling Law?

畴前两年,具身智能赛谈商榷最多的两个场所,一是「宇宙模子」,二是「VLA / 动作模子」。

前者以 NVIDIA Cosmos、Google Genie 为代表,主义通过生成式宇宙模子扩张数据供给;后者以 Physical Intelligence 的 π 系列、Diffusion Policy 等为代表,主义依靠大领域真机数据赢得通用动作才略。

两条道路各自取得了权臣进展,但谁也莫得的确回答一个问题 —— 当咱们把「物理 AGI」看成操办时,到底需要什么样的算法体系和数据体系,才略跑通 Scaling?

5 月 20 日,武汉光谷。极佳视界(GigaAI)在「家庭场景子品牌发布会暨物理通用智能技巧发布会」上,给出了一份相对齐全的谜底。

极佳视界 5.20 发布会现场

这场发布会公布了五件事:寰球首个物理 AGI「双金字塔」体系;家庭场景子品牌「拾光 SeeLight」与首款家庭通用东谈主形机器东谈主「拾光 S1」同步亮相;国内首个的确家庭场景百台部署落地武汉,Q3 起领域化运营;下一代居品「拾光 S2」三季度发布,的确家庭首创版预定通谈即日起开启;终末是一份 12 个月的道路图 —— GigaBrain-1、GigaBrain-2、GigaBrain-3 连发三代基础模子,操办是物理 AGI 的「GPT-3 时刻」。

信息量很大,其中咱们最存眷的,是物理 AGI 的「双金字塔」体系。

从 Scaling 的瓶颈提及

具身智能为什么于今没能跑通 Scaling Law?极佳视界联合东谈主、研发副总裁叶云在发布会上把问题归结为两条。

第一条在数据侧。真机数据精度最高,却受制于高资本与小领域;互联网视频领域浩瀚,却阑珊动作监督信号;仿真数据可无穷扩张,却难以跳跃 sim-to-real gap。任何单一着手,都无法同期闲适 Scaling Law 所条目的领域、信息密度与的确性。

第二条在算法侧。现时以谈话为主导的 VLA 范式,实验上是把视觉、动作 token 化后送入谈话模子,并不擅长编码 3D 信息、物理因果与一语气动作。换句话说,即便堆够了数据,现在的主流模子架构也偶而能高效消化它们。

极佳视界联合东谈主、研发副总裁 叶云

围绕这两条卡点,极佳视界提议的惩处旅途是把数据和算法分别按档次结构张开, 一座面向数据的金字塔,一座面向算法的金字塔,二者耦合,不可偏废。这即是「双金字塔」体系的着手。

寰球首个物理 AGI 「双金字塔」体系

从底层逻辑来看,这是物理 AGI 赛谈第一次有公司把 Scaling 旅途系统化张开。

五层数据金字塔

数据金字塔从底到顶按次为:互联网视频数据、真东谈主数据、宇宙模子模拟器、仿真合成数据、真机数据。

这一鉴别自己并不令东谈主不测 —— 它基本对应了学术界畴前两年对于具身数据着手的主要商榷:真机数据在金字塔尖端,精度最高、遮蔽最窄;互联网视频在底部,领域最大、监督最弱;中间三层(真东谈主示范、仿真、宇宙模子生成数据)则是最具工程化空间、也最被低估的部分。

真碰巧得宝贵的,是极佳视界在每一层都拿出了对应的工程化居品:

真机数据由家庭版轮臂机器东谈主「拾光 S1」和低资本真机数采硬件「Maker M01」协同汇聚;仿真合成数据与宇宙模子模拟器数据由自研具身宇宙模子平台「GigaWorld-0」系统化生成;真东谈主数据由低资本手合手数采硬件「U-01」和低资本 Ego 数采硬件「E-01」大领域汇聚;互联网视频数据则复用 YouTube、Panda-70M 等公开着手。

极佳视界「数据金字塔」

U-01、E-01 这种「低资本、非本色绑定」的数据汇聚硬件,肖似 Stanford 团队 UMI 与 EgoMimic 的探讨想路,被学术界公认是打破真机数据瓶颈的可行场所之一。

区别在于,极佳视界把它和自研机器东谈主本色(S1)、宇宙模子平台(GigaWorld-0)一谈作念成了一套齐全的全栈汇聚体系。单点探讨并不有数,全栈跑通且每一层都有自研硬件作念复古,在国内具身智能公司中现在并未几见。

三层算法金字塔

算法金字塔从底到顶分为:宇宙模拟、动作对皆、训诲强化。

极佳视界把这三层分别落到具体的模子上。

宇宙模拟层的代表是具身宇宙模子 GigaWorld-1。它谢宇宙模子领域泰斗评测 WorldArena 上以详细得分 62.34 打败 Wan、CogVideoX、Veo 3.1、Cosmos-Predict 等模子赢得寰球第一,是榜单中首个详细得分打破 60 分大关的具身宇宙模子。

动作对皆层包括 GigaBrain-0 系列与 GigaWorld-Policy。前者是 VLA 道路的具身基础模子,在寰球领域最大的真机评测 RoboChallenge 中以 51.67% 任务到手率位列寰球第一,当先 π0.5 接近 10 个百分点;后者是宇宙动作模子,在面向家庭场景的寰球泰斗评测平台 RoboCasa365 上打败 NVIDIA GR00T N1.5 与 π0.5 赢得寰球第一,成为榜单首个登顶的宇宙动作模子。

训诲强化层是 GigaBrain-0.5M*,通过「宇宙模子 + 强化学习」实现具身基模的自我进化。

极佳视界「算法金字塔」

单一榜单第一在具身智能赛谈并不冷落,但同期在「宇宙模子 + 师法学习 + 强化学习」三个方朝上拿到寰球泰斗评测第一,并把三层之间的数据流转权衡买通,现在国内独一极佳视界一家作念到。WorldArena、RoboChallenge、RoboCasa365 三大泰斗评测成果分别讲明注解了其在感知 - 生成、真机操作、家庭场景泛化领域的三种中枢才略 。 这三个「寰球第一」也有劲讲明注解了「双金字塔」体系背后深厚的技巧复古。

跑通技巧体系之后,下一站家庭

技巧体系跑通之后,问题造成 —— 去那里考据 Scaling 是否果真拓荒。极佳视界给出的谜底是:的确家庭。

发布会上,极佳视界蚁合首创东谈主、首席科学家朱政博士负责发布公司面向家庭场景的全新子品牌 ——「拾光 SeeLight」,定位「国内首个家庭通用机器东谈主品牌」,由朱政担任品牌 CEO。

极佳视界蚁合首创东谈主首席科学家、拾光品牌 CEO 朱政

朱政在发布会上默示:「AGI 不该只停留在屏幕里。咱们不是在讲一个远处的明天故事,而是在把骨子里对物理 AGI 的信仰造成的确的居品,让物理 AGI 做事每一个东谈主。」

品牌发布同期推出的第一代居品「拾光 S1」,被界说为「寰球首个投入的确家庭场景的通用东谈主形机器东谈主」。S1 领受家庭版轮臂构型,滚球官网 - 滚球(中国)官方网站搭载极佳视界自研的具身基础模子,具备从感知、清楚到行径的齐全闭环才略。

聘用家庭、而不是工业线或物流作为物理 AGI 的首发场景,从技巧角度看是一个值得商榷的决议。家庭场景的绽放性、长尾性、东谈主机交互复杂度,都远超工业场景 —— 正因为如斯,它是考据「通用性」最严苛的试金石。极佳视界这种「先难后易」的场景聘用,与它在算法侧的技巧演进旅途,应该是团结种想路。

视频通顺:https://mp.weixin.qq.com/s/7UE0h6WvlWgYEHJQjOVivg

百台部署:第一笔可被考据的订单

具身智能赛谈畴前一年最被诟病的问题之一,是「发布会演示与的确场景使用之间的界限」 —— 险些扫数公司都会展示样机能作念什么,但鲜有公司能讲明注解它在家里何如用,能用多久。本次发布会上极佳视界给出的修起,是一笔照旧落地的订单。

ag真人app官方网站入口

极佳视界文牍拾光 S1 已赢得的确家庭场景百台订单,将率先部署于武汉光谷之寓社区(位于武汉光谷的的确居住社区),Q3 起开启领域化运营。这是公开信息中领域化家庭通用机器东谈主部署的首例 —— 此前 Figure、1X 等国外厂商天然袒露过家庭试用,但都停留在个位数订单或职工家庭体验。

100 台 + 的确居住社区 + Q3 领域化运营这一组合,意味着一笔蹙迫财富将启动积聚:的确家庭的始终使用数据。

机器东谈主投入武汉光谷之寓的确场景

这是 Scaling Law 在物默默能领域的确拓荒的关键。极佳方面在发布会袒露:拾光 S1 的家庭场景展示体验空间将于 2026 年 5 月 31 日起绽放参不雅。

拾光 S2:本色侧的系统性重构

发布会还预报了第二代居品「拾光 S2」将于 2026 年三季度负责发布。从袒露的本色参数看,这不是一次小迭代:

底盘体积减少 60%,更适住持庭狭小空间;电板续航升迁 70%,并支合手热换电,奏凯决定的确做事中的一语气责任才略;操作范围扩大 40%,支合手 2.2 米高度内任务履行。朱政在发布会上默示:「S2 的中枢,不是某个参数变得更漂亮,而是整机启动更接近的确家庭所需要的『可用性』。」

拾光 S2 全新联想构型,订价、发售战略将于三季度全面揭晓

从产业视角,机器东谈主本色侧的关键瓶颈其实是「能不成在的确家庭里始终巩固责任」—— 续航、热管制、纰谬寿命、安全冗余、珍藏资本。S2 的三项升级都奏凯对应这条线,工程取向相对克制。同期,的确家庭首创版预定通谈,自即日起负责开启。

12 个月,三代基础模子

剑指「GPT-3 时刻」

发布会的终末一个部分,是极佳视界初次公布物理 AGI 基础模子的 12 个月道路图 —— GigaBrain-1、GigaBrain-2、GigaBrain-3 连发三代。

GigaBrain-1 将于 2026 年第三季度发布,是寰球首个基于「双金字塔」体系打造的物理 AGI 基础模子,操办是在物默默能泛化性上达到新高度。自后 GigaBrain-2 与 GigaBrain-3 加快 Scaling,其中 GigaBrain-3 将基于 1000 万小时视频数据 + 100 万小时宇宙 - 动作数据进行教育,剑指物理 AGI 的「GPT-3 时刻」。

GigaBrain-3 剑指物理 AGI 的「GPT-3 时刻」

GPT-3 在数字 AGI 历史上的兴致,不在模子自己,而在「初次让 Scaling Law 显现涌现才略」的阿谁临界点 —— 当模子领域与数据领域到达某个阈值后,才略从量变跃迁为质变。物理 AGI 的「GPT-3 时刻」在表面上应该是同构的:数据领域(1000W + 100W 小时)和算法范式(双金字塔)到达某个临界点后,物默默能体表涌现的确兴致上的通用性。

这是一个可被磨练的假定。明天 12 个月后,行业就会看到这个临界点是否果真存在、极佳视界给出的具体数字是否落在临界点之上。在具身智能赛谈现时阶段,这种「用明确技巧节点修起根柢问题」的姿态并不常见 —— 同业的回答大多停留在「行将」、「快了」、「五年内」这一类时候糊涂化的表态。

极佳视界把「物理 AGI 何时到来」拆解为「需要什么样的体系」 + 「什么时候到达」两个具体的技巧命题,这是这场发布会的确区别于其他同类发布的地方。

三件事值得不竭跟踪

一场发布会,把畴前三年的技巧积聚、当下的居品完了、明天 12 个月的技巧道路图,一次性铺开。

从技巧圈的角度,接下来有三件事最值得跟踪:

第一,「双金字塔」体系是否果真能跑通 Scaling Law —— 五层数据 + 三层算法的耦合权衡是否拓荒,将由 GigaBrain-1(Q3 发布)与 GigaBrain-3(GPT-3 时刻)两次考据。

第二,百台家庭部署是否果真产生灵验的数据闭环 —— 的确家庭始终使用数据是物默默能领域现在最稀缺的财富,若是闭环跑通,极佳视界在数据侧的护城河会随时候快速变深。

第三,GPT-3 时刻是否果真会在 12 个月内到来 —— 这是物理 AGI 赛谈现时最具争议、也最有完了价值的判断。

畴前半年,对于「物理 AGI 何时到来」的商榷已成为行业高频话题,英伟达、Figure、Physical Intelligence、星河通用、智元…… 每一家都给出过我方的回答。但松手现在,莫得任何一家公司像极佳视界这么,把这个问题拆解为「算法 + 数据体系」和时候表。

系统性体式论 + 可考据时候表的组合滚球官网,这是此次发布会的确区别于其他同类发布的地方。