发布日期:2026-01-29 08:41 点击次数:86

空间智能迎来进攻开源阐发。1月 27 日开云体育(中国)官方网站,蚂围聚团旗下具身智能公司灵波科技晓示开源高精度空间感知模子 LingBot-Depth。
该模子基于奥比中光 Gemini 330 系列双目 3D 相机提供的芯片级原始数据,专注于训诲环境深度感知与三维空间解析能力,旨在为机器东谈主、自动驾驶汽车等智能末端赋予更精确、更可靠的三维视觉,在“看明晰”三维宇宙这一瞥业关节可贵上得到进攻冲破。这亦然蚂蚁灵波科技在2025外滩大会后初次亮相后,时隔半年在具身智能时刻基座标的公布进攻恶果。
在NYUv2、ETH3D等泰斗基准评测中,LingBot-Depth展现出代际级上风:比拟业界主流的 PromptDA与PriorDA,其在室内场景的相对差错(REL)裁汰跳动70%,在挑战性的寥落SfM 任务中RMSE差错裁汰约47%,开发了新的行业精度标杆。

(图说:在最具挑战的寥落深度补全任务中,LingBot-Depth性能举座优于现存多种主流模子。图中数值越低代表性能越好。)
在家庭和工业环境中,玻璃器皿、镜面、不锈钢蛊惑等透明和反光物体物体十分常见,但却是机器空间感知的难点。传统深度相机受制于光学物理特色,在靠近透明或高反光材质时,频频无法摄取灵验回波,导致深度图出现数据丢失或产生噪声。
针对这一瞥业共性可贵,蚂蚁灵波科技研发了“掩码深度建模”(Masked Depth Modeling,MDM)时刻,并依托奥比中光 Gemini 330 系列双目 3D 相机进行 RGB-Depth 数据网罗与效果考证。当深度数据出现缺失或极度时,LingBot-Depth 模子约略会通彩色图像(RGB)中的纹理、详细及环境高下文信息,对缺失区域进行臆度与补全,输出完满、紧密、边际更披露的三维深度图。值得一提的是,LingBot-Depth 模子已通过奥比中光深度视觉本质室的专科认证,在精度、表现性及复杂场景适当性方面均达到行业最初水平。
本质中,奥比中光 Gemini 330 系列在诈欺LingBot-Depth 后,靠近透明玻璃、高反光镜面、强逆光及复杂曲面等极具挑战的光学场景时,输出的深度图也曾平滑、完满,且物体的详细边际十分利害,其效果显贵优于业内最初的3D 视觉公司 Stereolabs 推出的 ZED Stereo Depth 深度相机。这意味着在不更换传感器硬件的前提下,LingBot-Depth 可显贵训诲阔绰级深度相机对高难物体的处分效果。

(图说:[上图]搭载 LingBot-Depth 后,奥比中光 Gemini 330 系列在透明及反光场景下深度图的完满性和边际披露度明白训诲,[下图]其效果优于业界最初的ZED 深度相机)
LingBot-Depth 的优异性起首于海量真确场景数据。灵波科技网罗约 1000 万份原始样本,索求出 200 万组高价值深度配对数据用于西宾,复古模子在顶点环境下的泛化能力。这一中枢数据财富(包括 2M 真确宇宙深度数据和 1M 仿真数据)将于近期开源,鼓动社区更快攻克复杂场景空间感知可贵。
据了解,蚂蚁灵波科技已与奥比中光收尾计策配合意向。奥比中光预备基于 LingBot-Depth 的能力推出新一代深度相机。
本周蚂蚁灵波将络续开源多款具身智能标的模子。
— 完 —
量子位 QbitAI · 头条号
关爱咱们开云体育(中国)官方网站,第一时代获知前沿科技动态
Powered by 开云官网登录入口 开云app官网入口 @2013-2022 RSS地图 HTML地图