kaiyun中国官方网站即通过构建寰球模子生成在线交互的仿真环境-kaiyun下载

发布日期：2026-04-17 04:29 点击次数：59

商汤绝影 CEO，商汤科技聚会首创东说念主、首席科学家王晓刚

跟着算法的进化，端到端自动驾驶时间阶梯正朝着更高效、智能和自合乎的所在发展。

2 月 22 日，2025GDC 行家诱惑者时尚大会时辰，商汤绝影 CEO，商汤科技聚会首创东说念主、首席科学家王晓刚发布了"与寰球模子协同交互的端到端自动驾驶阶梯 R-UniAD "，即通过构建寰球模子生成在线交互的仿真环境，以此进行端到端模子的强化学习覆按。

据王晓刚先容，R-UniAD 与 DeepSeek 时间改进想路同归一源：从师法学习向强化学习升级演进，从而完毕端到端自动驾驶卓越东说念主类的驾驶施展。

简言之，DeepSeek 时间是一个基于深度学习的图像搜索和识别时间，其主要把握于图像识别、盘算推算检测等任务。在智能驾驶界限，它不错为智能驾驶系统提供一些宝贵的鉴戒和参考真谛真谛。

比如在及时物体检测和识别方面，DeepSeek 时间不错通过深度学习模子对图像进行处置，及时识别说念路上的物体，如行东说念主、车辆、交通标记等，够匡助自动驾驶系统及时感知周围环境，从而作念出相应的决策。

由于自动驾驶触及到渊博的环境感知与决策场景，依赖于渊博的标注数据进行覆按，因此模拟环境中的数据生成和增强变得至关宝贵。R-UniAD 便是通过高质地数据进行冷运转，用师法学习的面孔覆按出一个端到端基础模子，再通过强化学习局势进行覆按。

这种"多阶段强化学习"端到端自动驾驶时间阶梯，具体可分为三个阶段：

1、依靠冷运转数据通过师法学习进行云霄的端到端自动驾驶大模子覆按；

2、基于强化学习，让云霄的端到端大模子与寰球模子协同交互，抓续提高端到端模子的性能；

3、云霄大模子通过高效蒸馏的面孔，完毕高性能端到端自动驾驶小模子的车端部署。

通过这项时间，智能驾驶系统不错束缚从海量的驾驶数据中学习和优化我方的模子，通过"仿真 + 实验"的覆按面孔加快自动驾驶系统的学习经过，来更好地应酬复杂的说念路场景。

早在 2022 年底，商汤绝影建议了行业首个感知决策一体化自动驾驶通用模子 UniAD，2024 年北京车展时辰，商汤绝影还展示了 UniAD 的实车起程效力，商汤绝影一直在不遗余力地鼓励这项时间的贸易化程度。

据钛媒体 App 得知，商汤绝影的量产端到端智驾决策瞻望将在年底委派，"开悟"寰球模子也正经用于数据出产，而在本年 4 月的上海车展，商汤绝影将会展示"与寰球模子协同交互的端到端自动驾驶决策"的实车部署。

（本文首发于钛媒体 App）kaiyun中国官方网站

新闻中心