2023年4月11日举行的第八届HAOMO AI DAY上,北京自动驾驶企业毫末智行发布了自动驾驶生成式大模型DriveGPT,中文名“
雪湖·海若”。
DriveGPT雪湖·海若通过引入驾驶数据建立RLHF(人类反馈强化学习)技术,对自动驾驶认知决策模型进行持续优化。其现阶段主要用于解决自动驾驶的认知决策问题,后续持续会将多个大模型的能力整合到DriveGPT雪湖·海若。目前,其实现了模型架构与参数规模的升级,参数规模达到1200亿,预训练阶段引入4000万公里量产车驾驶数据,RLHF阶段引入5万段人工精选的困难场景进行训练。
DriveGPT雪湖·海若的底层模型采用GPT生成式预训练大模型,DriveGPT输入是感知融合后的文本序列,输出是自动驾驶场景文本序列,即将自动驾驶场景Token化,最终完成自车的决策规控、障碍物预测以及决策逻辑链的输出等任务。
针对DriveGPT雪湖·海若的实现过程,毫末智行CEO
顾维灏表示,首先在预训练阶段通过引入量产驾驶数据,训练初始模型,再通过引入驾驶接管Clips数据完成反馈模型(Reward Model)的训练,然后再通过强化学习的方式,使用反馈模型去不断优化迭代初始模型,形成对自动驾驶认知决策模型的持续优化。同时,DriveGPT雪湖·海若还会根据输入端的提示语以及毫末CSS自动驾驶场景库的决策样本去训练模型,让模型学习推理关系,从而将完整驾驶策略拆分为自动驾驶场景的动态识别过程,完成可理解、可解释的推理逻辑链生成。
毫末DriveGPT
雪湖·海若将携手生态伙伴率先探索四大应用能力,包括智能驾驶、驾驶场景识别、驾驶行为验证、困难场景脱困。目前,毫末DriveGPT雪湖·海若已正式对外开放,开启对限量首批客户的合作,北京交通大学计算机与信息技术学院、高通、火山引擎、华为云、京东科技、四维图新、魏牌新能源、英特尔等已经加入。此外,首款搭载HPilot3.0的新摩卡DHT-PHEV即将上市,这也是毫末DriveGPT雪湖·海若的首发落地车型。