|
鱼羊 发自 凹非寺 在自动驾驶领域,googleWaymo无疑是标杆一样的存在。
现实世界中,Waymo已经行驶了1000多万英里(约1600万千米),而在模拟驾驶中,行驶里程更是到达100亿英里。 作为第一家提供自动驾驶出租车服务的自动驾驶汽车公司,Waymo早在去年12月,就落地美国亚利桑那州凤凰城。但历经泰半年,Waymo One仍未能开出凤凰城,商业化进展远不如公家预期。 商业化道路走得艰难,与技术进展息息相关,现在,DeepMind也出手了。 强强联手 能够可靠引导无人驾驶汽车的AI模型必要无限次的测试和微调,对算力也有很高的要求。 为了提高AI算法训练的有效性和效率,Waymo正在与DeepMind展开互助,DeepMind在博文中提到,这次,他们受到了达尔文进化论的启发。
Waymo的工程师解释,AI算法通过频频测试实现自我提升,这一进程就是不竭测验考试并凭据反馈进行调整。这样,模型的浮现在很大水平上是取决于训练方案的。 找到最佳方案通常必要依靠研究人员和工程师丰硕的经验。他们会精心挑选训练中的AI模型,剔除浮现最差的模型并释放资源,从头开始训练新算法。 手动调整自然可以快速发生更好地结果,但这太过依靠人力了。 于是,DeepMind设计了一种基于进化竞争(Population Based Training)的自动优化超参数的方式。 基于进化竞争 基于进化竞争,简称PBT,结合了手动调整和随机搜索的优点。该方式从随机变量(超参数)开始,训练多个机械学习模型。 模型会被按期评估,并以进化的方法互相竞争,浮现欠安的模型就会被“儿女”(变量产生些许变革的浮现更好的成员的副本)代替。 PBT不必要从头开始从新训练,因为每个儿女城市继承其父网络的状态,而且在整个训练进程中积极地更新超参数。 也就是说,PBT能将大部门资源用于训练良好的超参数值。 可是,PBT也其实不完美。它倾向于优化当前的结果而不考虑持久效应,这晦气于后期发力的AI模型。 DeepMind的研究人员考虑到了这一点,他们为此训练了更多群体,并建立了称为利基(niches)的子群体,它们的算法仅允许它们进行内部竞争。最后,这个子群体通过提供更多怪异模型在竞争中得到优势,这就鼓动勉励了多样性。 成效如何 DeepMind和Waymo将PBT应用于行人,自行车和摩托车驾驶员辨认任务,目的是查询拜访是否可以提高召回率(确定的障碍物在场景障碍物总数上的比例)和精度(检测到的障碍物的一部门实际上是障碍而不是误报)。 最终,他们试图训练单一的AI模型,以连结跨越99%的召回率,同时减少误报。 Waymo陈述说,这些实验为评估真实世界模型的鲁棒性提供了一个“现实的”框架,这反过来又为PBT算法的选择竞争提供了依据。 实验讲明,进化竞争必要快速评估的支持,PBT模型每15分钟就要评估一次。Google数据中心的数百散布式机械的并行化使这一需求成为可能。 Waymo还说,PBT算法能够实现更高的精度,而且减少24%的误报,同时也能连结较高的召回率。 别的,PBT所需的训练时间和计算资源仅为原来的一半。凭据Waymo的说法, PBT已被直采取入Waymo的技术基础架构。 传送门 DeepMind博客: https://deepmind.com/blog/how-evolutionary-selection-can-train-more-capable-self-driving-cars/ 作者系网易新闻·网易号“各有态度”签约作者
|




