谷歌两兄弟Waymo和DeepMind模拟进化论，开发新方法和技巧训练AI

时间:2019-07-27 10:52:15 阅读：7840+ 作者：责任编辑NO。魏云龙0298

据国外媒体报道，Alphabet旗下的无人驾驶汽车公司Waymo进行了大量训练来改良驱动其自动驾驶软件的人工智能。最近，它与另一家Alphabet子公司DeepMind合作开发了一种模拟进化论的新训练方法，来提高训练质量和效率。

正如Waymo所解释的那样，人工智能算法通过反复试验来自我改进。一个模型被提出一个任务，它通过不断地尝试和根据它收到的反馈进行调整，来学习执行这个任务。执行表现在很大程度上依赖于训练方案——被称为超级参数机制——而找到最佳训练方案的任务要有经验的研究人员和工程师亲自去完成。他们精心挑选正在接受训练的人工智能模型，剔除表现最差的模型，并释放资源从头开始训练新的算法。

DeepMind设计了一种不那么劳动密集型的训练方法：基于群体的训练（以下简称“PBT”），它从多个由随机变量(超级参数)启动的机器学习模型开始运作。这些模型会定期被评估，并以一种进化的方式相互竞争，这样，表现不佳的群体成员就会被“后代”(表现较好的成员的副本，其中的变量略有变化)所取代。PBT不需要重新开始训练，因为每个后代都继承了父网络的状态，并且在整个训练过程中会主动更新超级参数。最终的结果是，PBT有了“良好的”超级参数值，用上多数的资源进行训练。这就是进化的由来，因为这是一种人工自然选择的过程。

PBT并不完美——它倾向于对当前进行优化，而没有考虑长期结果，对发展迟缓的人工智能模型不利。为了缓解这种情况，DeepMind的研究人员训练了一个更大的群体，并创建了一个叫做“利基”的亚群体，在这个群体中，算法只允许在自己的子群体中竞争。最后，团队通过为更独特的模型提供竞争优势来直接奖励多样性。

最近，Waymo和DeepMind让PBT接受Waymo创造更好的虚拟司机的挑战，训练结果令人印象深刻——DeepMind在一篇博客文章中表示，借助PBT，负责标识区分由Waymo汽车的诸多传感器发现的行人、骑车者和摩托车骑手的网络误报率下降了24%。不仅如此，与Waymo以前使用的标准方法相比，PBT还节省了大约50%的训练时间和资源。

使用这种方法时，为了避免潜在的缺陷，DeepMind经过早期研究以后进行了一些调整，其中包括每隔15分钟就对模型进行评估，构建强大的验证标准和示例集，以便确保测试能够为真实世界构建表现更好的神经网络，而不只是仅适用于它们被灌输的特定数据的良好模式识别引擎。

Waymo表示，它已经将PBT直接纳入了Waymo的技术基础设施中，使得来自整个公司的研究人员只需点击一个按钮就可以应用PBT。该公司写道，“自这些实验完成以来，PBT已被应用于许多不同的Waymo车型，并有望帮助创造出更适合道路行驶的汽车。”

“如果发现本网站发布的资讯影响到您的版权，可以联系本站！同时欢迎来本站投稿！

上一篇：60秒不够用快手抖音部分用户可发超10分钟

下一篇：京东727领券指南：新秀丽满150打6.9折，领

谷歌两兄弟Waymo和DeepMind模拟进化论，开发新方法和技巧训练AI

最新资讯

Arm Tech Symposia 年度技术大会顺利收官，继续构建面向未来的 AI 计算平台

见证5G成长,进博会是高通展示合作成果的重要平台

进博会孟樸分享,从3G到5G,高通携手中国伙伴在全球市场合作共赢

小生意，大爆发｜八大行业双11策略划重点

Arm Cortex-X925 实现IPC提升, 集成特有 SVE2 功能，Arm 技术重塑消费电子设备性能标杆

西门子2024 Realize LIVE用户大会：拥抱新质生产力，激发数智新动能

阅读推荐

2024爱企查毕业季校园行：构建诚信就业市场，为成电、广大学子保驾护航

毕业不慌，查厉来帮｜爱企查携手西电学子深度体验品牌魅力

史上最刺激的闪购，淘宝百亿补贴凌晨放大招，真梦里啥都有！

全国人大代表刘宏志：推动数字乡村建设、激发乡村振兴“数智力量”

这不是一台单纯的打印机爱普生迪士尼草莓熊墨仓式打印机L4266体验

“千翼飞舞天际 5G闪耀广州”2023数字科技生态大会 11月10日中国·广州震撼来袭