2022年11月8日-10日,由中国汽车工业协会主办的第12届中国汽车论坛在上海嘉定举办。作为党的“二十大”召开后的汽车行业首场盛会,本届论坛以“聚力行稳 蓄势新程”为主题,共设置“1场闭门峰会+1个大会论坛+16个主题论坛”,以汽车产业的高质量发展为主线,与行业精英一起贯彻新精神,研判新形势,共商新举措。其中,在11月10日下午举办的“主题论坛12:跨界融合,赋能自动驾驶落地”上,亚马逊云科技大中华区战略业务发展部总监陈亦恺发表精彩演讲。以下内容为现场演讲实录:
在座的各位汽车行业的领导、专家、同仁,我是亚马逊云科技的陈亦恺。昨天和今天各位嘉宾做了许多非常精彩的演讲,我也很高兴有机会跟大家分享一下亚马逊云科技在自动驾驶领域一些实践的分享。
我们今天看到有整车厂、Tire1、以及自动驾驶的科技公司群聚一堂,我们亚马逊云科技作为云厂商有跟我们的友商不同的地方,我们没有下场造车,我们也还没有做Tire1,我们专注在做好云计算开创的引领者,更多地给我们的合作伙伴和客户去赋能,让他们去建构一个高效的自动驾驶开发平台。
今天分享的主题就是跟今天分会场的主题融合“跨界融合”,怎么让云计算在自动驾驶领域作为车云一体化的架构发挥更大的价值。
我们看到新能源汽车在今年已经得到了突破性的发展,从原来看到政策驱动已经完成变成市场驱动的行为,而且无人驾驶、高级辅助驾驶渗透率都慢慢在不断地提高。我相信在未来三到五年时间里,中国汽车的智能化与网联化会迎来新的发展高潮。
我们预计到2030年中国可能具备L2及以上的车辆保有量将会达到三千万辆,那个时候整个市场规模会有五千亿美元的规模,折合成人民币在三万五千亿这样的规模。从自动驾驶整个占比来看,也发现一些挑战。实际上在2015年的时候,整个产业链预期L4的自动驾驶将在2021年就会非常普遍,美国和欧洲会变成一个首发的市场,而且乘用车是第一个推进的细分的产品。
到今天来看,我们看到自动驾驶结合L2包括L2+更加普遍化,L4可能预计需要8-10年的时间真正得到真正商业化的大规模推广。同时,我们看到在中国的政策和客户的需求推动下,中国已经成为而且终将成为全球最大的自动驾驶的市场,也会应用到最新的技术和能力。
实际上不是乘用车,往往是很多商用车,我们看到的robot-bus在环卫和码头封闭区域已经实现了无人驾驶的突破,这是跟我们原来看到的是很大的差别。但是现在由于L2+的功能不断地延伸,除了驾驶的主导权由于政策法规的限制没有发生变化,L2+和L4、L3之间的边界不断地模糊。
亚马逊云科技从2016年以来,就大力投入到帮助我们的客户和合作伙伴在自动驾驶方面的研发。看到我们的历程和合作伙伴一路走来,我们帮助很多客户解决点状的工具的问题,也解决了很多的平台层面的问题,同时包括他们的业务运营问题。我们在帮助客户应用我们的数据采集、机器学习、人工智能技术,在数据闭环上帮助客户快速地进行它的业务场景和算法功能的迭代。
这上面列出的只是很小的一部分我们可以公开的案例,实际上在国际和国内很多的车厂、科技企业以及包括tire1,都在跟亚马逊云科技开展相关的合作。
接下来要谈到的是数据。自动驾驶离不开数据,从采集的车辆来看,基本上每一辆车每天会采集到8TB-100TB的规模,如果一个车队有200辆车,整体一天的规模就要到2PB,包括数据采集、数据筛选、标注以及数据训练、软件仿真整体过程,被输入到服务器端进行数据模型的训练,最后再部署到车端实现自动驾驶化。这是海量的数据及处理工作,涉及到许多业务场景。如果我们说对于新一代智能汽车,自动驾驶是智能汽车的灵魂,那么对于自动驾驶上,数据就是自动驾驶的灵魂,一定要解决数据管理的问题。
这些都对自动驾驶提出在数据管理方面很高的要求。基于这些要求,自动驾驶研发的企业包括在座的科技公司、主机厂、Tier1,在做自动驾驶开发的时候面临的六个挑战:
1、海量数据的收集,包括标准化管理海量数据的采集和传输,如何维护可靠的数据传输的通道?
2、海量数据的存储,如何保证海量数据的可用性?如何找到多样的且价格合理的存储方案?
3、数据管理上,开发人员包括其他团队成员甚至跨区域、跨国家的团队人员怎么样协作,有效地查找、分析、增强、挖掘数据,为后续使用做好准备。
4、模型训练,如何标准化地处理机器学习访问以及处理这些结构化和非结构化的数据,如何标准化整个组织的机器学习的MLOps流程。
5、自动驾驶仿真,如何保证仿真系统的架构一致性?如何有效地构建大规模仿真环境?如何更有效的开展硬件在环测试?
6、开发工具链,如何设计高效的现代化的工具来达到自动驾驶不同阶段的业务的要求?如何设计统一的开发工具来提高开发的效率。
这些都是在自动驾驶开发阶段必须要面临也必须解决的问题,我们来看看亚马逊云科技怎么来应对这些挑战:
挑战1:海量数据的采集和传输。
传感器收集过来,包括摄像头、激光雷达、毫米波雷达产生收集处理的数据,传统的方式是每天产生TB的数据放在车端的硬盘里面,然后到车厂,然后拔出硬盘,然后再将数据上传,这个工作非常繁复。
亚马逊云科技在去年亚马逊大会上推出了Amazon IoT FleetWise的产品,能够按照预定义规则收集车内CAN信号数据和传感器数据,能够配合车载数据采集器更灵活和标准的收集转化数据,自动地将车队的数据传输到云端。
最大的价值是可以通过前端的智能筛选功能把所需要的数据传到云端,来降低整个传输和储存的成本,以及包括可以实时管理车辆的运行状态,加快检测来避免召回。
挑战2:海量数据的存储。
在2006年我们已经推出了存储服务S3。我们不仅每年我们的存储的价格都在降低,而且每年都在推出新的产品,迭代的产品。这些迭代产品都在帮助客户降低存储所带来的投入和成本。在2021年我们推出了两款产品:一是S3检索存储,二是S3智能分层,这些有效地帮助我们客户优化成本,初步估计可以帮助客户用我们新的服务可以降低客户30%的投入。
挑战3:复杂的数据管理和数据分析。
亚马逊云科技具备最全面、安全和可扩展的服务组合,能够帮助客户在云端构建数据湖,并应用最广泛分析的方法来分析支持我们的数据湖,可以根据客户的业务要求进行配置,同时有很强的安全管理的机制来实现加密,定义数据的共享。同时也可以启动自助的数据分析和数据洞察。
挑战4:复杂的模型开发和训练。
亚马逊云科技有SageMaker,这是一款全托管的服务机器学习的产品,可以帮助开发人员和数据科学家快速地构建和训练包括部署机器学习的模型,让整个开发变成非常的简易,可以给开发团队提高10倍的工作效率。
挑战5:自动驾驶的仿真验证,这是超大规模的仿真验证的要求。
关键指标就是在于规模,我们看到例如Apache Spark处理通道来关联这些测试数据的原始数据是非常常见的。这里有一个示例,实际上我们显示如果在某天晚上通过竞价实例来完成模拟测试,我们组合几个实例,但是我们看到最终我们只用了20-25分钟达到1M vCPU用量,40分钟达到1.6M vCPU,用这种方式可以帮助我们的客户节省70%的成本,在仿真验证上的开销。
挑战6:规模、敏捷、成本以及安全,云原生的自动驾驶开发工具链。
传统车企从原来在车端进行瀑布式的集成开发到车云一体化敏捷的场景开发的时候,必定需要一个自动化价值的开发工具链。汽车企业要构建这种原来传统的分布式的E/E架构的时候,它是不能支撑未来的汽车的域控制器以及包括中央控制器的架构,它会需要一套平台能够进而支撑现在的业务,也能支持将来的业务快速发展。这个平台必然要构建在云上,而且这一套业务将来可以看到所有的车厂不会再把自动驾驶、座舱、车联网的业务来分别建构,而会建构在一套完整的平台上,就需要这套平台足够的扩展性来支撑所有的业务。
我们需要建构一个大规模计算所需要的计算资源,包括服务器、网络、存储、 GPU,来支撑所有的模型训练和运行仿真,来实现车云对等的运行环境,同时有强大的数据湖来支撑数据驱动的软件研发。只有一个完整的自动驾驶的研发的工具链才能做到这一点,使开发的效率得到有效的提高。
就像大家在这张图上所看到的“8”字模型,是自动驾驶的一个数据的闭环,原始数据从收集到汇集,到数据湖当中然后进一步细化转化分析,通过处理到云端进行部署。同时我们看到很多的工作将来会从车端汇聚到云上进行处理,一旦这些数据在处理就绪后,再进行软硬件在环验证测试,最后模型验证部署到车辆上,在现实环境中测试,都需要有一套完整的可以支持数据闭环的环节。
我们看到,在每个环节,都有对应的自己的服务和跟合作伙伴一起构建的服务能力,帮助汽车科技企业、Tier 1和全栈自研的整车厂,构建这样的能力。这个能力从现在看到的测试车辆,将来会拓展到运营车队管理。
刚才谈到面临的挑战,所应对的策略和看到问题的基础上,推出了一套基于云原生自动驾驶的开发平台框架。这套平台框架是赋能给合作伙伴和客户自己构建这套平台。
这套平台可以支持有效的ADAS和AD的开发,在前端通过刚才提到的FleetWise工具,通过4G/5G的网络获得的数据,注入到自动驾驶的数据湖,同时传感器数据在采集数据以后,通过专线或硬盘的形式注入到云端数据湖。同时,把所有的数据进行转换、抽取、标注、标识、场景识别。当这些数据做完以后,同时帮助大家进行算法的开发训练,以及做软件在环和硬件在环的仿真测试,这个平台可以实现自动编排,同时帮助大家形成从租户到项目工作台层次化的结构管理,让生态合作伙伴都可以一起在平台上进行协作开发,同时形成资源和数据的隔离,保证数据的安全性。
我们有Repo代码库,可以把算法工程师开发的代码上传到代码库,同时通过CI/CD的流水线自动归集做模型仿真,同时自动部署到硬件闭环上完成测试。硬件的开展可以通过协同的门户来协同任务,查看任务状态。
大家看到,这套平台已经跟国际几家合作伙伴和客户完成了真正商业的运用,平台可以快速开发部署,可以实现可交换,在里面每个模块都可以实践覆盖到硬件、软件、工具和云,进行数据接口的切换。
同时,基于云和HPC的开发工具包快速部署使用,基于云无限量的扩展,为将来服务提升延伸的可能。这也是一个可扩展的计算平台,包括车规级的系统应用,并提供一套完整的工具链。
总结一下,这套平台核心的价值在哪里?核心价值在于帮助合作伙伴和客户构建这套平台以后,他们可以加快投产的速度,可以有自动化的数据流水线、仿真流水线,以及并行加速的软件在环的环境、CI/CD的环境,云和硬件已经打通,实现硬件开环的自动化部署和测试。同时支持多租户的协同开发,还是一套开放和自主的平台,所有核心代码已经贡献给了开源社区ADDF自动驾驶开发框架项目,并充分利用开源的软件进行搭建;开放的框架集成第三方的软件硬件,不仅适用于自动驾驶领域,还包括座舱、车身、底盘领域所有的控制软件。
成本优化,利用云弹性资源减少一次性投入,云服务器技术显著降低了云的用量,开源软件也能降低大家在工具软件上的投入成本。构建核心软件能力,可以做到拥有平台代码,帮助大家快速构建平台,以及获得云原生的技术能力,掌握敏捷开发的能力与文化。
这儿列了一下全球客户和合作伙伴,我们和合作伙伴深度赋能这些客户进行自动驾驶开发,不断优化软件能力。
最后,今年亚马逊中国峰会上,升级了去年峰会上提出的“汽车行业创新加速计划”,去年是1.0,今年是2.0,差别在于更着重在行业解决方案,注重在帮助客户出海,以及加强合作伙伴计划。
加强在建构解决方案的领域,希望能够借助在全球合作伙伴和全球客户的最佳实践,帮助中国客户打造新一代自动驾驶开发平台,并能够建构整体的生态能力。相信所有出海车辆,除了新能源汽车、智能网联的客户体验外,自动驾驶、高级辅助驾驶也会成为标配功能。希望结合在国际上的安全合规以及国际生态合作伙伴,帮助国内车企及汽车科技企业对接国际车企,实现海外业务的拓展。
亚马逊云科技非常关注汽车行业初创企业,这些才刚刚开始获得投资并快速发展的企业,希望跟他们深度合作,一起对接客户,把他们培养成在每个领域的独角兽。
在专属上云补贴、共享商机、行业俱乐部、专业辅导、技术投入、共建方案、生态市场活动方面都会做出突破性的进展和尝试。欢迎各位合作伙伴一起加入到加速计划,和我们一起帮助中国企业、中国市场构建新一代自动驾驶平台。
谢谢!
(注:本文根据现场速记整理,未经演讲嘉宾审阅)