300句话合成20万字 AI超拟真有声书《智能交通》上线
2022-04-22 09:05:15 来源: 北京青年报

4月21日,世界读书日前夕,AI超拟真有声书《智能交通》在喜马拉雅App上线。这部音频作品基于百度董事长兼CEO李彦宏所作《智能交通》一书,使用李彦宏约300句公开语音数据,通过AIGC(AI自动生成内容)技术创作生成,其音频合成效果还原度媲美原声。

300句话合成20万字 AI超拟真有声书《智能交通》上线

利用300句话

合成20万字有声书

《智能交通》有声书共分86集,首日上线21集,后续每天更新2集,用户在百度搜索“智能交通有声书”可直接收听。从20万字专业文本到超拟真音频作品,《智能交通》有声书成功创作的背后是百度在语音合成技术上的领先优势。目前,只需9句话素材、5分钟等待,百度语音合成技术即可实现对用户声音的复刻,300句话即可生成媲美专业音库的音频内容。

作为业内唯一能提供10句话以内大规模产品级个性化语音合成服务的公司,百度相关技术早已应用于各类产品中,如在百度地图吸引超过600位明星红人入驻语音广场,实现个性化定制语音包,每日播放次数达2亿。

本次语音合成中,百度语音合成团队运用以TTS技术(语音合成)为代表的AIGC(AI自动生成内容)技术,基于robin公开的语音数据,成功使用语音合成技术生成了智能交通的公开课音频。众测结果表明普通用户基本无法区分robin真人声音与合成声音,支撑这一成果的是百度在语音合成技术上已获得的重大技术突破。

实际上,作为一种新兴的内容生产方式,AIGC的应用发展有赖于AI全栈技术能力的支撑。而作为国内AI领域的领军者,百度布局人工智能已逾十年。本次用语音合成一本接近20万字的有关智能交通的专业书籍,书中包括一些个人叙述内容,也包含一些技术讲解内容,涉及不同的表达语境,并且有相当多的中、英文专业词汇。为此,百度也运用了多种AI技术能力。包括率先研发的端到端细粒度建模技术,该技术无需显示的发音时长约束,降低了原始的数据要求及处理难度,可以胜任这种长短不一、口语化较多的发音场景。该技术使得原本成千上万的数据需求量大幅降低,目前百度最新的个性化合成只9句即可实现普通效果,300句可达到专业水准。

未来智能交通

聪明的车+智慧的路

《智能交通》有声书内容来自李彦宏所作《智能交通:影响人类未来10年—40年的重大变革》一书,这是国内首部系统阐述中国智能交通发展现状和前景的专著。

在书中,李彦宏认为,加快智能交通基础设施建设是大势所趋,人工智能、5G、云计算、物联网等技术正在成为拉动智能交通发展的新引擎。智能交通基础设施建设的目标,是“聪明的车”和“智能的路”协同推进,L5级自动驾驶的车和C5级的路是终极目标。我国有着领先的科技人才红利,有着丰富的人工智能应用场景,有着无可比拟的良好政策环境,智能交通建设必将走在世界前列。

具体来看,李彦宏在其中提出了六大创新理念,其中一个便是百度正在做的“智能交通运营商”。他认为,短期来看,每个城市都将有一个或多个智能交通运营商;中长期来看,或将出现2-3家全国性的智能交通运营商。智能交通运营商,将搭建起直接服务消费者的一站式出行服务平台,为人们提供综合的交通出行方案和服务,包括“交通信号控制”“交通支付”“智能停车”“无人驾驶”“智能公交”等服务需求。面向未来,智能交通运营商还将创造全新的出行的模式,比如定制出行、预约出行,个性化出行服务等。

而另一大创新理念“车路协同”则从成本、安全、效率、商业落地等方面,解释如何加快自动驾驶大规模商用的进程。目前一辆自动驾驶汽车的硬件成本在100万元左右。如果做到车和路的双向安全冗余,则可以补齐单车智能的短板,大规模降低成本。车路协同还通过车路的传感器互联,实现超视距感知,能综合考虑路上所有车辆的运动情况,从而做出全局最优决策结果,保证驾驶安全性。此外,相比于单车智能,车路协同可以从全局来统筹优化,并从根源上解决拥堵问题,让交通效率大幅度提升。

关于发展智能交通中存在的问题,李彦宏也在书中提出,L4及以上自动驾驶两大难点将是:安全和成本。自动驾驶是一个复杂的系统,包括环境感知、行为预测、规划控制、高精地图、高精定位等多个领域的顶尖技术。L4及以上的自动驾驶的实现,在硬件、软件层面,在算力、算法、数据层面,其技术难度不是线性的增长,而是指数级增长。比如自动驾驶汽车上的硬件如激光雷达、芯片的价格正在不断降低,这是整个产业链共同努力的结果,特别是国产企业在这方面已经取得了长足的进步,未来自动驾驶硬件很多都会实现国产化替代。

他预测,未来,由新技术、新理念、新模式构建的智能交通系统,将可能降低90%的交通安全事故。10年之内,靠交通效率的提升,基本上可以解决城市拥堵问题。而随着共享无人车的普及,MaaS出行即服务等理念的推行,私家车的保有量将大幅降低,全球碳中和目标有望顺利达成。

百度智能技术

历经9年全球领先

目前,百度公司分别在自动驾驶、智能交通、AI等多个方向努力,并在全国各地有诸多案例落地,全面助力智能交通发展。

自动驾驶方面,百度从2013年开始布局自动驾驶,2017年推出了全球首个自动驾驶开放平台Apollo。在中国北京、美国加州等城市已开展无人驾驶测试。百度让每个普通人都有机会体验自动驾驶的乐趣。百度旗下的“萝卜快跑”已在北京、广州、上海、重庆、深圳、阳泉等城市全面开放自动驾驶出行服务,面向公众常态化试运营。

2020年10月10日,Apollo自动驾驶出行服务正式登陆北京,目前已经在北京亦庄、通州、顺义、海淀提供自动驾驶出行服务,用户可通过萝卜快跑App一键呼叫自动驾驶车。2021年10月,萝卜快跑在亦庄开启常态化商业运营,向公众全面开放。数据显示,2021年Q4季度,自动驾驶出行服务App“萝卜快跑”载人订单量达21.3万单,萝卜快跑计划到2030年扩展到100个城市。

2021年6月17日,百度Apollo携手ARCFOX极狐共同发布新一代量产共享无人车ApolloMoon,成本仅为48万元,是行业L4级自动驾驶车型平均成本的三分之一。意味着百度自动驾驶车和一个运营5年的网约车司机+车的成本持平,让无人车的商业化落地具备了低成本优势,进入网约车运营成本区间,成为无人车真正走向大规模商业化的全新里程碑,将改变出行市场格局。

此外,“5G云代驾”是无人驾驶的重要配套服务,基于5G、智慧交通、V2X等新基建设施,可为无人驾驶系统补位。比如在面对临时道路变更或交通管制等情况,接到求助请求后“5G云代驾”可以接管无人驾驶车,改为平行驾驶状态,帮助车辆解决问题。“5G云代驾”云端驾驶员安全可靠,训练有素,云端驾驶训练均超过1000小时无事故,可以确保非自动驾驶状态车内乘客和车外行人的绝对安全。“5G云代驾”的云端驾驶员已成为AI时代的新职业。

在“智能信控”领域,书中也举出了一个案例。百度为京津冀协同发展的关键节点城市保定打造了河北省首个新型智能交通项目“保定AI智慧交管大脑”。基于百度的车路协同、大数据和AI技术,已经在保定建设了176个智能路口,实现了对车辆的自动化、精准化、智慧化的管控,让红绿灯“看清”路口车流量状态、“看懂”交通演变规律,并实时动态调整红绿灯配时策略。百度还在保定建设了一个特色场景:智能可变车道。在保定可变车道案例中,车道的切换是完全依靠百度的信控优化系统实现的,让车道的方向与车辆的需求更匹配,更及时地解决左转和直行排队长度不均衡的问题,实现了动态可变车道的控制。目前,保定城区高峰通行拥堵指数已下降4.6%,平均速度提升11.6%;应用动态干线协调控制的四条主干道,车辆行程时间平均缩短约20%,车速平均提高约6.5千米每小时。

在“车路协同”方面,2020年5月,北京ApolloPark在北京亦庄落成,这是全球最大的自动驾驶和车路协同应用测试基地。百度在此部署了ACE智能路口解决方案,这个方案具备“多杆合一、多感合一”、“一次投资、持续收益”的优势,目前部署了28个路口。百度ACE智能路口方案,以其创新引领性,定义了新基建交通路口的中国标准。广州黄埔区也采用了百度Apollo的ACE智能交通解决方案,在城区6条主干道实施了动态绿波的控制策略,每条道路平均行程时间下降了25%,平均遇红灯停车次数由3-4次下降为0-1次,其中核心干道开泰大道东往西方向实现了一路绿灯通过12个路口。广州黄埔区通过建设“智慧路”,让开车的市民一路绿灯通行,不再依赖“好运气”。

李彦宏在书中写道:“在我看来,智能交通时代的拐点已经到来。我非常庆幸,当我们国家有

责任编辑: 梅长苏