太便宜?这款特斯拉车型上市三个月后就停产了
05-27
【报道】说起百度,很多人还把它的定位局限于全球最大的中文搜索引擎。
并忽略了其作为全球知名领先AI智能公司的存在。
是的,作为一家高科技产业公司,百度正试图用自己的技术让这个复杂的世界变得更简单,并通过利用大数据和AI智能,解锁我们生活中便捷的使用场景。
那么,百度技术实力背后到底有哪些“黑科技”呢?在近日举行的百度创造大会-技术开放日媒体沟通会上,笔者得到了答案。
在本次活动上,百度的三位核心技术负责人向我们讲解了百度的最新技术进展,包括提升导航应用使用体验的“手机全双工语音交互”;提升智能汽车的自动驾驶能力。
“上帝视角纯电动汽车自动驾驶”和百度深度学习平台“飞桨”,加速科研开发。
这些技术虽然名字很简单,但背后却蕴藏着更深刻的技术内涵,下面我们来好好解读一下这三项百度“黑科技”。
如何让你的手机更“懂”你?近年来的汽车市场,带有智能语音功能的车型已经成为市场发展的主流。
它们的交互操作也让我们在驾驶时实现了“说话不用手”的操作理念,大大提高了驾驶的舒适度。
安全要素。
然而,对于一些因为预算有限或其他原因购买了“非智能”汽车的用户来说,是否错过了智能语音交互呢?智能手机成为解决这一问题的最佳平台。
关于手机上的语音交互功能,想必大家都或多或少接触过。
笔者曾经在手机上的百度地图APP上体验过这个功能。
您只需拨打“小度小度”即可发起语音指令。
您可以查看自己的位置和到达目的地的距离,并按照语音导航实现全场景语音交互。
然而,有时我会发现,如果你在陌生的城市开车,在车里听着音乐、和朋友聊天,车窗里传来城市交通的噪音。
这时,你开始使用语音交互功能与手机地图软件进行通讯,让它为你规划一条新的目的地路线。
相信大多数人的选择是让车子安静后再发出命令。
原因是您担心您的手机无法识别您所说的内容。
没错,与拥有多个无线电设备的汽车相比,手机作为只有单一无线电功能的智能终端,要识别车内人的语音指令绝对是一件“麻烦”的事情,尤其是手机应用在说话的情况下。
当它在听指令时,很可能会识别出所说的内容,因此很容易造成误判,尤其是导航应用,直接关系到交通安全。
那么如何解决呢?百度语音首席架构师贾雷表示,长期以来,国际上还没有一个解决方案能够普遍支持手机全双工语音交互,即手机在播放导航提示的同时,还可以听它甚至可以像真正的对话一样随时打断我们并对新的语音命令给出反馈。
要知道,想要实现全双工的语音交互,首先必须进行回声消除,防止手机终端识别出其播放的声音。
这些在预装软件的扬声器和汽车系统上相对容易实现,并且可以通过硬件适配算法提前保证回声消除效果。
手机App是纯软件后装解决方案,软件算法需要适配不同类型的终端硬件。
通常,手机扬声器和麦克风的距离比较近。
同时,手机终端款式繁多,硬件参差不齐。
这些因素的总和会导致声音信号的回声消除出现各种问题。
另外,手机硬件的迭代更新非常快,回声消除效果更是难以保证。
面对这一问题,百度技术团队结合传统信号处理和深度学习模型各自的优势,基于语音识别目标进行端到端的回声消除和信号增强,解决了手机场景下的回声??消除问题,即使手机音量开到最大时,回声消除量可达40分贝,让手机APP的语音识别功能正常工作。
另外,在交互过程中,常常存在与交互内容无关的其他信息的干扰,例如音乐、聊天、环境噪声、残留的内部噪声等,使得语音识别变得更加困难。
为此,百度基于SMLTA2开发了多场景统一预训练模型,解决噪声、用户口音、回声消除残留吸收等问题。
各场景识别率相对提升20%以上,是业界同类技术中最好的。
,准确率最高,可以说实力遥遥领先。
而且,结合语音和语义融合的置信技术,百度的技术方案可以减少错误响应,并支持交互过程中的引导和澄清,使人机交互更加智能和流畅,更接近人与人直接的体验。
人际交往。
开启上帝视角,让智能驾驶看得更远。
近年来,智能自动驾驶可以说成为汽车产业下半年发展的“门票”。
也是车企或者软件公司争相投资的最新方向。
然而,想要一辆具备自动驾驶功能的汽车“动起来”,关键因素是如何全面、准确地感知和识别周围环境,保证车辆有足够的时间避开障碍物,获得更安全的路径。
驾驶能力。
从目前的市场来看,特斯拉作为电动汽车行业的巨头,其自动驾驶采用的是全视觉感知方案。
国内车企大多选择了包括视觉、雷达在内的多融合传感解决方案,但它们的共同点是都需要获取视觉信号或其他传感器数据进行综合计算分析,然后通过系统处理进行规划。
行驶轨迹。
然而,在这个过程中,每个独立传感器收集的数据往往受到特定视角的限制。
经过各自的分析计算后,融合阶段会导致误差叠加,无法拼凑出准确、完整的实际路况图,并提供车辆决策。
规划带来困难。
因此,BEV(Bird's Eye View)自动驾驶感知解决方案逐渐成为此类问题的新答案。
与传统方式不同,纯电动汽车的自动驾驶感知就像“上帝视角”,居高临下地看待全局。
车辆上多个传感器采集到的数据将输入到统一的模型中进行整体分析推理,生成鸟瞰图,可以有效避免误差叠加。
听起来是不是有点混乱?这是一个例子。
现在很多汽车都带有环视功能。
在环视功能中,最终的环视图像将给出车辆周围环境的场景信息。
例如,当你停车时,你可以以上帝的视角直接看到周围的空间。
这时候停车就变得非常简单了。
为什么?因为人脑不需要做观察和拼接,直接得到神的视角,做出决策和计划。
回到自动驾驶系统,上帝视角对系统的简化和帮助很大。
这也是自动驾驶感知架构演进对我们提出的第一个要求。
因此,基于BEV功能,我可以更远地看到我的车辆并更清楚地了解它。
此外,该方案还可以实现时间序列融合。
它不仅可以采集某一时刻的数据、分析某一时刻的数据,还支持将过去时间段的数据集成到模型中,进行环境感知建模和时间序列信息。
的引入使得感知结果更加稳定,使得车辆对路况的判断更加准确,让自动驾驶更加安全。
目前,百度Apollo的ANP3.0智能驾驶系统采用纯电动解决方案,成为国内唯一能够依靠纯视觉贯穿城市地区多个场景的智能驾驶解决方案。
并且2020年,百度ANP3.0将在部分车型上大规模落地。
除了BEV自动驾驶感知解决方案外,百度还在自动驾驶领域首次提出了车路一体化解决方案UniBEV。
该解决方案集成了车载多摄像头和多传感器在线测绘、动态障碍物感知以及路侧视角的多路口多传感器融合。
这是业界首个车路一体化端到端感知解决方案。
基于统一的BEV空间,大型UniBEV车路一体化模型可以更轻松地实现多模态、多视角、多时间的时空特征融合。
因此,百度依靠大数据+大模型+小型化技术的闭环,在车侧和路侧的动静态感知任务上均取得领先成果。
缩短科研流程百度飞桨来了。
从目前来看,科学技术的发展必然离不开实验和理论验证。
无论是生命科学还是工业产品,都需要背后科研人员的努力。
例如,汽车从设计图纸到实现实车需要经过无数的实验和测试。
其中,最昂贵的是风洞测试。
俗话说“风洞一吹,黄金千两”。
建设风洞测试场地需要花费大量的时间和成本。
因此,当谈到加速研发进程时,人工智能科学计算(AI for Science)的应用就成为了缩短这一时间和成本的最佳选择。
在整个行业中,已经有许多科学家团队使用人工智能来帮助解决科学问题。
例如,在气象领域,人工智能可以实现更快、更准确的数值天气预报,包括预测强对流天气的短期降水情况、揭示大型台风的形成和演变。
在生命科学领域,传统的科学研究方法面临生物实验数据有限、计算任务复杂、交叉学科多等挑战。
随着人工智能应用探索的不断推进,人工智能已逐步应用于药物筛选、药物设计、靶点研究、合成生物学、疾病机制研究等方面取得落地并不断取得进展。
然而,人工智能为解决科学问题带来新方法的同时,也给人工智能基础软硬件带来了许多新的挑战。
这是因为深度学习平台需要具备更丰富的各种计算表达能力,解决科学问题需要超大规模的计算。
这对于深度学习平台与异构超级计算/智能计算中心和神经网络编译的适配和集成优化至关重要。
服务器加速和大规模分布式训练提出了新的要求。
那么如何解决呢?近年来,百度飞桨团队在这些问题上取得了进展。
作为国内首个自主研发、功能丰富、开源、工业级深度学习平台,Paddle开发了一系列用于科学研究的工具组件,如PaddleScience、PaddleHelix、Paddle Quantum等,支持复杂形状。
提供绕障流、结构应力应变分析、材料分子模拟等丰富领域的计算实例,广泛支撑AI+计算流体力学、生物计算、生物计算等前沿方向的科研探索和产业应用。
量子计算。
为满足科学领域大规模计算的需求,飞票推出超大规模图学习训练技术PGLBox,这是业界首个支持复杂算法+超大规模图学习训练技术。
同时实现大图+超大型离散模型。
它使用显存、内存和SSD。
级存储技术和训练框架性能优化技术,单机可支持百亿节点、百亿边的图采样和训练,并可通过多机扩展支持更大规模。
目前已应用于百度智能交通、信息推荐、搜索等标杆场景落地,极大提升了业务效率和用户体验。
在科研生态方面,百度飞桨与高校、科研机构在计算流体动力学、分子动力学、动态气象等领域开展了实例建设,形成了包括飞桨在内的一些开放的、多学科的生态社区。
特殊兴趣小组(PPSIG)、共创计划等与各方共同开发技术,促进资源共享,共建生态商机。
2009年以来,百度AI的能力逐渐衰退,开始与产业经济、生产线融合。
越来越多类似的人工智能项目正在飞桨上运行,比如智能质检、农产品智能分析等。
挑选并等待。
飞票积累了100多个与行业结合的人工智能应用模式。
由于这些模型最终都成功运行,有类似需求的开发者只要根据自身的一些特点对这些模型进行修改和调试,就可以在短时间内拿出完整的人工智能解决方案和项目实施方案。
所以,在这个AI for Science赛道上,对百度飞桨的AI能力是一个挑战,但每一次的技术突破都成为了百度飞桨提升能力的机会,这也可以缩短我们实现梦想的时间成为科技强国。
路。
百度飞桨的未来一定会更加精彩。
说实话,在本文结束时,在这次媒体沟通会上,光是这三项技术就已经深深震撼了笔者。
他们背后的实力也一定是百度深耕智能技术多年的技术成果的结晶。
是的,在这个智能时代,因科技改变生活的事物早已成为一种习惯,而我们通过不断的学习和体验也适应了这种节奏。
或许正因为如此,作为一家推动智能“造福人民”的企业,百度也在为我们的福祉做出应有的努力。
智慧是世界上最强大的力量。
我相信百度的“硬核”技术还不止于此。
让我们期待1月10日的百度Create开发者大会,看看百度会带来什么样的“黑”技术。
那么“技术”呢?我们拭目以待。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
05-27
05-27
05-27
05-16
05-27
05-17
05-17
05-18
05-27
05-18
最新文章
工信部将继续支持新能源汽车,两个机会不容错过
续航300公里的比亚迪秦EV电动版或将于3月上市
中国汽车工业协会数据!前11个月自主品牌出口下降9.3%
蜂巢能源常州工厂一期工程已投产,探路者车规级AI动力电池工厂
奥迪首款量产纯电动SUV e-tron正式亮相,续航400公里,明年进入中国
2024年,特斯拉电动汽车全球分离器使用量将达到3.4亿平方米
极氪汽车重启美股IPO,目标估值51.3亿美元
江淮iEV6S消息曝光 将于今年4月25日上市