标致混合动力汽车即将亮相必比登挑战赛
05-27
【互联网出行】本届广州车展期间,科大讯飞展出了最新版3.5语音交互助手:科大讯飞智能语音助理3.5,据悉,这款产品版本显着提升了系统降噪和交互体验。
简而言之:它可以让你和汽车之间的对话和交互体验更加接地气,而不需要像以前那样“互相适应”。
”+“相互包容”,它的实际表现是什么?我们上车谈谈吧! (文中称为3.5版本) 识别/降噪 说到语音识别,识别(有人在说)、定位(谁在说)和理解(在说什么)是最核心、最关键的体验。
我的想法。
如果这三步都做到了就不行,更别说后续的扩展了。
汽车的行驶环境非常复杂,包括轮胎噪声、噪声、发动机噪声、空调噪声和人声干扰等。
这些噪声会与说话人的有效音频一起发送到语音识别系统,会严重影响识别效果,因此需要进行降噪处理。
。
此次3.5版本采用的窄波束技术就是为了解决这个问题而诞生的。
通过向麦克风模块输入两个麦克风信号,并预先设定其有效区域,仅在有效区域内进行。
它同时拾音和抑制噪音,同时抑制非有效区域的说话人声音和环境噪音,从而提高有效区域的清晰度,减少有效区域外的噪音和环境影响。
这个怎么样?听起来是不是和主动降噪耳机类似?此外,结合相应的降噪技术,3.5版本还实现了更精准的控制。
支持前排驾驶员和副驾驶操作。
谁醒来就有最终决定权。
比如副驾驶醒了,那么后续的对话就只是汽车和副驾驶之间的事情了。
主驾驶中断?这不起作用!而且不同的唤醒位置对应着不同的功能,所以大家可以各取所需。
唤醒词:唤醒词给您印象最深的场景是什么?当着妈妈的面对着屏幕喊“XXX”,结果却是一脸惊愕?或者无论你想做什么,都得不停地喊你好、你好?关于唤醒词,3.5版本也有自己的变化。
用一句话来形容就是:有话直说!在3.5版本中,你只需要唤醒系统一次,就可以继续对它吼叫一段时间。
hello XX、hello XX等就不用多说了,值得一提的是,短时免唤醒支持全场景模式,可以在云端或者本地离线环境下操作。
这个设计的初衷很简单:让你感觉更像是在和一个人说话,而不是一个冰冷的机器。
另外,在3.5版本中,你仍然可以给它设置一个标题,对于两个字以上的标题,你不需要说hello XXX来唤醒它,直接说你好就可以了! “XXX帮我打开窗户”、“XXX的车太热了”、“XXX播放一首歌……”是不是感觉轻松多了?语境理解在语音交互中,很多时候我们有潜在的需求,而不是仅仅用一句话要求系统为你服务,比如天气、行程或者餐饮等,3.5版本为我们提供了更流畅的“对话可能性””,之后第一次语音交互完成后,你可以继续提出下一个问题或请求,而人与人之间的对话:之前已经提到或涉及到的事情往往会在后续的对话中变得具体。
使用术语来指代,甚至省略它们,甚至不出现在对话中。
“北京明天天气怎么样”? →“你有去那里的火车票吗?” →“为我订购一份”。
3.5版本的语音系统将记录语音对话的历史,并根据后续引用或缺失的信息来关联和补全历史信息,使整个对话具有深厚的历史逻辑。
这样做的目的是什么?每个人都有记忆吧?多轮交互/所见即所得 即使在语音交互时代,也不是所有操作都能一步完成。
这时候就需要和车、机器进行多轮的交互和确认。
在3.5版本中,多轮交互变得更加流畅。
您可以像和朋友聊天一样直接一步步确认,整个过程支持随时中断。
只要看到你想要或者需要的结果,你就可以随时回去或者撤退,直接说出来就可以了,不需要额外的步骤。
操作和废话。
所见即所得也是基于上述结构的服务。
在交互过程中,您经常需要在许多相似的结果中进行过滤,尤其是电话号码或道路。
你不必说:哪个号码,你甚至可以说,“最后一个号码的那个”,“丹棱街上的那个”,“最后一个号码的那个”。
“选择路怒症”患者现在可以鼓掌了!一次性信息点交互 最后我们来看看3.5版本的另一项“实用技能”:跨场景信息点交互。
听起来需要付出很多努力吗?您可以将其理解为:支持您根据POI位置信息进行各种混合形式的交互。
举个最基本的例子:我在哪里? →现在是哪条街? →如何去下一个路口?或者这样:泰丰大厦附近有韩国烧烤吗?外出时需要带伞吗? →最近污染严重吗? →最近的洗车场在哪里? →这附近有什么好吃的吗?你还可以这样做:最近北京的天气怎么样? (天气)→我想去那边欢乐谷,(目的地)→附近有住宿的地方吗? (POI) 小编总结:从当年的多媒体大屏到如今的车机互联,这块屏幕的角度和属性也随着硬件、随着自然语义和云的介入而快速迭代和改变。
技术的进步,我们越来越希望眼前的屏幕不仅仅是一台只能用文字来敷衍你的机器。
如果是一个人就太好了。
显然,科大讯飞已经给了我们答案,或者说趋势和方向,我们希望在3.5版本的体验中看到。
从源头上进行干预是助手3.5版本的核心,识别能力和降噪能力的显着提升,直接提升了它感知你的能力,借助云技术,3.5版本还实现了上下文理解、多轮POI信息的对话和综合交互。
虽然我们在人机交互的道路上还有很长的路要走,但至少今天,你终于愿意和它聊一会儿了。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
05-27
05-18
05-27
05-27
05-27
05-18
05-27
05-27
最新文章
马斯克:特斯拉或将重新接受比特币支付
售价34800元起,力帆320-620雪地版车展上市
Orange Kit AMG CLA 45 S Edition 1 官照
视觉变化是全新国产马自达3 Star试驾重点
四款国四新品发布,福田奥铃勒芒赛事启动
魅力后轮驱动改装斯巴鲁BRZ-丰田86-FR-S
预售人民币18万元起,领克07 EM-P将于5月17日上市
奔驰CLS概念车官方形象亮相北京车展