定位纯电动紧凑型SUV,启辰VX6应用图出炉
05-27
【汽车资讯】说到汽车多媒体系统的语音识别功能,我想大多数用户都会觉得没什么用。
难怪目前很大一部分汽车多媒体系统的语音识别功能只停留在语音命令识别阶段。
,使用时,用户必须通过按钮启动语音识别程序,然后说出命令,并且命令的发音和词汇必须准确,否则识别效果较差,无法获得更好的用户体验获得。
为了让用户使用更方便、更好的语音识别功能,奇瑞携手国内语音识别技术领先者科大讯飞开发了Cloudrive 2.0智能云网联驾驶系统。
该系统的自然语言处理技术可以让用户仅通过说话即可操作多媒体系统的大部分常用功能,识别率可达90%以上(在驾驶时有背景噪音的环境下)。
让我们体验一下这个多媒体系统所提供的功能。
有什么用? ● 科大讯飞是谁?科大讯飞由中国科学技术大学优秀博士生刘庆峰于2001年创立。
是一家专注于语音技术研发的公司。
语音技术包括语音合成技术和语音识别技术。
为了让机器说话,需要用到语音合成技术;为了使机器理解人类的语音,需要使用语音识别技术。
科大讯飞成立17年来,一直从事语音相关领域的研究,积累了丰富的经验。
连续多年在国内外语音技术领域获奖也证明了公司的技术实力。
科大讯飞于2007年进入大众视野,当时科大讯飞推出了“科大讯飞语音云”技术。
该技术可以为许多互联网应用提供即时语音识别支持,例如QQ、短信、微博等使用语音输入的内容。
其高识别率和易用性使其在业界引起不小的轰动。
今年10月18日,罗永浩在锤子M1/M1L系列手机发布会上宣布,这两款产品将支持科大讯飞语音输入法,识别率高达97%,基本解决手机上的语音输入问题设备。
在科大讯飞语音输入法演示中,罗永浩以极快的语速进行随机语音输入,手机屏幕立即生成准确的文字信息。
这让科大讯飞瞬间成为了锤子新品发布会的主角,让科大讯飞这个原本默默无闻的科技公司一夜之间成为了“网红”。
● 是什么催生了具有强大语音识别能力的多媒体系统?我想用过旧语音识别系统的朋友都会抱怨识别率低。
除非你用的是标准普通话,用词正确,口音流畅,语速不能太快或太慢,否则认不出来就是“常事”。
开发者和用户都知道这个问题,但要容纳不同地区用户的口音差异,让计算机“理解”人类使用的自然语言,最终提高识别率,谈何容易呢?科大讯飞花了17年的技术积累,终于实现了让机器更好地识别自然语音的变革,将识别率提升到97%。
推动这一变化的还有性能更强、集成度更高的计算机芯片,它可以使集成复杂语音识别功能的车载多媒体系统小到足以安装在汽车中控台内部。
同时,强大的计算能力让语音识别等待时间达到了普通用户可以接受的程度。
4G网络的普及也是变革进程的推动力。
通过4G网络,语音识别系统可以随时更新语音库,并通过云服务器识别本地无法识别的单词,确保语音识别系统能够识别最新的单词。
● 这不仅仅是在多媒体系统上安装一个“很棒的”语音识别软件那么简单。
当你站在屏幕前时,你可能会认为奇瑞的Cloudrive2.0智云互联网驾驶系统只是一个安装在普通多媒体系统上的“牛逼”软件。
” 语音识别软件。
如果这样看的话,那就大错特错了。
当实验室识别率达到97%的语音识别系统用在高速公路上行驶的汽车上时,识别率可能会下降到50%甚至更低。
因为风噪、胎噪等噪声会极大地影响语音识别率。
为了满足奇瑞的高要求,科大讯飞作为多媒体系统提供商,必须对整个系统硬件进行各种耐久性测试,以确保系统在不同温度和振动的环境下具有良好的稳定性。
● 语音识别与车载应用的互联,为用户带来便利。
车载多媒体系统的语音识别率很高,但如果不能实现任何功能,那就毫无用处。
科大讯飞通过投资地图引擎公司美星科技,获得了丰富准确的地图信息和数千万个兴趣点信息。
通过连接语音识别与导航系统,用户只需说出“我想吃火锅”,多媒体系统即可自动找到导航目的地,然后通过语音确认目的地,轻松导航。
目前,科大讯飞已与30多家内容提供商合作。
喜马拉雅FM、网易新闻、大众点评、美团等大家熟悉的应用程序都可以与科大讯飞的车载多媒体系统互联,并可以通过语音进行沟通,以最简单、最直接的方式进行。
● 科大讯飞的理想——实现人与机器的无障碍沟通科大讯飞成功开发了一套人工智能交互界面AIUI(人工智能用户界面),它集成了双工技术和麦克风阵列技术、声纹识别技术、方言识别、语义理解技术和内容服务,最终实现人机交流可以像人与人交流一样轻松。
● 真的有用吗?你尝试后就知道了。
在实际介绍试用过程之前,我们首先介绍一下目前科大讯飞系统在奇瑞车型上的安装情况。
首款搭载Cloudrive2.0智云网联驾驶系统的车型是今年3月上市的奇瑞艾瑞泽5。
搭载该系统的奇瑞瑞虎3X也将于11月15日正式上市。
新车将提供一年免费流量(每月MB),支持多媒体系统上的各种车内应用。
如果流量超出限额,您还可以通过银联、微信、支付宝等支付平台扫描二维码购买流量。
价格为10元/MB。
根据目前用户的使用情况,大部分用户的月流量不会超过MB。
下面的视频演示了奇瑞瑞虎3X多媒体系统的语音识别功能。
从视频演示中我们可以看到,测试人员可以以正常甚至稍快的语音速度进行自然语言语音输入,甚至可以中断系统正在播放的语音来输入语音命令。
语音识别率高,测试导航、音乐播放、通话等功能不需要用户按键或触摸屏幕,实现只需要说话、不需要双手的多媒体系统操作体验。
更多精彩视频,尽在视频平台《奇瑞Cloudrive 2.0智云互联网驾驶系统语音识别演示》 据现场技术人员介绍,奇瑞Cloudrive 2.0智云互联网驾驶系统应用的语音识别功能不包含方言识别(科大讯飞有相应的语音识别功能)。
方言识别技术),但对于带有方言口音的普通话可以达到较高的识别率。
全文总结:科大讯飞的语音识别技术确实走在了世界前列。
奇瑞Cloudrive2.0智云网联驾驶系统的语音识别功能也达到了自然语言识别的高水平。
一些常用的功能基本上可以通过1-2次语音人机交互来实现,大大提高了使用的便利性。
驾驶员无需看屏幕、无需按键,即可实现各种多媒体系统功能,让他更专注地观察路况,提高了驾驶安全性。
科大讯飞通过技术整合,完成了从语音技术提供商到语音服务提供商的转型。
科大讯飞提供的车载多媒体系统配备了国际领先的语音识别系统,具有高水平的用户体验。
相比苹果CarPlay的语音识别功能,由于科大讯飞与车企的深入合作,其多媒体系统可以与车辆实现更深层次的互联。
未来,它还可以用语音控制车内的灯光开关、调节空调等各种功能。
作为科大讯飞的合作伙伴,奇瑞也有望成为首批安装科大讯飞新一代多媒体系统的厂商之一。
更先进的AIUI将其多媒体系统体验提升到一个新的水平,值得期待。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
05-27
05-16
05-18
05-17
05-16
05-16
05-27
05-17
05-18
最新文章
马斯克:特斯拉或将重新接受比特币支付
售价34800元起,力帆320-620雪地版车展上市
Orange Kit AMG CLA 45 S Edition 1 官照
视觉变化是全新国产马自达3 Star试驾重点
四款国四新品发布,福田奥铃勒芒赛事启动
魅力后轮驱动改装斯巴鲁BRZ-丰田86-FR-S
预售人民币18万元起,领克07 EM-P将于5月17日上市
奔驰CLS概念车官方形象亮相北京车展