新能源汽车产业快速发展亟待配套措施出台
05-27
目前,中文语音识别已经率先取得突破性进展。
虽然离实际应用还很远(要求错误率低于10%),但是已经很接近了。
对于自动驾驶技术,人们通常关注的焦点是如何控制车辆并安全高效地行驶。
当我们在车内或车外时,我们如何与车辆互动? 在手机上打字?使用聊天工具进行交流?答案是直接说话,让车载AI进行语音识别。
语音识别本来是深度学习的一个小范畴。
我们生活的时代是英语霸权的时代。
IBM、微软、苹果和谷歌都宣称他们的语音识别(当然是英语)错误率约为 6%-7%。
与10年前相比,这应该是一个突出的数字。
然而,看看各大公司推出的语音助手,比如Siri、小冰和谷歌的新宠Google Assistant,我们就明白这些智能助手不太可能有太大用处。
面对大多数问题,他们要么炫耀自己的观点,要么用陈词滥调来解释问题,似乎智商堪忧。
人工智能在世界围棋比赛中击败了冠军。
为什么它的语言智力仍然这么差? 语音识别的关键在于模型。
无论外部原因(发音不标准、环境嘈杂、缺乏上下文关联),传统的GMM-HMM语音模型已经越来越没有潜力可挖。
至少目前还没有一个自动驾驶系统敢把语音识别放在关键位置(手势识别也有类似的问题)。
它们的作用就是充当花瓶,控制一些不重要的事情:比如打开音响、接听电话,甚至不发短信。
因为关键词错误,顾客晚上可能会回去跪搓衣板。
语音识别允许乘客说出他们的目的地,因为人类可以用眼睛检查机载人工智能是否正确理解它。
使用语音实时控制车辆本质上是禁止的。
如果出现操作失误,汽车制造商抱怨乘客的口音是没有意义的。
乘客不可能拿播音员证才能使用自动驾驶车辆。
这时,汉语作为单音节语言的优势就凸显出来了。
多家中国公司开发的软件的中文语音识别准确率接近%。
即使专业术语很多,软件也能正确解释(不限于特定专业)。
偶尔会有错误,也可能是乘客发音不标准造成的。
令人惊奇的是,如果说话者有标准口音,中文识别软件就不需要适应。
相反,如果说话者的口音不标准,AI需要短时间的训练,识别率仍会很快上升到标准状态。
对于自动驾驶车辆来说,几分钟的适应性训练是小菜一碟。
某公司主推的深度学习能力在这其中发挥了关键作用。
端到端的注意力机制是目前语音识别准确率高的主要因素。
中国企业在语音识别领域正处于历史性领先地位。
这表明中国一些软件公司在深度学习和机器智能算法方面取得了长足进步。
这些能力将更加清晰地体现在自动驾驶系统本身的设计中。
就传感器和计算单元等硬件设计而言,世界是平的。
任何愿意的企业都可以从世界上最著名的公司获得供应(价格可能有所不同)。
此时,软件设计日益成为自动驾驶系统开发的核心资产。
这真有趣。
车载AI与人类打交道的能力越强,它的智商进化得越快,学习能力就越强,我们对车辆的控制就越有信心。
我们惊讶地发现人类婴儿有这样的学习曲线。
虽然我们强调人工算法和人脑运作方式的差异,但最终它们可能会殊途同归。
目前来看,中文语音识别率先取得突破性进展。
虽然离实际应用还很远(要求错误率低于10%),但是已经很接近了。
这样一来,新推出的自动驾驶系统的说明可能会这样写:“支持客户使用语音实时控制车辆行驶。
如果使用中文,将会得到系统更加积极、正确的回应。
欢迎来到使用。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
05-27
05-27
05-18
05-27
05-17
05-18
05-27
05-27
05-18
05-27
05-18
05-27
最新文章
工信部将继续支持新能源汽车,两个机会不容错过
续航300公里的比亚迪秦EV电动版或将于3月上市
中国汽车工业协会数据!前11个月自主品牌出口下降9.3%
蜂巢能源常州工厂一期工程已投产,探路者车规级AI动力电池工厂
奥迪首款量产纯电动SUV e-tron正式亮相,续航400公里,明年进入中国
2024年,特斯拉电动汽车全球分离器使用量将达到3.4亿平方米
极氪汽车重启美股IPO,目标估值51.3亿美元
江淮iEV6S消息曝光 将于今年4月25日上市