作为合作方,Nuance研发工程总监张亚昕表示,以前的语音识别技术只能做到简单的语言识别,如果希望进阶到自然语言理解阶段,需要克服的技术障碍将包括复杂的软件算法;能够在各种高噪声环境中准确工作;多语言支持和快速反应;大词汇量、操作简单、低延迟等等。目前,Nuance汽车应用已涵盖导航、娱乐、电话&信息与联网服务领域,可实现包括单命令目的地输入、POI语音搜索、TTS语音播报信息与导航、新闻阅读器、语音拨号、口撰新信息等在内的多种功能。
“未来的人机交互将是互联、多模式、智能、个性化和无缝整合的。”张亚昕分享了Nuance的未来汽车愿景,“HMI不但支持语音、运动、触屏、手写、生物识别等多种操作方式,汽车甚至还能通过自适应模板和声纹技术等自动识别个人,流畅的人机对话将不再是梦。”
在高端汽车信息娱乐领域中,也有部分厂商采用云计算技术用于支持语音识别。但Glenda Dorchak认为,云计算的优势在于它能通过各种复杂算法,产生先进的分析技术和功能,以提供更高的精度。但问题在于,目前高级语音识别系统需要的是高MIPS和快速内存访问,UI越来越多地要求访问先进的查找表和算法。而云带来的直接负面影响就是系统的延时,且产品质量良莠不齐,这是很多用户无法接受的。未来,协处理器还将有望集成专用的硬件加速器、算术逻辑单元(ALU)和更大的内存,能够以更低的延时、功耗,更快地处理高级UI功能。
Spansion语音协处理器结合了定制型逻辑和高速存储器