什么算法技术用来制作Siri?
发布时间:2018-11-06 作者:jason
语音助手由几乎相同的技术组成。因此,要创建像Siri这样的个人助理,您需要:
语音到文本(STT)引擎。引擎将用户的语音转换为文本。语音可以是音频文件或用户的语音流。
文本到语音 (TTS)引擎。将文本转换为语音。这在驾驶或烹饪时特别有用,因此用户不必停止他正在做的与语音助理交互的事情。此外,它在助理人性化方面发挥了重要作用。
标记 (智能)。标记有助于语音助理了解用户的需求。例如,用户可能会问:“今晚我需要一把雨伞吗?”然后标签引擎可以用天气或日历信息标签标记信息。
降噪引擎。几乎没有一个安静和完美的语音请求环境,总会有一辆车在移动或者一只狗吠叫。因此降噪引擎不仅可以消除白噪声,还可以帮助您的助手了解您。
语音生物识别技术。这是一种身份验证方式,因此您的助手可以识别您的语音并仅响应您的命令。Siri实际上有它,你可以教你如何说“嘿Siri”。
语音识别。机器学习组件,可驱动所有个人助理移动应用程序。这项技术让助手能够理解你所说的内容,基本上它将意义置于你的话语背后。
语音压缩引擎。该引擎特别有用,因为它为用户提供了快速输出。它压缩用户的语音,以便更快地发送到服务器。为此,您可以使用不丢失数据的G711算法。
用户界面。语音助理的UI由语音和呼出两部分组成。语音部分是用户因他的问题而听到的内容,并且呼出是他在移动屏幕上看到的内容。