Siri工作方式详解:本地语音识别+云计算服务

快乐无极 , 2011/11/03 21:56 , 手机相关 » iPhone , 评论(0) , 阅读(1880) , Via 本站原创 | |
点击在新窗口中浏览此图片
Siri的强大让无数网友惊叹“人类已经无法阻止Siri了”
引用
  导语:ZDNet网站今天刊文称,苹果的语音助理服务Siri时髦而聪明,在一些情况下也很有用。那么Siri是如何工作的?“语音识别”是Siri的核心,但这并未解释Siri理解用户所说内容的详细过程。本周有业内人士撰文,解释了Siri的工作步骤。

  当用户对iPhone说话后,语音将被立即编码,成为一个压缩的数字文件,其中包含着所有有用的信息。这一信息将通过互联网服务提供商(ISP)的网络被发送至云计算服务器,而服务器中的模块将识别用户所说的内容。
  与此同时,用户的语音将在手机端被识别。安装在手机中的语音识别器将与云计算服务器通信,了解指令是否适合在本地被处理。用户的指令可能要求手机播放一首歌曲,而另一些指令则有可能需要手机连接至网络,寻求进一步的帮助。如果语音识别器认为,手机内部模块足以处理用户的指令,那么将会告知云计算服务器,不再需要服务器的支持。
  根据用户的声调和语序,服务器将对语音进行静态对比,了解语音中包含哪些字母。与此同时,本地的语音识别器也将对用户语音进行静态对比。在服务器端和手机端,可能性最高的识别内容将优先获得处理。
  此时,识别出的内容已经包含一系列的元音和辅音字母。随后这些内容将被发送至一个语言模块,以评估用户的语音中包含哪些单词。根据不同的可信度,计算机将创建一个用户所说内容的列表。
  如果判断结果具有足够的可信度,那么计算机将能理解用户所说的内容,例如发送短信或查找联系人列表中的联系人。随后用户将会看到手机屏幕上出现所需的内容,而不必手动操作。在这一过程中,如果用户的语音含义过于模糊,那么计算机将会询问用户,例如用户希望查找的联系人是埃里卡·奥尔森 (Erica Olssen)还是埃里卡·施密特(Erica Schmidt)。
发表评论

昵称

网址

电邮

打开HTML 打开UBB 打开表情 隐藏 记住我 [登入] [注册]