欢迎来到萍乡财经杂文网!

萍乡财经杂文网

你想看的都在这里
萍乡财经杂文网
当前位置:

信达证券白金版【专利解密】百度唇语语音唤醒技术

来源:萍乡财经 时间:08-10 13:51:28浏览4次

据微网消息  ,7月25日  ,百度举行了“百度艾城&乌兰察布战略合作签约仪式”  。在签字仪式上  ,百度与乌兰察布市济宁区正式达成合作共识  。他们将在交通、城市管理、社区、供热等24个项目上合作  ,共同带动人工智能城市治理产业在济宁地区集聚  ,为内蒙古智能城市建设示范房  。

在人工智能城市治理项目规划中  ,双方将共同投资建设智能城市基础设施  ,推动全面智能城市治理体系的建成  。从人工智能城市基础设施建设和重点示范项目入手  ,逐步实施人工智能交通管理系统、人工智能政府服务系统等方面的建设  ,逐步推进济宁地区人工智能城市的发展和转型进程 。

然而  ,语音识别技术是智能城市中不可或缺的一环  。随着语音识别能力的增强  ,越来越多的智能设备也被应用到语音识别中  。目前  ,智能设备的语音交互模式基本上使用基于语音唤醒词的语音交互  。语音功能唤醒的具体操作一般是使用固定的唤醒词  ,如:小程度、小程度等 。唤醒语音交互设备  。语音交互设备开始识别 ,然后与用户进行语音交互 。然而  ,在现有的语音唤醒方法中  ,唤醒词必须在语音交互之前再说一遍  ,重复唤醒词会给用户带来不好的体验 。

在此背景下  ,百度于18年1月22日申请了一项名为“基于嘴唇的语音唤醒方法、装置和计算机可读介质”的发明专利(申请号:201810061009.1) 。申请人是北京百度网络新闻科技有限公司

根据目前公布的专利文件  ,让我们看看这种基于嘴唇的声音唤醒方法  。

如上图所示 ,示出了基于嘴唇的语音唤醒方法的步骤流程图  。首先  ,采集用户的嘴唇变化图像 。当用户需要为某个智能设备启动语音交互功能时  ,用户可以直接对智能设备的摄像头说话 ,然后通过摄像头实时采集用户的嘴唇图像 。

其次  ,判断用户的嘴唇变化图像是否与预设的变化图像相匹配  。根据接收到的用户嘴唇变化图像进行判断  ,可以与预设的变化图像进行比较  ,判断图像是否匹配  。此外 ,由于用户可能正在与其他人交谈  ,因此有必要判断用户此时是否正在向智能设备进行语音输入  。

最后  ,当用户的嘴唇变化图像与预设的变化图像匹配时 ,语音交互功能被唤醒  。此时 ,当用户的嘴唇变化图像与预设图像匹配时 ,用户想要与智能设备进行语音通话  ,智能设备开始唤醒语音交互功能  。此时 ,用户不需要做任何额外的唤醒动作  ,可以直接进行语音对话  。

上图是嘴唇闭合和打开的示意图  。当用户的嘴唇变化图像与预设的变化图像匹配时  ,在唤醒语音交互功能的步骤后  ,接收用户的语音  ,判断该语音是否为有效的语音信息;如果是  ,则执行响应操作;如果没有 ,语音交互功能关闭  。

以上是基于唇语的语音唤醒方法 。在一些尴尬的情况下 ,不适合发声 ,即使在一些危险的情况下  ,这样的唇语技术也可以使用  。它也是一个有着大脑洞的专利  。我希望随着面部识别和其他技术的改进和发展 ,将来可能会有新的技术  ,比如嘴唇解锁  。

这篇文章最初是由第一作者写的  ,未经授权不得转载 。

   

分享到:

请输入搜索内容

最新标签

NEWSTAGS