唇语识别
集机器视觉与自然语言处理的技术
唇语识别是一项集机器视觉与自然语言处理于一体的技术,可以直接从有人讲话的图像中识别出讲话内容。
唇语识别系统使用
机器视觉技术
,从图像中连续识别出人脸,判断其中正在说话的人,提取此人连续的口型变化特征;随即将连续变化的特征输入到唇语识别模型中,识别出讲话人口型对应的发音;随后根据识别出的发音,计算出可能性最大的自然语言语句。
在唇语识别过程中,口型与发音,发音与文字之间,并不是唯一对应的关系,常常有多个可能的备选结果,需要实时计算出可能性最大的结果。
参考资料
2017“十大黑科技”亮相
.人民网.
最新修订时间:2024-05-21 12:38
条目作者
小编
资深百科编辑
目录
概述
参考资料
Copyright©2024
闽ICP备2024072939号-1