ACR
自动内容识别
ACR (Automatic Content Recognition) ,自动内容识别,是一种利用计算机算法直接识别多媒体内容(音频、视频、图像)的技术,识别算法的输入可以是多媒体文件,也可以是通过麦克风、摄像头采集的原始数据,然后在海量多媒体数据库中进行特征比对、搜索,从而得到匹配结果。
工作原理
ACR技术的工作原理与文字搜索引擎类似,需要收集海量的图像、音频、视频资源,并持续更新,然后通过数字信号处理技术,提取多媒体资源的数字特征,并进行索引、存储,构建索引数据库和搜索引擎。
ACR搜索引擎接收到查询请求时,对请求中包含的多媒体数据片段采用相同的处理过程,提取相同格式的数字特征,然后在索引数据库中查找、过滤、计算相似度,找到与未知片段最为相似的多媒体资源,当相似度达到一定置信度时,认为找到匹配结果。
常见技术及应用
数字指纹
数字指纹是指从多媒体资源本身提取可近似作为其唯一标识的数字特征。不应考虑内容的格式、编码、比特率、压缩率等方面的区别,只考虑内容传达的信息是否相同或十分类似。
以上特点使得数字指纹技术的应用范围十分广泛,音频指纹的应用市场发展较快,如音乐识别(Shazam),版权检测(YouTube),电视互动(新浪微博),多屏互动(Facebook)等。
数字水印
数字水印技术的原理类似二维码,需要改变多媒体资源的内容,按照一定规则,向其中插入人类不可感知的信息,然后再通过检测预设的规则来提取其代表的信息,水印技术耗费资源少,但需要解决引入噪音控制的问题。
水印技术的特点,使其是适用于某些特定场景,如声波支付(支付宝)。
技术平台
国际ACR技术市场发展迅速,各有所长,正在推动互联网消费市场的技术转型,知名的公司有:
最新修订时间:2023-08-04 12:05
目录
概述
工作原理
常见技术及应用
参考资料