在视频处理时,图片指的就是邻近的
画格。这些运动矢量可以想成是3D空间(2D+时域)投影到2D的结果。对一张图片而言,可以给每一个像素创建一个独特的运动矢量,也可以将邻近的像素聚集成一个区块,并只计算每一个区块的运动矢量。运动矢量的数学模型可以是单纯的
平移也可以含括例如3D空间的的
转动和
缩放等几何运动方式来更妥当地模拟真实摄影机的动态。
间接算法则是透过一些特征,如角检测来对画格间做匹配,通常会透过一些数学式去对局部或全域的统计特性做估计,如此可以借由这些数学式来把不匹配实际运动模式的匹配滤除掉。
每一种上述的方法都可以被说成是需要一些自己定义的匹配标准。差异在于是要先对同一个区域总计地进行比较(如基于特征的算法),或者是针对每一个像素进行比较(如基于区块和滤波器的算法)。一种新兴的比较标准是将一个区域作局部的转换如
拉普拉斯变换再将该区域各pixel作比较。有一些比较标准则可以将一些看起来相似但实际上并不匹配的点滤除,达到更好的匹配效果。
可以透过动态预测来做
动态补偿,利用
视频在时域上的相似性对下一个时间点的画格做预测。动态预测和
动态补偿都是
视频压缩中相当关键的技术,普遍地被运用在各
视频压缩的标准之中,例如
MPEG及较近期的
HEVC。
动态预测和
光流法常常被互相混用。它同时也与
图像配准和立体匹配有关。事实上上述几种词汇都是在找寻两张图片或视频画格间相对应的点。两图片或画格间相对应的点“通常”是该场景中的同一个点。然而,在作动态预测之前,我们必须定义相似性的比较标准。也就是说,我们需要一个尺度来测量两个点之间的相似程度。在相关领域的研究中,被定义了各种比较标准,像是SAD、MSE,随不同应用和优化需要常常会使用不同的比较标准。