视频数据_连续的图像序列

视频数据

连续的图像序列

视频数据是指连续的图像序列，其实质是由一组组连续的图像构成的，而对于图像本身而言，除了其出现的先后顺序而外，没有任何结构信息。

结构

视频数据可用故事单元、场景、镜头、帧来描述。

1．帧

帧(Frame)是组成视频的最小视觉单位，是一幅静态的图像。将时间上连续的帧序列合成到一起便形成动态视频。对于帧的描述可以采用图像的描述方法，因此，对帧的检索可以采用类似图像的检索方法来进行。

2．镜头

镜头(Shot)是由一系列帧组成的，它描绘的是一个事件或一组摄像机的连续运动。在拍摄视频时，根据剧情的需要，一个镜头可以采用多种摄像机运动方式进行处理。由于摄像机操作而引起的镜头运动主要有摇镜头、推拉镜头、跟踪等几种形式。

3．场景

场景(Scene)由一系列有相似性质的镜头组成，这些镜头针对的是同一环境下的同一批对象，但每个镜头的拍摄角度和拍摄方法不同。场景具有一定的语义，从叙事的观点来看，场景是在相同的地点拍摄的，因而具有相同的主题内容。

4．故事单元

故事单元(Story Unit)也称视频幕(Act)，是将多个场景进行组织，共同构成一个有意义的故事情节。如果把帧、镜头和场景分别对应文本信息中的字、词和句子，那么故事单元就好比文本信息中的段落。

特点

1．信息内容丰富

视频数据是随时间变化的图像流，含有更为丰富的其他媒体所无法表达的信息和内容。以视频的形式来传递信息，能够直观、生动、真实、高效地表达现实世界，所传递的信息量非常丰富，远远大于文本或静态的图像，例如，在课堂讲述毒品的基本知识和危害时，用一段视频表现出来的效果就强过单纯用一幅图像或一段文字来表现。

2．数据量巨大

静态图像、文本等类型的数据，数据量较小，而视频数据，数据量巨大。视频数据的数据量比结构记录的文本数据大约大七个数量级。视频数据对存储空间和传输信道的要求很高，即使是一小段的视频剪辑，也需要比一般字符型数据大得多的存储空间。通常在管理视频数据时都要对其进行压缩编码，但是压缩后的视频数据量仍然很大。

3．时空二重性的复杂结构关系

视频数据由多幅连续的图像序列构成，因而视频段之间的关系属性复杂，既有时间属性又有空间属性。文本数据是一种纯字符型数据，没有时间和空间属性，图像数据有空间属性，但是没有时间属性。

4．数据解释的多样性、主观性视频数据具有十分丰富的内涵，受人的个体主观因素影响较大，不同的人对同一段视频会产生不同的感受和重述。

参考资料

最新修订时间：2022-08-25 12:47

条目作者

概述

结构

参考资料