信息隐写是关于信息隐藏,即不让计划的接收者之外的任何人知道信息的传递事件(而不只是信息的内容)的一门技巧与科学。隐写术英文作“
Steganography”,来源于
约翰尼斯·特里特米乌斯一本看上去是有关黑魔法,实际上是讲
密码学与隐写术的一本书Steganographia中。此书书名来源于希腊语,意为“隐秘书写”。
隐写术就是将秘密
信息隐藏到看上去普通的信息(如
数字图像)中进行传送。现有的隐写术方法主要有利用高
空间频率的图像数据隐藏信息、采用
最低有效位方法将信息隐藏到宿主信号中、使用信号的色度隐藏信息的方法、在数字图像的像素亮度的
统计模型上隐藏信息的方法、Patchwork方法等等。当前很多隐写方法是基于文本及其语言的隐写术,如基于同义词替换的文本隐写术,an efficient linguistic steganography for chinese text一文章就描述采用中文的同义词
替换算法。其他的文本的隐写术有基于文本格式隐写术等。
因为这个原因,数字图像(包含有大量的数据)在因特网和其他传媒上被广泛用于隐藏消息。这种方法使用的广泛程度无从查考。例如:一个24位的位图中的每个像素的三个颜色分量(红,绿和蓝)各使用8个比特来表示。如果我们只考虑蓝色的话,就是说有2^8种不同的数值来表示深浅不同的蓝色。而像11111111和11111110这两个值所表示的蓝色,人眼几乎无法区分。因此,这个最低有效位就可以被(在某种程度上检测不到地)用来存储颜色之外的某些信息。如果我们对红色和绿色进行同样的工作的话,我们可以在(差一点不到)三个的像素中存储一个字节的信息。
更正式一点地说,使隐写的信息难以探测的,也就是保证“有效载荷”(需要被隐蔽的信号)对“载波”(即原始的信号)的调制对载波的影响看起来(理想状况下甚至在统计上)可以忽略。这就是说,这种改变应该无法与载波中的噪声加以区别。
(从信息论的观点来看,这就是说信道的容量必须大于传输“表面上”的信号的需求。这就叫做信道的冗余。对于一幅数字图像,这种冗余可能是成像单元的噪声;对于数字音频,可能是录音或者放大设备所产生的噪声。任何有着模拟放大级的系统都会有所谓的热噪声(或称“1/f”噪声),这可以用作掩饰。另外,有损压缩技术(如JPEG)会在解压后的数据中引入一些误差,利用这些误差作隐写术用途也是可能的。)
隐写术也可以用作数字水印,这里一条消息(往往只是一个
标识符)被隐藏到一幅图像中,使得其来源能够被跟踪或校验。实际上在日本,“……内容标识符论坛和日本数字内容协会已经开始试验一套数字水印系统来‘防止盗版’(
日本时报在线,2001年8月26日)。”
近几年来,隐写术领域已经成为了信息安全的焦点。因为每个Web站点都依赖多媒体,如音频、视频和图像。隐写术这项技术可以将秘密信息嵌入到数字媒介中而不损坏它的载体的质量。第三方既觉察不到秘密信息的存在,也不知道存在秘密信息。因此
密钥、
数字签名和私密信息都可以在开放的环境(如Internet,或者内联网)中安全的传送。主要介绍隐写术的基本原理以及各方面的应用。
载体文件(cover file)相对隐秘文件的大小(指数据含量,以
比特计)越大,隐藏后者就越加容易。因为这个原因,
数字图像(包含有大量的数据)在
因特网和其他传媒上被广泛用于隐藏消息。这种方法使用的广泛程度无从查考。例如:一个24位的
位图中的每个像素的三个颜色分量(红,绿和蓝)各使用8个比特来表示。如果我们只考虑蓝色的话,就是说有2种不同的数值来表示深浅不同的蓝色。而像11111111和11111110这两个值所表示的蓝色,人眼几乎无法区分。因此,这个
最低有效位就可以用来存储颜色之外的信息,而且在某种程度上几乎是检测不到的。如果对红色和绿色进行同样的操作,就可以在差不多三个像素中存储一个
字节的信息。
更正式一点地说,使隐写的信息难以探测的,也就是保证“
有效载荷”(需要被隐蔽的信号)对“载体”(即原始的信号)的调制对载体的影响看起来(理想状况下甚至在统计上)可以忽略。这就是说,这种改变应该无法与载体中的
噪声加以区别。