频率分析在
数学、
物理学和
信号处理中是一种分解
函数、
波形、或者
信号的频率组成,以获取
频谱的方法。在
密码学中,频率分析是指研究字母或者字母组合在文本中出现的频率。应用频率分析可以破解
古典密码。
频率分析基于如下原理:在任何一种书面语言中,不同的字母或字母组合出现的
频率各不相同。而且,对于以这种语言书写的任意一段文本,都具有大致相同的特征字母分布。比如,在
英语中,字母
E出现的频率很高,而X则出现得较少。类似地,ST、NG、TH,以及QU等双字母组合出现的频率非常高,NZ、QJ组合则极少。英语中出现频率最高的12个字母可以简记为“ETAOIN SHRDLU”。
在一个简单的替换密码中,
明文中的每一个字母都被另一个字母替换,而且且明文中相同的字母在转换为密文时总是被同一个字母所替换。比如,所有的e都会被替换成 X.一个含有大量X的密文消息会向密码破译者暗示X替换e.