davidch1(方义)
|
|
6 楼:
汉字密码学
|
05年01月08日22点38分 |
福尔摩斯破译的依据是:"在英文字母中e最常见,它出现的次数多到即使在一个短的句子中也是最常见的......除了e之外,英文字母出现次数的顺序并不很清楚。这种顺序,在平常一页印出的文字里和一个短句子里,可能正相反。大致说来,字母按出现次数排列的顺序是t,a,o,i,n,s,h,r,d,l,......"
呵呵,这就是利用了密码学。这些跳舞的小人图像相当于被加密后的密文,加密机制是代换密码,即通过某个特定的字符代替明文某个特定的字符。这种加密方法简单,但是对应的明文输出对应的密文,不能隐藏明文的统计特征,福尔摩斯就是通过统计密文(也就是文中的小人图像)出现的频度实现了破译。
根据资料推测,这篇文章柯南·道尔大概写于19世纪末20世纪初,这里想想当时中国的没落景象,不得不感叹一下西方科学的先进了。
英文单词是由字母组成,而字母一共只有26个,所以可以对其进行频度分析;可是汉字不同,常用汉字有三千个,那么能对汉字进行频度分析吗?
----------------------------------------------------------------------------------- 绝密档案(一)
汉字出现频率最高的应该是"我"字,也就是说,在元音结构中"O"是出现频率最高的一个字母.
关于汉字的频率研究,理论上应该是结构简单,具备四平八稳的形象特征的出现的频率最高.
可以利用目前的搜索引擎进行抽样统计.最笨的最准确的方法是:
先把三千个汉字用五笔输入法一一输入. 选择三到五个搜索网站看出现的每一个汉字的条目,记住数据. 接着选择智能输入,如上操作. 再接着选择全拼输入,如上操作. 再考虑繁体的影响,三种输入法并举.
在极个别的字上,肯定会出现用不同输入法搜索同一个字时,条目的数据显示不一样.
所有网站的病毒聚集区就在这里,缺陷的突破点也就在这里.
知道这一点的,不懂程序编辑也可以突破华文网站.
高级黑客是最先把这一点看透的,点到为止.
否则,四大行的钱,就跟自己口袋一样.呵呵!
诗歌可以赚大钱,汉字可以发大财!
好好学习,天天有大条玩,跟着老菜皮错不了.
至于什么太阳月亮星星,开裆裤的玩意.
呵呵,内库是这样洗的!
完美的程序就是一首简单的诗!
钥匙1
|
|
|
http://arronch.blogbus.com/
|
※来源: 【 推理之门 Tuili.Com 】.
|
|