reCAPTCHA-抵御垃圾评论
既然选择Wordpress开了博,就免不了跟垃圾留言较劲,一天少则几条,多则几十上百条,诚然有Akismet这个东东,但毕竟这是“被动式”防御,如果让Akismet再加上一个留言“验证码”一类的东西,估计效果会更上一层楼。所以,我要给大家推荐一款由Google(收购)出品的“在防止垃圾留言的同时,亦可帮助一些组织完成大量电子扫描设备无法识别的古籍中的单词”的东东(这句有点长,下文解说)。
CAPTCHA是“Completely Automated Public Turing Test to tell Computers and Humans Apart”的简称,中文即“全自动区分计算机和人类的测试”,最初是由卡内基梅隆大学的学者提出,其是用来在电子时代区分人类和计算机的最好方法,原理就是让用户看图输入一组经变形或增加波浪线的字母组、单词组,这类经处理的图像是无法由计算机扫描识别的,只能由人类分辨读出,所以,这个特性催生了reCAPTCHA这个项目。即同时产生两个词组(一前一后),一个词组是已知答案的词组(已经过CAPTCHA技术处理,机器无法识别),如果能回答出这组词,那么reCAPTCHA服务器将获知这是一个人类,他的回答将是可信的;同时,另一组词(当然也会经过CAPTCHA技术处理),是没有答案,即还不知道是什么单词,无论你输入的是对是错,都将连同上一个已知答案的词组,返回到reCAPTCHA服务器,如果上一个词组(已知答案)回答正确,第二个词组的答案将会被记录,反之不会,这个记录就将作为“人类对未知的扫描结果的一个预回答”记录下来,作为判断这个未知单词的依据。同时,这个未知单词还将被发往无数个使用reCAPTCHA技术的网站,假若不同的站点的不同访客都对这个单词回答了一样的答案,那么,这个答案就将作为这个单词的正确答案。这就是一个完整的reCAPTCHA过程过程,即通过一个“判定是否人类”的词组来获取“一个未知答案的词组”的答案。如下图:
说完reCAPTCHA的前生今世,再来说说它的用法,reCAPTCHA服务现由Google经营,全世界有大量的未处理的扫描单词存在那里,每时每刻都有该服务推向千万个使用该服务的网站,由访客来判断并给出答案。所以,针对不同的技术应用,都有相应的插件,
比如我们使用的Wordpress
一款名叫“WP-reCAPTCHA”
http://wordpress.org/extend/plugins/wp-recaptcha/
的插件就是用来完成将此服务显示出来的工作。用法如下:
1、打开http://www.google.com/recaptcha,点击左侧的Get reCAPTCHA,然后用你的Google账户登录。
2、在“Create a reCAPTCHA key”页面,填入你的域名,点击Creat Key生成(生成的key可用于本域名或本域名下的子域名)。
3、得到PublicKey和Private Key两组密匙,分别填到WP-reCAPTCHA插件的设置页面中,并点选“Enable reCAPTCHA for comments”,保存,就OK了。刷新下你的文章页面,是否有了如上图那个验证码?!
综上所述,你在使用reCAPTCHA服务抵御垃圾留言的同时,还将帮助人类识别、积累更精准的古老信息,将其变身为电子文档保存,这将是对人类自身的巨大贡献。不过说到这,不得不将其与我们的汉语做对比,比来比去,也就字母类的语言可以这么来,汉字的演变史太长太复杂了,古老的汉字就连我们自己的专家都难以识别,别说世界其他地方的人了,所以,我们汉字典籍的数字化,相比于英文等语言,还有更长的路要走。
参考:
1、维基百科关于CAPTCHA的解释。
http://zh.wikipedia.org/zh-cn/CAPTCHA
2、维基百科关于reCAPTCHA的解释。
http://zh.wikipedia.org/zh-cn/ReCAPTCHA