新华网 > > 正文

吐槽12306验证码?这些谈资你得有

2015年12月16日 09:07:49 来源: 新华网

  新华网北京12月16日电 想在抢票之余锻炼一下眼力,拼一拼智商,那么你绝对不能错过12306(中国铁路客户服务中心)最新的图形验证码系统。从8张图片中仔细辨别正确的答案,能体会到玩“连连看”、“大家来找茬”等游戏的乐趣。当然,你还必须具备广博的学识,要随时准备应对诸如“请点击下图中所有上过3.15晚会的企业”、“请选出所有的秦国货币”这样的“高冷”考题。

  【和12306拼智商】

  验证码存在的唯一意义,就是借以区分在这个页面上进行输入的到底是人还是机器。12306的验证码“进化史”,是一部不断与黄牛和抢票软件斗智斗勇的“血泪史”,从一开始的简单数字、字母、加减法,再到闪烁变形字母、干扰线变形字母……由于数字和字母组合可被抢票软件自动分析识别,自今年3月16日起,12306又启用了被广大网友吐槽不断的图形验证码。

  据统计,目前12306的图形码数量已多达581种,可细分为12个品类。根据输入两个关键词的登录规则,用户将有机会尝试336980道不同的验证码题目,由于存在一些模糊难辨的图片,再加上特定的“文化差异”,导致一次性输入正确率不高。难怪有网友感慨:“12306的验证码,已经击败了全国99%的购票者,我已经找不到回家的路了。”

  随着抢票软件的不断升级,验证码图片库也持续更新,验证难度进一步增加,加入了天文、地理、军事、文学等诸多知识,需用户动用抽象思维能力,但12306的验证码设计者表示“这还远远不够”。

  据铁道部“黄牛及抢票软件情报中心”介绍,目前黄牛党和抢票软件开发者们甚至组成了“反验证码特种小组”,专门研究如何第一时间破解12306的图形验证码。该小组“高手如云”,具备文理工科多学科背景。为了与这样一批“能文能武”的对手PK,12306未来还会抛出怎样高深的考题都不足为怪了。

  【验证码的“终极进化论”】

  验证码有一个充满科学气息的“高大上”名字——“全自动区分计算机和人类的公开图灵测试”(Completely Automated Public Turing test to tell Computers and Humans Apart,简称CAPTCHA)。

  众所周知,图灵测试是通过计算机回答人类提出的一系列问题来鉴别对方是人还是机器,而验证码则是一场机器向人提问的“反图灵测试”。

  随着计算机技术的进步,验证码被设计得越来越难是必然趋势,这也显示出人工智能的不断进步。程序员们在与破解者们进行着一场仿佛没有终点的拉锯战。

  斯坦福大学的一项研究发现:近两年来,互联网的验证码正变得越来越难以识别,并且每个网站平均有1/5的人,因为复杂的验证码而离开网站。

  不过,验证码也在进化过程中有了新的应用意义。卡内基梅隆大学的路易斯·冯·安等一群大神设计出了reCAPTCHA系统,将验证过程用于古籍的数字化。

  古籍扫描后,会出现一些难以准确辨识的字符,人工核对工作量巨大。而对电脑前的一个人来说,辨认验证码字符所花的几秒时间微不足道,如果把全球数以亿计的网民辨认的字符收集起来呢?于是,reCAPTCHA派上用场了,把无法识别的古籍文字制成验证码,派发给网站用户验证,根据不同用户反馈回来的单词答案,就可以轻松得到典籍模糊字符的正确结果了!原来,每一次烦人的验证,我们都在为人类典籍数字化做贡献?!reCAPTCHA后来被谷歌买走,谷歌还把这个概念应用到谷歌街景的门牌号识别中。

  【杀死那些验证码】

  难道真的没有办法让我们摆脱这些恼人的验证码吗?其实,谷歌早已在默默实施一项伟大的工程,试图“杀死那些验证码”。

  去年年底,谷歌推出了全新的验证码识别系统“No Captcha ReCAPTCHA" ,繁杂的验证码系统被一个简单的复选框所取代,用户只需勾选“我不是机器人(I'm not a robot)”这个选项即可。其实,通过收集用户在单击前的鼠标轨迹,谷歌就判断出了人与机器之间的细微差异。

  这一新系统会在“不经意间”收集用户的IP地址、cookies、CSS信息等变量,然后根据这些数据对比用户当前的行为是否与在互联网上历史行为一致,来判定究竟是人还是机器人在操作。如果谷歌认为当前用户的行为“可疑”,就会再调用传统“验证码”机制进行二次验证。据统计,绝大多数的“人类”用户都顺利通过了第一次验证。

  不过,也有人批评谷歌的“验证码杀手”有泄露用户隐私的嫌疑。AdTruth公司此前声称他们发现谷歌收集了超过用户鼠标行为之外的更多信息,并可能将这些信息用于广告服务,“它不仅能够判断你究竟是不是人,还能通过大量信息判断你是什么人”。(记者彭茜,编辑张忠霞,新华国际客户端报道)

【纠错】 [责任编辑: 田颖 ]
新华炫闻客户端下载

相关稿件

010020030300000000000000011154721285355871