新西兰全搜索科技资讯编辑Theo撰稿,现在在网络服务注册的账户,登录时候要填写的验证码越来越难了,有时要花几分钟才能搞定。这也验证码原本只是为了帮助系统分清是用户登录行为,还是电脑机器人操作登录,因此需要电脑识别不了,但是人类很容易识别。但是为什么现在连人类自己都难识别了。这些验证码的原理到底是什么? 我们今天就带大家一探究竟。验证码的英文名称是CAPTCHA(Completely Automated Public Turing Test to Tell Computers and Humans Apart 全自动分清电脑和人类的区别测试)。最先是在2000年由当时的卡内基梅隆大学计算机博士路易斯·冯·安发明的,主要是帮助雅虎邮箱甄别用户邮箱登录是人类登录还是电脑机器人登录的。该验证码于2009年卖给了谷歌公司。 因为读写是人类最擅长的能力之一,因此验证码最开始是简单的读写,比如说将字母和汉字拉成奇形怪状的,用户还是可以识别出来进行验证,但是对机器来说并不是那么简单。 然而,随着科技的发展,机器学习的能力开始增强,这种简单的读写很容易被图像识别软件给识别出来,起不到验证的作用。 于是验证码就变成前一部分字母是固定的,后一部分字母是随机根据老旧报纸或者文献上面的文字生成的,然后电脑会根据大部分用户的输入正确率来判别随机生成的文字是什么,来达到验证的目的。这样也帮助了电脑去判别老旧书籍上面印刷的文字,帮助了保存古籍的作用。但是,机器学习的能力很快造成这种验证也不管用了。 紧接着,谷歌推出了验证码二代,这样就出现了大家都很不喜欢的各种奇葩的图片识别测试: 初级版:请把下方滑块移到正确位置 进阶版:请选中下面图片中交通信号灯的区域 进阶版:请选中下面图片中人行斑马线的区域 进阶版:请选中下面图片中消防栓的区域 这些验证测试变得越来越难了,你以为这个仅仅是你输入验证码那么简单,其实你也是在帮电脑在学习图像识别,你是一个未被支付任何薪酬的人工标记的免费劳动力。谷歌通过验证码的方式,帮助他们的谷歌地图机器人来识别路上拍摄的各种画面,识别交通标识,行人,以帮助机器实现自动驾驶的能力。 你以为只有谷歌这么做么,其实中国国内的一些科技公司也在这边做帮助训练人工智能机器人,我觉得验证码方面吐槽最多的要数中国铁路购票的验证码了,超级令人厌烦: 在你马上就能拿到春运火车票回家的时候,给你来上这么一出。一旦选错,你的票就没了。 还有这种,如果不追星的话,估计连票都买不成了。 […]