IT技术博客大学习 共学习 共进步
全部 移动开发 后端 数据库 AI 算法 安全 DevOps 前端 设计 开发者

一个Captcha的思路

BT的花 blogs 2010-07-05 23:24:54 累计浏览 3,832 次
本机暂存

    Captcha――或者很山寨的说――图形验证码,是一个让人又爱又恨的技术。一方面它给正常用户增加了额外的负担,降低可用性;另一方面没有它,你一定迟早碰到 spam 的问题。

    我想大家都在致力于提高 Captcha 的可用性,即设计出"人"可以轻松识别,但是对机器(ANN/SVM)却很困难的技术。每当看到Google那样扭曲到变态的图标,正常用户都会感到愤怒。

    我以前看到一个比较有意思的方法是,让用户把一副图片旋转成正确的角度:比如一个凳子的图片,人类很轻松就知道应该四脚朝下,椅背方向朝上;但机器恐怕比较难做到这点。

    后来有一天我想到一个主意。人类的眼球有一个特性,就是只要切换速度足够快,那么可以感觉到一幅幅静止的图片动起来;甚至类似隔行扫描(A场、B场)那种技术,人类神经可以自动把一幅幅残缺的图片拼凑成整张。电视正是这么干的:

    原图已失效 原图已失效

    我的想法是借助动态gif,每一帧都有大量噪点(电视这个例子上是每一帧都有50%的噪点?),但噪点位置帧和帧之间都不一致,组合起来后或许能被人类自动忽略,而关注在我们希望展示的内容上。因此还特意研究了一下动态gif的技术(http://www.dup2.org/node/1250)。但最后没有得到一个好结果,就中止研究了。不过有了这样一个结论:一定要让背景(内容)和前景(噪声)同时运动,否则识别难度没有本质提高。

    本来这个属于失败的研究,不打算blog的,可是看到了一个新出来的 Captcha 服务:NuCaptcha,也是同时有动态背景和动态前景。那么这个思路可能还是值得分享一下

同分类推荐文章

  1. 从”内容治理”到”行为治理”:中国智能体治理框架深度解析与绿盟科技实践 (2026-06-23 21:49:28)
  2. 美团海报生成 AIGC 技术创新与实践 (2026-06-22 15:34:28)
  3. AI Coding Agent 时代,我自己最常用的 4 个终端工具 (2026-06-22 08:00:00)

查看更多 AI 文章 →

建议继续学习

  1. 给程序员新手的一些建议 (累计阅读 13,090)
  2. 淘宝图片存储架构 (累计阅读 10,961)
  3. 五个免费开源的数据挖掘软件 (累计阅读 6,529)
  4. 招聘者拿起你的简历后的前6秒钟看的都是什么 (累计阅读 6,112)
  5. CI框架里用的验证码 (累计阅读 5,819)
  6. 基于用户行为分析的搜索引擎自动性能评价 (累计阅读 5,780)
  7. 皮尔逊积矩相关系数的学习 (累计阅读 5,604)
  8. 文言文白话文互转:文言文转白话文(现代文),白话文(现代文)转文言文 (累计阅读 5,159)
  9. 音乐智能推荐 (累计阅读 4,414)
  10. 淘宝搜索中Query下拉推荐技术 (累计阅读 4,405)