首页 / AI

一个Captcha的思路

BT的花 blogs 2010-07-05 23:24:54 累计浏览 3,832 次

本机暂存

内容概览

这篇讲的是大家既熟悉又头疼的 Captcha 技术。作者开篇就点明了它的矛盾处境：一方面，它是对抗 spambot、保障服务安全的必要屏障；另一方面，它又实实在在地给正常用户增加了操作成本，有时甚至导致用户流失。

文章的核心观点在于，问题并不在于 Captcha 本身是否该存在，而在于当前的交互形式过于生硬和普遍。作者观察到，许多网站对所有用户“一刀切”地弹出验证，哪怕用户已经登录或行为模式十分可信。这种做法其实是在用最低效、体验最差的方式，去防御并非来自所有访客的威胁。

因此，作者的思路引向一个更精细的方向：Captcha 应该成为一个“智能开关”，而不是一堵固定的墙。理想情况下，系统应该能通过风险评分机制来判断——对于低风险操作和用户，应当完全隐藏 Captcha；只有当行为模式触发警报时，才介入验证。这样既维护了安全底线，又将对正常用户的打扰降到了最低。

Captcha――或者很山寨的说――图形验证码，是一个让人又爱又恨的技术。一方面它给正常用户增加了额外的负担，降低可用性；另一方面没有它，你一定迟早碰到 spam 的问题。

我想大家都在致力于提高 Captcha 的可用性，即设计出"人"可以轻松识别，但是对机器（ANN/SVM）却很困难的技术。每当看到Google那样扭曲到变态的图标，正常用户都会感到愤怒。

我以前看到一个比较有意思的方法是，让用户把一副图片旋转成正确的角度：比如一个凳子的图片，人类很轻松就知道应该四脚朝下，椅背方向朝上；但机器恐怕比较难做到这点。

后来有一天我想到一个主意。人类的眼球有一个特性，就是只要切换速度足够快，那么可以感觉到一幅幅静止的图片动起来；甚至类似隔行扫描（A场、B场）那种技术，人类神经可以自动把一幅幅残缺的图片拼凑成整张。电视正是这么干的：

原图已失效

我的想法是借助动态gif，每一帧都有大量噪点（电视这个例子上是每一帧都有50%的噪点？），但噪点位置帧和帧之间都不一致，组合起来后或许能被人类自动忽略，而关注在我们希望展示的内容上。因此还特意研究了一下动态gif的技术（http://www.dup2.org/node/1250）。但最后没有得到一个好结果，就中止研究了。不过有了这样一个结论：一定要让背景（内容）和前景（噪声）同时运动，否则识别难度没有本质提高。

本来这个属于失败的研究，不打算blog的，可是看到了一个新出来的 Captcha 服务：NuCaptcha，也是同时有动态背景和动态前景。那么这个思路可能还是值得分享一下

同分类推荐文章

从”内容治理”到”行为治理”：中国智能体治理框架深度解析与绿盟科技实践（2026-06-23 21:49:28）
美团海报生成 AIGC 技术创新与实践（2026-06-22 15:34:28）
AI Coding Agent 时代，我自己最常用的 4 个终端工具（2026-06-22 08:00:00）

查看更多 AI 文章 →

建议继续学习

给程序员新手的一些建议（累计阅读 13,090）
淘宝图片存储架构（累计阅读 10,961）
五个免费开源的数据挖掘软件（累计阅读 6,529）
招聘者拿起你的简历后的前6秒钟看的都是什么（累计阅读 6,112）
CI框架里用的验证码（累计阅读 5,819）
基于用户行为分析的搜索引擎自动性能评价（累计阅读 5,780）
皮尔逊积矩相关系数的学习（累计阅读 5,604）
文言文白话文互转：文言文转白话文（现代文），白话文（现代文）转文言文（累计阅读 5,159）
音乐智能推荐（累计阅读 4,414）
淘宝搜索中Query下拉推荐技术（累计阅读 4,405）