她写出一个小工具anubis，对抗整个AI产业的爬虫大军

2025年7月9日01:42:55评论0 views字数 1581阅读5分16秒阅读模式

在人工智能大模型狂飙突进的时代，谁还在捍卫“干净的互联网”？一位名叫Xe Iaso的女程序员，凭一己之力写出一个名为Anubis的开源工具，帮助全球数十万网站抵御AI爬虫的贪婪索取。

自今年1月上线以来，Anubis已被下载近20万次，被GNOME桌面环境、FFmpeg项目，甚至联合国教科文组织（UNESCO）等机构采用。

在这场看似不对称的“信息保卫战”中，Iaso代表的是日益边缘化的“小互联网”势力，而她面对的对手，是不再遵守robots.txt协议、不再理会公平原则甚至知识产权法规的生成式AI巨头。

一次服务器“卡顿”，引爆了一场抗争

事情的起点令人熟悉又无奈：Iaso发现自己托管代码的Git服务器突然访问异常。刷新无果后，她翻查访问日志，发现两天内服务器已重启500次，罪魁祸首是一只来自亚马逊云计算平台的AI爬虫，它正点击服务器上的每一个链接。

“我一开始想把服务器从公网下线，但还是希望保留公开代码。”Iaso回忆说，于是她开始尝试“拦截”——而这些尝试一开始并不合法，“有些做法我不能在录音里承认”。

直到她将一段实验性代码上传GitHub，GNOME项目作为“救命稻草”采用后，这段工具开始崭露头角：Anubis诞生了。

在AI爬虫变得越来越狡猾的今天，传统防御手段失效已成共识。

Iaso的解决方案，是一个她称之为“Uncaptcha”的机制：让浏览器完成一组JavaScript加密运算，并通过服务器校验，以此确认访客是否为真正的“人类用户”。这一过程对普通用户完全透明，主流浏览器自2022年以来已能轻松完成运算，但对AI爬虫而言，却需要高昂的计算成本。

这正是关键所在：“让AI爬虫的行为变得‘不经济’”，从而降低其大规模爬取的动机。

开源、轻量、可自托管：Anubis为何被快速接纳？

Anubis 的设计理念极为务实：

正因如此，它受到许多开源组织和小型机构的追捧。尽管它只是“一段业余时间里写的工具”，但Anubis已成为这场非对称战争中的一把利剑。

与AI军火赛跑：一场永无休止的“猫鼠游戏”

Iaso明白，这场战斗永无休止。“真正的挑战在于如何在不误伤用户的前提下识别AI爬虫，并防止对方反推你的防御模式。”她形容这就像“要让坏人看不出门在哪儿，却又要让好人能找到出口”。

她表示，数据投毒等方法无效。“在生成式AI的训练规模下，‘往海里撒点尿’不会改变海的味道。”

Anubis的背后，是一个人持续对抗整个野蛮生长的AI行业的努力。虽然她通过 Patreon和GitHub Sponsors获得一些支持，但她坦言这不足以维持全职开发，“如果有足够资金，我会立即雇佣协作者一起维护”。

在这个由AI驱动、数据疯狂攫取的时代，个体似乎注定处于劣势。但正如Iaso所说：“如果AI公司想阻止我，只需要想办法让我分心。”

Anubis或许不是最终的答案，但它代表了一种可能——一种不服输、不投降、不静默的姿态。

附注：Anubis项目主页（GitHub）地址：https://github.com/Xe/anubis

如果你不想让你的文档库、博客、开源项目等在线资产成为AI爬虫的饲料，不妨试一试这位开发者的“AI爬虫盾牌”。

原文始发于微信公众号（GoUpSec）：她写出一个小工具，对抗整个AI产业的爬虫大军

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

Code-Xplus功能添加