crawl4ai：非常强大的AI自动爬虫工具

admin

141051
文章

117
评论

2025年5月19日15:42:23评论3 views字数 657阅读2分11秒阅读模式

免责声明：
由于传播、利用本公众号Z1sec所提供的信息而造成的任何直接或者间接的后果及损失，均由使用者本人负责，公众号及作者不为此承担任何责任，一旦造成后果请自行承担！如有侵权烦请告知，我们会立即删除并致歉。谢谢！

项目地址：https://github.com/unclecode/crawl4ai

安装方法：

python3.9 -m pip install crawl4ai --pre -i https://pypi.tuna.tsinghua.edu.cn/simple

接着运行：

crawl4ai-setup
crawl4ai-doctor

crawl4ai：非常强大的AI自动爬虫工具

此时可写测试代码：

import asyncio
from crawl4ai import *

asyncdefmain():
asyncwith AsyncWebCrawler() as crawler:
        result = await crawler.arun(
            url="https://www.baidu.com/",
        )
print(result.markdown)

if __name__ == "__main__":
    asyncio.run(main())

运行：

使用命令行运行：

crwl http://www.baidu.com/ -o markdown

此外还可以调用AI进行多次处理：

crwl http://www.baidu.com/  -q "Extract all product prices"

原文始发于微信公众号（Z1sec）：crawl4ai：非常强大的AI自动爬虫工具

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

左青龙
微信扫一扫

右白虎
微信扫一扫

crawl4ai：非常强大的AI自动爬虫工具

邮件服务器安全检查工具 | 一个用于检查邮件服务器安全配置并识别潜在漏洞的综合工具。

工具 | QDoctor

一款全方位扫描工具 - Milkyway

SpiderX【JS加密自动化绕过工具】

LaunchBox:快速启动和管理各类工具的图形化工具箱，支持多种类型工具的统一管理和快速启动。

MORF - 移动侦察框架

ZipCrackerCTF比赛伪加密破解神器

密码恢复神器-Passware Kit Forensic

网络扫描工具箱 ss0t-Scan

一个漏洞挖掘小工具 - SeeMore

发表评论

在线咨询

微信