AgentQL 是一套用于从实时网站提取数据并自动化工作流的工具,包含 AI 驱动的查询语言、Python 和 JavaScript SDK、基于浏览器的调试器以及 REST API 端点。它使用自然语言查询来精确定位任何网页上的数据和元素,包括需要认证和动态生成的内容。用户可以在查询中定义结构化数据输出并应用转换。AgentQL 的自然语言选择器可以根据网页内容直观地查找元素,并在不同网站间兼容,同时能随着 UI 变化自行修复。
| 示例名称 | Python | JavaScript |
|---|---|---|
| 入门 | 脚本 | 脚本 |
| 关闭 Cookie 对话框 | 脚本 / Colab | 脚本 |
| 关闭弹出窗口 | 脚本 / Colab | 脚本 |
| 比较产品价格 | 脚本 / Colab | 脚本 |
| 通过提示获取元素 | 脚本 | 脚本 |
| 无限滚动 | 脚本 / Colab | 脚本 |
| 使用远程浏览器 | 脚本 | 脚本 |
| 使用现有浏览器 | 脚本 | 脚本 |
| 查询列表项 | 脚本 | 脚本 |
| 网站登录 | 脚本 / Colab | 脚本 |
| 无头浏览器 | 脚本 / Colab | 脚本 |
| 保存/加载认证会话 | 脚本 | 脚本 |
| 隐身模式 | 脚本 | 脚本 |
| 等待页面加载 | 脚本 / Colab | 脚本 |
| 电商定价数据 | 脚本 | 脚本 |
| 情感分析 | 脚本 / Colab | 脚本 |
| 获取 XPath | 脚本 | 脚本 |
| 提交表单 | 脚本 | 脚本 |
| 收集 YouTube 评论 | N/A | 脚本 |
| 使用类人行为避免反爬虫 | 脚本 | 脚本 |
| 在 Google Colab 中运行 | 脚本 | N/A |
| 收集电商分页数据 | 脚本 / Colab | 脚本 |
| 从 HackerNews 收集分页数据 | 脚本 / Colab | 脚本 |
| 抓取 Google Maps 并保存为 CSV | 脚本 | 脚本 |
| 新闻聚合器 | 脚本 | 脚本 |
如需详细指南和 API 参考,请查看我们的官方文档。
如果您觉得 AgentQL 有帮助,请考虑在 GitHub 上为我们加星!这有助于我们触达更多开发者并持续改进项目。
如有问题、反馈或支持需求,请加入我们的 Discord 社区。您也可以在 GitHub、Twitter 和 LinkedIn 上关注我们!