OA0 = Omni AI 0
OA0 是一个探索 AI 的论坛
现在注册
已注册用户请  登录
OA0  ›  技能包  ›  parallel:通过 Parallel.ai API 进行高精度网页搜索与研究

parallel:通过 Parallel.ai API 进行高精度网页搜索与研究

 
  branch ·  2026-02-17 21:33:04 · 3 次点击  · 0 条评论  

名称: parallel
描述: 通过 Parallel.ai API 进行高精度网络搜索与研究。专为 AI 智能体优化,提供丰富的摘要和引用。支持认证/私有数据源。
user-invocable: true
disable-model-invocation: true
触发器:
- parallel
- deep search
- research
- enrich
- findall
- monitor
- extract
元数据:
clawdbot:
emoji: "🔬"
primaryEnv: PARALLEL_API_KEY
requires:
bins: [python3, curl, jq]
env: [PARALLEL_API_KEY]


Parallel.ai

专为 AI 智能体构建的高精度网络研究 API。

安装与设置

安装必需的 Python 包:

pip install parallel-sdk requests

设置您的 API 密钥:

export PARALLEL_API_KEY="your-key"

获取密钥地址:https://platform.parallel.ai

可选 — 用于访问需要认证的私有数据源(基础使用无需此步骤):

export BROWSERUSE_API_KEY="your-key"  # 仅在需要使用认证源时设置

API 概览

API 主要用途 速度
Search 快速查询、时事新闻
Task 深度研究、数据丰富、报告生成 中-慢
FindAll 实体发现 → 结构化数据集 慢(异步)
Extract 从 URL/PDF 中提取纯净内容
Monitor 持续追踪与告警 周期性

Search API - 快速网络搜索

python3 {baseDir}/scripts/search.py "Who is the CEO of Anthropic?" --max-results 5
python3 {baseDir}/scripts/search.py "latest AI news" --json

Task API - 深度研究与数据丰富

# 简单问题 → 答案
python3 {baseDir}/scripts/task.py "What was France's GDP in 2023?"

# 结构化数据丰富(公司研究)
python3 {baseDir}/scripts/task.py --enrich "company_name=Stripe,website=stripe.com" \
  --output "founding_year,employee_count,total_funding"

# 研究报告(带引用的 Markdown 格式)
python3 {baseDir}/scripts/task.py --report "Market analysis of the HVAC industry in USA"

# 使用认证数据源(需要 browser-use.com 密钥)
export BROWSERUSE_API_KEY="your-key"
python3 {baseDir}/scripts/task.py "Extract specs from https://nxp.com/products/K66_180"

处理器

处理器 速度 深度 适用场景
base 简单查询、事实核查
core 标准 数据丰富、结构化数据提取
ultra 报告生成、多跳研究

FindAll API - 实体发现(2026年2月新增)

将自然语言描述转换为结构化数据集。例如,“查找俄亥俄州所有评分4星以上的牙科诊所” → 生成带引用的丰富列表。

# 基础实体发现
python3 {baseDir}/scripts/findall.py "Find all AI startups that raised Series A in 2025"

# 带数据丰富功能
python3 {baseDir}/scripts/findall.py "portfolio companies of Khosla Ventures" \
  --enrich "funding,employee_count,founder_names" --limit 50

# 潜在客户生成
python3 {baseDir}/scripts/findall.py "residential roofing companies in Charlotte, NC" --generator pro

# 检查运行中任务的状态
python3 {baseDir}/scripts/findall.py --status findall_abc123

生成器

生成器 覆盖范围 成本 适用场景
base 有限 快速发现、原型设计
core 均衡 大多数用例
pro 全面 最大召回率(基准61%)

工作原理

  1. 解析:将自然语言 → 转换为实体类型与匹配条件
  2. 生成:在网络上搜索候选实体
  3. 评估:根据匹配条件验证每个候选实体
  4. 丰富:为匹配的实体提取额外字段

Extract API - 纯净内容提取(2026年2月新增)

将任何 URL 转换为纯净的 Markdown 格式——可处理 JavaScript 密集型页面、PDF 和付费墙内容。

# 带摘要的基础提取
python3 {baseDir}/scripts/extract.py https://stripe.com/docs/api

# 提取完整内容(不仅仅是摘要)
python3 {baseDir}/scripts/extract.py https://arxiv.org/pdf/2301.00000.pdf --full

# 聚焦式提取
python3 {baseDir}/scripts/extract.py https://sec.gov/10-K.htm --objective "Extract risk factors"

# 同时处理多个 URL
python3 {baseDir}/scripts/extract.py https://url1.com https://url2.com --json

应用场景

  • API 文档 - 提取完整的参考文档和代码示例
  • PDF 研究论文 - 提取方法、结果、引用
  • SEC 文件 - 从 10-K、财报中提取特定章节
  • 新闻文章 - 获取无广告/导航/付费墙的纯净文本

Monitor API - 持续追踪(2026年2月新增)

设置周期性查询——在内容发生变化时接收告警。

# 创建一个监控任务
python3 {baseDir}/scripts/monitor.py create "Track AI funding news" --cadence daily
python3 {baseDir}/scripts/monitor.py create "Alert when AirPods drop below $150" --cadence hourly

# 使用 Webhook 通知
python3 {baseDir}/scripts/monitor.py create "OpenAI product announcements" \
  --cadence daily --webhook https://your-endpoint.com/webhook

# 列出所有监控任务
python3 {baseDir}/scripts/monitor.py list

# 获取事件(检测到的变化)
python3 {baseDir}/scripts/monitor.py events monitor_abc123
python3 {baseDir}/scripts/monitor.py events monitor_abc123 --lookback 10d

# 删除一个监控任务
python3 {baseDir}/scripts/monitor.py delete monitor_abc123

执行频率

  • hourly - 快速变化的话题、股票/价格追踪
  • daily - 新闻、竞争情报(最常用)
  • weekly - 缓慢变化、政策更新

查询示例

  • 新闻:"Let me know when someone mentions Parallel Web Systems"
  • 竞争:"Alert me when Apple announces new MacBook models"
  • 价格:"Notify me when PS5 Pro is back in stock at Best Buy"
  • 政策:"Track changes to OpenAI's terms of service"

认证数据源(2026年1月)

Task API 通过 MCP 服务器支持需要身份验证的私有数据源
- 内部维基和仪表板
- 行业数据库(NXP、IEEE 等)
- CRM 系统和订阅服务

使用 browser-use.com 的 MCP 集成:

设置

  1. browser-use.com 获取 API 密钥
  2. 创建一个包含已保存登录会话的配置文件
  3. 设置 BROWSERUSE_API_KEY 环境变量

使用方法

export BROWSERUSE_API_KEY="your-key"
python3 {baseDir}/scripts/task.py "Extract migration guide from NXP K66 docs"

如何选择 API

场景 推荐 API 原因
快速事实查询 Search 快速、简单
公司信息丰富 Task 结构化输出,带引用
构建潜在客户列表 FindAll 发现 + 验证 + 丰富数据
从 URL 提取内容 Extract 可处理 JS、PDF、付费墙
持续追踪 Monitor 一次设置,接收告警
深度研究报告 Task (--report) 多跳研究,带引用
访问受限内容 Task + MCP 通过认证进行浏览

API 参考

  • 文档:https://docs.parallel.ai
  • 平台:https://platform.parallel.ai
  • 更新日志:https://parallel.ai/blog

安全与权限

此技能的功能:
- 向 api.parallel.ai 发起 API 调用,用于网络搜索、研究、内容提取和监控
- monitor.py 使用 requests 库;其他所有脚本均使用 parallel-sdk
- 所有脚本均为只读研究工具——不会修改任何本地或远程数据
- BROWSERUSE_API_KEY(可选)仅用于通过 api.browser-use.com 访问认证数据源

此技能不会执行的操作:
- 不会将您的 API 密钥发送到 api.parallel.aiapi.browser-use.com 以外的任何端点
- 不会访问本地文件、数据库或系统资源
- 不会读取配置文件或访问文件系统
- 不会写入磁盘(使用 --json 参数时的 JSON 输出除外)
- 无法由智能体自主调用(disable-model-invocation: true

Python 依赖项: parallel-sdk, requests(通过 pip install parallel-sdk requests 安装)

首次使用前,请查看 scripts/ 目录以验证脚本行为。

3 次点击  ∙  0 人收藏  
登录后收藏  
目前尚无回复
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor