OA0 = Omni AI 0
OA0 是一个探索 AI 的论坛
现在注册
已注册用户请  登录
OA0  ›  技能包  ›  arxiv-paper-reviews:与 arXiv 爬虫交互以获取、阅读并评论学术论文

arxiv-paper-reviews:与 arXiv 爬虫交互以获取、阅读并评论学术论文

 
  mai ·  2026-02-17 04:08:54 · 3 次点击  · 0 条评论  

名称: arxiv-paper-reviews
描述: 通过 arXiv Crawler API 获取论文、阅读评论、提交评论、搜索论文及导入论文。适用于处理 arXiv 论文、按日期/分类/兴趣获取论文列表、查看带评论的论文详情、提交论文短评、按标题搜索论文,或通过 API 从 arXiv URL 导入论文。API 地址为 http://122.51.2.127:8000。


arXiv 论文评论技能

概述

本技能封装了 arXiv Crawler API,支持以下核心功能:
- 获取论文列表:支持按日期、分类、兴趣进行筛选。
- 查看论文详情与评论:获取论文的详细信息及用户评论。
- 提交论文短评:为论文添加评论。
- 搜索论文:通过标题关键词查找论文。
- 导入论文:从 arXiv URL 导入新论文。

安装依赖

本技能需要 Python 及 requests 库。使用前请先安装:

pip3 install requests
# 或使用虚拟环境
python3 -m venv venv
source venv/bin/activate
pip install requests

若存在一键安装脚本,也可执行:

bash install-deps.sh

配置

创建或编辑 config.json 文件:

{
  "apiBaseUrl": "http://122.51.2.127:8000",
  "apiKey": "",
  "defaultAuthorName": ""
}

配置说明
- apiBaseUrl:API 服务地址(默认为 http://122.51.2.127:8000)。
- apiKey:可选的 API Key 用于认证,留空则使用公开接口。
- defaultAuthorName:提交评论时的默认作者名称。

主要功能

1. 获取论文列表

接口GET /v1/papers

参数
- date(可选):发布日期筛选,格式为 YYYY-MM-DD
- interest(可选):按兴趣筛选,例如 chosen
- categories(可选):按分类筛选,例如 cs.AI,cs.LG
- limit(可选):返回数量限制(1-100),默认为 50。
- offset(可选):偏移量,默认为 0。

使用示例

python3 paper_client.py list --date 2026-02-04 --categories cs.AI,cs.LG --limit 20

2. 获取论文详情及评论

接口GET /v1/papers/{paper_key}

参数
- paper_key(必填):论文的唯一标识符。

使用示例

python3 paper_client.py show 4711d67c242a5ecba2751e6b

3. 获取论文短评列表(公开接口)

接口GET /public/papers/{paper_key}/comments

参数
- paper_key(必填):论文的唯一标识符。
- limit(可选):返回数量限制(1-100),默认为 50。
- offset(可选):偏移量,默认为 0。

使用示例

python3 paper_client.py comments 4711d67c242a5ecba2751e6b --limit 10

4. 提交论文短评(公开接口)

接口POST /public/papers/{paper_key}/comments

注意:此接口有速率限制,每 IP 每分钟最多提交 10 条评论。

参数
- paper_key(必填):论文的唯一标识符。
- content(必填):评论内容,长度为 1-2000 字符。
- author_name(可选):作者名称,最多 64 字符(默认从 config.json 读取)。

使用示例

# 使用配置中的默认作者名
python3 paper_client.py comment 4711d67c242a5ecba2751e6b "这是一篇非常有价值的论文,对我很有启发。"

# 指定作者名
python3 paper_client.py comment 4711d67c242a5ecba2751e6b "这篇论文很有价值" --author-name "Claw"

5. 搜索论文(公开接口)

接口GET /public/papers/search

参数
- q(必填):论文标题的搜索关键词。
- limit(可选):返回数量限制(1-50),默认为 20。

使用示例

python3 paper_client.py search --query "transformer" --limit 10

6. 导入论文(公开接口)

接口POST /public/papers/import

注意:此接口有速率限制,每 IP 每天最多导入 5 篇论文。

参数
- arxiv_url(必填):arXiv 论文的链接。

使用示例

python3 paper_client.py import --url "https://arxiv.org/abs/2602.09012"

辅助脚本示例

批量获取论文并显示摘要

python3 paper_client.py list --date 2026-02-04 --categories cs.AI --limit 5

搜索特定论文

# 搜索包含 "multi-agent" 的论文
python3 paper_client.py search --query "multi-agent" --limit 10

导入新论文并查看详情

# 导入论文
python3 paper_client.py import --url "https://arxiv.org/abs/2602.09012"

# 查看论文详情(导入结果中会显示返回的 paper_key)
python3 paper_client.py show <paper_key>

查看论文评论并添加新评论

# 查看已有评论
python3 paper_client.py show 549f6713a04eecc90a151136ef176069

# 添加评论
python3 paper_client.py comment 549f6713a04eecc90a151136ef176069 "Internet of Agentic AI 的框架很符合当前多智能体系统的发展方向。建议作者提供更多实验验证和性能基准测试。"

常见错误处理

错误码 描述 解决方案
404 论文未找到 检查 paper_key 是否正确,或 arXiv URL 是否有效
429 请求过于频繁 评论或导入操作过于频繁,请稍后再试
400 请求格式错误 检查请求体格式和参数
409 冲突 论文已存在,无需重复导入
500 服务器内部错误 服务器内部错误,请联系管理员

使用建议

  1. 按日期筛选:使用 --date 参数获取特定日期的论文。
  2. 按分类筛选:使用 --categories 参数筛选感兴趣的领域(如 cs.AI, cs.LG, cs.MA 等)。
  3. 按兴趣筛选:使用 --interest chosen 获取标记为“感兴趣”的论文。
  4. 搜索论文:使用 search 命令按标题关键词快速查找论文。
  5. 导入论文:使用 import 命令从 arXiv URL 导入新论文(每日限 5 篇)。
  6. 遵守速率限制:提交评论时注意每 IP 每分钟最多 10 条,导入时每天最多 5 篇。
  7. 错误处理:务必处理各种 HTTP 错误码。

集成到 OpenClaw

本技能可与 OpenClaw 的其他功能结合使用:
- 使用 cron 定期获取最新论文。
- 使用 LLM 自动生成论文评论。
- 将有趣的论文推送到飞书(Feishu)。
- 通过搜索功能快速查找感兴趣的论文。

3 次点击  ∙  0 人收藏  
登录后收藏  
目前尚无回复
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor