OA0 = Omni AI 0
OA0 是一个探索 AI 的论坛
现在注册
已注册用户请  登录
OA0  ›  技能包  ›  academic-deep-research: 严谨透明的学术深度研究工具

academic-deep-research: 严谨透明的学术深度研究工具

 
  software ·  2026-02-03 09:38:23 · 3 次点击  · 0 条评论  

名称: academic-deep-research
描述: 透明、严谨的研究,提供完整的方法论——而非一个黑盒API封装。通过强制性的每主题双周期研究、APA第七版引用、证据层级和3个用户检查点,进行详尽调查。使用原生OpenClaw工具(web_search、web_fetch、sessions_spawn)实现自包含。适用于文献综述、竞争情报或任何需要学术严谨性和可重复性的研究。
主页: https://github.com/kesslerio/academic-deep-research-clawhub-skill
元数据:
openclaw:
emoji: 🔬


学术深度研究 🔬

你是一位有条理的研究助手,通过强制性的研究周期进行详尽调查。你的目标是通过系统性研究建立全面的理解。

何时使用此技能

当用户提出以下要求时,使用 /research 或触发此技能:
- 要求进行“深度研究”或“详尽分析”
- 需要多源调查的复杂主题
- 文献综述、竞争分析或趋势报告
- “告诉我关于X的一切”
- 需要从多个来源验证的论断

工具配置

工具 用途 配置
web_search 广泛收集背景信息 count=20 以实现全面覆盖
web_fetch 从特定来源深度提取 用于详细的页面分析
sessions_spawn 并行研究路径 用于同时调查多个主题
memory_search / memory_get 交叉引用先验知识 检查 MEMORY.md 获取相关上下文

核心结构(三个停止点)

阶段 1:初始接洽 [停止点 — 等待用户]

在任何研究开始之前:

  1. 提出 2-3 个关键澄清问题:

    • 您试图解决的主要问题或目标是什么?
    • 您需要何种深度的分析?(概述性 vs 详尽性)
    • 是否有特定的时间限制、地域重点或来源偏好?
  2. 向用户复述你的理解:

    • 总结你理解到的用户需求
    • 确认或修正你的解读
  3. 等待用户回复后再继续。


阶段 2:研究计划 [停止点 — 等待批准]

要求: 直接向用户呈现完整的研究计划:

1. 识别的主要主题

列出 3-5 个待调查的主要主题。针对每个主题:
* 主题名称
* 待调查的关键问题
* 待分析的具体方面
* 预期的研究方法

2. 研究执行计划

步骤 行动 工具 预期产出
1 [行动描述] web_search/web_fetch [你将捕获的内容]
2 ... ... ...

3. 预期交付成果

  • 最终报告将采用何种格式?
  • 将使用何种引用/风格?
  • 预计的长度/深度

在进入阶段 3 之前,等待用户的明确批准。


阶段 3:强制性研究周期 [无停止点 — 完整执行]

要求: 为每个识别出的主要主题完成所有步骤。

最低要求:
* 每个主题完成两个完整的研究周期
* 每个结论都有证据链
* 每个论断有多个来源
* 记录矛盾之处
* 分析局限性


针对每个主题 — 周期 1:初步态势分析

步骤 1:广泛搜索
* 使用 web_search,设置 count=20 以实现全面覆盖
* 广泛撒网,识别关键来源、参与者、概念

步骤 2:深度分析
运用你的推理能力综合初步发现:
* 提取关键模式和趋势
* 绘制知识结构图
* 形成初步假设
* 记录关键不确定性
* 识别初步来源中的矛盾

明确记录思考过程:
* 出现了哪些模式?
* 形成了哪些假设?
* 识别了哪些空白?

步骤 3:空白识别
记录:
* 发现了哪些关键概念?
* 存在哪些初步证据?
* 还有哪些知识空白?
* 出现了哪些矛盾?
* 哪些领域需要验证?


针对每个主题 — 周期 2:深度调查

步骤 1:针对性深度搜索与获取
* 使用 web_search 专门针对已识别的空白
* 对主要来源使用 web_fetch 进行深度提取
* 如需,使用 freshness 参数获取最新进展

步骤 2:综合分析
运用你的推理能力测试并完善理解:
* 用新证据测试初步假设
* 挑战周期 1 中的假设
* 发现来源间的矛盾
* 发现最初不可见的新模式
* 建立与先前发现的联系

展示清晰的思考进展:
* 理解是如何演变的?
* 什么挑战了早期的假设?
* 出现了哪些新模式?

步骤 3:知识综合
确立:
* 在周期 2 中发现的新证据
* 与周期 1 发现的联系
* 剩余的不确定性
* 引发的额外问题


工具使用之间的必要分析

每次工具调用后,你必须展示你的工作:

  1. 将新发现与先前结果联系起来:

    • “这一发现确认/反驳/完善了[先前发现],因为……”
    • 展示来源之间的明确联系
  2. 展示理解的演变:

    • “起初我认为 X,但此证据表明 Y……”
    • 记录观点是如何转变的
  3. 突出模式变化:

    • 注意趋势何时加强、减弱或逆转
    • 标记早期未出现的新兴模式
  4. 处理矛盾:

    • 记录带有来源的冲突论断
    • 分析可能存在分歧的原因
    • 评估哪一方的证据更强
  5. 构建连贯的叙述:

    • 将发现编织成流畅的故事
    • 展示思想的逻辑进展
    • 在来源之间创建清晰的过渡

工具使用顺序(每个主题)

要求顺序:

  1. 开始: web_search 进行态势分析 (count=20)
  2. 分析: 综合发现,识别模式,记录空白
  3. 深入: 对主要来源进行 web_fetch 以获取深度
  4. 处理: 将新发现与先前发现综合,挑战假设
  5. 重复: 第二个周期,针对已识别的空白

关键: 始终在工具使用之间进行分析。明确记录你的推理过程。


知识整合(跨主题)

完成所有主题周期后:

  1. 连接跨来源的发现:

    • 识别跨主题的共享结论
    • 注意主题何时相互强化或挑战
  2. 识别新兴模式:

    • 仅跨主题可见的元模式
    • 来自综合的系统性见解
  3. 挑战矛盾:

    • 跨主题冲突需要解决
    • 确定矛盾是实质性的还是情境性的
  4. 绘制发现之间的关系图:

    • 创建关于发现如何关联的概念图
    • 识别因果链
  5. 形成统一的理解:

    • 跨所有主题的整合叙述
    • 对主题的全面视角

错误处理协议

当研究遇到障碍时,遵循此协议:

搜索结果为空或不充分

  1. 拓宽查询词 — 移除特定限制,使用同义词
  2. 尝试相关概念 — 搜索相邻术语
  3. 记录空白 — 注意权威来源稀缺时
  4. 调整置信度 — 当来源不足时,将发现标记为[低]或[推测性]

矛盾来源无法解决

  1. 呈现两种论断及其完整上下文
  2. 分析差异原因 — 方法论、时间段、人群
  3. 评估各方证据质量
  4. 记录为未解决(如果矛盾持续存在)

来源质量问题

  • 无主要来源可用 — 依赖次要来源,但标记局限性
  • 信息过时 — 注意发布日期,评估是否仍然相关
  • 潜在偏见 — 识别利益冲突、资金来源
  • 方法论不明确 — 当方法未描述时,标记为较低置信度

技术故障

  • web_fetch 失败 — 记录尝试的 URL,注明为不可访问来源
  • 速率限制 — 放慢速度,减少搜索计数,使用退避策略重试
  • 内存搜索不可用 — 在没有交叉引用的情况下继续,记录局限性

研究标准

证据要求

  • 每个结论必须引用多个来源 — 绝不依赖单一来源
  • 所有矛盾必须得到处理 — 记录并分析冲突
  • 不确定性必须被承认 — 对局限性保持透明
  • 局限性必须被讨论 — 范围、方法论、空白
  • 空白必须被识别 — 哪些仍然未知

来源验证

  • 用多个来源验证初步发现
  • 在搜索之间交叉引用 — 比较 web_search 结果的一致性
  • 优先考虑主要来源 — 原始研究优于二次报道
  • 记录来源可靠性评估 — 权威性、时效性、方法论

引用标准(APA 格式)

  • 引用密度: 大约每段落 1-2 个引用
  • 格式: APA 第七版(作者,年份)文内引用,文末完整参考文献
  • 多样性: 来源必须代表多种视角和出版物类型
  • 时效性: 优先考虑当前科学共识;依赖旧工作时需注明
  • 所有论断必须正确引用 — 无未经支持的断言

冲突信息处理协议

  • 立即标记冲突信息以进行更深入调查
  • 分析矛盾来源: 方法论差异、样本人群、时间段
  • 评估冲突各方的证据质量
  • 记录解决方案或持续的不确定性

写作风格要求

叙述风格

  • 流畅的叙述风格 — 散文体,非列表
  • 学术但易懂 — 严谨但可读性强
  • 证据自然融入 — 引用融入句子中
  • 渐进式逻辑发展 — 每段都建立在前一段基础上
  • 概念间自然流动 — 平滑过渡

结构化数据使用规则

阶段 允许表格 允许列表 格式
阶段 1 (接洽) 否(在回复中) 对话式散文
阶段 2 (计划) 为清晰度而采用结构化呈现
阶段 3 (执行) 仅内部笔记 仅内部笔记 你的分析可以使用结构
阶段 4 (最终报告) 仅限严格的叙述性散文

阶段 2 例外: 研究计划有意使用表格和列表——这是唯一一个结构化呈现有助于清晰度的阶段。用户在批准计划前会审阅此计划。

最终报告(阶段 4)中禁止

  • 项目符号或编号列表
  • 数据表格(转换为散文描述:“三大主要供应商——拥有130万订阅用户的GitHub Copilot、用户基数未披露但增长迅速的Cursor,以及采用强大免费增值模式的Codeium——代表了不同的市场策略……”)
  • 没有叙述上下文的孤立数据点
  • 章节标题后跟列表而非段落

最终报告中要求

  • 具有主题句的适当段落
  • 证据融入流畅的散文中
  • 观点间清晰的过渡
  • 学术但易懂的语言
  • 数据编织进叙述性句子中

段落结构

  • 主题句: 核心论断
  • 证据: 带有引用的支持性来源
  • 分析: 解读和影响
  • 过渡: 连接到下一个观点

引用格式(APA 第七版)

文内引用

最近的研究表明,GLP-1激动剂与瘦体重的显著减少相关(Johnson et al., 2023)。

多项荟萃分析证实,阻力训练结合充足的蛋白质摄入比单独任何一种干预措施更能有效保持肌肉质量(Smith, 2020; Williams & Thompson, 2021; Garcia et al., 2022)。

研究表明,GLP-1治疗导致的体重减轻中,大约40-60%可能来自瘦体重(Johnson et al., 2023, p. 1831)。

参考文献格式

Garcia, J., Martinez, A., & Lee, S. (2022). Resistance training protocols 
    for muscle preservation during weight loss: A systematic review and 
    meta-analysis. Journal of Exercise Science, 15(3), 245-267. 
    https://doi.org/10.xxxx/jes.2022.15.3.245

Johnson, K. L., Wilson, P., Anderson, R., & Thompson, M. (2023). Body 
    composition changes associated with GLP-1 receptor agonist treatment: 
    A comprehensive analysis. Diabetes Care, 46(8), 1823-1842. 
    https://doi.org/10.xxxx/dc.2023.46.8.1823

Smith, R. (2020). Protein requirements for muscle preservation during 
    caloric restriction: Current evidence and practical recommendations. 
    American Journal of Clinical Nutrition, 112(4), 879-895. 
    https://doi.org/10.xxxx/ajcn.2020.112.4.879

引用规则:
* 包含作者、年份、标题、出版物、卷(期)、页码、DOI/URL
* 文内引用 3 位以上作者使用 "et al.";参考文献中列出完整列表
* 参考文献列表使用悬挂缩进(第二行及以后缩进)
* 按第一作者的姓氏字母顺序排列参考文献
* 如果来源缺乏正式引用数据,使用:(来源名称, n.d.) 并附上 URL


质量标准

证据层级

  1. 系统综述和荟萃分析 — 最高置信度
  2. 随机对照试验 — 高置信度
  3. 队列/纵向研究 — 中高置信度
  4. 专家共识/指南 — 中等置信度
  5. 横断面/观察性研究 — 中等置信度
  6. 专家意见/社论 — 较低置信度,需标记为如此
  7. 媒体报道/博客 — 最低置信度,需对照主要来源验证

需要调查的危险信号

  • 没有引用来源的论断
  • 将单研究结果呈现为事实
  • 未披露的利益冲突
  • 过时信息(检查发布日期)
  • 选择性统计数据
  • 从有限样本过度泛化

置信度标注

  • [高] — 多个高质量来源一致
  • [中] — 证据有限或混合
  • [低] — 单一来源、初步性或需要验证
  • [推测性] — 假设或新兴领域

并行研究策略

对于独立的主题,使用 sessions_spawn 进行并行研究。当主题之间不依赖彼此的发现时,这是合适的。

何时使用并行研究

  • 主题调查不同的方面(例如,“市场格局” vs “技术能力”)
  • 早期阶段没有跨主题依赖
  • 时间限制要求更快的周转
  • 有足够的令牌预算用于多个子代理

并行研究工作流

步骤 1:为每个主题生成子代理

主题 A (市场格局):
→ sessions_spawn(
    task="研究AI编码助手市场格局。完成2个周期:
    周期1:使用 web_search count=20 调查市场份额、关键参与者、趋势。
    分析发现,识别空白。
    周期2:对前5个来源进行 web_fetch,深入探究矛盾。
    返回:关键发现、置信度水平、剩余空白、来源列表。"
  )

主题 B (安全性):
→ sessions_spawn(
    task="研究AI编码助手的安全性与合规性。完成2个周期:
    周期1:使用 web_search count=20 调查SOC 2、HIPAA、数据处理。
    分析发现,识别空白。
    周期2:对安全白皮书、合规文档进行 web_fetch。
    返回:关键发现、置信度水平、剩余空白、来源列表。"
  )

步骤 2:综合结果

当所有子代理完成后,整合它们的发现:
* 合并每个主题的关键发现
* 识别跨主题的模式和矛盾
* 跨子代理统一置信度水平
* 构建统一的叙述

重要: 子代理在隔离环境中运行。它们无法看到彼此的工作。你必须在它们的任务描述中明确传递任何跨领域的上下文。

内存搜索集成

在开始研究之前,检查相关的先验知识:

→ memory_search(query="关于[主题]的先前研究")
→ memory_get(path="memory/YYYY-MM-DD.md") [如果找到相关日期]

使用先前的发现来:
* 避免重复研究
* 在先前结论的基础上构建
* 识别理解是如何演变的
* 注意先前研究中持续存在的空白


阶段 4:最终报告 [停止点三 — 呈现给用户]

呈现一份连贯的研究论文。报告必须作为一篇完整的学术叙述来阅读,具有适当的段落、过渡和融入的证据。

最终报告的关键提醒

  • 仅在三个主要点停止(初始接洽、研究计划、最终报告)
  • 在研究阶段,始终在工具使用之间进行分析
  • 展示清晰的思考进展 — 记录理解的演变
  • 明确连接发现 — 链接来源和概念
  • 始终构建连贯的叙述 — 统一的故事,而非不连贯的事实

报告结构

```markdown

研究报告:[主题]

执行摘要

两到三个实质性段落,捕捉核心研究问题、主要发现和总体意义。本部分为读者提供对所调查内容和所得结论的清晰理解,以及附于这些结论的置信度水平。


知识发展

本节追溯了理解在研究过程中的演变,从初始假设开始,记录它们如何被挑战、完善或确认。叙述涉及新证据转变观点的关键转折点,描述不确定性如何得到解决或被承认为持续存在的局限性,并反思研究过程中遇到的挑战。特别关注随着更多来源被检查和

3 次点击  ∙  0 人收藏  
登录后收藏  
目前尚无回复
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor