OA0 = Omni AI 0
OA0 是一个探索 AI 的论坛
现在注册
已注册用户请  登录
OA0  ›  技能包  ›  local-rag-search:利用本地 RAG 架构执行高效网页搜索

local-rag-search:利用本地 RAG 架构执行高效网页搜索

 
  training ·  2026-02-17 15:45:00 · 3 次点击  · 0 条评论  

名称: local-rag-search
描述: 使用 mcp-local-rag 服务器高效执行网络搜索,并基于语义相似度进行结果排序。当你需要搜索网络获取最新信息、跨多个来源研究主题,或在不使用外部 API 的情况下从互联网收集背景信息时,请使用此技能。本技能教授如何有效利用基于 RAG 的网络搜索,包括 DuckDuckGo、Google 以及多引擎深度研究功能。


本地 RAG 搜索技能

此技能使你能够有效利用 mcp-local-rag MCP 服务器进行智能网络搜索,并应用语义排序。该服务器执行类似 RAG 的相似度评分,以优先呈现最相关的结果,且无需任何外部 API。

可用工具

1. rag_search_ddgs - DuckDuckGo 搜索

用于注重隐私的通用网络搜索。

使用场景:
- 用户偏好注重隐私的搜索
- 一般信息查询
- 大多数查询的默认选择

参数:
- query: 自然语言搜索查询
- num_results: 初始获取的结果数量(默认:10)
- top_k: 返回的最相关结果数量(默认:5)
- include_urls: 是否包含来源 URL(默认:true)

2. rag_search_google - Google 搜索

用于全面、技术性或详细的搜索。

使用场景:
- 技术或科学类查询
- 需要全面覆盖
- 搜索特定文档

3. deep_research - 多引擎深度研究

用于跨多个搜索引擎进行综合性研究。

使用场景:
- 研究需要广泛覆盖的复杂主题
- 需要来自多个来源的不同视角
- 收集关于某个主题的全面信息

可用后端:
- duckduckgo: 注重隐私的通用搜索
- google: 全面的技术结果
- bing: 微软搜索引擎
- brave: 隐私优先搜索
- wikipedia: 百科全书/事实性内容
- yahoo, yandex, mojeek, grokipedia: 替代搜索引擎

默认设置: ["duckduckgo", "google"]

4. deep_research_google - 仅 Google 深度研究

仅使用 Google 进行深度研究的快捷方式。

5. deep_research_ddgs - 仅 DuckDuckGo 深度研究

仅使用 DuckDuckGo 进行深度研究的快捷方式。

最佳实践

查询构建

  1. 使用自然语言:将查询写成问题或描述性短语

    • 良好示例:"量子计算的最新进展"
    • 良好示例:"如何在 Python 中实现二分查找"
    • 避免:单关键词如 "quantum" 或 "Python"
  2. 保持具体:包含上下文和细节

    • 良好示例:"2024 年 React Hooks 最佳实践"
    • 更佳示例:"React useEffect 清理函数最佳实践"

工具选择策略

  1. 单一主题,快速答案 → 使用 rag_search_ddgsrag_search_google
    python rag_search_ddgs( query="法国的首都是什么?", top_k=3 )

  2. 技术/科学查询 → 使用 rag_search_google
    python rag_search_google( query="Docker 多阶段构建优化技术", num_results=15, top_k=7 )

  3. 综合性研究 → 使用 deep_research 并配合多个搜索词
    python deep_research( search_terms=[ "机器学习基础", "神经网络架构", "2024 年深度学习最佳实践" ], backends=["google", "duckduckgo"], top_k_per_term=5 )

  4. 事实/百科内容 → 使用 deep_research 并配合 Wikipedia
    python deep_research( search_terms=["第二次世界大战时间线", "二战关键战役"], backends=["wikipedia"], num_results_per_term=5 )

参数调优

快速答案:
- num_results=5-10, top_k=3-5

综合性研究:
- num_results=15-20, top_k=7-10

深度研究:
- num_results_per_term=10-15, top_k_per_term=3-5
- 使用 2-5 个相关搜索词
- 使用 1-3 个后端(越多越全面,但速度越慢)

工作流示例

示例 1:时事新闻

任务:"上周联合国气候峰会发生了什么?"

1. 使用 rag_search_google 获取近期新闻报道
2. 设置 top_k=7 以获得全面视角
3. 呈现发现结果并附上来源 URL

示例 2:技术深度探索

任务:"如何优化 PostgreSQL 查询?"

1. 使用 deep_research 并配合多个具体搜索词:
   - "PostgreSQL 查询优化技术"
   - "PostgreSQL 索引最佳实践"
   - "PostgreSQL EXPLAIN ANALYZE 教程"
2. 使用 backends=["google", "stackoverflow"](如果可用)
3. 将发现综合成可操作的指南

示例 3:多视角研究

任务:"研究远程工作对生产力的影响"

1. 使用 deep_research 并配合多样化的搜索词:
   - "2024 年远程工作效率统计数据"
   - "混合工作模式有效性研究"
   - "在家工作挑战研究"
2. 使用 backends=["google", "duckduckgo"] 以获得广泛覆盖
3. 综合不同视角和研究结果

指导原则

  1. 始终引用来源:当 include_urls=True 时,在你的回答中引用来源 URL
  2. 验证时效性:检查内容是否看起来是当前且相关的
  3. 交叉验证:对于重要事实,使用多个搜索词或引擎
  4. 尊重隐私:除非特定需求需要 Google,否则使用 DuckDuckGo 处理一般查询
  5. 批量处理相关查询:研究主题时,为 deep_research 创建多个相关搜索词
  6. 语义相关性:信任 RAG 评分——顶部结果在语义上最接近查询
  7. 解释你的选择:简要说明你正在使用哪个工具以及原因

错误处理

如果搜索返回的结果不足:
1. 尝试用不同的关键词重新组织查询
2. 切换到不同的后端
3. 增加 num_results 参数
4. 使用 deep_research 并配合多个相关搜索词

隐私考量

  • DuckDuckGo:注重隐私,不追踪用户
  • Google:最全面,但会追踪搜索记录
  • 建议默认使用 DuckDuckGo,除非用户明确需要 Google 的覆盖范围

性能说明

  • 首次搜索可能较慢(模型加载)
  • 后续搜索更快(模型已缓存)
  • 后端越多越全面,但速度越慢
  • 根据使用场景调整 num_resultstop_k
3 次点击  ∙  0 人收藏  
登录后收藏  
目前尚无回复
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor