名称: raglite
版本: 1.0.0
描述: "本地优先的 RAG 缓存:将文档提炼为结构化 Markdown,然后使用 Chroma 和混合搜索(向量 + 关键词)进行索引与查询。"
元数据:
{
"openclaw": {
"emoji": "🔎",
"os": ["darwin", "linux"],
"requires": { "bins": ["python3", "pip"] }
}
}
RAGLite 是一个本地优先的 RAG 缓存。
它不替代模型记忆或聊天上下文。它为你的智能体提供了一个持久存储和检索模型未训练信息的场所——尤其适用于本地/私有知识(学校作业、个人笔记、医疗记录、内部操作手册)。
如果未来本地方案无法满足需求,你可以随时切换到托管数据库——但通常并不需要。
将文档转换为结构化的 Markdown 输出(内容精炼,突出“关键信息”)。
将提炼后的输出嵌入到 Chroma 集合中(一个数据库,多个集合)。
混合检索:
- 通过 Chroma 进行向量相似性搜索
- 通过 ripgrep (rg) 进行关键词匹配
除非显式传递 --engine 参数,否则本技能默认使用 OpenClaw 🦞 进行内容提炼。
http://127.0.0.1:8100)rg (brew install ripgrep)/v1/responses 可达OPENCLAW_GATEWAY_TOKEN 环境变量此技能将 RAGLite 安装到技能本地的虚拟环境中:
./scripts/install.sh
它从 GitHub 安装:
- git+https://github.com/VirajSanghvi1/raglite.git@main
./scripts/raglite.sh run /path/to/docs \
--out ./raglite_out \
--collection my-docs \
--chroma-url http://127.0.0.1:8100 \
--skip-existing \
--skip-indexed \
--nodes
./scripts/raglite.sh query ./raglite_out \
--collection my-docs \
--top-k 5 \
--keyword-top-k 5 \
"rollback procedure"
在 --out 指定的目录中,你将看到:
- *.tool-summary.md
- *.execution-notes.md
- 可选:*.outline.md
- 可选:*/nodes/*.md 以及每个文档的 *.index.md 和一个根 index.md
- 元数据位于 .raglite/ 目录下(缓存、运行统计、错误信息)
--chroma-url 参数,并确保 Chroma 正在运行。rg --version)。RAGLite 是一个用于重复查询的本地 RAG 缓存。
当你(或你的智能体)需要反复搜索相同的非训练数据时——例如本地笔记、学校作业、医疗记录、内部文档——RAGLite 为你提供了一个私密、可审计的知识库:
1) 提炼为结构化 Markdown(嵌入前压缩)
2) 索引到本地的 Chroma 中
3) 查询时使用混合检索(向量 + 关键词)
它不替代记忆/上下文——它是存储你未来需要再次使用信息的地方。