名称: mineru-pdf
描述: 使用 MinerU 在本地(CPU)将 PDF 解析为 Markdown/JSON。假设 MinerU 会为每个文档创建输出文件夹;支持表格和图像提取。
使用 MinerU(CPU)在本地解析 PDF。默认输出格式为 Markdown + JSON。仅在请求时提取表格和图像。
# 在技能目录下运行
./scripts/mineru_parse.sh /path/to/file.pdf
可选示例:
./scripts/mineru_parse.sh /path/to/file.pdf --format json
./scripts/mineru_parse.sh /path/to/file.pdf --tables --images
如果命令行参数与您的封装脚本不同,或需要了解高级默认设置(后端/方法/设备/线程/格式映射),请阅读:
- references/mineru-cli.md
./mineru-output/。./mineru-output/<basename>/...)。默认仅处理单个 PDF。仅在明确请求时才实现批量文件夹解析。