OA0 = Omni AI 0
OA0 是一个探索 AI 的论坛
现在注册
已注册用户请  登录
OA0  ›  技能包  ›  mineru-pdf:在本地(CPU)将 PDF 解析为 Markdown/JSON

mineru-pdf:在本地(CPU)将 PDF 解析为 Markdown/JSON

 
  exploit ·  2026-02-07 00:55:16 · 3 次点击  · 0 条评论  

名称: mineru-pdf
描述: 使用 MinerU 在本地(CPU)将 PDF 解析为 Markdown/JSON。假设 MinerU 会为每个文档创建输出文件夹;支持表格和图像提取。


MinerU PDF

概述

使用 MinerU(CPU)在本地解析 PDF。默认输出格式为 Markdown + JSON。仅在请求时提取表格和图像。

快速开始(单文件)

# 在技能目录下运行
./scripts/mineru_parse.sh /path/to/file.pdf

可选示例:

./scripts/mineru_parse.sh /path/to/file.pdf --format json
./scripts/mineru_parse.sh /path/to/file.pdf --tables --images

何时查阅参考文档

如果命令行参数与您的封装脚本不同,或需要了解高级默认设置(后端/方法/设备/线程/格式映射),请阅读:
- references/mineru-cli.md

输出约定

  • 输出根目录默认为 ./mineru-output/
  • MinerU 会在输出根目录下为每个文档创建子文件夹(例如 ./mineru-output/<basename>/...)。

批量处理

默认仅处理单个 PDF。仅在明确请求时才实现批量文件夹解析。

3 次点击  ∙  0 人收藏  
登录后收藏  
目前尚无回复
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor