OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请  登录
OA0  ›  技能包  ›  deepread-ocr:AI 原生 OCR 平台,将文档转化为高精度数据

deepread-ocr:AI 原生 OCR 平台,将文档转化为高精度数据

 
  schema ·  2026-02-11 23:34:33 · 18 次点击  · 0 条评论  

名称: deepread
title: DeepRead OCR
描述: 一个 AI 原生的 OCR 平台,可在数分钟内将文档转换为高精度数据。通过多模型共识机制,DeepRead 实现 97%+ 的准确率,并仅对不确定的字段标记以进行人机协同(HIL)审核——将人工工作量从 100% 降至 5-10%。无需任何提示词工程。
disable-model-invocation: true
元数据:
{"openclaw":{"requires":{"env":["DEEPREAD_API_KEY"]},"primaryEnv":"DEEPREAD_API_KEY","homepage":"https://www.deepread.tech"}}


DeepRead - 生产级 OCR API

DeepRead 是一个 AI 原生的 OCR 平台,可在数分钟内将文档转换为高精度结构化数据。它采用多模型共识机制,实现 97%+ 的准确率,并仅对不确定的字段标记以进行人机协同(HIL)审核,从而将人工审核工作量从 100% 大幅降至 5-10%。整个过程无需任何提示词工程。

功能概述

DeepRead 是一个生产级的文档处理 API,可在数分钟内提供高精度的结构化数据输出,并内置人工审核标记功能,确保手动审核仅针对标记的异常字段。

核心功能:
- 文本提取:将 PDF 和图像转换为干净的 Markdown 文本。
- 结构化数据:提取带有置信度分数的 JSON 字段。
- 人机协同(HIL)界面:内置人工审核流程——不确定的字段会被标记(hil_flag),因此只需审核例外情况。
- 多轮次处理:多次验证轮次以确保最高准确率。
- 多模型共识:模型间交叉验证以提高可靠性。
- 免费套餐:每月 2,000 页(无需信用卡)。

快速开始

1. 获取 API 密钥

注册并创建 API 密钥:

# 访问控制面板
https://www.deepread.tech/dashboard

# 或使用此直接链接
https://www.deepread.tech/dashboard/?utm_source=clawdhub

保存您的 API 密钥:

export DEEPREAD_API_KEY="sk_live_your_key_here"

2. Clawdbot 配置(可选)

添加到您的 clawdbot.config.json5 文件中:

{
  skills: {
    entries: {
      "deepread": {
        enabled: true
        // API 密钥从 DEEPREAD_API_KEY 环境变量读取
        // 请勿在此处硬编码您的 API 密钥
      }
    }
  }
}

3. 处理您的第一个文档

方案 A:使用 Webhook(推荐)

# 上传 PDF 并设置 Webhook 通知
curl -X POST https://api.deepread.tech/v1/process \
  -H "X-API-Key: $DEEPREAD_API_KEY" \
  -F "file=@document.pdf" \
  -F "webhook_url=https://your-app.com/webhooks/deepread"

# 立即返回
{
  "id": "550e8400-e29b-41d4-a716-446655440000",
  "status": "queued"
}

# 处理完成后(2-5 分钟),您的 Webhook 将收到结果

方案 B:轮询获取结果

# 上传 PDF(不使用 Webhook)
curl -X POST https://api.deepread.tech/v1/process \
  -H "X-API-Key: $DEEPREAD_API_KEY" \
  -F "file=@document.pdf"

# 立即返回
{
  "id": "550e8400-e29b-41d4-a716-446655440000",
  "status": "queued"
}

# 轮询直到完成
curl https://api.deepread.tech/v1/jobs/550e8400-e29b-41d4-a716-446655440000 \
  -H "X-API-Key: $DEEPREAD_API_KEY"

使用示例

基础 OCR(仅文本)

提取文本为干净的 Markdown:

# 使用 Webhook(推荐)
curl -X POST https://api.deepread.tech/v1/process \
  -H "X-API-Key: $DEEPREAD_API_KEY" \
  -F "file=@invoice.pdf" \
  -F "webhook_url=https://your-app.com/webhook"

# 或轮询等待完成
curl -X POST https://api.deepread.tech/v1/process \
  -H "X-API-Key: $DEEPREAD_API_KEY" \
  -F "file=@invoice.pdf"

# 然后轮询
curl https://api.deepread.tech/v1/jobs/JOB_ID \
  -H "X-API-Key: $DEEPREAD_API_KEY"

处理完成后的响应:

{
  "id": "550e8400-...",
  "status": "completed",
  "result": {
    "text": "# 发票\n\n**供应商:** Acme Corp\n**总计:** $1,250.00..."
  }
}

结构化数据提取

提取特定字段并附带置信度评分:

curl -X POST https://api.deepread.tech/v1/process \
  -H "X-API-Key: $DEEPREAD_API_KEY" \
  -F "file=@invoice.pdf" \
  -F 'schema={
    "type": "object",
    "properties": {
      "vendor": {
        "type": "string",
        "description": "供应商公司名称"
      },
      "total": {
        "type": "number",
        "description": "发票总金额"
      },
      "invoice_date": {
        "type": "string",
        "description": "发票日期,格式为 MM/DD/YYYY"
      }
    }
  }'

响应包含置信度标记:

{
  "status": "completed",
  "result": {
    "text": "# 发票\n\n**供应商:** Acme Corp...",
    "data": {
      "vendor": {
        "value": "Acme Corp",
        "hil_flag": false,
        "found_on_page": 1
      },
      "total": {
        "value": 1250.00,
        "hil_flag": false,
        "found_on_page": 1
      },
      "invoice_date": {
        "value": "2024-10-??",
        "hil_flag": true,
        "reason": "日期部分模糊",
        "found_on_page": 1
      }
    },
    "metadata": {
      "fields_requiring_review": 1,
      "total_fields": 3,
      "review_percentage": 33.3
    }
  }
}

复杂模式(嵌套数据)

提取数组和嵌套对象:

curl -X POST https://api.deepread.tech/v1/process \
  -H "X-API-Key: $DEEPREAD_API_KEY" \
  -F "file=@invoice.pdf" \
  -F 'schema={
    "type": "object",
    "properties": {
      "vendor": {"type": "string"},
      "total": {"type": "number"},
      "line_items": {
        "type": "array",
        "items": {
          "type": "object",
          "properties": {
            "description": {"type": "string"},
            "quantity": {"type": "number"},
            "price": {"type": "number"}
          }
        }
      }
    }
  }'

逐页分析

获取每页的 OCR 结果和质量标记:

curl -X POST https://api.deepread.tech/v1/process \
  -H "X-API-Key: $DEEPREAD_API_KEY" \
  -F "file=@contract.pdf" \
  -F "include_pages=true"

响应:

{
  "result": {
    "text": "所有页面的合并文本...",
    "pages": [
      {
        "page_number": 1,
        "text": "# 合同协议\n\n...",
        "hil_flag": false
      },
      {
        "page_number": 2,
        "text": "条款和条??...",
        "hil_flag": true,
        "reason": "存在多个无法识别的字符"
      }
    ],
    "metadata": {
      "pages_requiring_review": 1,
      "total_pages": 2
      }
  }
}

适用场景

✅ 适合使用 DeepRead 的场景:

  • 发票处理:提取供应商、总额、明细项目。
  • 收据 OCR:解析商户、商品、总额。
  • 合同分析:提取各方、日期、条款。
  • 表单数字化:将纸质表单转换为结构化数据。
  • 文档工作流:任何需要 OCR + 数据提取的流程。
  • 对质量要求高的应用:当您需要知道哪些提取结果不确定时。

❌ 不适合的场景:

  • 实时处理:处理需要 2-5 分钟(异步工作流)。
  • 批量处理超过每月 2,000 页:请升级到 PRO 或 SCALE 套餐。

工作原理

多轮次处理管道

PDF → 转换 → 旋转校正 → OCR → 多模型验证 → 提取 → 完成

该管道自动处理:
- 文档旋转和方向校正。
- 多轮次验证以确保准确率。
- 跨模型共识以提高可靠性。
- 字段级置信度评分。

人机协同(HIL)界面

DeepRead 包含内置的人机协同(HIL)审核系统。AI 将提取的文本与原始图像进行比较,并为每个字段设置 hil_flag

  • hil_flag: false = 清晰、置信度高的提取 → 自动处理。
  • hil_flag: true = 不确定的提取 → 路由至人工审核。

HIL 工作流程:
1. 高置信度提取的字段自动批准。
2. 不确定的字段被标记为 hil_flag: true 并附上 reason
3. 仅标记的字段需要人工审核(通常占总字段的 5-10%)。
4. 在 DeepRead Preview (preview.deepread.tech) 中审核标记的字段——这是一个专用的 HIL 审核界面,审核员可以并排查看原始文档和提取的数据,修正标记的字段,并批准结果。
5. 或者,您可以使用 API 响应中的 hil_flag 数据与您自己的审核队列集成。

AI 在以下情况下标记提取结果:
- 文本是手写的、模糊的或质量低下。
- 存在多种可能的解释。
- 字符部分可见或不清晰。
- 在文档中未找到该字段。

这是基于多模态 AI 的判断,而非基于规则。

高级功能

1. 蓝图(优化模式)

为特定文档类型创建可重用、优化的模式:

# 列出您的蓝图
curl https://api.deepread.tech/v1/blueprints \
  -H "X-API-Key: $DEEPREAD_API_KEY"

# 使用蓝图代替内联模式
curl -X POST https://api.deepread.tech/v1/process \
  -H "X-API-Key: $DEEPREAD_API_KEY" \
  -F "file=@invoice.pdf" \
  -F "blueprint_id=660e8400-e29b-41d4-a716-446655440001"

优势:
- 相比基础模式,准确率提升 20-30%。
- 可在类似文档间重复使用。
- 支持版本控制和回滚。

如何创建蓝图:

# 根据训练数据创建蓝图
curl -X POST https://api.deepread.tech/v1/optimize \
  -H "X-API-Key: $DEEPREAD_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "name": "utility_invoice",
    "description": "针对水电费发票优化",
    "document_type": "invoice",
    "initial_schema": {
      "type": "object",
      "properties": {
        "vendor": {"type": "string", "description": "供应商名称"},
        "total": {"type": "number", "description": "总金额"}
      }
    },
    "training_documents": ["doc1.pdf", "doc2.pdf", "doc3.pdf"],
    "ground_truth_data": [
      {"vendor": "Acme Power", "total": 125.50},
      {"vendor": "City Electric", "total": 89.25}
    ],
    "target_accuracy": 95.0,
    "max_iterations": 5
  }'

# 返回:{"job_id": "...", "blueprint_id": "...", "status": "pending"}

# 检查优化状态
curl https://api.deepread.tech/v1/blueprints/jobs/JOB_ID \
  -H "X-API-Key: $DEEPREAD_API_KEY"

# 使用蓝图(完成后)
curl -X POST https://api.deepread.tech/v1/process \
  -H "X-API-Key: $DEEPREAD_API_KEY" \
  -F "file=@invoice.pdf" \
  -F "blueprint_id=BLUEPRINT_ID"

2. Webhooks(生产环境推荐)

处理完成后接收通知,无需轮询:

curl -X POST https://api.deepread.tech/v1/process \
  -H "X-API-Key: $DEEPREAD_API_KEY" \
  -F "file=@invoice.pdf" \
  -F "webhook_url=https://your-app.com/webhooks/deepread"

处理完成后,您的 Webhook 将收到以下负载:

{
  "job_id": "550e8400-...",
  "status": "completed",
  "created_at": "2025-01-27T10:00:00Z",
  "completed_at": "2025-01-27T10:02:30Z",
  "result": {
    "text": "...",
    "data": {...}
  },
  "preview_url": "https://preview.deepread.tech/abc1234"
}

优势:
- 无需轮询。
- 完成后即时通知。
- 延迟更低。
- 更适合生产工作流。

3. 预览(HIL 审核界面)

DeepRead Preview (preview.deepread.tech) 是内置的人机协同(HIL)审核界面。审核员可以并排查看原始文档和提取的数据,修正标记的字段,并批准结果。预览链接也可以无需认证即可分享:

# 请求预览链接
curl -X POST https://api.deepread.tech/v1/process \
  -H "X-API-Key: $DEEPREAD_API_KEY" \
  -F "file=@document.pdf" \
  -F "include_images=true"

# 在响应中获取预览链接
{
  "result": {
    "text": "...",
    "data": {...}
  },
  "preview_url": "https://preview.deepread.tech/Xy9aB12"
}

公共预览端点:

# 无需认证
curl https://api.deepread.tech/v1/preview/Xy9aB12

速率限制与定价

免费套餐(无需信用卡)

  • 每月 2,000 页
  • 每分钟 10 次请求
  • 完整功能访问(OCR + 结构化提取 + 蓝图)

付费套餐

  • PRO:每月 50,000 页,每分钟 100 次请求,$99/月。
  • SCALE:自定义批量定价(联系销售)。

升级: https://www.deepread.tech/dashboard/billing?utm_source=clawdhub

速率限制响应头

每个响应都包含配额信息:

X-RateLimit-Limit: 2000
X-RateLimit-Remaining: 1847
X-RateLimit-Used: 153
X-RateLimit-Reset: 1730419200

最佳实践

1. 生产环境使用 Webhooks

✅ 推荐:Webhook 通知

curl -X POST https://api.deepread.tech/v1/process \
  -H "X-API-Key: $DEEPREAD_API_KEY" \
  -F "file=@document.pdf" \
  -F "webhook_url=https://your-app.com/webhook"

仅在以下情况使用轮询:
- 测试/开发环境。
- 无法暴露 Webhook 端点。
- 需要同步响应。

2. 模式设计

✅ 良好:描述性的字段说明

{
  "vendor": {
    "type": "string",
    "description": "供应商公司名称。通常在发票的页眉或左上角。"
  }
}

❌ 不佳:无描述

{
  "vendor": {"type": "string"}
}

3. 轮询策略(如必须使用)

仅在无法使用 Webhook 时,每 5-10 秒轮询一次:

import time
import requests

def wait_for_result(job_id, api_key):
    while True:
        response = requests.get(
            f"https://api.deepread.tech/v1/jobs/{job_id}",
            headers={"X-API-Key": api_key}
        )
        result = response.json()

        if result["status"] == "completed":
            return result["result"]
        elif result["status"] == "failed":
            raise Exception(f"任务失败: {result.get('error')}")

        time.sleep(5)

4. 处理质量标记

区分置信度高的字段和不确定的字段:

```python
def process_extraction(data):
confident = {}
needs_review = []

for field, field_data in data.items():
    if field_data["hil_flag"]:
        needs_review.append({
            "field": field,
            "value": field_data["value"],
            "reason": field_data.get("reason")
        })
    else:
        confident[field] = field_data["value"]

# 自动处理置信度高的字段
save_to_database(confident)

# 将不确定的字段发送到审核队列
if needs_re
18 次点击  ∙  0 人收藏  
登录后收藏  
0 条回复
关于 ·  帮助 ·  PING ·  隐私 ·  条款   
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
耗时 152 ms
Developed with Cursor