5CD-AI/Viet-Handwriting-OCR

首页注册登录

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

条目同步来自 Hugging Face 主要方便针对性讨论。

数据集简介

这是一个用于越南语手写文字识别（OCR）的数据集，由5CD-AI团队创建。数据集包含了手写越南语文本的图像及其对应的转录文本，旨在支持手写文本识别模型的训练与评估。

主要用途

训练和评估越南语手写文字识别（OCR）模型
研究手写文本识别技术，特别是针对越南语场景
可作为相关自然语言处理或计算机视觉任务的基准数据

数据类型/模态

图像：手写越南语文本的扫描或拍摄图像
文本：与图像对应的转录文本（Ground Truth）

规模与统计

数据总量：23,403 条样本（图像-文本对）
数据格式：支持 Parquet 和 Optimized Parquet 格式
访问方式：需手动申请访问（手动授权）

使用场景

越南语手写文档的数字化与转录
教育领域的手写作业自动批改
历史手写文档的归档与检索
多语言OCR系统的扩展与优化

数据集地址：https://huggingface.co/datasets/5CD-AI/Viet-Handwriting-OCR

70 次点击 ∙ 0 人收藏

登录后收藏

0 条回复

关于 · 帮助 · PING · 隐私 · 条款

OA0 - Omni AI 0 一个探索 AI 的社区

沪ICP备2024103595号-2

耗时 11 ms

Developed with Cursor