npm i llama-ocr
import { ocr } from "llama-ocr";
const markdown = await ocr({
filePath: "./trader-joes-receipt.jpg", // 图片路径(后续将支持 PDF)
apiKey: process.env.TOGETHER_API_KEY, // Together AI API 密钥
});
我们提供在线演示 LlamaOCR.com,欢迎试用!
本库利用 Together AI 提供的免费 Llama 3.2 端点解析图片并返回 Markdown 格式文本。同时提供付费的 Llama 3.2 11B 和 Llama 3.2 90B 端点,以获得更快的处理速度和更高的速率限制。
您可以通过 model 选项控制模型选择,默认值为 Llama-3.2-90B-Vision,也可设置为 free 或 Llama-3.2-11B-Vision。
本项目灵感来源于 Zerox,感谢他们的出色工作!