Chandra - 高精度多语言 OCR 模型 2025-11-02 0 浏览 0 点赞 长文 OCR技术在复杂文档识别中遇到诸多挑战,如表格结构、手写文字和多样化布局的准确解析。Chandra 是一款高精度OCR模型,能够将图片和PDF转换成带有完整布局信息的结构化HTML、Markdown和JSON格式,支持40多种语言,特别擅长识别复杂表格、表单(含复选框)、手写内容以及数学公式。 它不仅能提取图片和图表及其说明,还提供两种推理模式:本地使用HuggingFace模型,远程调用vLLM服务器。同时配套有命令行工具和交互式Web演示,方便开发者快速上手。 项目基于Apache-2.0开源许可,适合科研、个人和初创企业使用。 主要功能: - 高精度复杂表格和表单重构 - 良好手写体支持 - 支持数学公式和多语言识别 - 输出结构化数据(HTML/Markdown/JSON) - 图像和图表提取与说明捕获 - 多平台推理模式(本地与远程vLLM) - 方便的命令行工具和Web应用演示 适合需要高质量文档数字化的科研、教育、金融等行业使用。 GitHub 仓库 Chandra OCR 模型开源项目 #OCR #开源项目 #文档识别 #机器学习