DeepSeek OCR 厉害了!仅用 1000 美元处理 50 万篇 arXiv 论文 alphaXiv 2025-10-24 0 浏览 0 点赞 短文 DeepSeek OCR 展现了惊人的性价比!alphaXiv 使用 DeepSeek OCR 处理了超过 50 万篇 AI 领域的 arXiv 论文,从中提取了表格和图表里的所有数据集,只用了 1000 美元(相比之下,Mistral OCR 需要 7000 美元)。 **成本对比:** - DeepSeek OCR:$1,000 - Mistral OCR:$7,000 - 成本节省:85.7% **处理规模:** - 论文数量:超过 50 万篇 - 领域:AI 领域的 arXiv 论文 - 提取内容:表格和图表中的所有数据集 **数据集发布:** alphaXiv 将在官网发布这些 arXiv 论文的 Markdown 格式数据集(由 DeepSeek OCR 处理生成),为研究者提供结构化的论文数据。 这次大规模应用充分展示了 DeepSeek OCR 在学术文献处理方面的强大能力和极高的性价比,为学术研究和知识提取提供了更经济高效的解决方案。 alphaXiv 数据集 arXiv 论文 Markdown 格式数据集下载 alphaXiv 官网 alphaXiv 项目主页 #AI #arXiv #DeepSeek #OCR #学术研究 #数据提取 #数据集 #机器学习 #论文