SemTools:基于 Rust 打造的高性能命令行语义搜索与文档解析工具集 ylc3000 2025-11-06 0 浏览 0 点赞 resource SemTools:基于 Rust 打造的高性能命令行语义搜索与文档解析工具集 • 语义搜索无需向量数据库,利用 model2vec embeddings 实现快速本地关键词匹配,支持多语言和上下文行搜索 • 多格式文档解析(PDF、DOCX、PPTX等),默认调用 LlamaParse API,支持缓存与异常处理保证稳定性 • 设计符合 Unix 哲学,标准 stdin/stdout 流处理,便于管道组合和多任务并发提升效率 • 支持自定义距离阈值和返回结果块大小,灵活适配不同搜索精度和上下文需求 • 轻松组合 grep 等工具预过滤,构建复杂搜索管道,适合代码审查、文档分析、知识库检索等场景 • 配置简洁,通过 ~/.parse_config.json 或环境变量管理 API Key 和参数,用户可快速上手 • 未来计划支持更多解析后端和搜索模型选择,持续扩展本地化和多样化能力 SemTools 让语义搜索和文档解析回归命令行,兼顾性能与灵活性,适合开发者和技术专家构建高效信息处理流程。 了解详情🔗 github.com/run-llama/semtools 网闻录 SemTools:基于 Rust 打造的高性能命令行语义搜索与文档解析工具集