把一亿篇论文进行聚类会是什么样? ylc3000 2025-11-13 0 浏览 0 点赞 短文 把一亿篇论文进行聚类会是什么样? InferenceNet 与 LAION、Wynd Labs 联合发布了 Project OSSAS 项目,他们用开源模型处理了1亿篇科学论文,做了个可视化工具,将相关的论文聚类到一起,让全世界的科学知识变得可访问、可搜索、可对比。成本只要10万美元。 他们使用了自己定制的模型: 1. Aella-Qwen3-14B:基于阿里的 Qwen3 14B 微调,推理能力强 2. Aella-Nemotron-12B:基于 NVIDIA 的 Nemotron 12B,混合 Mamba-Transformer 架构,吞吐量炸裂 最终这个可视化工具可以点击任何论文查看结构化摘要和发现论文之间的关系和模式,方便在大家查找论文的时候快速检索。 这里有必要介绍下 InferenceNet, 这个网站可以网络调用全球闲置 GPU, 类似现代版的 SETI@ Home,但专门跑 LLM 任务, 可以让科研人员能用上原本根本负担不起的算力. 项目地址: aella.inference.net 网闻录 把一亿篇论文进行聚类会是什么样?