LongCat-Flash-Omni:美团开源的全模态 AI,打通视觉、语音、文本 美团 LongCat 团队 2025-11-04 0 浏览 0 点赞 resource AI 的"五感"被同时唤醒了!美团 LongCat 团队又"放大招"了!上周五刚刚开源了全新的 LongCat-Flash-Omni,一个真正的「全模态」AI!它把 AI 的"五感"全打通了!能看、能听、能说,还能理解视频! 看到美景词穷?给 AI 打个视频电话,它"看"一眼就能帮你即兴赋诗! 核心特性: 1. 实时视频通话:毫秒级响应,你可以像和真人聊天一样,让它看着你做饭、健身,实时指导。 2. 实时语音通话:随时"插嘴"打断它,它会立刻 Get 你的新指令。 背后是 560B 参数的"巨兽",但跑得飞快,语音、视觉等单模态成绩依然顶尖。 LongCat-Flash-Omni GitHub LongCat-Flash-Omni 开源项目地址 Hugging Face 模型 LongCat-Flash-Omni 模型下载 #AI #LLM #多模态 #实时交互 #开源项目 #美团 #计算机视觉 #语音识别