AvatarAI 是一套开源的实时 AI 数字人平台
AvatarAI 是一套开源的实时 AI 数字人平台,只需上传一张照片和 5 秒语音,就能克隆声音并与任意面孔实时对话。系统集成 Whisper 语音识别、Claude/GPT-4/Llama 3 多模型对话、XTTS v2 零样本克隆及 MuseTalk 唇同步视频生成,提供完整的端到端对话流与 WebSocket 流式传输。 平台支持本地运行或一键部署至 AWS GPU 实例,具备 JWT
github.com/PunithVT/ai-avatar-system