SOFIA:一款融合桌面自动化与多模态交互的本地智能代理 ylc3000 2025-11-06 0 浏览 0 点赞 resource SOFIA:一款融合桌面自动化与多模态交互的本地智能代理,专注隐私保护,助力高效管理邮箱、日历及文件。 • 跨平台界面支持:Web(Gradio)、透明桌面覆盖(PyQt6)、MCP服务器,满足多场景无缝切换 • 先进视觉自动化:基于YOLO的UI元素识别(OmniParser),精准鼠标键盘控制,屏幕截图实时解析,具备自动错误恢复能力 • Gmail与Google日历深度集成:自然语言操作邮件搜索、撰写、回复、转发及日程管理,OAuth2安全认证保障隐私 • 多模态交互:文本、图像聊天 + Whisper音频转录 + 实时流式响应 + 拖拽文件处理,操作体验直观高效 • 灵活AI后端切换:本地Ollama模型(隐私优先,无API费,需24GB+ GPU)与云端OpenAI API(速度快、准确度高)自由切换 • 严格安全设计:所有文件操作限定在~/SOFIA/目录,环境变量管理API密钥,参数校验与沙箱执行防止越权操作 • 自主任务执行架构:THINK→PLAN→EXECUTE→VERIFY闭环,支持并行工具调用与对话记忆,提升自动化鲁棒性 适合追求隐私和本地控制的高级用户及开发者。推荐搭配独立显示器以发挥全部桌面自动化优势。 了解更多👉 github.com/akim42003/SOFIA 网闻录 SOFIA:一款融合桌面自动化与多模态交互的本地智能代理