A Definition of AGI:顶级学者为人工通用智能提供清晰定义 Dan Hendrycks, Yoshua Bengio, Dawn Song, Gary Marcus 等 2025-10-24 0 浏览 0 点赞 长文 这篇论文把 AGI 定义清楚了! **论文背景** 《A Definition of AGI》由 Dan Hendrycks、Yoshua Bengio、Dawn Song、Gary Marcus 等多位顶级学者共同撰写,核心目标是为人工通用智能(AGI)提供一个清晰、可量化的定义,从而让人类能够科学地评估 AI 到底距离"人类水平智能"有多远。 **问题的提出** 论文指出,长期以来 AGI 的定义非常模糊,常被描述为"像人类一样聪明的 AI",但缺乏可验证的标准。随着 GPT-4、Gemini、Claude 等大型模型不断突破,人们争论"是否已接近 AGI",但这种讨论无法脱离一个具体的衡量框架。 因此,作者希望用心理学的认知模型来定义 AGI。 **核心定义** **AGI 是一种在认知多样性和熟练度上,能够与受过良好教育的成年人相匹敌或超越的人工智能。** 这一定义强调两方面: - **认知广度**:是否能在多个不同领域展现理解与学习能力 - **认知深度**:是否能以人类水平解决复杂任务、展现推理和综合能力 **十大核心能力** 为了让这一定义可以被测量,作者借鉴了心理学中最具实证基础的 Cattell–Horn–Carroll(CHC)智力理论。论文据此提出了一个由十个核心认知领域组成的 AGI 框架: **1. 一般知识(General Knowledge)** 涉及常识、科学、社会科学、历史与文化等广泛的人类知识。 **2. 阅读与写作能力(Reading and Writing)** 衡量模型在语言理解、文本生成、语法与表达上的能力。 **3. 数学能力(Mathematical Ability)** 覆盖从算术、代数、几何到概率与微积分的知识与推理。 **4. 即兴推理能力(On-the-Spot Reasoning)** 考察模型面对新问题时的推理、规划、心智理论与适应力。 **5. 工作记忆(Working Memory)** 衡量模型维持和操作信息的能力,包括文字、图像和声音信息。 **6. 长期记忆存储(Long-Term Memory Storage)** 即模型能否持续学习并保留新知识。 **7. 长期记忆提取(Long-Term Memory Retrieval)** 测试模型能否准确提取记忆、避免幻觉。 **8. 视觉处理(Visual Processing)** 评估其理解、生成、推理和扫描视觉信息的能力。 **9. 听觉处理(Auditory Processing)** 包括语音识别、语音生成、节奏与音乐感知等。 **10. 速度(Speed)** 即模型在执行简单认知任务时的反应与处理速度。 **AGI 分数体系** 作者用这十个维度构建了一个综合的"AGI 分数"(AGI Score),满分为 100%,表示与人类智力等同。每个维度在总分中占 10%,体现了广度优先的设计思路。 **当前模型的评分** 通过这一框架,研究团队为不同模型计算了 AGI 分数: - **GPT-4**:约 27% - **GPT-5**:约 58% 这意味着 GPT-5 的认知广度和熟练度已经达到人类智能的一半左右。它在阅读理解、写作、数学和视觉理解方面表现突出,但在长期记忆方面依然是 0%,即几乎不具备持续学习能力。 **锯齿状智能现象** 论文进一步分析了当前 AI 系统的"锯齿状智能"现象——某些方面超人,某些方面极度欠缺。 例如,模型依赖超大上下文窗口(工作记忆)来弥补缺乏长期记忆的缺陷,这是"能力弯曲"的表现。类似地,模型通过外部检索(RAG)来弥补内部记忆提取不足,但这并不代表真正的学习或理解。 作者称这种现象为"能力错觉"(illusion of generality)。在他们看来,真正的 AGI 必须具备能长期积累、内化和提取知识的认知系统,而不是依赖外部数据库或一次性上下文。 **核心结论** 论文的结论是,虽然大型模型在某些领域已接近人类,但距离真正的 AGI 仍有显著差距。 **最大的瓶颈:** 1. 缺乏长期记忆与持续学习能力 2. 多模态整合不足 3. 自主推理能力有限 作者认为,这一框架提供了一种客观方法,能持续追踪 AI 向 AGI 发展的进展,并揭示未来研究需要突破的方向。 **概念区分** 论文还特别区分了 AGI 与其他相关概念: - **超级智能**:远超人类的智能 - **递归 AI**:能自主改进自身的 AI - **自维持 AI**:能独立运行并自我保护 - **经济型 AI**:能产生巨大利润但不一定具备通用智能 **论文明确指出:AGI 衡量的是认知能力,而不是经济价值。** **意义与价值** 这篇论文的价值在于: 1. **提供了可量化的标准**:将模糊的概念转化为可测量的指标 2. **揭示了真实差距**:让我们清楚地看到当前 AI 的局限性 3. **指明了研究方向**:明确了未来需要突破的关键领域 4. **促进了理性讨论**:为 AGI 相关讨论提供了科学基础 这是 AGI 研究领域的一个重要里程碑,为整个行业提供了一个共同的评估框架。 论文 PDF A Definition of AGI 完整论文 项目官网 AGI Definition 官方网站 #AGI #AI #GPT #人工智能 #机器学习 #深度学习 #认知科学 #评估框架