电子书 《推理王国》
一本关于AI推理机制的开源教程,从熵增到边界,追问智能的本质。 本书还在编写中,目前放出的内容为上卷,内容可能也会调整。 上卷(第1–13章) 从熵增到边界,沿历史线索追问推理的本质——符号主义、统计学派、Transformer、搜索与因果。 下卷(第14–22章) 从形式系统出发,用逻辑演绎重建推理王国——一致性、线性逻辑、概率、因果、复杂度、自指。
datawhalechina.github.io/reasoning-kingdom/一本关于AI推理机制的开源教程,从熵增到边界,追问智能的本质。 本书还在编写中,目前放出的内容为上卷,内容可能也会调整。 上卷(第1–13章) 从熵增到边界,沿历史线索追问推理的本质——符号主义、统计学派、Transformer、搜索与因果。 下卷(第14–22章) 从形式系统出发,用逻辑演绎重建推理王国——一致性、线性逻辑、概率、因果、复杂度、自指。
datawhalechina.github.io/reasoning-kingdom/课程内容主要是:interpretability(可解释性)、alignment(对齐)、agents(智能体)。 “大型语言模型正在迅速重塑机器学习的研究与实践,但关于它们的工作原理、如何确保其按预期行为以及如何在其基础上构建可靠系统仍存在许多问题。本课程聚焦于 LLM 研究前沿的三个核心领域:可解释性、对齐与智能体。学生将学习分析电路和内部表示,通过稀疏自编码器和线性表示探测模型特征的几何结构
uchicago-llm-course.github.io/Claude Code 的文档是出了名的难啃。slash commands、hooks、skills、MCP 配置——每一块都要自己摸索,折腾半天不知道对不对。这个平台:claude.nagdy.me 核心设计是「边做边学」,不是读文档。 11个交互模块,从入门到进阶 1)浏览器内置终端模拟器,直接练 slash commands 和 hooks 2)不需要安装 Claude Code,不需要 A
claude.nagdy.me分通识教育和专业教育两部分。 左侧通识教育适合非计算机专业阅览。
rmcong.github.io/AI_COURSE.html试一下提示词 1)「用 Excalidraw 画一只猫」 2)「画一个架构图:用户 → API Server → 数据库」 3)「把刚才的系统设计画出来」
github.com/excalidraw/excalidraw-mcp/部署AI智能体通常需要复杂的架构,LLM网关负责API路由,数据库管理多租户,安全层防止越权,还要额外的监控工具,来回切换部署颇为麻烦。 GoClaw 把AI智能体平台的完整功能全部整合到一起,提供了生产级多租户AI代理解决方案。 不仅支持20+ LLM提供商(Anthropic、OpenAI、Groq等)和7大消息渠道(Telegram、Discord、Slack等),还提供5层安全防护、多
github.com/nextlevelbuilder/goclaw如果说 OpenAI Codex CLI 是开发者手中的利剑,那么 Oh My Codex(OMX)就是一套完整的指挥系统。 在 AI 编码工具日新月异的今天,我们正在见证一个关键的转变:从“与单个聊天机器人对话”转向“指挥一支自动化的 AI 专家团队”。由韩国开发者 Yeachan Heo 主导的开源项目 Oh My Codex,正是这一趋势的集大成者。 它不是 Codex 的替代品,而是它
github.com/Yeachan-Heo/oh-my-codexAI研究常常需要切换多个工具,论文搜索要用arXiv,网页信息靠搜索引擎,代码分析和实验复现还得单独跑环境,来回折腾效率低下。 Feynman 把AI研究全流程整合到一起,提供开源AI研究代理解决方案。 不仅支持论文搜索、智能多代理深度研究,还能文献综述、实验复现、代码审计,甚至自动生成带引用的研究报告。 主要功能: 多代理研究系统,自动调度Researcher、Reviewer、Wr
github.com/getcompanion-ai/feynman理解大型代码库、文档、论文常常需要来回翻阅文件,搜索关键词却抓不住架构脉络和设计意图,耗时费力。 graphify 把你的代码文件夹、文档、论文、图片瞬间转化为可查询知识图谱,让AI编码助手快速洞察代码背后的"为什么"。 支持代码AST结构提取、多模态内容分析(PDF、图片、Markdown),生成交互式图谱、报告和JSON,一键查询连接关系,神节点与惊喜关联一目了然。 主要功能: 自
github.com/safishamsi/graphifyAI Agent开发常常需要管理海量对话历史,传统RAG或知识图谱难以实现真正学习,记忆准确率低、长期遗忘严重。 Hindsight™ 提供革命性的Agent记忆系统,让AI Agent真正"学会"而非仅"记住"。 不仅在LongMemEval基准测试中创下最优性能,还支持世界事实、个人经历、心理模型构建,已被Fortune 500企业投入生产。 主要功能: 记忆保留(Retain):
github.com/vectorize-io/hindsight开发聊天总切工具多烦。代码编辑器敲代码,文档查资料,AI助手问问题,浏览器搜方案,来回切换费时费力。 Token用量砍75%,洞人说话保持技术精确。智能洞人模式,技术术语不变,语法碎片化,砍赘词文章。 主要功能: 超压缩沟通,砍75% Token用量; 洞人语法,掉文章填充词,保持技术精确; 短同义词,碎片句式,无套话对冲; 代码块不变,技术术语原样保留; 触发词自动:c
github.com/JuliusBrussee/cavemanAI编程代理经常缺乏生产级工程技能,容易跳过规格编写、测试验证、代码审查等关键步骤,导致代码质量低下、后期维护成本高。 包含19个结构化技能工作流和7个斜杠命令,支持Claude、Cursor、Gemini CLI等多平台AI工具,让代理像资深工程师一样规范开发。 主要功能: 7个开发生命周期命令:/spec(规格先行)、/plan(任务分解)、/build(增量实现)、
github.com/addyosmani/agent-skillsAI 时代,招程序员要考什么?你还在考算法题吗? 关键点:候选人要么是 Builder,要么是 Reviewer,两者都不是的不录用。 Builder 型:产品直觉 + 驱动 AI + 基本设计感 1)能写高质量 Issues,让 AI 真正能动起来,而不是反复追问 2)不等授权,先出原型,快速验证方向 3)一个人能同时扮演 PM + 设计 + 开发 Reviewer 型:极强系
vorojar.github.io/ai-native-hiring-guide/约翰·奥斯特豪特的《软件设计的哲学》是一本教你如何将复杂的软件系统分解为可以相对独立实现的模块的经典书,豆瓣评分9.1。 这个skill会指导agent根据书中的理念来做代码审查、架构讨论、API 设计、模块分解决策、重构、命名和注释改进、错误处理策略。 你也可以直接在线阅读本书。地址: cactus-proj.github.io/A-Philosophy-of-Software-Design-
github.com/luoling8192/software-design-philosophy-skill“该项目用来展示训练自己的语言模型并非神秘操作。无需博士学位。无需大型 GPU 集群。只需一个 Colab 笔记本,5 分钟,你就能拥有一个从零构建的可用 LLM——包括数据生成、分词器、模型架构、训练循环和推理。如果你能运行笔记本,就能训练语言模型。 它不会生成可以写论文的亿参数模型。但它会准确展示每个环节的工作原理——从原始文本到训练权重再到生成输出——让大型模型不再像黑箱。” GuppyL
github.com/arman-bd/guppylm构建AI智能体通常需要集成多个框架,规划逻辑复杂、工具调用繁琐、状态管理麻烦,还要单独开发UI界面和部署方案,来回折腾效率低下。 PraisonAI 把AI员工团队所需的功能全部整合,提供了一站式低代码自动化解决方案。 不仅支持多智能体协作、规划执行、深度研究和代码生成,还集成记忆系统、RAG检索、100+大模型支持,甚至能部署到Telegram、Discord、WhatsApp等平台24/7
github.com/MervinPraison/PraisonAI想要复刻一个网站的界面,通常需要手动分析 HTML 结构、抠 CSS 样式、下载素材,然后再用代码一个一个组件地还原,过程极其耗时且繁琐。 ai-website-cloner-template 利用 AI 编码智能体(AI Coding Agents)实现了“一键克隆”网站,能将任何目标网页反向工程为一套干净、现代的 Next.js 代码库。 只需运行 /clone-website 命
github.com/JCodesMore/ai-website-cloner-templateVibe Coding 之后,下一步是什么? Django 联创 Simon Willison写了一份持续更新的工程实践指南,12章,专门讲工程师如何真正驾驭 Claude Code、OpenAI Codex 这类 coding agent。 认知重建——"写代码"这件事变了 1)Coding agent 的本质是:在循环里执行工具来达成目标。不是聊天补全,是真正能跑代码、能迭代的 age
simonwillison.net/guides/agentic-engineering-patterns/在今年年初左右,我们见证了 AI 从聊天机器人——你向大模型提问,它给你答案——向代理系统的转变——你给大模型一个任务,它会长时间思考,并使用数百种工具尽力完成任务。OpenClaw 作为目前历史上增长最快的 Github 仓库,在这一趋势中发挥了核心作用。 与此同时,即便是主流 AI 领域,甚至本地开源 AI 领域,对隐私和安全问题也表现出完全的轻率。举例来说,最近一些更注重安全的人对 Ope
vitalik.eth.limo/general/2026/04/02/secure_llms.html“为了让编码代理在更少监督下工作,我们需要提升对其结果的信心。作为软件工程师,我们对 AI 生成的代码存在天然的信任障碍——大型语言模型具有非确定性,它们不了解我们的上下文,也不真正理解代码,它们以 token 为思维单位。本文探讨了一种心理模型,将上下文与驾驭工程的新兴概念结合,以建立这种信任。”
martinfowler.com/articles/harness-engineering.html