资源
完全从0开始,仅用3块钱成本 + 2小时!即可训练出仅为25.8M的超小语言模型MiniMind
之前介绍过的项目“大道至简”minimind更新了不少。该项目会带你完全从0开始,仅用3块钱成本 + 2小时!即可训练出仅为25.8M的超小语言模型MiniMind。
它还有一个兄弟项目:训练小型视觉模型的 github.com/jingyaogong/minimind-v
最近更新的是RLAIF训练算法:PPO、GRPO、SPO(从0原生实现)
项目介绍:
大语言模型(Large Langu
github.com/jingyaogong/minimind6小时前网闻录
长文
CLAUDE.md不是规则手册,而是路由器
CLAUDE.md文件超过100行后,AI会选择性忽略指令。解决方法不是添加更多规则,而是将执行逻辑从指令转移到基础设施——用自动化钩子(hooks)强制质量检查,用技能文件(skills)按需加载上下文,用campaign文件持久化会话状态。
10小时前网闻录
长文
OpenAI:使用 GPT-5.4 设计前端的实用技巧,最后附官方前端 skill
OpenAI使用 GPT-5.4 设计前端的实用技巧
10小时前网闻录
资源
一人公司(OPC)必看的 9 个 Skill
Gumroad 创始人 Sahil Lavingia 做了一件挺有意思的事。他把自己那本「The Minimalist Entrepreneur」里的极简创业方法论,拆解成了 9 个 Agent Skills,开源在了 GitHub 上。
这 9 个 Skills 基本覆盖了一人公司从 0 到 1 再到持续增长的完整链路。Find Community 帮你找社区、定方向,Validate Ide
github.com/slavingia/skills10小时前网闻录
长文
十个提示词,重新定义“主动学习”
被动接受信息是低效的。Claude可以模拟苏格拉底式追问、交错练习、类比教学等十种主动学习方法,让你真正掌握知识,而不只是“看过”它
10小时前网闻录
提示词
把下面这段加到你的 Codex 自定义指令里,体验会好太多
"向我汇报结果时,用简单直白的语言说清楚你做了什么、结果怎样。最终回复里不要出现术语、技术实现细节和代码腔。写的时候就当你在跟一个聪明人解释,但对方没在看代码。你实际干活的过程(怎么思考、怎么规划、怎么写代码、怎么调试、怎么解决问题)该多技术就多技术,该多严谨就多严谨。这条要求只针对你跟我沟通的方式。
在向我汇报之前,尽一切可能先验证自己的工作。不要写完代码就当大功告成。用你手头的工具实际跑一遍
17小时前网闻录
长文
构建 Claude Code 的经验教训:我们如何使用技能
本文分享了Anthropic构建Claude Code技能的实战经验:总结了9大技能类型,提出记录易错点、渐进式披露等最佳编写实践,并探讨了团队内技能的分发与管理,助力高效打造AI Agent。
1天前网闻录
长文
构建 Claude Code 的经验教训:像智能体一样思考
本文总结了构建Claude Code智能体的经验:设计工具需匹配模型能力;通过UI优化提问交互;随模型进化将待办升级为任务;赋予搜索能力使其自主构建上下文;利用“渐进式披露”避免工具臃肿。设计工具是一门需不断实验的艺术。
1天前网闻录
长文
我们突破了智能体记忆的边界:推出准确率约 99% 的 SOTA 记忆系统
Supermemory推出新型智能体记忆技术ASMR,摒弃传统向量数据库与RAG,采用多智能体并行摄取与主动检索机制,在长期记忆基准测试中创下约99%的SOTA准确率,突破性能极限,代码即将开源。
1天前网闻录
资源
OpenEnv 是一个基于 Gymnasium 风格 API 的代理式执行环境接口库,助力 RL 训练后环境的创建和管理
在线强化学习训练环境开发、部署总是琢磨如何隔离安全运行,有没有简单统一的接口和工具呢?
OpenEnv 是一个基于 Gymnasium 风格 API 的代理式执行环境接口库,助力 RL 训练后环境的创建和管理。
它支持环境的容器化隔离,基于 WebSocket 提供简洁的 step()、reset()、state() 等接口,让训练框架和研究者都能轻松调用。
核心功能:
标准化环境客户端
github.com/meta-pytorch/OpenEnv1天前网闻录
资源
在线构建智能体记忆库的必备利器!🚀
Honcho 是一款开源的记忆库与托管服务,专为构建有状态的智能体(stateful agents)设计。它支持任何模型和架构,能持续学习并维护用户、智能体、群组、观点等实体的动态状态,让你的智能助手记忆力爆棚,更加可信和个性化。
主要亮点:
统一的“伙伴”模型,支持多参与者多会话交互
多种记忆存储原语:工作空间、会话、消息、集合与文档
强大的异步推理系统,自动生成用户画像与会话摘要
github.com/plastic-labs/honcho1天前网闻录
资源
MiniMax Skills 专为 AI 编码助手打造了一套结构化的开发技能库
在线开发经常需要面对前端设计、后端架构、移动开发和图形着色等多样技能,学习曲线陡峭且缺少系统化指引。
MiniMax Skills 专为 AI 编码助手打造了一套结构化的开发技能库,覆盖从前端动画、全栈集成,到安卓 iOS 原生开发,再到 GLSL 着色器视觉特效。
项目不仅支持丰富技术栈和产业标准,还能兼容多种 AI 工具如 Claude、Cursor、Codex 和 OpenCode,通过
github.com/MiniMax-AI/skills1天前网闻录
资源
LightRAG 是一个简单快速的检索增强生成(RAG)框架
LightRAG 是一个简单快速的检索增强生成(RAG)框架,能高效整合大语言模型和知识图谱,实现智能文档查询和多模态检索。
LightRAG支持多种存储方案(PostgreSQL、Neo4j、Milvus、OpenSearch等),支持文本、图片、表格、公式等多种数据类型的端到端知识抽取和问答。还提供了丰富的示例代码、Web UI,以及支持OpenAI、Hugging Face、Ollama、
github.com/HKUDS/LightRAG1天前网闻录
资源
一个第三方的小龙虾客户端nexu
nexu(奈苏,next to you)是一个开源桌面客户端,让你的 OpenClaw 🦞 Agent 直接运行在微信、飞书、Slack、Discord 等 IM 中。
已支持微信接入 OpenClaw —— 适配微信 8.0.7 OpenClaw 插件,点击连接、微信扫码,即可在微信中与 AI Agent 对话。
下载即用,图形化配置,内置飞书 Skills,支持 Claude / GPT /
github.com/nexu-io/nexu/1天前网闻录
长文
我是如何使用大语言模型(LLMs)写软件的
本文分享了利用大语言模型(LLM)开发软件的高效工作流。作者认为系统架构能力现比纯编码更重要。通过让AI分别扮演架构师、开发者和审查员进行多模型协作,能以极低缺陷率构建项目,文末附有真实AI编程实录。
1天前网闻录
长文
智能体开发基础
本文介绍了使用 Claude 进行智能体开发的基础。建议在测试项目中放弃手动编码,利用“计划模式”与 AI 协作。通过从小任务开始不断试探 AI 的能力极限与失败,帮助开发者转变编程思维,为学习高级技巧打下基础。
1天前网闻录
资源
A Visual Guide to Attention Variants in Modern LLMs 现代大型语言模型注意力变体视觉指南
Sebastian Raschka的新长篇文章:A Visual Guide to Attention Variants in Modern LLMs 现代大型语言模型注意力变体视觉指南
这篇文章整理了现代大语言模型中为了提高推理效率和内存占用而演进出的各种注意力机制变体。
“在本文中,我认为回顾近年来在知名开源权重架构中开发和使用的各种注意力机制变体会很有趣。
我的目标是让这个集合既可作为参考
magazine.sebastianraschka.com/p/visual-attention-variants1天前网闻录