神经网络的数学
Mathematics of Neural Networks,一本80页的数学讲义,作者 Bart M.N. Smets。 本书会从数学角度介绍神经网络的基本结构、训练方法,以及几何中的等变性如何用于设计更有结构约束的网络。 内容先解释神经网络如何表示函数、如何训练、为什么需要深度和卷积,再用李群与等变性的框架说明如何把几何对称性写进网络结构里。
arxiv.org/pdf/2403.04807Mathematics of Neural Networks,一本80页的数学讲义,作者 Bart M.N. Smets。 本书会从数学角度介绍神经网络的基本结构、训练方法,以及几何中的等变性如何用于设计更有结构约束的网络。 内容先解释神经网络如何表示函数、如何训练、为什么需要深度和卷积,再用李群与等变性的框架说明如何把几何对称性写进网络结构里。
arxiv.org/pdf/2403.04807Transformer Explainer 是一个交互式可视化工具,旨在帮助任何人理解基于Transformer的模型(如GPT)的工作原理。它直接在浏览器中运行实时GPT-2模型,让您可以输入自己的文本进行实验,并实时观察Transformer内部组件和操作如何协同预测下一个词元。 在线访问:poloclub.github.io/transformer-explainer
github.com/poloclub/transformer-explainer清单包含18份经典文献,涵盖四大核心维度: 性格:培养极强的能动性; 战略:优化决策与信息获取; 领导力:高效推进项目落地; 组织关系:洞察人际与协作心理。 旨在帮助通才汲取前人经验,快速提升综合实战能力。
DeepSeek v4 Flash DSpark 在 2 台 @NVIDIAAI DGX Sparks 上运行,速度达 60 tok/s。 比之前的配方提升约 50%!上下文保守设置为 256k — 约 3 个并发会话。 1× DGX Spark Qwen 3.6 35b NVFP4 - 256k ctx, 110 tok/s DeepSeek v4 Flash REAP Qw
github.com/MiaAI-Lab/DeepSeek-v4-Flash-DSpark-2x-DGX-Spark软件行业已无“安逸的中间地带”,企业目前仅剩两条突围路径: 一是拼增长:重组精锐团队,打造全新的AI原生产品,在短期内实现营收增长加速10%以上; 二是求利润:大刀阔斧地精简架构与成本,实现包含股票薪酬(SBC)在内的40%以上真实营业利润率。
本文反思了AI智能体对开源生态的冲击:大量低质的Issue和PR加重了维护负担,且AI常以复杂的局部补丁掩盖问题,忽视全局修复。作者强调,开源的核心是人类协作与社区,面对代码泛滥,开发者应拒绝孤立,坚持沟通合作以共建坚实基础。
AI时代“拿时间换安全”已彻底失效。破局关键是打造机器无法复制的“特定知识”:复杂判断力、品味、跨界思维与信任感。请找到世界需要、你能精通并善于表达的领域去深耕。拒绝盲目焦虑,趁现在立刻开启职业自救!
AI让程序员从享受“心流”的创造者,退化成疲于查错的机器保姆。这不仅导致个人技能退化,更将引发未来高级技术人才断层,催生海量“数字垃圾”。作者呼吁:请在工作之外,守护好你宝贵的想象力与创造力!
LocateAnything 是 NVIDIA 推出的视觉语言模型加速方案,通过并行框解码一次性预测完整边界框,彻底去掉逐坐标 token 生成的瓶颈,实现每秒 12.7 个框的检测速度,比 Qwen3-VL 快 10 倍,同时在 LVIS 上 F1 提升 3.8%。 仅需 30 亿参数即可在消费级 GPU 上运行,一套模型同时支持目标检测、GUI 定位、OCR 与文档理解,适合计算机代理、机器
huggingface.co/spaces/nvidia/LocateAnything“解析器通常被视为语法问题,但一旦语法正确,几乎所有性能瓶颈和工程难点都存在于另一个层面——即生成的语法树在内存中的表示方式。本文阐述了我用于构建Yuku(一款用Zig编写的JavaScript和TypeScript解析器)的设计理念,该解析器运行速度比同类成熟解析器快数倍,且这一方法适用于任何原生语言编写的解析器或编译器前端。核心主张很简单:优先设计数据结构,让机器的访问模式决定其形态,速度便会
www.arshad.fyi/writings/engineering-high-performance-parsers高效阅读项目源码的方法: 跑通项目,搭建并精简调试环境; 明确目的,区分主干与分支代码; 场景分析,利用测试用例追踪执行流程; 理清结构,优先掌握核心数据结构的关系; 重视输出,通过提问、画图和写笔记来消化知识。
硬约束 不编造:调外部 API/CLI 前查文档确认模型名、端点、语法。不确定直接说不确定 不隐瞒:隐瞒比犯错严重。测试挂了说挂了,没验证说没验证,不美化不省略 敢说话:发现用户的方向/前提有问题,主动指出。是协作者不是执行者 报完成前验证:先跑通再说完成。验不了就明说"没验证",不暗示成功 不乱动:操作文件目录前确认位置,尊重现
在线阅读:jshn9515.github.io/deep-learning-notes/zh/index.html “关于怎么学深度学习,我困扰了很久。 《动手学深度学习》是很好的入门书,但更新速度已经有些跟不上这个领域的发展。Transformer 之后,CLIP、Diffusion、vLLM 等等内容越来越多,网上资料虽然丰富,却很零散,今天看 Attention,明天学 LoRA,后天又
github.com/jshn9515/deep-learning-notes/AI Berkshire 将巴菲特、芒格、段永平、李录四位大师的方法论结构化,通过多 Agent 并行研究实现专业级分析。 它既支持 Claude Code,也兼容 Codex,用户只需在终端输入对应指令,就能启动从数据收集、商业模式拆解、护城河评估到估值决策的全流程研究。框架内置反偏见机制和金融严谨性校验,确保输出结论可落地而非泛泛而谈。 主要功能: 四大师多视角对抗分析,输出明确通过/
github.com/xbtlin/ai-berkshireAgent Toolkit for AWS 是一套专为 AI 编码代理打造的 AWS 开发工具包,将服务调用、技能指引和安全管控全部整合在一起,为开发者在 AWS 上构建、部署和管理应用提供完整支持。 它不仅内置了覆盖 300 多种 AWS 服务的 MCP Server,还提供了开箱即用的插件和技能包,兼容 Claude Code、Codex、Cursor 等主流编码代理,同时支持云端文档检索、
github.com/stablyai/orcaHiring Agent 是一款基于大模型的简历智能评估工具,能自动解析 PDF 简历、提取结构化信息,并结合 GitHub 公开数据给出客观、透明的打分与解释。 它支持本地 Ollama 或 Google Gemini 两种运行方式,通过模块化流程完成 PDF 提取、分段解析、GitHub 项目 enrichment,最终输出类别得分、证据、加分与扣分点,并支持导出 CSV 结果。 主要功能
github.com/interviewstreet/hiring-agentOpenSpec 是一套专为 AI 编程助手设计的规范驱动开发框架,它把需求、设计和任务拆解成结构化的产物,让 AI 与开发者在写代码前先达成一致。 框架提供探索、提议、应用和归档的完整工作流,支持随时迭代更新任意产物,兼顾个人项目与企业级规模的灵活性。 主要功能: 规范驱动的变更流程,包含 proposal、specs、design、tasks 四类文件; 支持 /opsx:expl
github.com/Fission-AI/OpenSpecNVIDIA Agent Skills 是一套官方验证的 AI 智能体技能库,覆盖 CUDA-X、AI Blueprints、Jetson、NeMo 等 NVIDIA 全栈工具,帮助智能体高效调用 GPU 加速库和平台能力。 仓库提供一键安装流程,通过 npx skills add 即可将技能部署到 Claude Code、Cursor、Codex 等主流智能体,无需手动复制文件。技能内容每日从
github.com/NVIDIA/skillsvideo-use 是一套基于代码代理的视频编辑工具,让你通过自然语言指令完成从原始素材到最终成片的全部流程。 只需把素材丢进文件夹,与 Claude Code 对话即可得到 final.mp4,自动完成去冗余、调色、字幕、转场和动画合成,无需预设菜单或手动操作。 主要功能: 智能剪辑:自动去除口头禅、死区和冗余片段; 自动调色:支持自定义 ffmpeg 链路,为每段素材生成电影感或中
video-use 是一套基于代码代理的视频编辑工具OpenSEO 是一套开源的 SEO 工具集,旨在为个人和团队提供与 Semrush、Ahrefs 同等能力的平替方案。 它不仅支持关键词研究、排名追踪、竞品分析、反向链接和站点审计,还能通过 MCP 协议与 Claude Code、OpenClaw 等 AI 代理无缝对接,让 SEO 工作流实现自动化。 主要功能: 关键词研究与聚类、排名监控及竞品洞察; 反向链接分析与站内 SEO
github.com/every-app/open-seo