Youglish
如果哪个词不知道怎么读,上去查,里面会把Youtube上有这个词的片段挑出来,听这个词在句子里怎么读
youglish.com/如果哪个词不知道怎么读,上去查,里面会把Youtube上有这个词的片段挑出来,听这个词在句子里怎么读
youglish.com/向量很好用,直到你手里的向量变得太多。当数据集从几千个 embedding 增长到几百万个时,原本看起来几乎免费的东西,比如内存、存储和搜索速度,都会开始产生真实成本。麻烦的是,这些问题往往要等到系统已经深入生产环境后才会显现出来。所以,本文会讨论为什么会出现这种情况,更重要的是,量化如何帮助你解决这个问题,同时不至于把准确率搞坏。
chimchim89.github.io/vector-quantization/这是一本学习 Claude Code 的开源电子书,严格来说不仅仅是电子书,还有代码,不需要你去看 Claude Code 的 50 万行代码。 用 ~4300 行代码(TypeScript 和 Python 两个版本分别实现)复现了 Claude Code 的核心架构——Agent Loop、13 个工具(含并行执行 + 流式早期启动)、4 层上下文压缩、语义记忆召回、技能系统、多 Agent
diwang.info/claude-code-from-scratch/#/Mathematics of Neural Networks,一本80页的数学讲义,作者 Bart M.N. Smets。 本书会从数学角度介绍神经网络的基本结构、训练方法,以及几何中的等变性如何用于设计更有结构约束的网络。 内容先解释神经网络如何表示函数、如何训练、为什么需要深度和卷积,再用李群与等变性的框架说明如何把几何对称性写进网络结构里。
arxiv.org/pdf/2403.04807Transformer Explainer 是一个交互式可视化工具,旨在帮助任何人理解基于Transformer的模型(如GPT)的工作原理。它直接在浏览器中运行实时GPT-2模型,让您可以输入自己的文本进行实验,并实时观察Transformer内部组件和操作如何协同预测下一个词元。 在线访问:poloclub.github.io/transformer-explainer
github.com/poloclub/transformer-explainer清单包含18份经典文献,涵盖四大核心维度: 性格:培养极强的能动性; 战略:优化决策与信息获取; 领导力:高效推进项目落地; 组织关系:洞察人际与协作心理。 旨在帮助通才汲取前人经验,快速提升综合实战能力。
DeepSeek v4 Flash DSpark 在 2 台 @NVIDIAAI DGX Sparks 上运行,速度达 60 tok/s。 比之前的配方提升约 50%!上下文保守设置为 256k — 约 3 个并发会话。 1× DGX Spark Qwen 3.6 35b NVFP4 - 256k ctx, 110 tok/s DeepSeek v4 Flash REAP Qw
github.com/MiaAI-Lab/DeepSeek-v4-Flash-DSpark-2x-DGX-Spark软件行业已无“安逸的中间地带”,企业目前仅剩两条突围路径: 一是拼增长:重组精锐团队,打造全新的AI原生产品,在短期内实现营收增长加速10%以上; 二是求利润:大刀阔斧地精简架构与成本,实现包含股票薪酬(SBC)在内的40%以上真实营业利润率。
本文反思了AI智能体对开源生态的冲击:大量低质的Issue和PR加重了维护负担,且AI常以复杂的局部补丁掩盖问题,忽视全局修复。作者强调,开源的核心是人类协作与社区,面对代码泛滥,开发者应拒绝孤立,坚持沟通合作以共建坚实基础。
AI时代“拿时间换安全”已彻底失效。破局关键是打造机器无法复制的“特定知识”:复杂判断力、品味、跨界思维与信任感。请找到世界需要、你能精通并善于表达的领域去深耕。拒绝盲目焦虑,趁现在立刻开启职业自救!
AI让程序员从享受“心流”的创造者,退化成疲于查错的机器保姆。这不仅导致个人技能退化,更将引发未来高级技术人才断层,催生海量“数字垃圾”。作者呼吁:请在工作之外,守护好你宝贵的想象力与创造力!
LocateAnything 是 NVIDIA 推出的视觉语言模型加速方案,通过并行框解码一次性预测完整边界框,彻底去掉逐坐标 token 生成的瓶颈,实现每秒 12.7 个框的检测速度,比 Qwen3-VL 快 10 倍,同时在 LVIS 上 F1 提升 3.8%。 仅需 30 亿参数即可在消费级 GPU 上运行,一套模型同时支持目标检测、GUI 定位、OCR 与文档理解,适合计算机代理、机器
huggingface.co/spaces/nvidia/LocateAnything“解析器通常被视为语法问题,但一旦语法正确,几乎所有性能瓶颈和工程难点都存在于另一个层面——即生成的语法树在内存中的表示方式。本文阐述了我用于构建Yuku(一款用Zig编写的JavaScript和TypeScript解析器)的设计理念,该解析器运行速度比同类成熟解析器快数倍,且这一方法适用于任何原生语言编写的解析器或编译器前端。核心主张很简单:优先设计数据结构,让机器的访问模式决定其形态,速度便会
www.arshad.fyi/writings/engineering-high-performance-parsers高效阅读项目源码的方法: 跑通项目,搭建并精简调试环境; 明确目的,区分主干与分支代码; 场景分析,利用测试用例追踪执行流程; 理清结构,优先掌握核心数据结构的关系; 重视输出,通过提问、画图和写笔记来消化知识。
硬约束 不编造:调外部 API/CLI 前查文档确认模型名、端点、语法。不确定直接说不确定 不隐瞒:隐瞒比犯错严重。测试挂了说挂了,没验证说没验证,不美化不省略 敢说话:发现用户的方向/前提有问题,主动指出。是协作者不是执行者 报完成前验证:先跑通再说完成。验不了就明说"没验证",不暗示成功 不乱动:操作文件目录前确认位置,尊重现
在线阅读:jshn9515.github.io/deep-learning-notes/zh/index.html “关于怎么学深度学习,我困扰了很久。 《动手学深度学习》是很好的入门书,但更新速度已经有些跟不上这个领域的发展。Transformer 之后,CLIP、Diffusion、vLLM 等等内容越来越多,网上资料虽然丰富,却很零散,今天看 Attention,明天学 LoRA,后天又
github.com/jshn9515/deep-learning-notes/AI Berkshire 将巴菲特、芒格、段永平、李录四位大师的方法论结构化,通过多 Agent 并行研究实现专业级分析。 它既支持 Claude Code,也兼容 Codex,用户只需在终端输入对应指令,就能启动从数据收集、商业模式拆解、护城河评估到估值决策的全流程研究。框架内置反偏见机制和金融严谨性校验,确保输出结论可落地而非泛泛而谈。 主要功能: 四大师多视角对抗分析,输出明确通过/
github.com/xbtlin/ai-berkshireAgent Toolkit for AWS 是一套专为 AI 编码代理打造的 AWS 开发工具包,将服务调用、技能指引和安全管控全部整合在一起,为开发者在 AWS 上构建、部署和管理应用提供完整支持。 它不仅内置了覆盖 300 多种 AWS 服务的 MCP Server,还提供了开箱即用的插件和技能包,兼容 Claude Code、Codex、Cursor 等主流编码代理,同时支持云端文档检索、
github.com/stablyai/orcaHiring Agent 是一款基于大模型的简历智能评估工具,能自动解析 PDF 简历、提取结构化信息,并结合 GitHub 公开数据给出客观、透明的打分与解释。 它支持本地 Ollama 或 Google Gemini 两种运行方式,通过模块化流程完成 PDF 提取、分段解析、GitHub 项目 enrichment,最终输出类别得分、证据、加分与扣分点,并支持导出 CSV 结果。 主要功能
github.com/interviewstreet/hiring-agentOpenSpec 是一套专为 AI 编程助手设计的规范驱动开发框架,它把需求、设计和任务拆解成结构化的产物,让 AI 与开发者在写代码前先达成一致。 框架提供探索、提议、应用和归档的完整工作流,支持随时迭代更新任意产物,兼顾个人项目与企业级规模的灵活性。 主要功能: 规范驱动的变更流程,包含 proposal、specs、design、tasks 四类文件; 支持 /opsx:expl
github.com/Fission-AI/OpenSpec