国防部长 Pete Hegseth 任命 Marc Andreessen 加入国防政策委员会。该任命标志硅谷、AI、国防科技与国家安全战略加速融合。Andreessen 代表“美国动力”派,视软件、芯片、自主系统、AI 和工业能力为国家权力核心。此举凸显美国将 AI 视为战略技术,用于国防、威慑、采购、情报和地缘竞争。同时反衬 Anthropic 此前对军方使用其模型划设红线的立场——前沿 AI 正被纳入国家安全体系,拒绝配合的公司可能被美国战略核心日益孤立。
Marc Andreessen has been appointed by Secretary of War Pete Hegseth to the Defense Policy Board.
Qwen 3.6 27B 是一款密集参数本地大语言模型,原生支持 256k 上下文。在 Macbook Max M5 上运行 llama.cpp Q8_0 量化版(含多 token 预测)可达 30 tokens/s;用户反馈在 RTX 5090 上 Q6_K 量化可达 50 tokens/s。它可通过单个提示完成创意诗歌、用 pnpm 生成六边形扫雷游戏等任务,作者称其为首个真正具备通用智能的本地模型。另有一个 MoE 变体 35B A3B,但作者推荐 27B 版本。
一个简单的CUDA向量加法程序在RTX 4090上运行,背后需执行上千万条CPU指令、操作数个设备文件、发出约900次ioctl并访问一个内存映射doorbell寄存器。程序经nvcc编译,设备代码先由cicc转为PTX虚拟ISA,再由ptxas转为SASS机器码,最终正确完成1+1=2的一百万次计算。
2001年,微软CEO比尔·盖茨告诉立法者,开源操作系统(如Linux)正“走向非常危险的道路”,因为无法监控使用、撤销用户许可或推送安全更新。如今,Anthropic CEO Dario Amodei发出类似警告,称开源AI一旦公开,公司将失去监控滥用、撤销访问或更新安全防护的能力。两个时代的警告如出一辙,指向开源模式在大型系统中的失控风险。
🚨ANTHROPIC CEO: OPEN SOURCE AI IS GETTING DANGEROUS Anthropic CEO Dario Amodei told lawmakers that open-source AI is mo...
Founder Tip: Load up on intern energy and naivety. Today's interns are a question away from most knowledge thanks to LLM...
黄仁勋在Fox Business访谈中指出,阻止中国获得英伟达芯片不等于阻止其AI发展。华为崛起表明制裁正转化为产业刺激:供应缺失催生本土市场,倒逼国内供应商成熟并走向出口。他认为真正竞争不再是拥有最快加速器,而是谁定义智能操作层(芯片、能源、基础设施、模型、应用及标准)。芯片政策不是简单开关,每道限制在减缓一个流向的同时会强化另一股力量;长期风险在于美国技术可能缺席它本希望影响的系统。
Dario Amodei has a really hardline view that China shouldn't have strong AI. He says - "That's the national security int...
👀 This is from an ex-Meta PM.
Anthropic应用AI工程师Margot Van Laar在Code with Claude分享提示词工程实战手册。核心观点:维护已有提示词比从零写更常见,最佳起点是评估(Eval)而非直接改提示词。两个场景:客服机器人需用XML标签结构化,移除旧模型冗余指令,为精确计算提供工具;零售排班Agent应拆分成生成-评估-修复循环,使用更强推理模型(Opus)+自适应思考。强调评估是判断改动有效性的唯一严谨方式。
iOS 27 Beta 3 is expected next week. This week, Apple could release iOS 26.6 Beta 3, iOS 26.5.2, or both.
An anthropic应用AI工程师Margot Van Laar在Code with Claude分享提示词工程实战,核心观点:大部分时间在调试和维护已有生产提示词而非从零编写。两个场景:客服机器人维护中,用XML标签结构化清理,移除旧模型遗留的“禁止列表”指令(新模型会过度拟合),精确计算应调用工具,转人工决策需明确代价与收益;零售排班Agent从零构建时,拆成生成-评估-修复三个简单提示词更稳定,选用更强推理模型(Opus)。她反复强调:评估(Eval)是唯一严谨方式,没有评估就是碰运气。
睡前来一发,这个视频还是挺完美的。 Anthropic的应用AI工程师Margot Van Laar在Code with Claude分享了提示词工程的实战手册。 核心观点是:我们很少从零写提示词,大部分时间都在调试和维护已有的生产提示词。...
Anthropic应用AI工程师Margot Van Laar在Code with Claude分享提示词工程实战手册。核心观点:生产提示词大多时间在调试维护,最好起点是评估而非直接修改。维护客服机器人提示词时,需用XML标签结构化,移除冗余补丁,明确输出格式;避免旧模型“禁止列表”指令在新模型上过度拟合;精确计算应赋予工具;升级决策需说明代价与收益。从零构建零售排班Agent,应拆分为生成-评估-修复循环,三个简单提示词各司其职;更强推理模型+自适应思考更高效。评估是唯一验证改动的严谨方式。
Anthropic CEO Dario Amodei on Open-Source AI Models. "I don't think open source works the same way in AI that it has wor...
Gary Marcus 在最新帖子中宣布即将离线度假,并分享了一张 Oren Etzioni 发送的 AI 生成自行车事故图片(源自真实的 REI 广告),同时提及了“The Klarna Effect”彩蛋。
Berry Xia 宣布成功完成了一套“视频讲解的Skills”开发与测试。用户只需提供网站、内容、视频地址等信息,该技能就能自动生成基础的讲解视频。作者询问社区兴趣度,表示如果需求多可能会进一步分享。目前未披露具体使用的模型或平台名称。
Meta 正面临每个 AI 公司都会遇到的难题:想用内部系统 MetaCode 取代 Claude Code、Codex 等昂贵的外部编码工具,但在构建更好的编码模型时,必须确保不意外地使用竞争对手模型的输出进行训练或评估。这就是知识蒸馏陷阱——公司越依赖前沿模型建设内部 AI 基础设施,就越难证明智能来源的独立性。
作者以软件工程师和小说家双重身份,对比AI前后的典型工作流。AI通过学习万亿行公开源代码,已能持续生成高质量代码,但开发者角色从亲手编写变为“编辑”:撰写提示词、审查AI输出、必要时修改或合并代码。AI如同能力合格但缺乏二十年后系统级知识与机构记忆的初级/中级开发者,无法理解法律合规、外部系统延迟、未来功能冲突或敏感数据安全风险。资深开发者必须核验和修正看似可用的AI代码。文章同时类比历史小说家研究过程,指出深度沉浸的心流体验仍是核心。
用户发现 Codex Remote 功能的一个 bug:当前 5 小时额度用光后,消息发出去仅 thinking 几秒就消失,没有任何额度提醒或异常提示,导致用户毫无察觉。
Anthropic CEO Dario Amodei on Open-Source AI Models. "I don't think open source works the same way in AI that it has wor...
I got tired of reading badly formatted agent written reports, so I put together a writing skill derived from the GOVUK s...
用户反映 Claude Opus 4.8 幻觉问题严重,导致代码多次被改崩,且对话中频繁出现他人信息串扰。最终放弃 Claude,重新订阅 ChatGPT 200 美元会员(Codex),并称赞 Codex 远程控制体验远超 Claude。
DeepSeek 的 MLA 通过只缓存低维潜向量压缩 KV Cache,但 QK-Norm 需归一化高维 Key,若缓存归一化结果则打破低维优势。文章提出数学等效变换:将 QK-Norm 中动态逆 RMS 标量和静态仿射权重合并到 Query 侧,推理时每个 token 只需额外缓存一个逆 RMS 标量,即可严格等价实现 QK-Norm,不牺牲显存效率。在 400M/1B 模型训练 100B tokens 实验中,QK-Normed MLA 相比 QK-clipping loss 更低(1B 模型 gap ~0.02),训练更稳定且收敛更快。
OpenAI Codex 项目负责人安布罗西诺称,设计比代码更难量化评判,训练模型区分优劣设计比验证代码编译更繁琐。Figma 首席执行官菲尔德指出,AI 模型基于数据分布训练,产出通常平庸。格莱美提名音乐人巴斯强调,引导 AI 创作离不开人类审美判断。目前 AI 在创意设计领域主要作为提速工具,无法独立产出成熟成品。
Kim引用quxiaoyin观点指出,中国开源AI并非出于人文主义,而是抢占市场份额、压制美国模型的战略。模型在华为芯片(如DeepSeek 4)上训练和推理优化,使中国掌握模型层与芯片层。同时美国数据中心建设不足,能源和电网容量严重短缺;中国2025年一年新增太阳能装机量相当于美国10–15年,在建36座核电站。华为芯片虽仍落后NVIDIA,但以量取胜。出口管制无法解决问题,美国应投资开源模型、推动中国使用NVIDIA并加速核电建设。
The worst case scenario for USA AI: 1. Chinese open sources keep gaining market share. China owns the model layer. 2. Th...