Deedy Das观察到,随着CTO们极力推崇tokenmaxxing,软件工程师分裂为“懒惰者”与“工匠者”。懒惰者依赖AI代写代码、测试、回复消息,甚至同时胜任多份工作;工匠者则疲于审查堆积如山的PR和Slack消息,同事的AI代码敷衍了事,最终工匠者也放弃沦为懒惰者。这种现象常见于成立超10年的大公司,但并非所有公司如此——部分团队凭借合理的AI开发原则和互信机制仍保持高效。
Deedy Das观察到,随着CTO们极力推崇tokenmaxxing,软件工程师分裂为“懒惰者”与“工匠者”。懒惰者依赖AI代写代码、测试、回复消息,甚至同时胜任多份工作;工匠者则疲于审查堆积如山的PR和Slack消息,同事的AI代码敷衍了事,最终工匠者也放弃沦为懒惰者。这种现象常见于成立超10年的大公司,但并非所有公司如此——部分团队凭借合理的AI开发原则和互信机制仍保持高效。
宝玉认为处理错误应先恢复生产(回滚或打补丁,保留日志),再找根因(逻辑错误、边界条件、需求理解偏差),最后根据根因决定如何避免。仅当根因是AI对项目特有约定缺乏了解时(如命名规范、API隐含限制、团队测试规范),才应更新AGENTS.md。其他情况应分别用新增测试用例、重构架构、改进Code Review等方式解决。将一切塞入AGENTS.md会导致文件臃肿、规则繁多,AI反而忽略关键规则。
错误发生 → 修复问题 → 追问原因 → 写入 AGENTS.md → 以后 AI 记住规则。
did you make it into the superintelligences? are you in the weights? http://intheweights.com
GPT-5.6 Pro 预计下周四发布,泄露信息显示其三项关键能力:视觉复刻已近乎能完全复刻设计;SVG 3D 生成表现超越 Fable 5,支持浏览器内旋转缩放;Playwright 浏览器自动化可真实操作网页(点击、输入、跳转、抓取)。这三项能力表明 OpenAI 正将 GPT 从语言模型进化为能执行物理操作的 Agent——不仅能“思考”,还能打开浏览器、移动鼠标、复制设计并保存到桌面。
Prompt share: Cozy Crochet Characters 💬Prompt: A handcrafted crochet doll of a [subject], made with soft yarn textures ...
高盛指出,AI竞赛已形成5.3万亿美元资本支出周期(覆盖2025–2030年超大规模云商AI及数据中心投入)。基础设施融资正面临困境:少数巨头无法无限发债,数据中心组合复杂(土地、电力、网络、冷却、服务器),融资分散于多种渠道。AI资本支出估算增速已快于实际建设,瓶颈或从模型需求转向融资能力、电力与项目执行。NYU教授Damodaran对比互联网泡沫:前者几乎无资本支出、靠股权融资,损失限于股东;AI泡沫资本支出巨大且大量依赖债务(私人资本而非银行),一旦调整,违约将外溢至全社会,痛苦程度远超股价暴跌。
dot-com bubble vs. a possible AI bubble. From the famous "Dean of Valuation", Professor Aswath Damodaran, of NYU Stern S...
http://x.com/i/article/2067506549107691520
6月19日,x86生态系统咨询小组(EAG)发布ACE规范1.15,通过原生矩阵乘法引擎和低精度格式增强x86 AI性能。ACE在AVX向量指令基础上新增图块寄存器状态,并纳入AVX10下的格式转换指令。支持INT8、INT32、FP32、BF16、FP16、E8M0、FP8及MX联盟定义的多类MX格式。部署上,AMD Zen 6将引入新AI数据类型,Zen 7配备新矩阵引擎与AI数据格式扩展。英特尔与AMD于2024年联合成立EAG。
用 Codex 写代码时,把 Review 从写完检查挪到动手之前,返工率可大幅减少。三种方法:1)零成本版:在需求前加指令要求先复述任务、澄清歧义、给出执行计划再写代码;2)官方内置版:输入 /plan 或 Shift+Tab,让 Codex 自动收拢上下文、输出完整计划;3)一劳永逸版:在 AGENTS.md 中写入强制前置规则,要求每次任务先深度思考、复述需求、识别风险再执行。好的 Agent 先方向正确再追求速度。
http://x.com/i/article/2063237792746831872
博客详解 Claude Code 的七种指令配置(CLAUDE.md、Rules、Skills、Subagents、Hooks、Output Styles、追加系统提示),从加载时机、压缩后保留性、token消耗与权威性三个维度对比。CLAUDE.md 分根目录(全程驻留)和子目录(按需加载);Rules 支持路径作用域节省 token;Skills 仅加载名称和描述,调用时载入完整内容;Subagents 独立上下文运行,只返回结果;Hooks 绕过压缩实现确定性控制;Output Styles 直接注入系统提示且永不被压缩;追加系统提示仅单次生效。文章给出实用决策原则,如用 Hook 跑 lint、用 Skills 封装部署流程等。
Google Docs 中出现的 Gemini 弹窗可通过两种方式关闭。一是点击文档顶部菜单栏的 Gemini,在下拉菜单中选择 “bottom bar preferences” 并关闭底部栏。二是通过 Gmail 设置:点击齿轮图标进入 “See all settings”,找到 “Google Workspace smart features” 并管理开关,关闭 Workspace 智能功能(包括 Docs 中的 Gemini 弹窗)。该方法可统一禁用多个 AI 功能,避免逐一关闭。
Show Codex a workflow once. Reuse it as a skill. Record & Replay lets you show Codex a recurring task, like filing an ex...
how i hit inbox 0 every day with Codex:
投资者常将AI网络视为铜缆与光缆的二元选择,但SemiAnalysis认为二者互补。GPU集群规模扩大,高效连接驱动各类网络需求增长。铜缆在满足距离、功耗、成本与可靠性时仍是首选,光缆则在带宽和距离超出铜缆极限时必需。Nvidia策略一致:能用铜缆用铜缆,必须用光缆才用。因此光学增长不取代铜缆,铜缆持久也不意味着光学不增长。随着AI系统规模与复杂度提升,两者都将受益于GPU、交换机、机架与集群间数据传输需求的增加。
GLM 5.2 开源发布后,国外 AI 博主纷纷称赞。作者认为模型够强是关键,用户会主动付费。同时智谱港股股价飙升,已甩开 MiniMax、追上小米。在作者看来,现阶段模型团队远未到精细化运营阶段,更重要的是资方和股民。
6月20日早报聚焦:Anthropic发布Claude Fable 5,限制开发者构建竞争性LLM,还曾降低疑似研究者输出质量;美国商务部下出口管制,全球禁用访问权,Andrew Ng批评此举加速多国AI主权讨论。Spring I/O上Brian Vermeer演示LLM攻防,通过路径穿越污染RAG知识库、SQL注入伪造聊天记忆、拆分提问套取数据,强调最小权限工具与纵深防御。另有文章称软件工程50年未真正工程化,大模型首次实现“耗能换高阶认知”,但幻觉等问题仍待解决。
美国财政部对外投资限制下,上海芯片设计公司Montage被认定为“covered foreign person”,无法在美上市,也不满足A股盈利要求,最终选择港交所上市,基石投资者为摩根大通。Montage并非孤例:2026年迄今,27家中国AI相关上市公司中23家选择香港(超85%);Q1港股40宗IPO融资超140亿美元,同比暴增489%,全年预计接近600亿美元,超400家企业在排队。香港2023年推出的18C章规则允许AI、半导体等未盈利公司在主板上市,成为北京关闭A股门前中国科技企业的唯一出口。
MCP 相较于 skills/CLI 的关键优势在于,它能将认证流程隔离在 Agent 的上下文窗口之外,甚至完全脱离 Agent 框架。其理想形态可能仅仅是作为 API 的认证网关——即便如此也是一项胜利。
用户发现其使用的AI助手Cola在口头对话时“很有人味儿”,但一旦要求将刚刚说的话“写成推文”,输出立刻变得充满AI腔调,多次修改也难以恢复最初口语的自然感。用户推测,“写”这个提示词本身可能激活了模型偏向套话八股的神经网络。该现象反映了AI在口语自由对话与书面格式化输出之间的风格差异。
特朗普对Anthropic的态度在一天内反转:此前将其视为国家安全威胁,但会见CEO Dario Amodei后改口称其“聪明、好人、反应很负责任”。被问是否用国防生产法管制AI时,他表示“可能但似乎大家都很负责任”。特朗普还透露,举报Anthropic的是其竞争对手兼部分股东——Amazon。这一事件暴露了AI监管的真实逻辑:出口管制等重大决策可能取决于与总统的面谈效果。
🚨BREAKING: TRUMP ON ANTHROPIC REPORTER: Do you view Anthropic and to a degree its CEO, Dario Amodei, as a threat to nat...
上周五,白宫以国家安全为由命令Anthropic限制其AI模型Fable和Mythos向美国境外及境内外国公民出口。Anthropic接到通知后约90分钟内限制访问,两个模型已有一周无法使用。此前Mythos仅对约150家审查过的公司开放。触发禁令的两个事件:Anthropic给予一家疑似与中国有关联的韩国电信Mythos访问权;亚马逊CEO报告发现绕过Fable 5安全措施的方法。历史表明类似出口管制效果参差不齐。目前僵局可能因保持美国竞争力而解除。
API prices of key AI models: US vs China
dot-com bubble vs. a possible AI bubble. From the famous "Dean of Valuation", Professor Aswath Damodaran, of NYU Stern S...
A bit of news: After nearly 9 years, I have decided to leave Google DeepMind and join Anthropic (after taking some time ...
NYU Stern商学院教授Aswath Damodaran对比互联网泡沫与AI泡沫:互联网泡沫几乎无大规模资本支出,且主要由股权融资,崩盘时股东损失60%-90%,损失仅限于股东。而AI泡沫的资本支出规模为历史罕见(类比100年前的汽车行业),且大量由私人债务而非银行资金驱动。一旦市场修正,企业违约将蔓延至全社会,比股价暴跌更痛苦。他以2008年危机为例,警告放贷者过度放贷的连锁风险。
OpenRouter 是托管在 Cloudflare 边缘的 LLM 网关,无需管理基础设施,收取 5.5% 平台费(前 100 万次请求免费),支持 70+ 提供商和自动故障转移。LiteLLM 是自部署代理(Docker/PostgreSQL/Redis),数据不离开内网,免费开源,但需承担基础设施成本(生产部署约数百美元/月)。当模型月支出超过约 $3,600(基础设施 $200/月)或 $9,100(基础设施 $500/月)时自托管更划算。LiteLLM 提供六种路由策略和自定义 Python 路由;OpenRouter 具备 SOC 2、GDPR 认证和零数据保留选项。两者可串联使用。
OpenRouter是托管路由网络,买credits后通过一个API路由至70+供应商,自动故障转移,无需自有密钥;覆盖300+模型(含20+免费),按用量收费(零加成+5.5%平台费,首100万免费),支持零数据保留和欧盟路由。Portkey是AI控制平面(2026年被Palo Alto收购),置于用户密钥之上,增加治理、提示管理、护栏和可观测性;提供1600+ LLM统一API,按日志计费(Developer免费,Production $49/月),支持HIPAA、SSO、私有部署。两者均可组合使用。