Finally, Artificial Analysis Intelligence Index concludes the GLM-5.2 release.
Finally, Artificial Analysis Intelligence Index concludes the GLM-5.2 release.
六月的一周里,美国商务部迫使Anthropic对全体外国公民禁用Fable 5和Mythos 5,同时司法部在密西西比法院为xAI未获许可的燃气轮机辩护,称其因国家安全过于重要不能关停。两件事方向相反——一边是束缚,一边是盾牌——但共同证明:AI及其伴随的数据中心扩张、前沿模型访问等,正越来越多地被置于国家管控之下。作者中立指出,AI作为国家战略要务,无法任其自然发展;对xAI有利,对Anthropic不利。
🥇MaineCoon: From Passive Video to Real-Time AI Presence The first unlimited-duration interactive audio-visual model. Mo...
I'm an AI researcher turned brain tumor patient, and recently I used the models to crack my mystery fatigue faster than ...
近日,Anthropic CEO Dario Amodei与白宫沟通失败,引发业内反思。技术团队与权力对话存在两套语言体系:技术方讲逻辑、安全、长期价值,对方讲立场、交易、国家安全优先级。业内建议关键谈判应派懂人情、能读空气、擅长建立信任的人出席,而非纯技术团队。AI时代技术门槛将拉平,真正的竞争力在于搞定人和建立信任——技术决定产品上限,沟通决定产品生死。
这次达里奥跟白宫沟通失败,Anthropic踩的坑, 给所有技术团队敲了警钟, 建议技术出身的创始人都看一遍经典美剧《广告狂人》, 因为你光把模型做到行业顶尖没用,沟通对不上频道,说下架就下架。 技术团队和权力对话,天生是两套语言体系, 你...
Claude Code之父分享团队核心理念:CLAUDE.md越短越好,他自己的仅两行(提PR自动合并、发审批频道),并建议定期清空重写。模型能力每代都在飞涨,人为堆配置、做UI很快会过时,因此坚持CLI而非GUI。终端输出在详细与简洁间通过用户反馈迭代(支持verbose模式)。用AI修bug已很高效,能自行分析heap dump。核心观点是做减法、保持轻,并不断推翻过时使用习惯。
Cursor AI CEO Michael Truell在X上宣布与SpaceX联手,共同构建有用AI。据推文称,双方合作规模接近600亿美元。年仅二十多岁的Truell被评价拥有多项稀缺品质,主推文认为其未来成就可能并肩甚至超越OpenAI CEO Sam Altman和Anthropic CEO Dario Amodei。目前具体合作细节尚未披露。
Lots to do together. Excited to be joining forces with @SpaceX to build useful AI.
Cursor CEO Michael Truell提出目标:发明一种新型编程,让人用最简洁的方式描述意图,其余交给模型。他反对两种主流设想——“一切照旧”派(继续用TypeScript/Go等正式语言)和“纯聊天机器人”派(对bot说句话就改代码),认为前者低估模型进步,后者缺乏精确控制。他的设想是“代码之后”的世界:用类似英文伪代码表达软件逻辑,能在高层级编辑、精准指向修改,让难懂的符号变成可读可改的形式。
GDPval-AA v2 is the highest weighted evaluation in the Intelligence Index v4.1. The upgrade re-baselines ELO to human pe...
BREAKING: GLM-5.2 is now 1st on Design Arena. With an Elo of 1360, GLM-5.2 has jumped ahead of the now unavailable Claud...
Factory AI CEO 在播客中分享观点:约80%-90%的任务可用开源模型完成,顶级模型更适合规划与决策;AI工具对高杠杆人群提升更大,低杠杆者受益有限;未来最值钱的工程师是能端到端拥有业务结果的人,而非仅写代码者;预计三年内Token支出中位数将与薪资处于同一数量级。
SpaceX has exercised the option to acquire @cursor_ai in an all-stock transaction with the goal of building the world's ...
Nathan Lambert与Finbarr Timbers合作推出新播客,系统调研GLM 5.1、Kimi K2.6、DeepSeek V4、Xiaomi MiMo V2.5、Nemotron Ultra等模型的最新后训练方法。核心讨论包括:行业转向多教师在线策略蒸馏(MOPD)的原因;Olmo风格配方需改进的方向;后训练如何适配大型组织;以及在AGI早期阶段的职业建议。播客章节涵盖历史回顾、2026年模型配方(MiMo Flash、DeepSeek V4、GLM 5、Kimi K2.6等)及开放式后训练讨论。
微软CEO萨提亚·纳德拉在达沃斯世界经济论坛与贝莱德董事长拉里·芬克对话时表示,AI的真正力量在于转换:文档可通过AI生成代码变成网站,网站可进一步转为应用;企业将原本耗时数小时的决策规模化为几分钟。纳德拉强调,AI首次赋予了软件自我转换的能力。
用户指责某人使用Llama 3.3 70B扫描代码库,生成的错误报告全是错误的,认为这种行为纯粹是在制造互联网垃圾,并决定将其拉黑。该推文附带了相关GitHub issues链接。
亚马逊举报Anthropic模型可被越狱后,特朗普政府要求主动下架,CEO硬刚拒绝。政府祭出出口管制,90分钟限时卡死境外访问。Anthropic找被政府标记为“激进民主党”的安全专家反驳,导致矛盾激化。政府内部评价双方语言体系根本不同。Anthropic连夜飞华盛顿救火,但信任难修复。此前与国防部谈武器权限合作同样谈崩。事件凸显AI公司与政府缺乏共同对话语言,技术顶尖无法替代沟通能力。
怀念Fable 5的第二天😭 最新消息看下来,Fable 5下架这事,好像也不是什么技术安全事件。 更像是Anthropic一顿操作把政府彻底得罪,活生生演成了政治闹剧。 导火索本来只是亚马逊举报模型可被越狱, 特朗普政府三通电话打过去,...
数据指出,AI辅助下代码产出约4倍,但交付价值仅+10%,90%为待验证代码;代码churn+861%,缺陷率从9%升至54%;零审查合并PR增加31%,审查时长+441%。实测146个PR发现,93.4%被标记位置仅一个工具发现,四工具从未同时标记同一行。策略建议:按风险分层(配置改→linter,核心路径→双AI+人)、前置triage、提高PR门槛(要求意图说明+测试输出)、刻意小PR、先读测试再读实现、CI不可妥协、人类负责merge决策。
http://x.com/i/article/2066435928739217408
Lovable 团队@felixhhaas 认为,AI 拉平执行门槛后,绩效公式从“资深专家+流程管控”转向“心智模式+行为方式”。七条原则涵盖选人(按态度而非技能、保持好奇)、协作(像创始人、杀 ego、更在意)、产出(资深者深入一线、先发布再改进)。核心观点:当技能半衰期缩短、个体杠杆被放大时,“谁来做、以什么心态做”成为决定性因素。
High-Performance Teams in the Age of AI 🔥 I've spent a lot of time thinking about what makes teams move incredibly fast...
The AI community seems to increasingly be heading towards a polarized world when discussing safety and consolidated powe...