Nathan Lambert 在 Interconnects 博客创办约三年后更新规划。他当前三大目标:为前沿模型演进提供清晰度、创建开放模型生态、建立支撑机构。博客定位为原始、高辨识度的独立声音,避免成为全职分析平台。已披露与 Arcee AI 和 Mercor 签署咨询协议,以深入后训练领域并推动透明评测与开放生态。订阅者突破 7 万,付费约 900 人;运营实体 Interconnects AI, LLC 已成立,但银行账户数月余额接近零,收入再投入业务,近期不打算全职运营。
Nathan Lambert 在 Interconnects 博客创办约三年后更新规划。他当前三大目标:为前沿模型演进提供清晰度、创建开放模型生态、建立支撑机构。博客定位为原始、高辨识度的独立声音,避免成为全职分析平台。已披露与 Arcee AI 和 Mercor 签署咨询协议,以深入后训练领域并推动透明评测与开放生态。订阅者突破 7 万,付费约 900 人;运营实体 Interconnects AI, LLC 已成立,但银行账户数月余额接近零,收入再投入业务,近期不打算全职运营。
Richard Sutton的“苦涩教训”通常被解读为警告不要在AI系统中编码过多人类知识,最终胜出的方法是能吸收更多算力和数据的一般性方法。现代基础模型预训练表面上是这一教训的胜利:采用通用架构、海量数据、简单的自监督目标(语言模型预测下一个token,视觉模型重建掩码块等)。但问题在于,训练目标仍由人类在训练循环外选定——完成一次大规模预训练后评估下游表现,再调整方案重新运行。这个控制环路非常粗糙。该论文探讨能否让这一环路变得更高效。
State of the blog, mid-2026 About 3 years since I started writing weekly. https://www.interconnects.ai/p/state-of-the-bl...
Grok Imagine Video 1.5 能一键生成电影级视频,完美复刻《黑客帝国》Neo躲子弹的 Bullet Time 场景(雨中后仰、绿色调、皮风衣墨镜),以及《权力的游戏》龙妈骑龙低空飞越君临的史诗镜头。用户感叹该模型“这么便宜还这么好用”,对比之下自己刚充的 6000 多元 seedance 会员显得不值。两个示例均附有详细 Prompt,涵盖镜头运动、物理模拟、光照与音频要求,展现出强大的文生视频能力。
Grok Imagine Video 1.5真的要吹爆,这么便宜还这么好用,一键复刻权力的游戏! 我刚充的6000多块的seedance会员算什么🥹 Prompt: Faithfully animate this reference im...
三位软件工程师来信询问AI是否会全面接管编程。作者回答最早今年底、最迟后年。以珍妮纺织机为喻,学会用新工具只是缓刑;美团宣布30%–50%裁员印证趋势。作者提出“终端思维”:意图即实现(PRD is Code),中间步骤注定消失。最终问题:当执行被机器接管,人类站在哪里?
Meta在Facebook应用中推出AI Mode搜索,利用公开帖子回答复杂查询。实测显示基础推荐尚可,但存在严重幻觉:推荐奥斯汀的咖啡店给明尼阿波利斯行程,并错误引用社区泳池周末闭馆(实际周末开放)。AI曾就“1月6日国会骚乱者是否为爱国者”给出可疑答复。作为规划工具,AI Mode能发现用户未注意的活动,但地理错误和引用不实让结果大打折扣。
一项调查显示,74%消费者认为互联网比10年前更不人性化,平均40分钟出现“bot fatigue”。61%的消费者说不出一个在品牌宣传中善用AI的公司,60%表示看到“AI”一词会反感,16%认为没有品牌用好AI。企业团队每周平均花16.6小时改善AI可见性,但该领域尚无公认领导者。报告建议品牌在AI时代注重“人性化”体验,并为AI引擎提供结构化内容。目前AI引用监测工具仍处早期,定价从免费到六位数不等,且无统一仪表盘。
Reminder that you can use the Codex App, CLI and SDK with any open source model, not just with OpenAI models. https://de...
用户实测 xAI 的 Grok Imagine Video 1.5 视频生成模型,用详细 prompt 生成《权力的游戏》龙妈骑龙飞越君临城场景,火焰特效、物理模拟、原生音频和光影均达电影级水准。另一测试复刻 Tyrion 法庭演讲,面部微表情、布料动态、火把光影互动自然,效果不输 seedance 2。用户感叹仅需低廉价格(对比刚充的 6000 多元 seedance 会员)即可生成如此高质量视频。
Grok Imagine Video 1.5 实测: 复刻《权力的游戏》Tyrion 经典法庭演讲,效果真的有点吊炸,完全不输seedance 2, 整个场景真实感、物理表现和原生音频都拉满了......面部微表情、布料动态、火把光影互动都...
关联讨论 3 条xAI:News(网页)X:Elon Musk (@elonmusk, xAI)X:cb_doge (@cb_doge)百度伐谋自我演化决策智能体在三个科研场景取得突破:清华大学电机系用其将磁芯材料暂态预测MSE Loss从40+提升至96+,全球第五,论文被ECCE收录;中科院学生以200行种子策略经400轮LLM语义级变异,自主发明H-DWA、K-Filter、A-Lock战术,获硬件实战赛全球第一、仿真赛第三;清华大学管理科学与工程学院团队针对A股日内价格预测,720轮自动演化后R²从0.010升至0.032,4周达到传统方法2-3个月水平。三团队均证实自动演化结构优于或持平人工设计。
詹锟在理想汽车Livis Day上表示,国内除特斯拉FSD外暂无智驾系统能入第一梯队。他于2026年5月赴美体验FSD V14.3后坦言差距真实。理想公布下半年路线:第三季度向AD Max车型推送马赫VLA新版本,第四季度全场景智驾对齐FSD V14。目前L9 Livis搭载马赫VLA 2.1,基于自研5nm马赫M100芯片(单芯1280 TOPS,双芯2560 TOPS)。小鹏何小鹏此前称其VLA将于2026年8月达FSD V14.2的硅谷效果。
Finally, Artificial Analysis Intelligence Index concludes the GLM-5.2 release.
Anthropic 近日发布创业行动指南,将生命周期分为 Idea、MVP、Launch、Scale 四阶段,每阶段附目标、退出标准、常见失败模式及基于 Claude 的 AI 实践。指南覆盖:用 Claude 验证问题假设、绘制竞争图谱、开展客户发现;通过架构设计避免 AI 生成 MVP 代码的技术债务;区分真正产品市场契合与早期热度的衡量框架;用智能体工作流替代创始人注意力的 Launch 阶段操作系统;以及 Chat、Claude Cowork、Claude Code 各阶段使用矩阵。还收录了 Ambral、Anything、Carta Healthcare 等创始人的实际案例。
GLM-5.2 在 Artificial Analysis Intelligence Index v4.1 上得分 51,领先 MiniMax-M3(44)、DeepSeek V4 Pro(max,44)和 Kimi K2.6(43)。模型总参数 744B,活跃参数 40B,上下文窗口 1M tokens,API 定价每百万输入/输出/缓存命中 token 分别为 $1.4/$4.4/$0.26。科学推理显著提升:HLE 得分 40%(+12)、CritPt 21%(+16)。GDPval-AA v2 得分 1524,与 GPT-5.5(xhigh)持平。每任务输出 43k tokens(其中 37k 推理),每任务成本约 $0.46,位于智能 vs 成本帕累托前沿。采用 MIT 许可证,可通过 DeepInfra、Novita 等第三方平台使用。
Epoch AI基于SEC文件分析显示,微软、亚马逊、Alphabet、Meta、Oracle五大超大规模云服务商的AI基础设施支出年增长约70%,经营现金流仅增长约23%。若趋势持续,支出将在2026年第三季度超过现金流。目前Alphabet已通过股权融资850亿美元,亚马逊和英伟达发行债券补充资金。除Oracle外其余公司仍盈利且持有大量现金,但自由现金流可能归零或转负。Epoch AI指出这仅为简单外推,未计入AI投资能否产生足够收入来弥补缺口这一关键因素。
六月的一周里,美国商务部迫使Anthropic对全体外国公民禁用Fable 5和Mythos 5,同时司法部在密西西比法院为xAI未获许可的燃气轮机辩护,称其因国家安全过于重要不能关停。两件事方向相反——一边是束缚,一边是盾牌——但共同证明:AI及其伴随的数据中心扩张、前沿模型访问等,正越来越多地被置于国家管控之下。作者中立指出,AI作为国家战略要务,无法任其自然发展;对xAI有利,对Anthropic不利。
🥇MaineCoon: From Passive Video to Real-Time AI Presence The first unlimited-duration interactive audio-visual model. Mo...
视频Agent Seko在最新更新中推出无限画布,并能自动将创意、剧本、角色、场景和分镜等素材节点连接成完整工作流。用户可通过Seedance 2.0全能模式输入一句话或完整剧本,Seko自动生成多集短剧大纲、人物、场景、美术风格及分镜描述,并支持逐段修改提示词和生成视频。画布提供全自动与精细手动编辑的双重控制,解决了AI视频从70分改到85分时反复重做的痛点。实测用该流程三小时完成两集悬疑短剧,角色一致性、故事节奏和画面氛围表现力均超出预期。
Pixverse(@PixVerse_)のCanvasで作成しました。 #pixversecpp #zargates #pvpvibe @Nika_Ruis Rosmira Thornvale is a young cat knight w...
Anthropic发布了Swift包,使Claude模型适配苹果定义的LanguageModel协议,从而能在iPhone和Mac本地运行。这一转变打破了Anthropic一向要求别人适配其API的惯例。背后是苹果通过统一接口把自己变成AI模型分发平台,开发者用同一套代码可在本地模型和Gemini等之间切换。推文认为行业竞争已从模型能力转向规则标准,在苹果生态内顺应其规矩比硬扛更明智。
Anthropic 6月16日发布博文,分析2025年10月至2026年4月约23.5万用户的40万次Claude Code会话。用户平均每周使用20小时,其中代码修改占26%,代码编写占25%,合计超半数。典型会话中人类负责约70%规划决策,Claude完成约80%执行决策。新手(1级)每次提示产生约5个操作和600个单词输出,专家(5级)产生2倍操作和5倍输出(约3200个单词)。
I'm an AI researcher turned brain tumor patient, and recently I used the models to crack my mystery fatigue faster than ...
Z ai 发布 GLM-5.2(744B 总参数/40B 活跃参数),在 Artificial Analysis Intelligence Index v4.1 上得分 51,超越 MiniMax-M3、DeepSeek V4 Pro 和 Kimi K2.6。科学推理大幅提升:CritPt +16、HLE +12、GPQA Diamond 达 89%。GDPval-AA v2 得分 1524,与 GPT-5.5 (xhigh reasoning) 相当。上下文窗口扩展至 1M tokens,MIT 许可证。第一方 API 定价 $1.4/$4.4/$0.26 每百万输入/输出/缓存命中 token,每任务成本约 $0.46,处于智能 vs 成本帕累托前沿。
近日,Anthropic CEO Dario Amodei与白宫沟通失败,引发业内反思。技术团队与权力对话存在两套语言体系:技术方讲逻辑、安全、长期价值,对方讲立场、交易、国家安全优先级。业内建议关键谈判应派懂人情、能读空气、擅长建立信任的人出席,而非纯技术团队。AI时代技术门槛将拉平,真正的竞争力在于搞定人和建立信任——技术决定产品上限,沟通决定产品生死。
这次达里奥跟白宫沟通失败,Anthropic踩的坑, 给所有技术团队敲了警钟, 建议技术出身的创始人都看一遍经典美剧《广告狂人》, 因为你光把模型做到行业顶尖没用,沟通对不上频道,说下架就下架。 技术团队和权力对话,天生是两套语言体系, 你...
Grok Imagine Video 1.5 实测: 复刻《权力的游戏》Tyrion 经典法庭演讲,效果真的有点吊炸,完全不输seedance 2, 整个场景真实感、物理表现和原生音频都拉满了……面部微表情、布料动态、火把光影互动都很自然
Grok Imagine Video 1.5 is here Our new image-to-video model with sharper realism, better physics and faster generations ...
Claude Code之父分享团队核心理念:CLAUDE.md越短越好,他自己的仅两行(提PR自动合并、发审批频道),并建议定期清空重写。模型能力每代都在飞涨,人为堆配置、做UI很快会过时,因此坚持CLI而非GUI。终端输出在详细与简洁间通过用户反馈迭代(支持verbose模式)。用AI修bug已很高效,能自行分析heap dump。核心观点是做减法、保持轻,并不断推翻过时使用习惯。
Hacker News 讨论揭示:Qwen 3.6 35B-A3B 模型提及率 33% 领先,27B 变体以 20% 紧随其后,DeepSeek Pro 与 Gemma4 31B 位列前四。Agent 工具中 Pi (49%) 与 OpenCode (45%) 占主导。用户对比称,Claude Opus 可带来 15 倍加速,而本地离线 Qwen 提供 5 倍加速,且完全免费、保护隐私。SWE-bench Verified 基准测试显示,Qwen 3.6 27B 得分 77.2%,35B-A3B 得分 73.4%,接近 Claude Sonnet 4.6 的 79.6%。MoE 架构使大模型在消费级硬件上高效运行。
智谱 GLM-5.2 正式发布和开源了,基准测试成绩相当吓人 核心定位是处理长周期任务,并且有稳定的 100 万上下文,模型还引入了思考力度控制。 架构层面,GLM-5.2 提出了 IndexShare 机制,每四层稀疏注意力共享同一个 i...
作者为优化 AI 生成 Python 代码的 lint 效率,发现 ast.walk 遍历 AST 是性能瓶颈。通过逐步去除生成器 yield、内联 iter_child_nodes 和 iter_fields、用 getattr(node, field, None) 替代异常处理,实现了约 2 倍提速。随后用 Rust 通过 PyO3 重写遍历逻辑,并直接读取 __dict__ 及预缓存 AST 子类类型信息,最终将 ast.walk 速度提升约 220 倍。