OpenAI CEO Sam Altman 继续押注大语言模型的规模扩展,批评一代研究者过于自信地认为 scaling 行不通。在斯坦福回应 Yann LeCun 等批评者时,Altman 表示有些人将身份与立场绑定,即便数据证明他们错了也不愿放手。他指出 LLMs 已在某些领域超越人类智能,如 OpenAI 模型推翻了一个长期困扰数学家的猜想。但对于需要高判断力的长期复杂任务,LLMs 仍远不如人类。Anthropic CEO Dario Amodei 近期也表达了类似看法。
邵猛发推讨论一项LLM对比投票,对比双方为GLM-5.2(智谱)与Gemini 3.5 Flash(Google DeepMind)。他认为结果毫无悬念,Gemini 3.5 Flash表现不佳,并感叹自Gemini 3.0多模态惊艳发布后,Google便一路沉寂。最后提问:目前几款国产LLM中,谁更强?
BestBlogs 第100期特刊《百篇回顾》发布,精选两年间AI领域100篇文章,梳理六条发展主线:一、模型从会回答到能干活;二、AI Coding实现变便宜、验证变贵;三、工程范式把隐性判断写成文字;四、Agent一套冷静的工程常识;五、产品商业从卖工具到卖结果;六、领袖思想答案变廉价、提问变值钱。提供阅读清单、24分钟播客和图文三种形式可选。
http://x.com/i/article/2068589784554250240
BestBlogs精选周刊发布第100期,回顾两年AI发展。作者认为每周信息虽碎,但整体脉络清晰:AI答案越来越便宜,提对问题、做对判断反而更值钱。从数百万篇内容中精选6000多篇,再从中挑出100篇,配上AI播客和图文,做成两年回顾导航图。
http://x.com/i/article/2068589784554250240
Levie now uses Salesforce 5x more than at any point before. The Box CEO @levie connected Salesforce's MCP server to Clau...
NYU Stern商学院估值教授Aswath Damodaran指出,AI的10-15万亿美元可寻址市场如果成功实则“可怕”。原因在于:AI作为工具的市场远小于替代人类的市场;只有AI取代人类,才能实现这一规模。若成真,半数白领将失业,社会面临收入丧失和人生意义缺失。他在播客中还讨论了TAM陷阱、AI单位经济学、增长伴随再投资可能破坏价值,以及AI正将部分科技巨头从轻资产公司转变为基础设施公司等观点。
"Growth, when it's accompanied by huge amounts of reinvestment and substandard gross margins, might not just be neutral ...
Signal总裁Meredith Whittaker在接受Bloomberg采访时警告,ChatGPT、Claude等AI聊天机器人“不是你的朋友、有意识的生物或有感知的对话者”。她坦言自己会用AI工具“格式化文档”,但不会向它们提问,因为不想让思考过程被“平均已有内容”的系统答案取代。针对微软AI CEO Mustafa Suleyman预测用户可让Copilot处理全部圣诞购物,Whittaker指出,这需要Copilot监听家庭群聊、获取信用卡、浏览器、Signal、代发消息、家庭地址和日历等权限,相当于在Signal中“开了一个后门”。
dot-com bubble vs. a possible AI bubble. From the famous "Dean of Valuation", Professor Aswath Damodaran, of NYU Stern S...
Greg 列出当下最有价值的六项技能:搭建管理 agent 并运行本地 AI 模型、懂渠道的营销、全能机器人、短内容策展、能出产品又能分发的 builder-distributor、线下社区建设。主推文指出 AI 抹平单一工具门槛,纯写提示词或代码贬值,真正拉开差距的是打通 builder 与 distributor 全链路。具体解读:本地部署保留应急控制权;内容策展是稀缺筛选力;管理 agent 需监控重试。建议三件事:迁核心工作流到本地并搭观测面板;精准分发产品给 20 个潜在用户;线下聊天获真实反馈。
The most valuable skill sets on the planet right now: 1. people who can set up agents properly, manage them, and run loc...
特斯拉AI高级工程师(从事自动驾驶与机器人ML)揭露ML项目真实时间分配:50%评估、40%数据清洗、8%集成、2%训练。前两项共同设定学习的噪声底限,模型无法降低——这是数据的香农最优界。他每天思考本体论(ontology),旧标签必须持续审查,因为生产系统中分布漂移与边缘用例不断暴露标签缺陷。核心结论:训练不是瓶颈,清理现实数据的能力才是关键。
Many people think any given ML project is 99% training. In reality, it's 50% evaluation, 40% data cleaning, 8% integrati...
New research: Is AI making employers view labor as more of a commodity? In a large online labor market, we find that pos...
*Another* apparently AI-generated story wins a literary prize, this time judged by a panel including the novelist Ruth O...
《幻兽帕鲁》开发商 Pocketpair 发行与传播负责人约翰·伯克利表示,玩家对生成式 AI 的反感是游戏公司不使用它的充分理由。伯克利确认 Pocketpair 完全没有使用生成式 AI,并称内部有足够多的美术人员愿意亲自完成工作,让 AI 接手而裁掉他们没有意义。他还指出,Steam 已开始在一定程度上限制生成式 AI,未来开发者可能需主动声明游戏“100% 由人类制作”。
there is no question, none at all, that china has full access to all of openai & anthropic's github/slack/docs today no ...
Take-Two 在 2025 年 4 月裁撤了整个 AI 研究团队,该团队长期从事传统 AI 研究而非生成式 AI。前负责人卢克·迪肯博士接受采访时表示,生成式 AI 当前热度被严重夸大,泡沫一旦破裂,外界可能连同传统 AI 研究一并抛弃。他认为业界有道德责任妥善管理生成式 AI,但完全拒绝也不是正确答案。迪肯警告,公众缺乏细致判断来区分传统 AI 与生成式 AI,大语言模型已进入幻灭低谷期。
高通 CEO 安蒙认为,AI 智能体将改变应用和设备使用方式。他设想的入口之一是内置摄像头和显示屏的智能眼镜,用户告诉数字助理需求,AI 智能体即可协调多个应用完成流程。安蒙指出应用不会消失但会变化,智能体将成为新应用。苹果 Siri、三星 Bixby 等数字助理能力持续提升。未来手机和新设备将围绕 AI 智能体重新设计。高通正参与 40 多种 AI 设备设计,包括智能首饰、带摄像头的耳机、智能胸针和手表。安蒙最看好智能眼镜,预计其规模最终可与智能手机相当——去年全球智能手机出货超 12 亿部。
纽约大学金融学教授达摩达兰6月20日警告,AI行业泡沫破裂冲击可能比2000年互联网泡沫更严重。AI需巨额资金建设数据中心等实体基础设施,且大量投资靠举债,市场调整时损失将向社会扩散。他怀疑AI商业模式能否实现规模效应,因每次使用均消耗更多算力,成本类似Spotify按次付费而非Netflix分摊模式。DeepSeek等中国竞争对手可能继续压低价格,当前利润率已不高。即便最乐观情景成真,若AI直接取代完整岗位,一半白领可能失业,社会代价极其惊人。
2024年诺贝尔化学奖得主、AlphaFold团队核心领导者John Jumper在Google DeepMind工作近9年后宣布离职,将加入Anthropic,先休整一段时间。Jumper博士毕业仅6个月便被Demis Hassabis委以AlphaFold团队领导重任,最终做出诺奖级成果。其告别中写道“GDM taught me how to do great science”。社区调侃Anthropic在组建“AI Avengers”,并期待下个月Jeff Dean是否也会加入。主推文暗示Google可能已启动留人计划。
John Jumper (Google AlphaFold 团队核心领导者、2024 年诺贝尔化学奖得主)宣布,在 Google DeepMind 工作近 9 年后决定离开,加入 Anthropic(先休整一段时间) 我看到这条离职帖下面好...
Deedy Das观察到,随着CTO们极力推崇tokenmaxxing,软件工程师分裂为“懒惰者”与“工匠者”。懒惰者依赖AI代写代码、测试、回复消息,甚至同时胜任多份工作;工匠者则疲于审查堆积如山的PR和Slack消息,同事的AI代码敷衍了事,最终工匠者也放弃沦为懒惰者。这种现象常见于成立超10年的大公司,但并非所有公司如此——部分团队凭借合理的AI开发原则和互信机制仍保持高效。
宝玉认为处理错误应先恢复生产(回滚或打补丁,保留日志),再找根因(逻辑错误、边界条件、需求理解偏差),最后根据根因决定如何避免。仅当根因是AI对项目特有约定缺乏了解时(如命名规范、API隐含限制、团队测试规范),才应更新AGENTS.md。其他情况应分别用新增测试用例、重构架构、改进Code Review等方式解决。将一切塞入AGENTS.md会导致文件臃肿、规则繁多,AI反而忽略关键规则。
错误发生 → 修复问题 → 追问原因 → 写入 AGENTS.md → 以后 AI 记住规则。
did you make it into the superintelligences? are you in the weights? http://intheweights.com
高盛指出,AI竞赛已形成5.3万亿美元资本支出周期(覆盖2025–2030年超大规模云商AI及数据中心投入)。基础设施融资正面临困境:少数巨头无法无限发债,数据中心组合复杂(土地、电力、网络、冷却、服务器),融资分散于多种渠道。AI资本支出估算增速已快于实际建设,瓶颈或从模型需求转向融资能力、电力与项目执行。NYU教授Damodaran对比互联网泡沫:前者几乎无资本支出、靠股权融资,损失限于股东;AI泡沫资本支出巨大且大量依赖债务(私人资本而非银行),一旦调整,违约将外溢至全社会,痛苦程度远超股价暴跌。
dot-com bubble vs. a possible AI bubble. From the famous "Dean of Valuation", Professor Aswath Damodaran, of NYU Stern S...
Show Codex a workflow once. Reuse it as a skill. Record & Replay lets you show Codex a recurring task, like filing an ex...
GLM 5.2 开源发布后,国外 AI 博主纷纷称赞。作者认为模型够强是关键,用户会主动付费。同时智谱港股股价飙升,已甩开 MiniMax、追上小米。在作者看来,现阶段模型团队远未到精细化运营阶段,更重要的是资方和股民。
智谱 AI 开源新一代大模型 GLM-5.2,在编程基准测试中表现亮眼,仅落后顶级闭源模型 Claude Opus 约 1 个百分点。马斯克预测中国大模型需到 2027 年 Q1 才能追上 Anthropic Fable,智谱创始人唐杰回应“用不了那么久”。
用户发现其使用的AI助手Cola在口头对话时“很有人味儿”,但一旦要求将刚刚说的话“写成推文”,输出立刻变得充满AI腔调,多次修改也难以恢复最初口语的自然感。用户推测,“写”这个提示词本身可能激活了模型偏向套话八股的神经网络。该现象反映了AI在口语自由对话与书面格式化输出之间的风格差异。
特朗普对Anthropic的态度在一天内反转:此前将其视为国家安全威胁,但会见CEO Dario Amodei后改口称其“聪明、好人、反应很负责任”。被问是否用国防生产法管制AI时,他表示“可能但似乎大家都很负责任”。特朗普还透露,举报Anthropic的是其竞争对手兼部分股东——Amazon。这一事件暴露了AI监管的真实逻辑:出口管制等重大决策可能取决于与总统的面谈效果。
🚨BREAKING: TRUMP ON ANTHROPIC REPORTER: Do you view Anthropic and to a degree its CEO, Dario Amodei, as a threat to nat...
dot-com bubble vs. a possible AI bubble. From the famous "Dean of Valuation", Professor Aswath Damodaran, of NYU Stern S...
A bit of news: After nearly 9 years, I have decided to leave Google DeepMind and join Anthropic (after taking some time ...