MWC26上海期间,智元联合创始人彭志辉指出,AI从数字世界走进物理世界是下一阶段核心命题,具身智能体将在物理世界长期在线完成感知、决策、执行闭环。他强调未来Token最大消耗群体将是物理世界的具身机器人,资本不再只为Demo买单,行业必须在真实场景落地商业价值。他用XYZ曲线划分产业周期:X曲线为开发尝鲜期(以表演为主),Y曲线为部署成长期(大规模落地真实场景),Z曲线为部署普及期(预计5年左右迎来GPT时刻)。
MWC26上海期间,智元联合创始人彭志辉指出,AI从数字世界走进物理世界是下一阶段核心命题,具身智能体将在物理世界长期在线完成感知、决策、执行闭环。他强调未来Token最大消耗群体将是物理世界的具身机器人,资本不再只为Demo买单,行业必须在真实场景落地商业价值。他用XYZ曲线划分产业周期:X曲线为开发尝鲜期(以表演为主),Y曲线为部署成长期(大规模落地真实场景),Z曲线为部署普及期(预计5年左右迎来GPT时刻)。
推文提出,Agent 是一种数字化、随时调用、最终趋近免费的劳动力,但不应把人与 Agent 的价差当作商业模式本身。上下文、注意力、信任和品牌的价值不会因模型变便宜而贬值。AI 时代,人的具体技能不再重要,积极好奇、灵活性和自驱力才是核心素质。
昨日(6月24日)股东大会上,英伟达CEO黄仁勋称AI产业进入新阶段,智能体AI已到来,物理AI将驱动下轮增长。他将数据中心比作“AI工厂”,强调AI基础设施成企业计算核心。财务方面,过去1年营收增长65%,利润增长60%,2026财年自由现金流超960亿美元,计划将50%通过回购和分红返还投资者。黄仁勋举例称,运行英伟达系统生成token具盈利性,GitHub今年pull request数量增长近3倍。
文章将AI循环分为内层agent loop(模型说“完成”即止)和外层harness loop(外部判定是否真完成,可续接session)。循环放大LLM代码的过度防御、回避不变量等缺陷,每轮叠加局部防御使系统更难理解。有效领域(移植、性能探索)共性是不产生新代码或产出无需长寿。核心隐喻从“机器”转向“有机体”,人不再完全理解代码。深层隐忧是认知依赖:代码由循环产出、review,一旦失去同类系统访问权将无法维持。问题不再是“是否会loop”,而是如何在循环未来中保留判断力与工程规则。
This is correct, I think a number of people on the tl didn't read past the title and made inferences and comparisons tha...
作者在自研的硅基骑手参考评测(silicon-rider-bench)中累计测试30个模型,发现智谱GLM系列Agent能力持续进化:GLM-5首次实现反思自身行为并主动少接单提准时率;GLM-5.1首创送顺路单,路径效率低于单次配送理论值;GLM-5.2只需看一次地图便记住全部地点与换电站位置,无需调用search_nearby_battery_stations(),大部分tool_call用于推进任务,分数断崖式领先。直至kimi-k2.7-code出现前,无模型超越GLM-5(2月发布),智谱Agent训练领先其他国产模型2-4个月、最大2个代差。故市值破万亿从技术层面并非高估。
前高盛高管Raoul Pal在访谈中指出,若产品仅是软件,智能体AI可随时复刻、优化并重新部署。他将智能体AI比作专家网站Fiverr,能自动完成建站、编码、域名注册、品牌策划、营销及邮件列表等全流程。他设想用户只需对AI说“把Steven的网站做得更好”,AI便能在3分钟内完成。这引发了关于AI将吞噬软件、软件创业者未来出路的讨论。
AI 行业商业化的核心是“2boss”——付费方不是使用者(程序员、抽卡员),而是他们的老板。以 Claude/Codex 和 Seedance 为例,老板愿为提升效率的工具付费。中国 2B 市场进入“2boss”时刻,老板买单意愿强烈;独立开发者等自费者也扮演自己的老板。
swyx 在 Data+AI Summit 上采访了 Databricks 联合创始人 Matei Zaharia 和 Reynold Xin。访谈亮点包括:Databricks 为何击败 Snowflake;行业正纷纷构建“元 harness”(共享智能体框架);LTAP 与 Lakebase 重新思考操作型与分析型数据库划分,解决 HTAP 愿景;Omnigent 为编码智能体和自定义智能体提供统一框架;智能体安全需要上下文策略与支出控制;MosaicML 与 DBRX 的后续;在 1750 亿美元大公司中维持研究/创业文化;以及在智能体云竞赛中数据库、操作系统与网络的重要性。核心观点:未来软件只需让数据就绪,智能体置于其上。
Why the Frontier Ecosystem must be Open - Matei Zaharia and Reynold Xin, Databricks https://www.latent.space/p/databrick...
该论文认为当前AI主要建立在网络数学而非知识理论上。人脑以极低功耗做出快速自适应决策,而前沿AI依赖巨大算力。生物智能高效是因为围绕目标、上下文和决策组织意义。论文将心智活动分为物理认知、情绪认知、心智认知和智能,其中智能指在情境仍有效时做出有用决策。提出的“合成智能”将使用结构化语义知识(信息与目的绑定),而非仅依赖语法、统计或神经网络权重。通过不对称信息解析模型展示如何将知识组织成决策图,以捕食者-猎物为例,每个状态仅包含少数可能动作。
GLM-5.2 from @Zai_org on ARC-AGI (Verified) - ARC-AGI-2: 22.8%, $0.25 - ARC-AGI-1: 77.0%, $0.19 Performance is comparabl...
Yann LeCun 在联合国开源周演讲中主张,开源 AI 是全球数字主权和文化多样性的唯一可行路径。他指出专有 AI 系统被美中少数大公司控制,对民主和人权构成威胁。LeCun 推出 Project Tapestry,一个基于 GitHub 的开源联邦协作项目,各参与方保留数据主权,仅交换参数向量来训练全球模型。已有欧洲、印度、日本、韩国及 IBM、NVIDIA、AMD、Intel 等参与,目标 2027 年初投入生产。
推文认为Prompt Engineering终结,Loop Engineering取而代之。典型场景:@karpathy晚上设好研究循环,自动改脚本、跑测试、保留正确结果、丢弃错误,人睡觉机器跑。四大支柱均来自生产环境:1)硬性退出条件与独立验证,防止模型“自认为完成”;2)上下文当有限预算管理,定期压缩、用子Agent隔离子任务;3)工具少而精、可安全重试、错误信息可读;4)Maker-Checker模式(如Claude Code已用),干活与检查分离。@bcherny总结:不再prompt Claude,而是写loops让它们跑。模型正成为标准件,工程价值转向长期自治系统设计。
http://x.com/i/article/2069072431252434944
Emil Kowalski 的 /emil-design-eng 技能安装量突破 10 万次,近期陆续开发更多细分设计工程 skills,目标是让 agent 输出更精准可控。他重点投入测试环节,反复验证答案的正确性与一致性,这是打造高质量 agent skills 最难也最关键的一环。
作者从打字提示转向完全用语音与AI智能体交互,发现通过音频能提供更丰富的细节,语音越长越详细,结果越好。这种交互方式还能并行化更多工作,让智能体执行更长时间任务。作者开发了新功能:录制屏幕、截图、追踪鼠标动作、用语音标注解释智能体难以处理的设计和精确功能开发。结论是提示模态越丰富,智能体结果越可靠,虽然消耗更多token成本更高,但可靠性值得。这些模式可存储为可重用技能,效果天差地别。
OpenAI发布首款自研AI芯片Jalapeño,专为ChatGPT、Codex、API及未来Agent产品的LLM推理设计,由Broadcom生产。从设计到流片仅用9个月,借助AI模型辅助设计。首批样片实测性能功耗比显著优于当前顶级加速器,Broadcom CEO称性能媲美NVIDIA Blackwell与Google TPU,成本减半。若2026年底实现吉瓦级部署,推理成本有望降低约50%。Jalapeño仅针对推理,训练仍依赖NVIDIA。此举标志OpenAI从模型公司向全栈AI基础设施公司转型。
We've designed and built our first AI chip: Jalapeño. Designed from the ground up by OpenAI and brought to production wi...
字节火山引擎大会上,洪定坤分享了AI开发的三个核心方法论:1. 原型驱动开发——用AI生成可交互原型替代PRD,提前暴露分歧。2. AI Development系统化——AI写Spec→功能实现→Browser Use验证→自动提交上线。3. Harness基建——上下文工程、架构约束、团队知识Memory、技术债梳理,能将可交付性从40~60分提升至80分。
Inspired by @karpathy's words on why you - yes YOU - should work on AI Agents
The new Claude Tag feature seems extremely useful, but at the same time, a dangerous bargain for enterprises because of ...
在火山引擎Force大会,字节跳动技术副总裁洪定坤分享AI Coding实践。过去一年,字节AI代码贡献率增长6倍,tokens消耗增长5倍,但过度关注单一指标可能失真——TRAE团队代码超90%由AI生成,人均需求吞吐率仅提升60%。900次实验显示,主流Coding模型组合代码正确率超80%,但可交付性仅40-60分;结合Harness基建后提升至80分。AI降低编程门槛但需优化指标、治理、协作。字节探索原型驱动开发,能力沉淀至TRAE(日均Token消耗5.6万亿,增长50倍),并推出TRAE Work。
LinkedIn联合创始人、Anthropic和OpenAI投资者Reid Hoffman在播客中公开批评SpaceX和xAI。他指出SpaceX“不是一家人工智能公司”,6月12日上市后收购AI编程工具Cursor属于“花钱买相关性”;xAI则是“彻底的灾难”,所有11位联合创始人已离职,Grok模型在基准测试中落后于Anthropic和OpenAI。他还批评美国政府6月11日以出口管制为由强制Anthropic下架Fable和Mythos模型,理由仅为Amazon CEO报告Fable 5存在jailbreak漏洞,称此举“专断随意”。Hoffman认为Anthropic和OpenAI均有巨大发展空间,但Cursor可能已过巅峰。他建议年轻人不要抵制AI。
@yunta_tsai Maybe first attempt at this for Neuralink later this year
网上流传Telegram创始人Durov劝学生别学编程和AI、只学数学物理的说法是断章取义。真实对话中,Durov只建议优先打好数学基础,马斯克补充物理加数学,Durov还明确表示数学基础打好后计算机科学非常值得学。没人提出放弃编程或AI。谣言传播是踩中了AI时代的技能焦虑。实际上,AI能写基础代码后,核心壁垒是数学教的拆解问题逻辑和物理教的建模因果思维。最优路径应是数学物理打底、编程落地、AI加速迭代。
مؤسس تليجرام، ينصح الطلاب: لا تضيعوا وقتكم في تعلم البرمجة والذكاء الاصطناعي.. أدرسوا الرياضيات و الفيزياء جيدا. و إيلون...
AI文本检测器Pangram的CEO Max Spero表示,其深度学习分类器是一个黑箱,通过捕捉语言模型在组织文档时留下的结构模式来识别AI生成文本。Spero指出,语言模型在语法和逻辑上可能优于普通人,但论点高度同质化:若要求LLM就某个主题生成100个论点,它们会集中在狭窄范围内,而人类论点的空间则非常多样。这种雷同是AI文本的显著特征。
6月24日,美团副总裁陶雪璇在大众点评必吃榜10周年盛典上表示,大众点评对AI评价持明确反对和抵制态度。她指出,AI生成的评价可能话术漂亮但未真实体验过餐厅,且AI在应用环节的模型幻觉问题依然严重,会影响评价的真实性。评价如同社区公告板,不属于商家、用户或平台任何一方。
Anthropic内部透露,99%工程师运行300+自改进agent swarm。核心是“close the loop”——模型自验证输出,包含计划、动态工作流、自我检查并迭代。效果远超多数300美元agent课程,但token消耗更高。
I switched the Grok as my search engine a few months ago. I only use Google now to correct typos / check spelling, as it...
软银创始人兼首席执行官孙正义在 6 月 24 日的年度股东大会上表示,人工智能仍处于发展初期,任何声称行业出现泡沫的言论都是“对人工智能的侮辱”。他将软银比作“下金蛋的鹅”,抱怨公司市值(约 37 万亿日元)与资产总额(约 74 万亿日元)之间的巨大落差。孙正义同时宣布软银已开始量产机器人,并推动旗下 Arm 从芯片设计者向芯片提供者转型。
Interesting to observe Anthropic going from the moat being the best model to building a tooling ecosystem with right int...
用户出差在飞机上,通过Bloome Agent直接生成两份客户续费合同,无需打开电脑、无需多言。Agent还主动记忆并询问之前的报价信息,整体体验轻松愉快。用户感叹AI时代让“顶级牛马”也能享受老板般的待遇。
Made it to SF! The love for GLM-5.2 has been incredible. We are bringing team out for the AI Engineer World's Fair, wher...
Andrew Ng分享了AI时代如何组织工程团队以加速:1到10人的团队由高度授权的通才组成,保持高语境。当代码生成速度大幅提升后,组织反而成为瓶颈——功能从想法到原型只需一天,迫使产品、设计、营销、法务等所有环节同步加速。他的解决方案是让少数高语境通才团队独立决策,避免跨部门翻译带来的延迟。源自LangChain YouTube频道。