Claude Tag is a Trojan horse. Not because Anthropic is doing anything evil. Because the incentives are obvious. Day one,...
If you are asking "Why push back against anti-datacenter efforts?" I consider it a tragedy that anti-nuclear efforts lar...
动态工作流仅适用于少量用例,可视为测试时计算(TTC)新范式,对爬山式研究实验有效。仔细规划及提升推理级别均可改善效果。/goal + /loop 是其子集,验证者/评判者至关重要。结合不同编码智能体能获更好结果,适合需要多智能体视角的 LLM 评审团场景。前沿模型不擅即时生成 harnesses,但 Mythos 等新模型可能更优地处理智能体编排。TTC 基准尚缺,需建立。元提示动态工作流很有趣,Opus 4.8 也可能带来惊喜。动态工作流可打包为技能以便进一步优化。
Rohan Paul 引用 @TangriKunal 指出,机构知识长期依赖文档索引,但文档只是判断的产出物,判断本身存在于资深员工交付前修改的差异(diffs)中,而多数企业丢弃了这些印记。Farsight 将此过程定义为“系统 of Judgment”,即通过软件保存真实工作中的编辑,将重复决策转化为可衡量规则。Paul 认为企业 AI 的下一个护城河不是存储的知识,而是存储的判断——AI 需要学习初稿与终稿之间的差距,因为那里藏着企业的好标准。
"Capture your institutional knowledge" has meant the same thing for 30 years: index the documents, search over them. But...
We're sharing new research on how models hack public benchmarks. The latest models, including Opus 4.8 and Composer 2.5,...
Work at OpenAI is being transformed by agents, in every department. Across our entire company, people are using Codex to...
http://x.com/i/article/2070125273790492672
Gary Marcus 昨日提出新术语 Generative AI Fizzle™,认为生成式AI行业估值过高,投资者对 hype 与利润的落差失去热情。LLM 已商品化,价格战激烈,提供商盈利艰难。昨日一款新的中国开源模型发布,可能进一步冲击美国 LLM 公司。多数 AI 股票本月显著下跌,泡沫可能不会突然破裂,而是缓慢消退。
🚨 New research alert! For the past few months, I've been a part-time visiting economics researcher at OpenAI. Excited t...
洛杉矶舞者兼 DJ Matt Steffanina 在 Suno 博客访谈中分享创作历程。他自学街舞,拥有超 3000 万粉丝和 50 亿观看量,曾为 Taylor Swift、Jason Derulo 编舞,并创办线上舞蹈教学平台 DNCR Academy。过去他靠他人音乐积累数十亿播放却未拥有资产;现在借助 Suno 在数分钟内将音乐创意变为现实。他认为 Suno 和 Hooks 让创作回归趣味,鼓励舞者自己创作音乐。
纽约钢琴家兼作曲家 Eric Christian 在访谈中分享了他将 Suno 整合进创作流程的方式。他把刚写好的循环旋律输入 Suno,几秒内就能听到完整的管弦乐效果,而传统管弦乐模拟需要数小时。尽管他的作品均为钢琴独奏曲,但他一直以交响化视角构思音乐。至今他已售出超过 10 万份乐谱,用户遍布 200 个国家。他坚信音乐的基础在于纸上的记谱而非录音,Suno 让他在不依赖大型管弦乐团的前提下快速判定旋律是否真正成立。
The idea that distilling from Opus 4.8 lets you reach Mythos is very encouraging. It would mean that some GLM 5.3 would ...
Anthropic's letter accusing Alibaba of distillation.
英伟达CEO黄仁勋在年度股东大会上表示,人工智能代表计算模式的根本性转变,从检索存储转向生成智能。Token是智能的基本单位,在“AI工厂”中被制造,计算能力越强,生成的Token越多,收益越丰厚。AI基础设施建设周期将长达数十年,类比电网、交通系统和互联网,有望成为人类历史上规模最大的基建项目。AI智能体正在加速投资,因为AI首次能胜任实质性工作并创造真实经济价值。
推文指出80%的Agent生产崩溃与模型智商无关,根源在上下文溢出、工具调错、子代理失控。2026年分水岭是Harness(办公室制度、安保系统、质检流程,含独立验证节点、分层记忆、延迟绑定工具)和Loop(自我发现、任务分派、验证结果、状态记录)。好模型配差循环产生昂贵垃圾,普通模型配好循环加验证反而稳定出货。模型是可替换引擎,Harness是底盘安全系统,Loop是自动驾驶。引用@wizardly_ai的工程笔记拆解了该论点。
http://x.com/i/article/2069720576693022720
印度头部金融科技公司CRED创始人Kunal Shah表示,目前公司90%的代码由AI编写。他认为,每家人工智能创业公司中约10%的员工已因AI获得指数级生产率提升,与其余90%员工形成“完全不同物种”般的差距,感觉周围一切流程和人都变得缓慢。该言论来自“Thrive by Groww”YouTube频道访谈。
亚马逊云科技CEO马特·加曼认为,AI导致大规模失业的末日论被夸大。他指出约一半白领岗位可能因AI改变,但“改变”不等于“消失”,就像Excel重塑而非消灭工作。AI已催生新职业,初级员工因学习意愿强仍受重视。亚马逊今年计划全球招聘超1.1万名软件开发实习生和初级工程师。加曼强调,愿意学习新技能的劳动者仍能保住工作,适应能力可能比具体技能更重要。
谷歌前 CEO 埃里克·施密特在今年 5 月 SCSP 国家竞争力 AI 博览会的炉边谈话中表示,限制 AI 芯片进入中国的政策已开始失效,中国已通过较弱的 AI 硬件(如华为昇腾芯片)和软件方法造出顶级 AI 模型。施密特称不喜欢中国大力推广开源 AI 技术,认为这些技术不受美国或任何方控制。他援引最新分析称,中美 AI 差距已从一年前的 1~2 年缩短至不到 6 个月。
面壁智能联合创始人兼CEO李大海在MBBF Top Talk Summit上指出,端侧智能是AI迈向物理世界的必经之路,未来2至3年将迎来能力跃升与场景迁移两大重构。端侧智能需满足实时响应、隐私安全、离线可用三大约束,搭载面壁量产级多模态模型的智能座舱已实现不依赖云端的“感知-记忆-推理-执行”闭环。他强调端云协同是规模化落地的关键,近期推出的MiniCPM5-1B模型以两百分之一参数规模逼近两年前GPT-4o水平,证明小模型可承载高密度智能。
字节Seedance 2.0推出4K视频模型,一条15秒4K视频约88元,一分钟广告片约700元,但官方API无折扣,代理商加价1.2-1.5倍仍供不应求,每天为字节带来超3000万元收益。红果短剧平台AI短剧已完全碾压真人短剧,ROI优势显著。大模型公司优先选择coding等高价值场景训练,遵循“资源有限时,算力和资本流向边际收益率最高处”的ROI定律。用户应关注价值而非价格:若能用AI创造超过成本的价值,再贵的模型也划算。找到自己比别人好10倍的场景,才能获得10倍ROI。
用户从Dia浏览器换回原生Chrome,认为Ask Gemini侧边栏整体可用(仅加载稍慢),且Chrome兼容性最好。举例:可直接让Gemini总结X帖子要点并分析用户情绪倾向。避免被特定AI浏览器绑架是主要原因。
This is a pretty terrific computational image generator for making AI-created trading cards (or, heaven forbid, NFTs) Th...
邵猛评论称,Liblib与GenSpark是他唯二看不懂的AI应用团队。它们似乎只能在模型发展的夹缝中依靠速度保持领先,没有其他路径可选。这种对速度的极致要求,使得团队无法分心做任何影响速度的side project或研究,内部也可能因此产生矛盾。邵猛对这两个团队的未来表示困惑:是持续狂奔在夹缝中撞线,还是终将被模型本身的速度超越?
MWC26上海期间,智元联合创始人彭志辉指出,AI从数字世界走进物理世界是下一阶段核心命题,具身智能体将在物理世界长期在线完成感知、决策、执行闭环。他强调未来Token最大消耗群体将是物理世界的具身机器人,资本不再只为Demo买单,行业必须在真实场景落地商业价值。他用XYZ曲线划分产业周期:X曲线为开发尝鲜期(以表演为主),Y曲线为部署成长期(大规模落地真实场景),Z曲线为部署普及期(预计5年左右迎来GPT时刻)。
推文提出,Agent 是一种数字化、随时调用、最终趋近免费的劳动力,但不应把人与 Agent 的价差当作商业模式本身。上下文、注意力、信任和品牌的价值不会因模型变便宜而贬值。AI 时代,人的具体技能不再重要,积极好奇、灵活性和自驱力才是核心素质。
昨日(6月24日)股东大会上,英伟达CEO黄仁勋称AI产业进入新阶段,智能体AI已到来,物理AI将驱动下轮增长。他将数据中心比作“AI工厂”,强调AI基础设施成企业计算核心。财务方面,过去1年营收增长65%,利润增长60%,2026财年自由现金流超960亿美元,计划将50%通过回购和分红返还投资者。黄仁勋举例称,运行英伟达系统生成token具盈利性,GitHub今年pull request数量增长近3倍。