We're getting another round of THE AI BUBBLE IS POPPING stories, with the news about Uber/Microsoft pulling back on AI s...
Belgian man convicted of hate speech describes the judicial rationale for his latest conviction. I asked Gemini: Is this...
[AINews 3 Apr 2026] Gemma 4: The world's best small Multimodal Open Models, dramatically better than Gemma 3 in every wa...
OpenAI CEO Sam Altman承认,此前警告的AI冲击白领工作的情况并未如预期般快速发生。他之前曾警告常规办公工作,尤其是入门级任务,可能因AI受到重击。其新观点认为,由于企业在判断、信任、品味、情绪感知和依赖语境的复杂沟通等方面仍需依赖人类,工作模式正在发生弯曲而非断裂式崩溃。
MIT、斯坦福等机构的一项研究(2,691名参与者)揭示了“效率增益幻觉”:在基本计算、拼写等简单任务上,用户实际使用AI的比例高于自我预测,且预期节省时间(平均55.7秒)远高于实际测量值(仅7.5秒)。研究指出,隐性成本源于提示、等待、检查等“界面摩擦”。更关键的是,使用AI会形成依赖循环——仅两次使用后,即便独立完成更快,参与者也更倾向继续依赖AI,这种倾向源于对便捷感的错误认知,可能导致用户逐渐丧失对自身何时是更快工具的准确判断力。
数学家测试了 Claude Mythos 模型解决开放数十年的 Erdős 问题 #90。值得注意的是,Mythos 未复制 OpenAI 已知解法(题号 #1196),而是反复采用了另一条论证路径,被评价为更“简洁”且无“分析复杂性”,且整个过程与网络隔离。此前,GPT-5.5 已解决过多道 Erdős 问题,深度求索的 Nexus 模型解决了 9 道。此次 Mythos 给出了比现有解法更简洁的证明,凸显了一个 80 年难题在数周内被接连攻破的趋势。
over the weekend i checked the obvious thing, which is whether mythos is able to solve the erdos unit distance problem, ...
推文指出,Markdown作为AI编程的“源代码”存在根本缺陷。首先,其结果缺乏确定性,同一份Markdown因使用模型、Agent Harness及操作者的不同,最终产品千差万别。其次,难以清晰描述UI交互,导致生成的界面质量仅为“凑合能用”,不足以达到商用标准。该观点引用了@jianshuo的相关讨论作为背景。
http://x.com/i/article/2059196541693562880
一项分析指出,通过将任务外包给第三方并结合本地部署的大语言模型(LocalAI),企业或很快能在成本效益上超越仅依赖前沿实验室(如 OpenAI 或 Anthropic)的方案。该观点预测了 AI 服务交付模式的转变。
Paul Graham 指出,他收到的创业者邮件现在常采用一种强硬的新闻体风格,他确信这是 AI 代笔,因为以前没人这么写。他认为一旦知道内容是 AI 生成,就很难不对其产生反感。他将其视为一种欺骗,表示从未读完过这类署名人类但由 AI 撰写的邮件,并认为使用 AI 写作并不值得称赞,任何青少年都能做到。
CMU与UMD的研究指出,当前长上下文大语言模型(如Mamba、Jet-Nemotron、Qwen3.5)的瓶颈并非记忆容量,而是“巩固计算”不足。论文《Language Models Need Sleep》提出,可模仿人类睡眠的海马回放机制,在清空前对模型的fast weights进行多次迭代更新(N次forward pass),以提升推理能力。实验表明,该机制在Rule 110元胞自动机及多跳图检索等任务上显著提升了模型性能,且不增加推理延迟。
Runway通过Project Luxo研究发现,AI生成视频已跨越“恐怖谷”。他们向创意生态从业者展示了《The Rogue》等AI短片及广告样片,评估显示观众开始关注故事本身,而非技术瑕疵。所有作品均由单人团队制作,耗时从3周到4小时不等。Runway认为,这标志着AI媒体成熟——当技术足够好以至于“隐形”,观众沉浸于故事时,便实现了这一跨越。
关联讨论 1 条X:Runway (@runwayml)Uber首席运营官Andrew Macdonald表示,公司并未看到在AI上投入更多成本后,生产力获得了相应的提升。
分析Twitter(X)近3年数据发现:工具发现、产品拆解、开发者资源类内容最能引发转发;书单、工具清单类内容天然适合收藏。Prompt、英语学习、知识管理类内容具有长期传播力。在爆款率上,资源入口型帖子最高,达51%;工具教程类为39%;观点类仅为9%。涨粉速度最快的时段临近年底,原因可能是该时段通常集中发布新的AI模型。
英伟达创始人兼CEO黄仁勋表示,面对AI发展,家长和孩子不应只寻找不会被AI取代的学科,而应学会利用AI深化学习、提升技能。他指出,新闻学、艺术学、设计等领域仍有价值,人类独有的特质将更珍贵。黄仁勋认为,AI自动化了许多工作,但会推动人类承担更具判断力和创造性的高层次工作。他将AI发展与历次科技浪潮类比,并指出这并未削弱人类,反而让人们变得更忙、野心更大。
Suno 用户社区出现一种现象:部分用户不再使用 Spotify 等传统音乐流媒体,转而几乎只收听自己通过 Suno 生成的 AI 音乐。有用户在 Reddit 帖子中“自豪地宣称”并引发了共鸣,他们将此形容为一种“令人上瘾”的体验,沉迷于收听自己创作的、源源不断的“热门歌曲”。
哥伦比亚大学等机构对250万篇生物医学论文的审计显示,自2023年以来,伪造参考文献的数量增加了超过12倍。研究人员认为,这与大语言模型的广泛使用有关——这些虚假引用匹配论文主题、格式规范且难以识别。98%的受影响论文至今未收到出版商的任何回复。该问题可能影响制定临床指南的学术文献基础。
联合国《特定常规武器公约》论坛每年在日内瓦举办两次,聚焦致命自主系统。2017年11月,Branka Marijan与会时发现,这次会议与往常不同。尽管讨论仍围绕“杀人机器人”展开,且这项技术当时被认为可能永远不会发展或部署,但她意识到,那个遥远、想象中的未来已突然变得近在咫尺。
Y Combinator 创始人、OpenAI 早期投资者保罗·格雷厄姆表示,他会忽略明显由 AI 撰写的邮件,因为这感觉“像被欺骗”。相关研究表明,他的这种反应十分普遍。
推文指出,AI工具创业公司面临产品形态的快速彻底重构,两年间核心产品已几乎与过去不同,尽管底层能力仍有延续性,但本质上已是新产品,好在公司得以存续。引用曲凯观点强调,AI创业者是在压路机前捡钢镚,模型进步速度会淘汰众多创业公司,无法达到“逃逸速度”即意味着失败,行业竞争极其凶险。
推文强调,Cursor被收购后已从代码编辑器进化为能交付成品的AI代理平台。用户实例显示,其能快速生成可直接使用的六维雷达图Excel模板和HTML可视化版本,类似一个“全职执行助理”。引用指出,Cursor内部模式已变,工程师扮演“AI团队经理”角色,其内部30%的合并PR由异步云代理自动创建,单周运行2000+并发代理,生成300万行代码,消耗数十亿token。一个任务被自动拆分为规划、编码、测试、发PR四个角色并行处理,人类仅需定义范围和最终审核。
拿到Cursor赠送的$10000额度之后,我专门研究下这家公司, 看到Cursor CEO这个演讲,我突然意识到, 我们对AI编程的理解,从根上就错了, 当大多数人还在纠结哪个模型写代码更快更准的时候, Cursor已经直接进入了下一个时...
MIT与南加州大学的研究表明,自ChatGPT普及以来,美国联邦法院无律师代理的诉讼案件数量已近乎翻倍。目前五分之一的诉状中包含AI生成的文本。面对海量涌入的材料,法官们正被迫采取严厉措施来应对这场由AI引发的文书处理危机。
自主AI系统正从软件环境转向仓库、配送网络和公共空间等物理领域。这引发了对现有AI规则是否涵盖此类物理环境系统的关注,因为当前多数治理框架主要聚焦于在线伤害和模型输出,例如偏见、虚假信息及有害内容。
微软因此前Copilot植入引发负面舆论,正暂缓激进推广,转而开发一套Copilot设计体系,旨在让AI功能无感化融入日常操作。微软365首席设计官约翰・弗里德曼主导该体系研发,目标是打造统一、智能且人文的交互体验,使Copilot能读懂用户意图,自然融入流程。体系包含“动态操作按钮(DAB)”及“流转交互”等模式,强调功能入口无缝联动、用户主导,让AI仅作为思维的延伸。
One engineering challenge in dexterous Robot hands is balancing strength and speed. Here a SharpaWave performing rapid h...
扎克伯格在播客中批评苹果自iPhone后创新停滞,称其只是在吃乔布斯留下的老本。他指出iPhone升级体验提升有限,用户换机周期延长;AirPods虽成功但苹果通过封闭生态限制第三方接入。苹果ATT政策导致Meta广告收入损失超100亿美元,双方在Vision Pro与Quest等领域存在竞争。扎克伯格正推动Meta在AI眼镜、开源大模型如Llama等方向发展。
Mark Zuckerberg says Apple's lack of innovation since the iPhone will lead to its decline "They haven't really invented ...
文章核心指出,传统App+AI是人操作应用,AI辅助;而Agent应用是人指挥AI智能体自主操作应用或命令行。文中以微软Copilot(早期版本仅能回答问题)与Codex(能自主完成PPT制作修改)为例说明此差异。针对“在Agent上构建垂直应用是否等同于传统App+AI”的疑问,作者澄清,只要执行主体是AI智能体,即为以AI为主的应用。
@dotey 其实我一直有个好奇点:在 agent 上构建应用其实就是特定赛道垂直应用,那这个应用岂不就是现在的传统 app+ai 了,那它还能是个 AI 为主的吗?
一位工程师分享称,其团队每人每月获1000美元Cursor token预算,使用后AI提效显著。两个月后,老板因效率提升决定将20人团队缩减至5-6人,导致十余人被裁。