At @ThriveHoldings, we built a product with @OpenAI to automate tax prep for the 30+ accounting firms we own across the ...
At @ThriveHoldings, we built a product with @OpenAI to automate tax prep for the 30+ accounting firms we own across the ...
推文指出AI行业发展进入新阶段,出现对过往技术路线的反思。核心观点包括:1. 单纯的大语言模型本身不足以成为完整产品,必须结合工具框架(harness);2. 完全自动化脱离人的参与是不切实际的;3. 慢工出细活的耐心变得尤为重要;4. AI部署成本高昂,考量投资回报率时有时不如人力划算。这标志着行业从追求技术突破转向更务实的产品构建与价值评估。
One reason I started teaching my "progress" class is the vibes vs reality gap. Coming into the greatest decade in human ...
年近70岁的一位阿姨,做眼科教学和临床四十多年 微信对我留言:Vibe Coding出了自己的一个公益小网站 我看了下,这个网站,非常精致,也很有特点: 1、不用登录,打开就能做眼肌放松练习,也可以顺便了解一些科学用眼、日常护眼的小知识 2...
推文描述了万名毕业生在毕业典礼上嘘前Google CEO埃里克·施密特的场景。作者认为,愤怒发泄于外部虽是低成本情绪出口,但真正危险的是台下那些在嘘声中学习并利用AI的同学。核心观点是:AI不会立即取代所有人,而是先放大差距,将机会赋予实践者。原文以一位22岁年轻人用AI免费完成价值1.5万美元营销策略的案例为证,并指出入门级工作的护城河已转向判断力、领域知识与执行力,AI已成为必要入场券。因此,与其抗议,不如将时间投入实践。
http://x.com/i/article/2058381329318682624
用户实测发现,GPT Image 2 在仅给出简单指令的情况下,能自主生成结构清晰、可直接使用的排版图,体验震撼。有分析指出,GPT 这种出色的结构化排版能力,本质上源于其预训练过程中接触了大量此类素材,而非模型审美本身有巨大提升,但其默认效果已足够好用。
卧槽,GPT Image 2 的默认审美已经到这个程度了? 今天拍了份数学卷子,让它分析错题 分析完我随手加了一句: "将上面的孩子的最主要问题以及解决方案,平时训练建议都用一张图画出来" 没配色、没构图、没风格限定 结果它自己排版、标记 ...
快手旗下Kling AI在第79届戛纳电影节举办访谈,邀请中国、美国和韩国的创作者,共同探讨AI如何进入真实的电影制作工作流。对谈内容涵盖了从好莱坞规模的剧集制作,到全AI生成的剧情电影,以及AI动画电影等不同形式的影视创作。创作者们分享了AI在其实际叙事创作中的应用视角。
Anthropic CEO Dario Amodei曾预测AI将在数年内大幅取代白领工作,但他本人近期已转向“杰文斯悖论”观点,即自动化最终会创造更多需求。OpenAI CEO Sam Altman也承认此前的预测“大错特错”。然而,耶鲁大学预算实验室自ChatGPT推出以来的持续追踪数据显示,美国职业结构并未发生显著变化,AI曝光度高的岗位失业率也未加速增长。德意志银行为此创造了“AI冗余清洗”一词。目前,AI能力的快速增长与实际就业市场反应之间,存在着前所未有的差距。
蚂蚁集团CEO韩歆毅分享了对AI智能体时代的商业思考。他指出,核心逻辑正从流量经济转向以智能体生态繁荣度为核心的网络效应。智能体间的信任需通过一次次任务结果交付来建立。同时,所有价值将实现“Token化”,Token成为价值流转的新载体。AI支付被视为未来最关键的基础设施之一,涉及为智能体构建钱包、协议与清结算网络。蚂蚁集团已将AI支付团队置于高战略地位,正大力投入这一关键基建的布局。
Goldman Sachs CEO, David M. Solomon on nytimes "A.I. won't eliminate 25% of jobs. What's more likely is that people will...
Google DeepMind负责人 Demis Hassabis 将其 AGI 实现时间预测提前至2029年,并称我们正处于“奇点”的初级阶段。他提出的“爱因斯坦测试”基准是:用知识截止于1911年的 AI 能否独立推导出广义相对论,目前尚无系统能接近通过。然而,业界对 AGI 的定义仍无共识,例如 OpenAI CEO Altman 预测时间为2028年,xAI CEO Musk 宣称奇点已在1月发生,而 Anthropic 则避免使用该术语。尽管定义不明,AGI 实现的时间线预测正在不断缩短。
高盛CEO David Solomon 批驳AI将消除25%工作的论点,认为人们将更高效利用时间。他以自身分析师经历为例,曾需数小时手动制作图表,如今借助工具秒级完成,但银行雇佣人数反增。工具使业务复杂度自然扩展。他反问在有Excel、邮件和Zoom的今天,谁觉得工作变少?此观点呼应OpenAI CEO Sam Altman的看法:他承认对AI冲击白领工作的预期过于悲观,因为公司仍需人类的判断、信任、品味和复杂沟通能力。
wionews: OpenAI CEO Sam Altman now says the feared AI white-collar job collapse has not arrived as fast as he expected. ...
Palantir CEO Alex Karp批评当前流行的AI生成“低质内容”。他指出,这类内容的问题不仅在于夸大的言论,如声称将导致大量失业,更在于其核心是“软件伪装有效”——表面流畅,却无法处理权限、边缘案例、审计追踪等现实世界的复杂需求。Karp将Palantir的Foundry和Apollo平台作为对比,强调真正的软件平台是由技术团队长期构建,能够实际解决问题的系统。
美光市值已突破1万亿美元,一年前其市值还仅为700亿美元。这一飞跃的核心驱动力是AI发展对高带宽内存(HBM)的迫切需求。尽管GPU备受关注,但HBM已成为确保GPU持续高效工作的关键部件。随着AI智能体的兴起,无法快速将数据送达芯片已成为新的系统瓶颈,使得内存成为AI增长背后的关键约束。行业的焦点正从单一的逻辑芯片性能,转向整体数据流能否跟上AI推理和智能体工作负载的需求。此外,瑞银将其目标价从535美元大幅上调至1625美元,认为其长期供应协议可能平滑盈利的周期性波动。
Google其实比OpenAI更早做MoE。 我们专访到了Gemini前核心科学家Andrew Dai。Andrew回忆,Google Brain在 2021 年就已经做出了比GPT-3更强的MoE大模型GLaM,PaLM 2甚至在2023...
everyone in ai infrastructure* is finally getting filthy rich and it is so nice to see them succeed *not the sexy ai res...
Stack Overflow 上月新提问量降至 6866 个,与 2008 年上线时持平,受 ChatGPT、Cursor、Claude 等 AI 编程助手冲击。然而公司年收入翻倍至 1.15 亿美元,亏损收窄。增长源于两方面:将社区数据转化为企业知识库产品,已有 2.5 万家公司使用;并将数据授权给 AI 公司用于模型训练。CEO 指出,消失的多是简单问题,复杂问题仍会流向平台,而这正是大模型训练所需的高质量数据。一个隐忧是,这可能导致一个循环:用户流向 AI,AI 依赖旧数据,但新的高质量问答数据却不再产生。
@madiator Death by LLM
We're getting another round of THE AI BUBBLE IS POPPING stories, with the news about Uber/Microsoft pulling back on AI s...
Belgian man convicted of hate speech describes the judicial rationale for his latest conviction. I asked Gemini: Is this...
[AINews 3 Apr 2026] Gemma 4: The world's best small Multimodal Open Models, dramatically better than Gemma 3 in every wa...
OpenAI CEO Sam Altman承认,此前警告的AI冲击白领工作的情况并未如预期般快速发生。他之前曾警告常规办公工作,尤其是入门级任务,可能因AI受到重击。其新观点认为,由于企业在判断、信任、品味、情绪感知和依赖语境的复杂沟通等方面仍需依赖人类,工作模式正在发生弯曲而非断裂式崩溃。
MIT、斯坦福等机构的一项研究(2,691名参与者)揭示了“效率增益幻觉”:在基本计算、拼写等简单任务上,用户实际使用AI的比例高于自我预测,且预期节省时间(平均55.7秒)远高于实际测量值(仅7.5秒)。研究指出,隐性成本源于提示、等待、检查等“界面摩擦”。更关键的是,使用AI会形成依赖循环——仅两次使用后,即便独立完成更快,参与者也更倾向继续依赖AI,这种倾向源于对便捷感的错误认知,可能导致用户逐渐丧失对自身何时是更快工具的准确判断力。
数学家测试了 Claude Mythos 模型解决开放数十年的 Erdős 问题 #90。值得注意的是,Mythos 未复制 OpenAI 已知解法(题号 #1196),而是反复采用了另一条论证路径,被评价为更“简洁”且无“分析复杂性”,且整个过程与网络隔离。此前,GPT-5.5 已解决过多道 Erdős 问题,深度求索的 Nexus 模型解决了 9 道。此次 Mythos 给出了比现有解法更简洁的证明,凸显了一个 80 年难题在数周内被接连攻破的趋势。
over the weekend i checked the obvious thing, which is whether mythos is able to solve the erdos unit distance problem, ...
推文指出,Markdown作为AI编程的“源代码”存在根本缺陷。首先,其结果缺乏确定性,同一份Markdown因使用模型、Agent Harness及操作者的不同,最终产品千差万别。其次,难以清晰描述UI交互,导致生成的界面质量仅为“凑合能用”,不足以达到商用标准。该观点引用了@jianshuo的相关讨论作为背景。
http://x.com/i/article/2059196541693562880
CMU与UMD的研究指出,当前长上下文大语言模型(如Mamba、Jet-Nemotron、Qwen3.5)的瓶颈并非记忆容量,而是“巩固计算”不足。论文《Language Models Need Sleep》提出,可模仿人类睡眠的海马回放机制,在清空前对模型的fast weights进行多次迭代更新(N次forward pass),以提升推理能力。实验表明,该机制在Rule 110元胞自动机及多跳图检索等任务上显著提升了模型性能,且不增加推理延迟。