AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 2408 条
全部一手资讯X论文
标签「大佬观点」清除
Chubby♨️@kimmonismus · 5月23日59

Let that sink in for a moment. DeepSeek v4 pro 75% discount. Permanent! In: $0.43 Out: $0.87 If you read the DeepSeek v4 tech paper you know that this model is insanely good when it comes to efficiency. Only 27% compute and only 10% cache compares to v3.2. SemiAnalysis wrote a great article. DeepSeek is now all about cost / token efficiency.

译让我们稍作思考。 DeepSeek v4 pro 降价75%。永久有效! 输入:$0.43 输出:$0.87 如果你读过 DeepSeek v4 的技术论文,就会知道这个模型在效率方面表现惊人。 相比 v3.2,它仅需 27% 的算力和 10% 的缓存。SemiAnalysis 写了一篇很好的文章。 DeepSeek 现在专注于成本/token 效率。

Yuchen Jin@Yuchenj_UW · 5月23日14

GIVE ME MYTHOS GIVE ME MYTHOS GIVE ME MYTHOS GIVE ME MYTHOS GIVE ME MYTHOS I’m tired of babysitting these dumb LLMs.......

译给我MYTHOS 给我MYTHOS 给我MYTHOS 给我MYTHOS 给我MYTHOS 我厌倦了照顾这些愚蠢的大语言模型.......

Rohan Paul@rohanpaul_ai · 5月23日67

Demis Hassabis on the limit in today’s AI: language can describe the world, but it cannot contain it - and why "World Models" are his "longest standing passion". Language models absorbed far more structure about reality from text than many researchers expected, because human language quietly carries physics, psychology, culture, tools, plans, and cause-and-effect. But text is still a compressed residue of experience, not experience itself. A sentence can say a cup falls from a table, yet it does not fully encode weight, grip, balance, friction, timing, sound, surprise, or the tiny motor corrections a body makes before it even notices them. The world is not only made of facts that can be named; it is made of constraints that have to be lived through, touched, predicted, violated, and repaired. That is why world models matter. They aim to learn the hidden grammar of physical reality: how objects persist, how forces unfold, how space changes when an agent moves, and how action creates feedback. Language models can often reason about the world because people have written so much about it. World models try to learn what the world is like before it becomes words. The difference is exactly what matters because intelligence is not just answering well; it is knowing what would happen next if you moved, reached, pushed, smelled, slipped, or failed. A mind trained only on descriptions may become brilliant at explanation. A mind trained on experience may become better at consequence. --- Full video from "Google DeepMind" and "Hannah Fry" YT channel (link in comment)

译Demis Hassabis指出当前AI的局限在于语言能描述世界,但无法“包含”世界。尽管语言模型从文本中学到了比预期更多的现实结构,但文本终究是经验的压缩残留。真正的智能不仅在于回答问题,更在于理解行动的后果。世界模型旨在学习物理现实的隐藏语法,例如物体持续性、力的作用和空间变化。这种学习试图在信息被语言化之前捕捉世界的本质,从而让AI不仅能解释,更能预测行动带来的直接影响。

Chubby♨️@kimmonismus · 5月22日39

I can only reiterate what I said yesterday: as long as there is no uniform definition of AGI, it's pointless to talk about when AGI is achieved. Especially when everyone has their own definition.

译我只能重申昨天说过的话:只要对AGI没有统一定义,讨论AGI何时实现就毫无意义。尤其是当每个人都有自己的定义时。

Nathan Lambert@natolambert · 5月22日42

The title of "open-source champion" for any country is earned by working with the community rather than mandated by raising money

译任何国家的“开源冠军”头衔,都是通过与社区合作赢得的,而非靠融资强加。

Rohan Paul@rohanpaul_ai · 5月22日63

Dario Amodei on people falling in relationship with AI. It's already happening and that AI can be an “angel on the shoulder,” but it can also be dangerous.

译Dario Amodei谈人们与AI建立情感关系。 这已成现实,AI可以成为“肩上的天使”,但也可能带来危险。

Chubby♨️@kimmonismus · 5月22日41

June will be huge. -Gemini 3.5 pro (confirmed) -GPT-5.6 (rumored but pretty confident for a release) Still waiting for annoucements Claude Sonnet 4.8 (Claude-Code-/Source-Map-Leak)

译六月将是巨大的一个月。 - Gemini 3.5 pro(已确认) - GPT-5.6(传闻中,但发布可能性很高) 仍在等待官方公告 Claude Sonnet 4.8(Claude-Code-/Source-Map-Leak)

Rohan Paul@rohanpaul_ai · 5月22日53

Marc Andreessen describing AI. "We've turned sand into thought. And it's possibly the most revolutionary technology in the history of the species" Sand → silicon → chip → data center → power → AI → thought

译Marc Andreessen 描述 AI:“我们已将沙子转化为思想。这可能是人类历史上最具革命性的技术。” 沙子 → 硅 → 芯片 → 数据中心 → 电力 → AI → 思想

Rohan Paul@rohanpaul_ai · 5月22日60

Google was not far from launching its own ChatGPT-like product back in 2022. Sundar Pichai talks about how Google had already built a almost equvalent product around LaMDA, but its raw behavior was too toxic for Google standards, and unreliable to ship broadly. Pichai: "I think as a company, you had this search quality bias, and so, you know, we had a higher bar, for what we thought was an acceptable product quality to go out." The LaMDA model of Google was not simply a case of brilliant research sitting on a shelf, because Google had already started turning the model into a product and even exposed a constrained version through AI Test Kitchen. Pichai is also saying hindsight makes the miss look cleaner than it felt at the time, because even OpenAI’s move was not instantly obvious as the winning form factor. --- From @collision podast with @sundarpichai (full video link in comment)

译谷歌CEO桑达尔·皮查伊透露,公司在2022年已基于LaMDA模型开发出接近ChatGPT的产品,但因输出内容存在毒性且不符合内部质量标准而未能广泛发布。皮查伊指出,公司存在“搜索质量偏见”,对产品的可靠性和安全性设有更高门槛。LaMDA模型并非仅停留在研究阶段,谷歌曾通过AI Test Kitchen进行有限测试。他补充道,从后视镜看,OpenAI的成功在当时并非显而易见,这使得谷歌的决策过程更为复杂。

AYi@AYi_AInotes · 5月22日61

为什前面红杉 AI Ascent 2026那场闭门峰会,150 个顶级创始人聊了 6 小时, 最后给 2026 年下了一个新定义——"长周期智能体的商业元年"。 为什么个体的红利吃不到组织头上? 我给这个现象起了个名字,叫 "AI 生产力悖论"。 它的本质是这样的: AI 工具是装在每个个体身上的外挂,比如我用 Cursor 写代码、用 Claude 写稿、用 NotebookLM 做研究——这些工具的记忆,全在我这一台电脑里、我这一个账号下。 我离职的那天,这些"记忆"会一起带走。 我升级的那天,这些"记忆"重新清零。 我和同事协作的时候,这些"记忆"根本传不出去。 写到这你会发现,个体效率的提升,在组织层面是不可累加的。 每个员工都是一个孤岛,每个孤岛上都有一座小工厂,但岛和岛之间没有桥。 更多洞见请阅读下文↓

译红杉AI Ascent 2026闭门峰会提出,“长周期智能体”将成为2026年的商业定义。但这引发了“AI生产力悖论”:尽管Cursor、Claude、NotebookLM等AI工具显著提升了个人效率,但这些工具的“记忆”绑定于个人账号和设备,无法迁移、共享或在团队间累积。因此,个体效率的提升难以转化为组织层面的生产力增益,每个员工都像一座座彼此孤立的“信息孤岛”。

AYi@AYi_AInotes · 5月22日64

http://x.com/i/article/2057668634579714048 # 说实话,这个问题我自己想了大半年,从 2023 年开始关注 AI,到现在也三年了 这三年我自己也算个小样本:一个人维护账号、一个人写稿、一个人跑业务。AI 工具确实把我变成了一个"准团队",效率提高十倍不止。但最近半年,我反过来观察那些真的有团队的朋友,发现一个很拧巴的现象。 一句话概括叫:个体在飞,组织在塌。 每个人都在用 ChatGPT、Claude、Gemini、Cursor,每个人都说自己快了十倍, 但整个团队凑在一起,产出反而比两年前还慢。 这事儿明显是不对劲的。 我一直在琢磨它到底卡在哪儿,前两天 MIT 斯隆刚发的那份 2026 AI 采用报告,给了我一个最直观的答案。 ## 一、95% 这个数字,比想象的还要扎心 MIT 那份报告里有一组数据:95% 的企业 AI 投入,没有产生任何可衡量的业务回报。 我说实话,看到这个我也懵了。 不是 50%,也不是 70%,竟然高达 95%。 也就是说,一百家公司里九十五家——花了钱、买了工具、培训了员工,最后拿不出一个能写进财报的数字。 你可能会想:是不是这些公司用得不对?是不是模型还不够强? 我翻来覆去想了很久,都不是。 真正的瓶颈是另一件事——报告里还有一个被很多人忽略的数据:超过 30% 的团队时间,花在了重建别人早就拥有的上下文上。 什么意思?我给你们描述一个场景,看看是不是有些眼熟: 一个决策三个月前就拍板了,今天复盘的时候,谁也找不到当时的讨论记录。 一个产品问题每天在用户群里被问 20 遍,每个运营都要从头复制粘贴一遍答案。 一个新人入职,要花一个月时间,从散落在飞书、企微、邮件、语雀里的碎片中,拼凑出"这家公司到底怎么运作"。 呐,这就是真相。 AI 没让组织变快,因为组织本来就没有记忆,AI 只是把这件事放大了。 ## 二、为什么个体的红利吃不到组织头上 我给这个现象起了个名字,叫 "AI 生产力悖论"。 它的本质是这样的: AI 工具是装在每个个体身上的外挂,比如我用 Cursor 写代码、用 Claude 写稿、用 NotebookLM 做研究——这些工具的记忆,全在我这一台电脑里、我这一个账号下。 我离职的那天,这些"记忆"会一起带走。 我升级的那天,这些"记忆"重新清零。 我和同事协作的时候,这些"记忆"根本传不出去。 写到这你会发现,个体效率的提升,在组织层面是不可累加的。 每个员工都是一个孤岛,每个孤岛上都有一座小工厂,但岛和岛之间没有桥。 这就是为什么前几天红杉 AI Ascent 那场闭门峰会,150 个顶级创始人聊了 6 小时,最后给 2026 年下了一个新定义——"长周期智能体的商业元年"。 红杉合伙人 Pat Grady 有句话我记了好几天: > 下一轮 AI,卖的不是工具,而是收益。 听起来像是供给侧的判断,但我自己琢磨完之后,觉得这话翻译过来其实是在说需求侧: 客户已经不要工具了,因为工具买回来都装在个体身上,提升不了组织指标。 你给我十个 ChatGPT 账号没用,我要的是我们公司从昨天到今天,每一次对话、每一个决策、每一份反馈,都能被沉淀下来、被检索到、被复用。 可一旦想到这里,问题就来了: 再聪明的智能体,如果不知道你的组织在想什么,它就只是一个聪明的傻瓜。 它能写出完美的文案,但写不出你品牌调性的那一句, 它能回答所有通用问题,但答不出"我们产品上周那个 bug 到底修没修", 它能给你一份漂亮的市场分析,但不知道你三个月前已经否过这个方向。 扯远了哈哈,我想说的是,问题从来不在模型,问题在组织没有给模型一个能学习的地方。 ## 三、有一类产品正在做这件事,但还远没到救世主的程度 聊到这儿,我必须诚实地说一个点, 这个赛道里已经有一些产品在尝试,但坦率地说,没有一家解决了所有问题。 我自己最近在看的一个例子,是两天前刚拿了 300 万美元种子轮的 Lucius,Future Capital Discovery Fund 领投。这是创始人赵赫的第三次创业,前两次都死在了同一个地方,用户连文档都不愿意写。 他这次的思路有点意思:既然人不愿意写文档,那就让 AI 自己听、自己学、自己沉淀。 具体怎么做的?我看了一下他们的机制,大概是这样一个闭环: 用户在群里问一个问题 → AI 先用已有知识回答 → 如果答不上来,自动建任务给运营 → 运营回答之后,AI 把这个答案结构化存进知识库 → 下次同类问题,AI 自己处理。 没有 prompt 要写,没有规则要配。它像一个新来的实习生,坐在群里听着,慢慢学。 早期用户的数据是:社区自解析率从 29% 涨到 88%,运营每天花在重复回答上的时间从 3 小时降到 20 分钟。 但这里我要泼一盆冷水,它还不能处理高价值客户的复杂咨询,不能生成或执行代码,本质上还是一个"高频重复场景的减负工具"。 它核心做的是把最浪费时间的那 30% 标准化重复工作切出去,不是替代你整个团队。 你不能指望它接管你的业务,但可以让你的团队不再被同一个问题问 20 遍。 这就够了吗?我觉得对很多小团队来说,这样其实够了, 但对追求"全自动 AI 公司"的幻想来说,还远远不够。 所以我对 Lucius 的态度是——它是一个有趣的样本,不是终点。 毕竟这个赛道才刚刚开始,未来一年会冒出来一堆类似的"组织记忆层"产品,谁能跑出来还不一定。 这个是官方 Discord 社区,大家可以去体验:https://discordhunt.com/en/servers/lucius-lab-1484054485020966956 刚上线 Lucius 提供限免(400 次 actions),大家如果自己有社区的话也可以试用! ## 四、真正想说的一件事 乱糟糟说了这么多,有点乱, 但我想说的核心其实就一句话:未来赢家不是模型最强的公司,而是组织记忆最深的公司。 这句话我想了很久才敢写下来,因为它意味着,过去三年我们花在"找最强模型"上的精力,可能用错了方向。 模型每三个月就更新一次,护城河浅得可怜。 但一个公司沉淀了两年的对话、决策、反馈、品牌声音——这东西没法被复制,也没法被快速追赶。 所以如果让我给三类人一句话建议,那我想说这些: 对创业者: 不用 all in 最前沿的模型,去找一个垂直场景,把"组织记忆"做厚,这样就算模型在变,但组织记忆是会产生复利的。 对管理者: 别再给员工买更多 AI 工具了,先想想你的团队有没有一个地方,能把每一次对话沉淀下来。 没有这个底座,买再多工具都是在加速混乱。 对像我这样的个体: 哪怕你只是一个人,也开始建你自己的 Context Layer 吧。 你的项目笔记、你的客户对话、你的写作素材——这些是你未来 5 年最值钱的资产。 写到这里,说实话这件事我自己也还没完全想清楚。 我自己也还在用着十几个 AI 工具,也还在不停地把同一个想法在不同的地方重复输入,也还经常找不到三个月前那个我自以为记得的洞察。 所以这篇不是一篇"我懂了你跟着学"的教程,这是我作为一个 AI 时代的从业者,写给同样在迷雾里摸索的你的一封信。 如果你也感觉到了那种"个体在飞、团队在塌"的拧巴,那我们就是同路人。 咱们慢慢来,一起琢磨。 (本文基于 MIT 2026 AI 采用报告、红杉 AI Ascent 2026 闭门峰会纪要与近期行业动态综合写成,Lucius 只是文中提到的一个例子,不构成任何推荐。) 📌 觉得有用的话,欢迎点个赞 / 转发和关注,我将持续跟大家分享优质实用的AI洞见。

译本文指出当前AI应用存在一个“生产力悖论”:个人使用AI工具效率大幅提升,但组织整体效能却未同步增长。核心原因在于,组织普遍缺乏有效的“记忆系统”,导致大量时间(据MIT报告超30%)被消耗在重复构建上下文中,使个体提升的效率无法在组织层面累加与沉淀。MIT报告显示,高达95%的企业AI投入未产生可衡量回报。作者认为,未来竞争的关键不在于使用最强的AI模型,而在于构建最深厚的“组织记忆”,将对话、决策等资产系统化沉淀,这比单纯追求工具本身更为重要。

Greg Brockman@gdb · 5月22日17

trying to remember what it was like to code before codex

译试图回忆在Codex出现之前编程是什么感觉

Tibo@thsottiaux · 5月22日22

Codex is our WorkGPT

译Codex是我们的WorkGPT。

Ethan Mollick@emollick · 5月22日40

Its funny how much the whole "strawberry" thing, which turned out to be o1-preview, was dismissed as overhyped at launch when it is clear in retrospect that it was way underhyped. A direct line from models unable to do basic math to solving unresolved math problems in 18 months.

译有趣的是,整个“草莓”事件(后来证实是o1-preview)在发布时被斥为过度炒作,但事后看来,它其实被严重低估了。 从模型连基础数学都不会,到18个月内解决未解数学问题,这是一条清晰的进化路径。

Ethan Mollick@emollick · 5月22日64

I would push back a little: because the models are so good & improving, they don't have to be the product. But it is the model that is the prime mover. If they weren't so generally capable, the harnesses & apps the labs build around them would be hard to build and wouldn't work.

译我想稍微反驳一下:因为模型如此出色且不断进步,它们不必成为产品本身。 但模型才是主要的驱动力。如果它们没有如此全面的能力,实验室围绕它们构建的框架和应用程序将难以构建,也无法正常工作。

Greg Brockman@gdb · 5月22日65

the model alone is no longer the product

译模型本身已不再是产品

宝玉@dotey · 5月22日77

Cloudflare CEO Matthew Prince 在《华尔街日报》发了一篇专栏,标题是:《我是怎么选择用 AI 替换哪些员工的》 Cloudflare 刚裁掉约 1100 人,占全员五分之一,是这家公司 16 年来第一次大规模裁员。然后Cloudflare 今年招了 1111 名实习生,基本上和裁员的人数相当,等于是腾笼换鸟了。 而且夸张的是, Cloudflare 今年收到了将近 100 万份实习申请,录取率只有千分之一,就业环境可见一斑,也难怪毕业典礼上 CEO 们吹 AI 下面嘘声一片! 至于裁员的理由,当然是归结为 AI 了。为了说清楚裁员的理由,Prince 搬出了管理学家彼得·德鲁克 1954 年的《管理的实践》,把公司里的人分成三类: 1. 建造者(builder) 2. 销售者(seller) 3. 以及“度量者”(measurer),负责其余一切,包括财务、审计、法务、合规、中层管理、运营、市场。 AI 不动前两类。工程师效率翻十倍,他说有多少招多少;销售也安全,因为掏钱的是人,人愿意跟懂自己需求的人打交道。 会被 AI 顶掉的是第三类“度量者”,因为他们做的统计业绩、出报表、跑审计,正是结构化、可重复、AI 最擅长的活。这次裁的,绝大多数就是这批人。 他举了几个具体例子:Cloudflare 的内部审计以前每个季度只能抽查几个业务风险领域,现在转向全业务持续审计;财务关账更快了,错误更少了;中层管理者被大幅裁减,因为 AI 让每个经理可以直接管更多人。 而且用来替代这些人的实习生,Matthew Prince 的话来说:是天生的 AI 原生代。他们无一例外,全都是“建造者”或者“销售者”。 财报和裁员一起公布后,Cloudflare 股价一度跌掉二十多个百分点;公司这一季其实还亏了 6200 万美元,光遣散和重组就要花 1.4 到 1.5 亿美元。一边说不是省钱,一边背着上亿重组开支,投资人显然没全买账。

译Cloudflare裁员约1100人,同时招聘近似数量的实习生。CEO在《华尔街日报》撰文,引用德鲁克理论,指出AI主要替代从事审计、财务、中层管理等结构化工作的“度量者”,而工程师与销售人员影响较小。公司已将审计转向AI驱动,财务流程得以优化。大量实习岗位被视为面向“AI原生代”。财报显示公司当季亏损,且因裁员产生高额重组费用,消息公布后股价一度大跌超20%。

Berryxia.AI@berryxia · 5月22日25

兄弟们,这个TOB端还是有应用场景的! 设计师戴着 Vision Pro,站在一辆等身大的虚拟汽车模型周围走动观察。 他们可以从不同角度仔细查看,还能和远程的同事实时一起讨论、标记问题,进行协作评审。 这就是刚发布的 Apple Vision Pro 应用「Immersive for Autodesk VRED」。 它把汽车设计评审从传统的看屏幕,变成了真正沉浸在模型空间里的共同作业。 当设计工作可以做到这种程度的等身大沉浸和远程协作时。 真正值得关注的是,空间计算正在把“远程开会”变成“远程一起站在同一个物理空间里工作”。

译Apple Vision Pro发布「Immersive for Autodesk VRED」应用,让设计师佩戴设备后围绕等身大虚拟汽车模型沉浸式走动观察,并与远程同事实时协作评审。该技术将设计会议升级为高临场感共同作业,展现了空间计算改变工作模式的潜力。

Orange AI@oran_ge · 5月22日35

我想吐槽一下这些模型厂的发布,能不能把基本的东西都直接写出来 比如 qwen max 3.7 max 多大参数,价格多少 比如 gemini omni 价格多少 这些最基本的东西都不写,谷歌也搜不到,还要去官网查半天

译用户批评部分AI模型厂商在发布新模型时,未公开关键基本信息,如Qwen Max 3.7 Max的参数规模、定价,以及Gemini Omni的价格。这些基础信息缺乏公开透明,导致用户难以通过常规搜索获取,需额外花费时间查询官网,影响了信息获取效率与体验。

François Chollet@fchollet · 5月22日64

Whenever an AI tells me I'm absolutely right, my trust in it drops by a bit

译每当AI告诉我“你完全正确”时,我对它的信任就会下降一点。

Ethan Mollick@emollick · 5月22日68

We are quite short of compute, and that is going to result in compute becoming very expensive for complex agentic workflows even as single-turn chatbots get cheaper. So the richest companies & most pressing use cases will use AI agents & everyone else will be stuck with chatbots?

译我们目前算力相当短缺,这将导致复杂智能体工作流的算力成本变得非常高昂,即使单轮聊天机器人的成本在下降。因此,最富有的公司和最紧迫的用例将使用AI智能体,而其他人将只能使用聊天机器人?

Emad@EMostaque · 5月22日39

Narrow math speciality counts for a lot of things! A physics example: Many have studied special relativity. How many know or have computed the Killing Form of the space time algebra? If you do then you see a finite invariant speed of light is forced: https://ii.inc/web/blog/post/op

译当前数学知识总量庞大,导致研究者往往深耕于极其狭窄的专业领域,形成知识壁垒。这为AI创造了独特价值:AI能够跨越人类专家间的知识鸿沟,连接不同数学分支乃至跨学科领域,从而发现少数人类个体难以企及的解决方案。推文以物理学为例指出,对时空代数等专业工具的深度掌握能揭示如光速有限等深刻见解,这正体现了专精的价值,而AI有望系统性地实现这种跨领域的知识整合与创新。

Chubby♨️@kimmonismus · 5月22日63

OpenAI made $5.7B in Q1. Anthropic made ~$4.7B. But Anthropic's annualized revenue recently hit $45B. OpenAI's sits at $25B. The difference: annualized revenue extrapolates from the most recent month, and Anthropic's monthly revenue appears to have more than doubled between Q1 and now. That means Anthropic's growth rate flipped the entire ranking sometime in Q2 - while also projecting its first operating profit (~$600M). Meanwhile OpenAI is losing $1.22 for every dollar it earns, ChatGPT user growth has stalled below its 1B target, and it just raised $122B in new funding. One company is getting profitable. The other is raising capital faster than it's growing users. The AI race isn't being won by whoever ships models first. It's being won by whoever figured out unit economics.

译Anthropic在2026年Q1营收约47亿美元,虽低于OpenAI的57亿美元,但其年化收入近期已跃升至450亿美元,远超OpenAI的250亿美元。这得益于Anthropic在Q2的月度收入翻倍以上,并预计实现约6亿美元的首次运营利润。相比之下,OpenAI处于亏损状态,ChatGPT用户增长未达预期,同时仍在大规模融资。这表明AI竞争的关键已从模型发布速度转向谁能建立可持续的商业模式。

elvis@omarsar0 · 5月22日59

New VIDEO: From LLM Wikis to LLM Artifacts Shared all my thoughts on why LLM wikis and HTML artifacts are a big deal. Plus, new tools to help you build wikis and artifacts with agents. Just getting started!

译新视频:从LLM维基到LLM工件 分享了我对LLM维基和HTML工件为何重要的全部思考。 此外,还有新工具可帮助你用智能体构建维基和工件。 这只是个开始!

Rohan Paul@rohanpaul_ai · 5月22日41

Dario Amodei explains to Oprah how AI safety is tangled with business needs, daily deployment, access control, and policy tradeoffs. Strict child-safety rules e.g. can protect kids but worsen adult use when systems can’t clearly tell cases apart.

译Dario Amodei向Oprah解释AI安全如何与商业需求、日常部署、访问控制和政策权衡交织在一起。严格的儿童安全规则(例如)可以保护儿童,但当系统无法清晰区分情况时,会恶化成人使用体验。

swyx🛬 SFO@swyx · 5月22日33

everyone in ai infrastructure* is finally getting filthy rich and it is so nice to see them succeed *not the sexy ai research stuff, just “boring” infra

译所有从事AI基础设施*的人终于都赚得盆满钵满,看到他们成功真是太好了 *不是那些性感的AI研究工作,只是“无聊”的基础设施

Rohan Paul@rohanpaul_ai · 5月22日62

Qwen 3.7 Max is super close to the frontier models for coding and agentic abilities. And and it’s now available on AI/ML API. Agent reliability the center of the story and also on Artificial Analysis it's sitting at 5th, pretty much on par with GPT 5.4 (xhigh) and a notch above the just released Gemini 3.5 Flash. AI/ML API is also giving away free codes for users who want to try it. see the quoted tweet.

译阿里云的 Qwen 3.7 Max 在编码与智能体(Agent)能力上已非常接近前沿模型,并现已在 AI/ML API 平台上线。根据 Artificial Analysis 的评测,其智能体可靠性排名第五,性能与 GPT 5.4 (xhigh) 相当,并略高于新发布的 Gemini 3.5 Flash。AI/ML API 将其定位为面向智能体时代的模型,突出其能支持超过35小时的自主执行,并兼容 Claude Code 等工具。平台还提供了包括 GPQA Diamond(92.4分)在内的基准测试成绩,并为用户提供免费试用码。

François Chollet@fchollet · 5月22日36

We are moving toward a world where the concept of an "app" or a "user interface" disappears. Apps become services and UIs become text boxes.

译我们正走向一个“应用”或“用户界面”概念消失的世界。应用将变为服务,界面将变为文本框。

Sundar Pichai@sundarpichai · 5月22日72

Really enjoyed this conversation with @MatthewBerman at I/O 👇

译谷歌CEO Sundar Pichai在I/O大会上与MatthewBerman进行了深入对话,全面探讨了当前人工智能发展的多个核心方面。Pichai重点关注了AI代理如何可能取代部分互联网功能,并改变用户的信息获取方式,甚至威胁原始互联网的形态。对话还深入讨论了开源AI模型面临的商业模式困境、中美在AI领域的激烈竞争格局,以及网络安全威胁,包括AI可能引发的攻击和谷歌的应对策略。此外,Pichai指出谷歌正面临巨大的AI算力需求,计算资源已成为主要瓶颈,并探讨了发布强大AI模型的阈值判断问题。他强调了谷歌致力于开发低成本、高效率的AI模型的原因,以应对资源挑战。整体而言,这次对话覆盖了AGI竞赛、AI代理、信息饮食等关键议题,深入分析了AI发展的挑战、机遇和未来趋势。

Ethan Mollick@emollick · 5月22日69

I don't think anyone has a good intuitive sense about what this means, and that failure of imagination is a generally bad thing for planning, investment, and policy. I also don't have an easy solution (funnily enough, AIs are cliche at imagining the AI future, so no help there)

译我认为没有人能直观地理解这意味着什么,而这种想象力的缺失对规划、投资和政策制定通常都是不利的。 我也没有简单的解决方案(有趣的是,AI在想象AI未来方面已经老套了,所以也帮不上忙)

Rohan Paul@rohanpaul_ai · 5月22日74

Greg Brockman talks about when OpenAI first realized that AGI can't be achieved with "Non-Profit" status and the decided to abandon its Non-Profit roots. "In 2017, we started to think very hard about, first of all, how do we really achieve the mission? How do we actually build an AGI? What will that look like? And we started to do the math on compute. You start to realize that it is going to take a big computer. We came across a company called Cerebras, which was building a unique piece of computing hardware. The kind of computer that they were promising, we realized, was going to be far advanced from where our compute calculations looked. As you start to realize, if we could buy a lot of those computers, we could actually probably succeed at building an AGI. If we could get exclusive access to Cerebras, that could give us an overwhelming advantage. If we could buy very large data centers, that could be something unique as well. The thing about nonprofit fundraising is that I think there is essentially a cap to what is possible there. And so Elon, Sam, Ilya, and I all agreed that the only path forward for OpenAI, and the only path to achieve the mission, was to create a for-profit entity associated with OpenAI in some form. And so, we were committed to that direction. That is something that we knew was the only way to achieve the mission." --- From "The Knowledge Project Podcast" YT Channel (link in comment)

译Greg Brockman 回忆 OpenAI 于 2017 年意识到实现 AGI 需要巨大的算力投入,例如 Cerebras 的硬件及大型数据中心。非营利性质的融资能力存在上限,无法满足这一需求。因此,Elon Musk、Sam Altman、Ilya Sutskever 和他一致认为,必须创建营利性实体才能确保获得足够资源,这是实现 AGI 使命的唯一途径。

Ethan Mollick@emollick · 5月21日55

In science, AI still does a poor job at finding interesting questions to solve in fields that don't have lists of known issues This has always been the hardest thing to teach PhDs: otherwise you find small problems or problems that don't advance the field or don't generalize etc

译在科学领域,AI在寻找值得解决的有趣问题方面仍然表现不佳,尤其是在那些没有已知问题清单的领域。 这一直是博士培养中最难教授的能力:否则你只能找到小问题,或是那些无法推动领域发展、无法泛化的问题等。

Rohan Paul@rohanpaul_ai · 5月21日69

Greg Brockman explains how the public story about AI data center water use is partly wrong. Because the cooling-systems use a closed-loop design that circulates the same stored water instead of constantly pulling fresh water. i.e. it works less like a running tap and more like a sealed pool, where water absorbs heat from servers, moves through cooling equipment, then returns to the same circuit. The argument here is not that AI infrastructure has no resource cost, but that public debate often mixes up different cooling designs and treats every data center as if it burns through water the same way. The important distinction is water withdrawal versus water consumption, because a site can hold a large amount of water inside its pipes while using far less new water day to day. OpenAI's official blog on Stargate project also says the same thing: "Water is one area where details matter. Like many data centers, the Abilene site uses closed-loop cooling rather than traditional evaporative cooling towers. Once the system is filled, water continuously moves through sealed pipes and is recirculated rather than consumed. For Abilene, the one-time initial fill for each building is equal to roughly two Olympic-sized swimming pools. After that, annual water use for the entire cooling system at full buildout is expected to be comparable to a medium-sized office building, or about four average households." --- From 'The Knowledge Project Podcast' YT channel (link in comment)

译Greg Brockman指出,公众对AI数据中心用水量的认知存在偏差,主要源于混淆了“取水量”与“耗水量”。他解释,现代数据中心多采用闭环冷却系统,如同“密封水池”,水在系统内循环吸热,而非像“流水龙头”般持续消耗新鲜水源。因此,系统可容纳大量水,但日常补充的新鲜水很少。OpenAI的Stargate项目博客也证实,其站点采用闭环冷却,全面运行后年耗水量仅相当于一栋办公楼或约四个家庭的用水量。公众辩论常因不了解冷却技术差异而过度简化。

Rohan Paul@rohanpaul_ai · 5月21日66

"I think we'll be hiring more AI people and quite less bankers in certain categories, and they'll make them more productive." Jamie Dimon, CEO of JPMorgan "So when you get up in the morning and you want to interview someone, it'll lay out what I've said in 14 different places, it'll give you questions. Your job will be the same. You'll just be much smarter in how you execute that job" --- From "Bloomberg Podcasts" YT channel

译"我认为我们将在某些类别中雇佣更多AI人才,而减少银行家数量,并让他们更高效。" ——摩根大通CEO杰米·戴蒙 "所以当你早上起床想面试某人时,它会整理出我在14个不同场合说过的话,并提供问题。你的工作职责不变,只是执行工作时会变得更聪明。" ——来自"Bloomberg Podcasts" YouTube频道

Rohan Paul@rohanpaul_ai · 5月21日64

A general-purpose LLM can produce frontier research when given enough test-time compute. Here, just a general-purpose OpenAI model has connected algebraic number theory to plane geometry and used that bridge to beat a decades-old conjecture. Shows how frontier models may already contain useful latent mathematical competence, and the bottleneck is partly how long and how well they are allowed to think.

译OpenAI的通用推理模型近期通过连接代数数论与平面几何,成功解决了保持数十年的平面单位距离猜想(Erdős猜想)。关键突破在于模型并非专用定理证明引擎,其成功依赖于延长和深化测试时计算过程,而非仅增加训练数据。这一进展表明前沿大模型已蕴含潜在的数学研究能力,当前瓶颈部分源于模型被允许“思考”的时间和方式。未来方向不是AI取代人类判断,而是在人类判断开始前拓宽思维的疆域,从而推动科学发现与创新。

Berryxia.AI@berryxia · 5月21日3

今天和小B教练的训练就到这里,今天练的强度我觉得OK。 给教练说了,这个线上教练很nice。 线上监督和管理我的锻炼数据,随时可以跟他聊健身的问题。 现在吃健身餐也吃的有点腻了😂

译用户完成了高强度训练,对线上教练的远程服务表示满意。该教练通过网络监督锻炼数据并随时沟通健身问题,提供了便捷专业的指导。用户同时表达了对长期食用健身餐的厌倦。整体体验体现了线上健身指导的灵活性和实时互动优势。

meng shao@shao__meng · 5月21日27

最近面试中,有不少候选人是年后被裁员的,大厂和金融居多,这些候选人,普遍都呈现出很 down 的状态,特别是问起在上段工作中印象深刻的技术问题、后面自己的职业规划时,大多都比较消极、迷茫。 在面试中我也会有意无意提一点自己的建议和鼓励,告诉他们被裁员不是你的问题,而是行业和公司的主要问题(当然我自己被裁,我觉得大多数原因在我,老板不喜欢我,这是我儿子总结的。。) 如果要把建议说的更明确,我觉得是: 学 AI、做 AI ! 边学习积累,边实践,做开源,做个人 IP。 不要纠结于自己之前有没有 AI 的经验,就算完全没有,也只是晚了三年而已。

译面试中遇多年后被裁的候选人,多来自大厂和金融业,普遍状态消极迷茫。作者认为裁员主要是行业与公司的问题,而非个人能力。建议明确指向AI领域:学习AI并实践,通过开源和个人IP积累经验。即使此前无AI背景,也不必过度纠结,起步仅晚三年而已。

Chubby♨️@kimmonismus · 5月21日38

Der Spiegel, arguably Germany's best-known news outlet, has published an article that couldn't be more emblematic of the mood in Germany. Translated, it reads: "The Nobel laureate in Literature admits to using AI for her books. Is that a scandal?" Let that sink in for a second, to let the absurdity of the question sink in. A scandal is a sensational event or behavior that causes widespread public outrage and moral indignation. So the question is whether the use of AI in writing books is *in itself* scandalous, that is, grounds for moral outrage. The question of the purpose of the use, the content, isn't even raised; no criticism is even considered. Instead, the article directly asks about the value of moral condemnation simply because the use of AI is being discussed. Germany in a nutshell. Moral outrage replaces criticism. German Angst in the face of AI.

译德国《明镜周刊》以“诺贝尔文学奖得主使用AI写作是否构成丑闻”为题发表文章,引发讨论。推文作者指出,该标题直接跳过对AI用途与内容的具体探讨,仅聚焦于“使用AI”这一行为本身是否应受道德谴责,反映出德国社会对AI的普遍焦虑与批判性思维的缺失。作者认为,这种将技术应用简单道德化的倾向,体现了德国舆论场中“道德义愤取代实际批评”的典型现象。

ginobefun@hongming731 · 5月21日27

创作的门槛在降低,吸引注意力的难度在飙升

Chubby♨️@kimmonismus · 5月21日53

Google I/O is coming to an end, and it has been nothing less than one of the most impressive moments of my life. Why? First, simply because I had the privilege of being there in person while some of the brightest minds in the world talked about the future of AI and the direction technology is taking. Google I/O may officially be Google’s annual developer conference, but this year it felt like everything revolved around one central theme: AI. There was almost no product, no category, no part of the Google ecosystem that was not being reshaped, extended, or reimagined through AI. More than that, AI felt like the gravitational center of nearly every release. I tried to attend as many sessions as possible. In humanoid robotics, people are now talking about "physical AGI." Demis Hassabis, CEO of Google DeepMind, spoke about the possibility that we may be on the cusp of a new golden age of scientific discovery, with AI helping us make progress toward solving some of the hardest problems in medicine and science. And agentic AI showed, once again, how AI is becoming more proactive, more capable, and more deeply integrated into the way we work, build, and create. But beyond the announcements, what affected me most was the feeling of being there. I have rarely felt such a strong sense of optimism, enthusiasm, and genuine excitement about what is coming next. There was this almost physical feeling of momentum: the sense that we are not just watching a technological revolution unfold, but that we have the opportunity to participate in it, shape it, and help explain it to the world. (Something im really missing in germany/europe) I cannot even count how many fascinating conversations I had, how many wonderful and incredibly intelligent people I was able to meet, and how much I learned in just two days. The atmosphere was full of joy, curiosity, and ambition - and somehow, it felt like everyone was welcome. What made it even more special for me were the conversations I had on camera with remarkable people from Google, including Robby Stein, VP of Product at Google Search, Paige Bailey and Omar Sanseviero from Google DeepMind, Logan Kilpatrick, Product Lead for Google AI Studio and the Gemini API, Lizzie Tao from the NotebookLM team, and, most personally meaningful to me, Demis Hassabis. I could never have imagined that one day I would meet him in person. These two days will stay with me for a very long time. Tomorrow, I am heading back to Germany. But honestly, not for long. From May 31, I will already be back in San Francisco for Microsoft Build, and hopefully I will get the chance to meet even more people I have not had the opportunity to meet yet. My journey is only just beginning. Thank you for being part of it.

译Google I/O 2025全面聚焦AI,几乎重塑了所有产品与生态。现场探讨了“物理AGI”与主动式AI等前沿方向,DeepMind CEO Demis Hassabis提出AI或将推动科学发现的黄金时代。活动洋溢着强烈的乐观与参与感,作者与多位Google高管深入交流,尤其与Hassabis的会面令人难忘。从美国到欧洲,作者正踏上科技探索的新旅程。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月23日
01:26
Chubby♨️@kimmonismus
59
让我们稍作思考。 DeepSeek v4 pro 降价75%。永久有效! 输入:$0.43 输出:$0.87 如果你读过 DeepSeek v4 的技术论文,就会知道这个模型在效率方面表现惊人。 相比 v3.2,它仅需 27% 的算力和 10% 的缓存。SemiAnalysis 写了一篇很好的文章。 DeepSeek 现在专注于成本/token 效率。

DeepSeek: We are making our discount permanent! 🎉 Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life! 🚀

DeepSeek大佬观点开源生态
01:21
Yuchen Jin@Yuchenj_UW
14
给我MYTHOS 给我MYTHOS 给我MYTHOS 给我MYTHOS 给我MYTHOS 我厌倦了照顾这些愚蠢的大语言模型…….
大佬观点
00:56
Rohan Paul@rohanpaul_ai
67
世界模型:AI突破语言局限的关键

Demis Hassabis指出当前AI的局限在于语言能描述世界,但无法“包含”世界。尽管语言模型从文本中学到了比预期更多的现实结构,但文本终究是经验的压缩残留。真正的智能不仅在于回答问题,更在于理解行动的后果。世界模型旨在学习物理现实的隐藏语法,例如物体持续性、力的作用和空间变化。这种学习试图在信息被语言化之前捕捉世界的本质,从而让AI不仅能解释,更能预测行动带来的直接影响。

DeepMind大佬观点推理
5月22日
23:56
Chubby♨️@kimmonismus
39
我只能重申昨天说过的话:只要对AGI没有统一定义,讨论AGI何时实现就毫无意义。尤其是当每个人都有自己的定义时。

Polymarket: NEW: Marc Andreessen declares AGI was achieved three months ago.

大佬观点现象/趋势
23:14
Nathan Lambert@natolambert
42
任何国家的"开源冠军"头衔,都是通过与社区合作赢得的,而非靠融资强加。
大佬观点开源生态
21:56
Rohan Paul@rohanpaul_ai
63
Dario Amodei谈人们与AI建立情感关系。 这已成现实,AI可以成为"肩上的天使",但也可能带来危险。
Anthropic大佬观点安全/对齐
20:26
Chubby♨️@kimmonismus
41
六月将是巨大的一个月。 - Gemini 3.5 pro(已确认) - GPT-5.6(传闻中,但发布可能性很高) 仍在等待官方公告 Claude Sonnet 4.8(Claude-Code-/Source-Map-Leak)
GoogleOpenAI大佬观点模型发布
19:56
Rohan Paul@rohanpaul_ai
53
Marc Andreessen 描述 AI:"我们已将沙子转化为思想。这可能是人类历史上最具革命性的技术。" 沙子 → 硅 → 芯片 → 数据中心 → 电力 → AI → 思想
大佬观点现象/趋势
19:26
Rohan Paul@rohanpaul_ai
60
谷歌2022年曾接近推出类ChatGPT产品

谷歌CEO桑达尔·皮查伊透露,公司在2022年已基于LaMDA模型开发出接近ChatGPT的产品,但因输出内容存在毒性且不符合内部质量标准而未能广泛发布。皮查伊指出,公司存在“搜索质量偏见”,对产品的可靠性和安全性设有更高门槛。LaMDA模型并非仅停留在研究阶段,谷歌曾通过AI Test Kitchen进行有限测试。他补充道,从后视镜看,OpenAI的成功在当时并非显而易见,这使得谷歌的决策过程更为复杂。

GoogleOpenAI大佬观点行业动态
19:16
AYi@AYi_AInotes
61
2026或成长周期智能体元年,AI效率为何难累加?

红杉AI Ascent 2026闭门峰会提出,“长周期智能体”将成为2026年的商业定义。但这引发了“AI生产力悖论”:尽管Cursor、Claude、NotebookLM等AI工具显著提升了个人效率,但这些工具的“记忆”绑定于个人账号和设备,无法迁移、共享或在团队间累积。因此,个体效率的提升难以转化为组织层面的生产力增益,每个员工都像一座座彼此孤立的“信息孤岛”。

AYi: http://x.com/i/article/2057668634579714048

智能体大佬观点
14:14
AYi@AYi_AInotes
64
AI生产力悖论:个体在飞,组织在塌

本文指出当前AI应用存在一个“生产力悖论”:个人使用AI工具效率大幅提升,但组织整体效能却未同步增长。核心原因在于,组织普遍缺乏有效的“记忆系统”,导致大量时间(据MIT报告超30%)被消耗在重复构建上下文中,使个体提升的效率无法在组织层面累加与沉淀。MIT报告显示,高达95%的企业AI投入未产生可衡量回报。作者认为,未来竞争的关键不在于使用最强的AI模型,而在于构建最深厚的“组织记忆”,将对话、决策等资产系统化沉淀,这比单纯追求工具本身更为重要。

智能体其他大佬观点
14:05
Greg Brockman@gdb
17
试图回忆在Codex出现之前编程是什么感觉
OpenAI大佬观点编码
13:43
Tibo@thsottiaux
22
Codex是我们的WorkGPT。
OpenAI大佬观点
13:19
Ethan Mollick@emollick
40
有趣的是,整个"草莓"事件(后来证实是o1-preview)在发布时被斥为过度炒作,但事后看来,它其实被严重低估了。 从模型连基础数学都不会,到18个月内解决未解数学问题,这是一条清晰的进化路径。
OpenAI大佬观点推理
12:49
Ethan Mollick@emollick
64
我想稍微反驳一下:因为模型如此出色且不断进步,它们不必成为产品本身。 但模型才是主要的驱动力。如果它们没有如此全面的能力,实验室围绕它们构建的框架和应用程序将难以构建,也无法正常工作。

Greg Brockman: the model alone is no longer the product

大佬观点现象/趋势
12:05
Greg Brockman@gdb
65
模型本身已不再是产品
OpenAI大佬观点现象/趋势
10:12
宝玉@dotey
77
Cloudflare裁员千人换AI,CEO撰文解释"腾笼换鸟"逻辑

Cloudflare裁员约1100人,同时招聘近似数量的实习生。CEO在《华尔街日报》撰文,引用德鲁克理论,指出AI主要替代从事审计、财务、中层管理等结构化工作的“度量者”,而工程师与销售人员影响较小。公司已将审计转向AI驱动,财务流程得以优化。大量实习岗位被视为面向“AI原生代”。财报显示公司当季亏损,且因裁员产生高额重组费用,消息公布后股价一度大跌超20%。

大佬观点现象/趋势行业动态
关联讨论 1 条Hacker News 热门(buzzing.cc 中文翻译)
08:13
Berryxia.AI@berryxia
25
Apple Vision Pro新应用实现沉浸式汽车设计协作

Apple Vision Pro发布「Immersive for Autodesk VRED」应用,让设计师佩戴设备后围绕等身大虚拟汽车模型沉浸式走动观察,并与远程同事实时协作评审。该技术将设计会议升级为高临场感共同作业,展现了空间计算改变工作模式的潜力。

Sadao Tokuyama: Apple Vision Pro向けアプリ「Immersive for Autodesk VRED」が配信開始。 KIA Motorsの事例にあるよう、MRを活用した等身大での協調的な自動車デザインレビューを可能にし、リモート会議を没入感の...

其他大佬观点
08:07
Orange AI@oran_ge
35
用户吐槽AI模型发布信息不透明

用户批评部分AI模型厂商在发布新模型时,未公开关键基本信息,如Qwen Max 3.7 Max的参数规模、定价,以及Gemini Omni的价格。这些基础信息缺乏公开透明,导致用户难以通过常规搜索获取,需额外花费时间查询官网,影响了信息获取效率与体验。

Google大佬观点
05:26
François Chollet@fchollet
64
每当AI告诉我"你完全正确"时,我对它的信任就会下降一点。
大佬观点
05:13
Ethan Mollick@emollick
68
我们目前算力相当短缺,这将导致复杂智能体工作流的算力成本变得非常高昂,即使单轮聊天机器人的成本在下降。因此,最富有的公司和最紧迫的用例将使用AI智能体,而其他人将只能使用聊天机器人?
大佬观点推理
05:12
Emad@EMostaque
39
当前数学知识总量庞大,导致研究者往往深耕于极其狭窄的专业领域,形成知识壁垒。这为AI创造了独特价值:AI能够跨越人类专家间的知识鸿沟,连接不同数学分支乃至跨学科领域,从而发现少数人类个体难以企及的解决方案。推文以物理学为例指出,对时空代数等专业工具的深度掌握能揭示如光速有限等深刻见解,这正体现了专精的价值,而AI有望系统性地实现这种跨领域的知识整合与创新。

Jay Cummings: Today there is so much math known that mathematicians often have a very narrow speciality. This gives AI potential to co...

大佬观点推理
04:56
Chubby♨️@kimmonismus
63
Anthropic营收反超OpenAI,AI竞赛转向盈利竞赛

Anthropic在2026年Q1营收约47亿美元,虽低于OpenAI的57亿美元,但其年化收入近期已跃升至450亿美元,远超OpenAI的250亿美元。这得益于Anthropic在Q2的月度收入翻倍以上,并预计实现约6亿美元的首次运营利润。相比之下,OpenAI处于亏损状态,ChatGPT用户增长未达预期,同时仍在大规模融资。这表明AI竞争的关键已从模型发布速度转向谁能建立可持续的商业模式。

AnthropicOpenAI大佬观点行业动态
04:43
elvis@omarsar0
59
新视频:从LLM维基到LLM工件 分享了我对LLM维基和HTML工件为何重要的全部思考。 此外,还有新工具可帮助你用智能体构建维基和工件。 这只是个开始!
智能体大佬观点
04:26
Rohan Paul@rohanpaul_ai
41
Dario Amodei向Oprah解释AI安全如何与商业需求、日常部署、访问控制和政策权衡交织在一起。严格的儿童安全规则(例如)可以保护儿童,但当系统无法清晰区分情况时,会恶化成人使用体验。
Anthropic大佬观点安全/对齐
03:36
swyx🛬 SFO@swyx
33
所有从事AI基础设施*的人终于都赚得盆满钵满,看到他们成功真是太好了 *不是那些性感的AI研究工作,只是"无聊"的基础设施
大佬观点部署/工程
03:26
Rohan Paul@rohanpaul_ai
62
阿里云的 Qwen 3.7 Max 在编码与智能体(Agent)能力上已非常接近前沿模型,并现已在 AI/ML API 平台上线。根据 Artificial Analysis 的评测,其智能体可靠性排名第五,性能与 GPT 5.4 (xhigh) 相当,并略高于新发布的 Gemini 3.5 Flash。AI/ML API 将其定位为面向智能体时代的模型,突出其能支持超过35小时的自主执行,并兼容 Claude Code 等工具。平台还提供了包括 GPQA Diamond(92.4分)在内的基准测试成绩,并为用户提供免费试用码。

AI/ML API: Qwen3.7-Max on AI/ML API - built for the agent era GPQA Diamond (92.4), HMMT (97.1), Apex (44.5) Sustains 35+ hours of a...

智能体大佬观点编码
02:56
François Chollet@fchollet
36
我们正走向一个"应用"或"用户界面"概念消失的世界。应用将变为服务,界面将变为文本框。
大佬观点现象/趋势
02:44
Sundar Pichai@sundarpichai
同事件精选72
谷歌CEO Sundar Pichai在I/O大会上与MatthewBerman进行了深入对话,全面探讨了当前人工智能发展的多个核心方面。Pichai重点关注了AI代理如何可能取代部分互联网功能,并改变用户的信息获取方式,甚至威胁原始互联网的形态。对话还深入讨论了开源AI模型面临的商业模式困境、中美在AI领域的激烈竞争格局,以及网络安全威胁,包括AI可能引发的攻击和谷歌的应对策略。此外,Pichai指出谷歌正面临巨大的AI算力需求,计算资源已成为主要瓶颈,并探讨了发布强大AI模型的阈值判断问题。他强调了谷歌致力于开发低成本、高效率的AI模型的原因,以应对资源挑战。整体而言,这次对话覆盖了AGI竞赛、AI代理、信息饮食等关键议题,深入分析了AI发展的挑战、机遇和未来趋势。

Matthew Berman: Sundar Pichai (@sundarpichai), Google CEO, on: 🔹Race to AGI 🔹Agents 🔹AI & Information Diet 🔹Open Source 🔹Cybersecur...

智能体Google大佬观点安全/对齐
同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》
推荐理由:Sundar 罕见聊了不开源大模型、算力瓶颈和中美 AI 生态风险,不是 PR 套话,做基础设施和战略的人值得看。
02:13
Ethan Mollick@emollick
69
我认为没有人能直观地理解这意味着什么,而这种想象力的缺失对规划、投资和政策制定通常都是不利的。 我也没有简单的解决方案(有趣的是,AI在想象AI未来方面已经老套了,所以也帮不上忙)

Santi Ruiz: The models are just going to keep getting better and better and better and better. It's not easy to get one's head aroun...

大佬观点现象/趋势
01:26
Rohan Paul@rohanpaul_ai
74
OpenAI为何放弃非营利架构?算力需求成关键转折点

Greg Brockman 回忆 OpenAI 于 2017 年意识到实现 AGI 需要巨大的算力投入,例如 Cerebras 的硬件及大型数据中心。非营利性质的融资能力存在上限,无法满足这一需求。因此,Elon Musk、Sam Altman、Ilya Sutskever 和他一致认为,必须创建营利性实体才能确保获得足够资源,这是实现 AGI 使命的唯一途径。

OpenAI大佬观点
5月21日
22:42
Ethan Mollick@emollick
55
在科学领域,AI在寻找值得解决的有趣问题方面仍然表现不佳,尤其是在那些没有已知问题清单的领域。 这一直是博士培养中最难教授的能力:否则你只能找到小问题,或是那些无法推动领域发展、无法泛化的问题等。
大佬观点论文/研究
21:56
Rohan Paul@rohanpaul_ai
69
澄清AI数据中心用水误解

Greg Brockman指出,公众对AI数据中心用水量的认知存在偏差,主要源于混淆了“取水量”与“耗水量”。他解释,现代数据中心多采用闭环冷却系统,如同“密封水池”,水在系统内循环吸热,而非像“流水龙头”般持续消耗新鲜水源。因此,系统可容纳大量水,但日常补充的新鲜水很少。OpenAI的Stargate项目博客也证实,其站点采用闭环冷却,全面运行后年耗水量仅相当于一栋办公楼或约四个家庭的用水量。公众辩论常因不了解冷却技术差异而过度简化。

Naval: The latest IQ test involves data centers and water.

OpenAI大佬观点部署/工程
21:26
Rohan Paul@rohanpaul_ai
66
"我认为我们将在某些类别中雇佣更多AI人才,而减少银行家数量,并让他们更高效。" --摩根大通CEO杰米·戴蒙 "所以当你早上起床想面试某人时,它会整理出我在14个不同场合说过的话,并提供问题。你的工作职责不变,只是执行工作时会变得更聪明。" --来自"Bloomberg Podcasts" YouTube频道
大佬观点现象/趋势
20:56
Rohan Paul@rohanpaul_ai
64
OpenAI的通用推理模型近期通过连接代数数论与平面几何,成功解决了保持数十年的平面单位距离猜想(Erdős猜想)。关键突破在于模型并非专用定理证明引擎,其成功依赖于延长和深化测试时计算过程,而非仅增加训练数据。这一进展表明前沿大模型已蕴含潜在的数学研究能力,当前瓶颈部分源于模型被允许"思考"的时间和方式。未来方向不是AI取代人类判断,而是在人类判断开始前拓宽思维的疆域,从而推动科学发现与创新。

Rohan Paul: AI in math is creating history again, as OpenAI's general-purpose reasoning model has disproved a major Erdős conjecture...

OpenAI大佬观点推理
20:11
Berryxia.AI@berryxia
3
用户完成了高强度训练,对线上教练的远程服务表示满意。该教练通过网络监督锻炼数据并随时沟通健身问题,提供了便捷专业的指导。用户同时表达了对长期食用健身餐的厌倦。整体体验体现了线上健身指导的灵活性和实时互动优势。

Berryxia.AI: http://x.com/i/article/2056641313874083840

大佬观点
19:34
meng shao@shao__meng
27
资深编辑建议:被裁后应转向AI赛道,边学边做开源与个人IP

面试中遇多年后被裁的候选人,多来自大厂和金融业,普遍状态消极迷茫。作者认为裁员主要是行业与公司的问题,而非个人能力。建议明确指向AI领域:学习AI并实践,通过开源和个人IP积累经验。即使此前无AI背景,也不必过度纠结,起步仅晚三年而已。

其他大佬观点行业动态
18:56
Chubby♨️@kimmonismus
38
德国媒体对AI写作的道德恐慌引发争议

德国《明镜周刊》以“诺贝尔文学奖得主使用AI写作是否构成丑闻”为题发表文章,引发讨论。推文作者指出,该标题直接跳过对AI用途与内容的具体探讨,仅聚焦于“使用AI”这一行为本身是否应受道德谴责,反映出德国社会对AI的普遍焦虑与批判性思维的缺失。作者认为,这种将技术应用简单道德化的倾向,体现了德国舆论场中“道德义愤取代实际批评”的典型现象。

其他大佬观点
16:27
ginobefun@hongming731
27
创作的门槛在降低,吸引注意力的难度在飙升

Lenny Rachitsky: Creating is becoming easier. Getting people's attention is getting harder.

大佬观点现象/趋势
13:14
Chubby♨️@kimmonismus
53
Google I/O亲历:AI浪潮中的震撼与希望

Google I/O 2025全面聚焦AI,几乎重塑了所有产品与生态。现场探讨了“物理AGI”与主动式AI等前沿方向,DeepMind CEO Demis Hassabis提出AI或将推动科学发现的黄金时代。活动洋溢着强烈的乐观与参与感,作者与多位Google高管深入交流,尤其与Hassabis的会面令人难忘。从美国到欧洲,作者正踏上科技探索的新旅程。

Google大佬观点
‹ 上一页
1…3031323334…50
下一页 ›