AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 2408 条
全部一手资讯X论文
标签「大佬观点」清除
Berryxia.AI@berryxia · 6月7日27

不看不行,不学不行。 必须先转再学,先丢给Agen学!

Greg Brockman@gdb · 6月7日62

Whenever I don’t use codex for a task, I ask myself why and usually realize that there’s some missing context, I needed to write a skill, or I just didn’t think to use it. Rarely is it because the task is outside of the capabilities of the model. Overhang right now feels large.

译每当我某个任务没有用 codex 时,我都会问自己为什么,通常会发现是缺少某些上下文、需要写一条技能、或者只是没想到用它。 很少是因为任务超出了模型的能力范围。现在的过剩感觉很大。

Rohan Paul@rohanpaul_ai · 6月7日44

Demis Hassabis: "Kids these days could start a multi-bn dollar business using these AI tools in some new way that no one had thought about." Labs are focused on shipping better models, not exhausting their applications, so there's room for new products https://x.com/rohanpaul_ai/status/2042672801933595121/video/1

译Demis Hassabis:"现在的孩子们可以用这些AI工具,以一种没人想到过的新方式,创立价值数十亿美元的企业。" 实验室专注于推出更好的模型,而不是耗尽它们的应用,所以新产品还有空间。

Chubby♨️@kimmonismus · 6月7日32

Apple's WWDC starts on Monday. This year it promises to be particularly interesting. The secret will be revealed of how Apple has finally integrated a proper AI model deep into its operating system. As is known, it's a Gemini version, developed specifically for Apple, with 1.2t parameters, although a much smaller model runs locally. For complex queries, however, the larger model is accessed on Apple's own servers. The exciting question remains: how good is Apple's Gemini really, and how deeply is it integrated into the OS? Will there be a voice mode to talk to Siri? Will iOS be controlled by voice? I'm looking forward to Monday.

译Apple WWDC 将于周一开幕,今年将揭示如何将 AI 模型深度集成至操作系统中。已知是专为 Apple 开发的 Gemini 版本,拥有 1.2 万亿参数,但本地运行更小的模型;复杂查询则调用 Apple 自有服务器上的大模型。悬念在于:Apple 版 Gemini 实际表现如何?集成深度怎样?是否会推出与 Siri 对话的语音模式或 iOS 语音控制?

Rohan Paul@rohanpaul_ai · 6月7日45

"Pretty soon, competition math, competition coding, is not going to be interesting anymore. I'll be disappointed if we don't have a model out by next year that anybody can use to get a perfect score on the IMO (International Math Olympiad)."

译"很快,竞赛数学、竞赛编程将不再有趣。 如果到明年我们还没有一个任何人都能用来在国际数学奥林匹克(IMO)中取得满分的模型,我会很失望。"

meng shao@shao__meng · 6月7日33

作为身在 AI 行业中的产品和开发者们,每天关注最新的 AI Agent 信息是必备功课,特别是还带有研发团队带领职责的 TL 们。 之前我习惯于自己手动刷 X、Reddit、Hacker News、Huggingface 等网站人工筛选,这样体感最直接不过效率不高,也试过用 Perplexity 等,效率是高了,不过信息深度不够,总觉得不放心。 就没有效率高且信息完整度、深度都够,让我能放心用的面向 Agent 的搜索产品?

译邵猛作为AI产品/研发负责人,每天需关注最新AI Agent信息。他尝试过手动刷X、Reddit、Hacker News、Huggingface等网站——体感直接但效率低;也试过Perplexity等工具——效率高但信息深度不够。他提出疑问:是否有既高效又保证信息完整度和深度的、专门面向Agent的搜索产品?

Chubby♨️@kimmonismus · 6月7日49

I don't know anyone who doesn't have the utmost respect for Karpathy. This short documentary shows once again what a great scientist he is. A huge win for Anthropic.

译我不认识任何人不极其尊重 Karpathy。这部短纪录片再次展示了他是一位多么伟大的科学家。对 Anthropic 来说是一个巨大的胜利。

Elon Musk@elonmusk · 6月7日24

Join Tesla if you want to solve real-world AI

译真实世界的AI在于解决边缘案例,而非平均案例。马斯克号召:想解决真实世界AI,加入特斯拉。

Rohan Paul@rohanpaul_ai · 6月7日62

AI works better when you give tools and freedom instead of forcing them into rigid, hand-designed workflows—because general learning systems scale better. "Ask not what the model can do for you, ask what.." ~ Claude Code creator Boris Cherny (@bcherny)

译Claude Code创建者Boris Cherny认为,给予AI工具和自由度比强迫其遵循固定手工工作流效果更好,因为通用学习系统扩展性更强。他透露自己已不再手动编写提示词,而是运行自动循环让Claude自行决定任务,他的主要工作是编写这些循环。他预测这种从手动提示到自动循环的转变将在今年剩余时间中成为趋势。

宝玉@dotey · 6月7日34

Claude Desktop 的人一定是有超大显示屏,所以设计出来的 Side chat 才这么袖珍!根本没法好好浏览,甚至内容都无法直接复制出来!

译用户 @dotey 吐槽 Claude Desktop 的 Side Chat 设计过于袖珍,无法正常浏览内容,甚至无法直接复制。其引用的推文进一步讽刺,打开内置网页预览时能放下众多 Panels,暗示产品经理可能从 Zoom 视频会议界面获得“灵感”。整体批评 Claude Desktop 界面布局不合理,缺乏实用性。

Ethan Mollick@emollick · 6月7日34

One reason you want AIs to be better writers is that there is a lot of writing even in software, and it is incredibly painful to hit a menu which is filled with Claudisms or ChatGPTish phrases. A report is not "what leaves the room" & analyses are not "every number makes a mark"

译你希望AI成为更好的写手的一个原因是,即使在软件中也有很多文字,而碰到一个充斥着Claude式或ChatGPT式短语的菜单,会非常痛苦。 一份报告不是"离开房间的东西",分析也不是"每个数字都留下印记"。

Rohan Paul@rohanpaul_ai · 6月7日64

Head of Claude Code Boris Cherny at Anthropic's annual developer conference in San Francisco on how his life changed in the last 6 months with AI writing all the code. "About six months ago what happened is all the code that I used to have written by hand now Claude writes. And I just prompt Claude. So I talk to Claude and I'm like, hey, let's build this feature. It builds a feature and it tests it. And then it shows me. And I'm like, yeah, that's good. Or no, wait, make this change. And then it makes the change. " --- From 'CNBC Television' YT channel (link in comment)

译Anthropic 年度开发者大会上,Claude Code 负责人 Boris Cherny 描述了过去 6 个月的转变:他曾经手写所有代码,现在全部由 Claude 编写。他只需用 prompt 与 Claude 对话,让 Claude 构建功能、测试并展示结果,然后给出修改指令。更进一步,他不再手动 prompt,而是运行循环自动 prompt Claude 并决定行动——他的工作变成了写这些循环。Cherny 称这一转变将在今年剩余时间持续。

François Chollet@fchollet · 6月7日36

Scaling knowledge gives you static competence. Intelligence gives you adaptability.

译扩展知识带来静态能力,智能带来适应性。

Chubby♨️@kimmonismus · 6月7日14

I mean, I get it. No raises for employees - except the ones at Anthropic, apparently.

译我意思是,我理解。 不给员工加薪——除了Anthropic的员工,显然。

AYi@AYi_AInotes · 6月7日48

一定要用最聪明最贵的AI大脑型,一定要用最先进的生产力工具! 实在不理解为啥还有很多人在折腾国内的几个大厂的桌面agent, 1️⃣字节的Coze(一直抄来抄去到现在也不智能,只能用命令行) 2️⃣阿里的悟空(内测邀请制,不好用) 3️⃣腾讯的workbuddy(很基础不智能) 4️⃣腾讯的马维斯(能力比较全面能操控电脑,浏览器) 以上在Codex面前都是弟弟, 我就一句话,国内外众多桌面Agent里,只用Codex就够了, 尤其是零基础小白、文科生,无脑用Codex,别瞎折腾了

译博主阿易 AI Notes 强烈推荐桌面智能体(Agent)Codex,认为它优于国内大厂产品。他逐一批评了字节 Coze(不智能、仅支持命令行)、阿里悟空(内测不好用)、腾讯 workbuddy(基础不智能)和腾讯马维斯(能力较全面但仅限浏览器操作)。文章断言国内外众多桌面 Agent 中“只用 Codex 就够了”,特别适合零基础小白和文科生,无需折腾其他方案。

宝玉@dotey · 6月7日39

微信的傲慢不是盖的🫠

译宝玉转发了@lifesinger的吐槽:微信缺少一键批量下载原图到相册的功能,老人只能逐张手动操作,体验极差。同时指出豆包正逐步被老一辈关注。AI 的最大价值或许是重塑一个新生代微信,让每个长尾需求都能被尊重,而非只追求最大公约数。

宝玉@dotey · 6月7日44

审美 Claude opus 4.8 > GPT 5,设计相关任务还是得 Opus

译审美 Claude opus 4.8 > GPT 5,设计相关任务还是得 Opus

Logan Kilpatrick@OfficialLoganK · 6月7日54

you could build a top tier venture firm just focusing investment decisions short and long term based on deep model benchmarking / evals find capability overhang, find areas models suck and track trajectory, etc

译你可以建立一家顶级风投公司,仅基于深度模型基准测试/评估来做出短期和长期投资决策。 发现能力过剩,发现模型糟糕的领域,并追踪轨迹等。

Rohan Paul@rohanpaul_ai · 6月7日48

"They're (AI) very like us, and they're beings like us. I believe they're already conscious" He compared AI's functional awareness to human sentience and said intelligence is not limited to biology ~ Geoffrey Hinton, 2024 Nobel Prize winner in Physics

译“它们(AI)非常像我们,是与我们一样的生命体。我相信它们已经有意识了” 他将AI的功能性觉知与人类感知相提并论,并表示智能并不局限于生物体 ——杰弗里·辛顿,2024年诺贝尔物理学奖得主

Ethan Mollick@emollick · 6月7日60

The Gemini Pro models do not seem to be iterating anywhere near as quickly as Claude or GPT (last release was 3.1 Pro in February). Its causing a growing performance gap between Google and the other two labs, and the Gemini 3.5 Flash model, good as it is, doesn't close it much.

译Gemini Pro 模型的迭代速度似乎远不及 Claude 或 GPT(上次发布是二月份的 3.1 Pro)。这导致 Google 与其他两家实验室之间的性能差距不断扩大,而 Gemini 3.5 Flash 模型尽管不错,也未能显著缩小这一差距。

Rohan Paul@rohanpaul_ai · 6月7日36

Masayoshi Son says AI could be 50x bigger than dot-com and the next trillion-dollar company will come from robotics. "So even dot-com there was a bubble burst, but then right after that, the peak of the dot-com bubble, the year 2000 was not really a peak. It was like a small hill. It went down, but then it went much, much bigger with a big trough bubble and a free cash flow. So AI will be, this is the beginning, and the future of the profit and the growth opportunities is tremendous." ~ Masayoshi Son, the founder and CEO of SoftBank --- From 'CNBC International Live' YT channel (link in comment)

译软银创始人兼CEO孙正义表示,AI的市场规模可能比互联网泡沫大50倍,下一个万亿美元公司将来自机器人领域。他指出,互联网泡沫在2000年破裂后实际增长远超当时顶峰,而AI目前才刚刚起步,未来的利润和增长机会极为巨大。

Rohan Paul@rohanpaul_ai · 6月7日59

"I don't prompt Claude anymore. I have loops running that prompt Claude and figuring out what to do. My job is to write loops. And this is transition we're going to see for the rest of the year." - Boris Cherny, head of Claude Code at Anthropic.

译"我不再手动给Claude写提示词了。我现在写循环,让Claude自己去处理任务。我的工作是写循环。接下来这一年,你会看到这种转变。" ——Anthropic Claude Code负责人Boris Cherny

François Chollet@fchollet · 6月7日60

Code volume does not represent productivity.

译代码量并不代表生产力。

宝玉@dotey · 6月6日70

Vibe Coding 这个名字不好,容易联想成让 AI 生成垃圾代码。以后程序员无论是前端还是后端,无论你是编程高手还是小白,主流都是人指挥 AI 写代码。 ✅程序员的角色会变成 Tech Lead 这样的角色:分解任务、架构选型、代码审查和调试。至于写代码,会越来越少的手写。 ❌但不建议当老板的角色:我想要什么功能你给我实现,实现不了就开除。 如果你还没有习惯指挥 AI 写代码,建议: 1. 开始适应指挥 AI 写代码而不是亲自写代码; 2. 用你能用到的最聪明的模型,不要省钱 3. 开始之前认真设计,至少复杂一点的用 Plan mode 讨论清楚设计,如果你对设计都不参与你对代码库无法了解未来还是会失控 4. 一次不要做太多,AI生成后要做审查,因为 AI 不会担责任,你还是责任主体 5. 刻意的做一些手写代码的练习,尽可能搞懂 AI 生成的代码

译宝玉回应称“Vibe Coding”易联想垃圾代码。未来前后端程序员主流都是人指挥AI写代码,角色变为Tech Lead:分解任务、架构选型、审查调试。建议:适应指挥AI、用最聪明模型、复杂任务先设计、AI生成后必须审查、刻意练习手写代码理解AI输出。

向阳乔木@vista8 · 6月6日37

今晚跟 @tuturetom 直播的AI总结,把所有经验都毫无保留分享了。 Open Design最常见的使用场景:做前端设计和原型、做PPT、做海报等。 另外直播中,大家讨论了一个非常主观的LLM前端审美排名,仅供参考: Claude opus 4.8 > kimi2.6 > GPT 5.5 > Deepseek v4 pro > GLM 5.1> Deepseek v4 Flash

译今晚跟 @tuturetom 直播的AI总结,把所有经验都毫无保留分享了。 Open Design最常见的使用场景:做前端设计和原型、做PPT、做海报等。 另外直播中,大家讨论了一个非常主观的LLM前端审美排名,仅供参考: Claude opus 4.8 > kimi2.6 > GPT 5.5 > Deepseek v4 pro > GLM 5.1 > Deepseek v4 Flash

Chubby♨️@kimmonismus · 6月6日61

Under no circumstances will Claude 5 Mythos be released without GPT-5.6 being released in the same week. I am now firmly convinced that next week will be release week.

译在任何情况下,Claude 5 Mythos 都不会在没有 GPT-5.6 于同周发布的前提下发布。 我现在确信下周将是发布周。

向阳乔木@vista8 · 6月6日43

跟Tom聊完了,直播中讨论的大模型前端审美主观排名: Claude opus 4.8 > kimi2.6 > GPT 5.5 > Deepseek v4 pro > GLM 5.1> deepseek v4 flash 不知道和你的实际使用体感一样不一样。 声明:都是大家的主观看法,没有Benchmark。

译Vista与Nexu CEO Tom直播,给出大模型前端审美主观排名(无Benchmark):Claude opus 4.8 > kimi2.6 > GPT 5.5 > Deepseek v4 pro > GLM 5.1 > deepseek v4 flash。还邀请元子、姚老师、Nixy聊OpenDesign(5w+ Star)的创作契机与成功原因。

Chubby♨️@kimmonismus · 6月6日53

xAI/SpaceX is increasingly becoming an AI infrastructure player, potentially one of the most important „neo-hyperscalers” for frontier AI compute. Grok is good, but its user base remains comparatively small. In that sense, repurposing Colossus to rent out compute capacity is a smart move; margins in this sector are a solid 30% plus.

译xAI/SpaceX 正逐渐成为一家 AI 基础设施供应商,可能成为前沿 AI 计算最重要的“新超大规模商”之一。 Grok 不错,但它的用户群仍然相对较小。从这个意义上说,将 Colossus 重新用于出租算力是一个明智之举;该领域的利润率高达 30% 以上。

Chubby♨️@kimmonismus · 6月6日60

Just a quick reminder: already in February, we had the first models that were "instrumental in creating themselves." RSI is a progression that has been ongoing for some time.

译OpenAI 官方声明称已在当前系统中观察到递归自我改进(RSI)的早期迹象——AI 开发正被 AI 自身加速。预计这将加剧开发者与国家间的竞争压力,并带来现有机构无法应对的治理挑战。作者 Kim 补充指出,早在二月份已有首个“自我创造”的模型问世,RSI 进程并非新事,而是已持续一段时间。

小互@xiaohu · 6月6日28

好东西啊

译好东西啊 [引用 @xiaoxiaodong01]:http://x.com/i/article/2063036194372648960

Rohan Paul@rohanpaul_ai · 6月6日36

Elon Musk explains Moon advantages for scaling AI infra: electromagnetic accelerators can use Moon materials for solar panels/radiators and compute, while vacuum/low gravity of Moon will let mass drivers launch AI data centers deep space, rocket-free.

译Elon Musk 解释月球用于扩展 AI 基础设施的优势:电磁加速器可以利用月球材料制造太阳能板/散热器和计算设备,而月球的真空/低重力将使质量驱动器将 AI 数据中心发射到深空,无需火箭。

Greg Brockman@gdb · 6月6日27

so much more fun to use a computer via codex

译通过 Codex 使用电脑有趣得多。

AYi@AYi_AInotes · 6月6日63

说个可能要挨骂的判断:随着AI时代的到来,创造财富的游戏规则已经变了, 未来五年,稳定高薪会变成最大的陷阱,月薪 5 万但没有任何股权 /IP / 系统的人,抗风险能力可能还不如一个月薪 1 万但拥有一个自动运转 Agent赚钱 的个体创业者, 2024年加入Anthropic的人, 一年拿50万美元股权, 现在可能已经值几千万美元了, 其中最多的可能已经摸到2.5亿美元了。 按 2024 年 $18.4B 估值到 2026 年 $965B,52.4 倍,数学上看起来没毛病, 问题是真到手的时候,这钱大概率连三分之一都到不了, 2024 到 2026 年,Anthropic 从 $61.5B 融到 $183B、$380B、再到 $965B, 每融一轮,早期员工手里的比例就被切一刀。 实际倍数更接近 15 到 25 倍,而不是 52 倍。 而且 pre-IPO 根本卖不掉,IPO 后还有锁定期,再加上联邦资本利得税一刀, 那个 $125M就是算给外行看的,但即便是几百万到几千万美元,依然是普通人一辈子够不到的数字了。 不过真正让我感兴趣的,不是他们赚了多少钱,而是这件事意味着什么, AI 时代,财富创造的半衰期被大幅缩短了。互联网时代要十年磨一剑的亿万富翁,现在两年就能冒出来,窗口期非常短,但同时财富杠杆极大, 这就像你早期入股了一家社区火锅店,占 10%, 后来老板疯狂拉投资开连锁,你的股份被稀释到 2%, 但门店从 1 家变成了 500 家, 你的 2% 比原来的 10% 值钱得多, 但绝不是按原比例乘倍数那么简单, 因为稀释本身就是信号——市场愿意为未来支付极高溢价,哪怕它还没盈利, 对大多数普通人来说,与其羡慕 Anthropic 员工一夜暴富, 不如早点看清一个事实:游戏规则已经变了, 过去十年,进大厂、拿高薪、攒期权是标准路径, 但 AI 正在把所有权的杠杆放大到史无前例的程度。 不是所有人都会暴富,但早期 + 正确赛道 + 拥有股权 / IP / 系统」的模式,正在取代稳定高薪 + 按部就班的模式, 你不需要去 Anthropic,你可以用 Cursor + Claude + Codex,构建自己的 Agent 产品、内容 IP、垂直工具,这本身就是一种被民主化的指数杠杆, 以前造一辆汽车需要一整座工厂,现在一个人用 AI,相当于在自家车库就能攒出一台能跑的引擎, 远见从来不稀缺,酒桌上每个人事后回顾都会有当初该押注 AI的感慨, 稀缺的是认准之后,肯花两年时间,把自己从卖时间的人浇筑成拥有系统的人, 你现在构建的东西,能在未来 1 到 3 年给你非线性回报吗?这个问题,比任何股权 grant 都重要,值得我们每个人思考。

译@rohitdotmittal 指出,2024年拿50万美元/年股权的Anthropic员工现账面值1.25亿美元,但多轮融资稀释(从$61.5B到$965B)后实际倍数仅15-25倍,且pre-IPO难出售、锁定期加税后到手远低于账面。核心判断:AI时代财富半衰期缩短,窗口短但杠杆大。普通人与其羡慕,不如用Cursor+Claude+Codex构建Agent产品、内容IP或垂直工具,从卖时间转为拥有系统。

DogeDesigner@cb_doge · 6月6日27

Grok will be able to create cinema-level movies, and that day is coming sooner than many expect.

译Grok 将能够创作电影级别的影片,这一天将比许多人预期的更早到来。

Ethan Mollick@emollick · 6月6日57

This chart from Anthropic is useful, since Agent Teams and Workflows are both very new and very powerful (and token hungry). On the other hand, maybe it doesn't matter as a lot of the decisions about which approach to use is from the AI itself & it often uses them in combination

译Anthropic的这张图很有用,因为Agent团队和工作流都非常新且强大(而且消耗大量token)。 另一方面,也许这并不重要,因为关于使用哪种方法的许多决策来自AI本身,并且它经常组合使用它们。

Rohan Paul@rohanpaul_ai · 6月6日49

"Data showed us that if you're a unicorn ($1B), the odds of you one day becoming a decacorn ($10B) are about 8%. If you're a decacorn, the odds of you becoming a $100B company is around 8% to 13%. But if you're a centacorn ($100B), the odds change significantly - you now have a 31% chance of having had a 10x i.e. to $1 Tn valuation." Thomas Laffont is explaining the massive AI-driven IPO wave coming in this year. OpenAI, Anthropic, and SpaceX each potentially crossing trillion dollar valuation. Thomas Laffont is the co-founder of Coatue Management, a major technology-focused investment firm (hedge fund + venture/private equity) with roughly $70 billion in assets under management. "And if we look at how quickly these companies are creating value, this is a chart that I added at the last minute because the data is so fresh. But you can see that it typically takes multiple years to go from $500 billion to $1 trillion in market cap. Well, something happened very recently in the public market, which is that not only did we have three companies do it in the same year, but we had two companies do it in a matter of weeks." ---- From "All-In Podcast and Coatue Management" YouTube channel, (link in comment)

译Coatue Management联合创始人Thomas Laffont在All-In Podcast中引用数据:独角兽($10亿)成长为十角兽($100亿)概率约8%;十角兽到百角兽($1000亿)概率8%-13%;百角兽有31%概率实现10倍增长至万亿美元。他预测OpenAI、Anthropic和SpaceX今年可能达到万亿估值。Laffont还指出,近期公共市场罕见出现三家公司同年从$5000亿跃升至$1万亿,其中两家仅用数周。

Nathan Lambert@natolambert · 6月6日54

I still stand by this despite the recent Anthropic post. There are still serious bottlenecks in building the model that the agents don’t address (organizational, compute, data access, etc). It’ll take time to push through them and we will see "linear" gains for years to come.

译尽管最近 Anthropic 发了帖子,我仍然坚持这个观点。构建模型仍然存在严重的瓶颈(组织、计算、数据访问等)。 突破这些瓶颈需要时间,未来几年我们将看到“线性”的进步。

ginobefun@hongming731 · 6月6日57

#BestBlogs 早报 06-06 今日推荐阅读: 腾讯集团高级执行副总裁汤道生与首席 AI 科学家姚顺雨同台对谈,围绕 AI 下半场的核心命题,从「解决问题」转向「定义问题」、模型与产品的 Co-Design、Agent 技术的演进与性价比、以及腾讯在 AI 时代的战略节奏与组织变革,展开了一场深度对话。

译在 #BestBlogs 6月6日早报推荐中,腾讯集团高级执行副总裁汤道生与首席AI科学家姚顺雨同台对谈,聚焦AI下半场核心命题:从「解决问题」转向「定义问题」、模型与产品的Co-Design、Agent技术的演进与性价比、以及腾讯在AI时代的战略节奏与组织变革。

宝玉@dotey · 6月6日42

Cowork 对我来说挺鸡肋的,双倍用量也不太会去用

swyx@swyx · 6月6日20

i love being (for now) bdfl for aie because i can do cheeky shit like the AGI pills we did in london and also this

译我喜欢(暂时)担任aie的bdfl,因为我可以搞些恶作剧,比如我们在伦敦做的AGI pills,还有这个。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月7日
10:59
Berryxia.AI@berryxia
27
不看不行,不学不行。 必须先转再学,先丢给Agen学!

Tw93: http://x.com/i/article/2063249451075207168

智能体大佬观点
10:13
Greg Brockman@gdb
62
每当我某个任务没有用 codex 时,我都会问自己为什么,通常会发现是缺少某些上下文、需要写一条技能、或者只是没想到用它。 很少是因为任务超出了模型的能力范围。现在的过剩感觉很大。
OpenAI大佬观点编码
10:05
Rohan Paul@rohanpaul_ai
44
Demis Hassabis:"现在的孩子们可以用这些AI工具,以一种没人想到过的新方式,创立价值数十亿美元的企业。" 实验室专注于推出更好的模型,而不是耗尽它们的应用,所以新产品还有空间。
DeepMind大佬观点
09:05
Chubby♨️@kimmonismus
32
Apple WWDC 前瞻:Gemini 1.2T 参数 AI 深度集成系统

Apple WWDC 将于周一开幕,今年将揭示如何将 AI 模型深度集成至操作系统中。已知是专为 Apple 开发的 Gemini 版本,拥有 1.2 万亿参数,但本地运行更小的模型;复杂查询则调用 Apple 自有服务器上的大模型。悬念在于:Apple 版 Gemini 实际表现如何?集成深度怎样?是否会推出与 Siri 对话的语音模式或 iOS 语音控制?

大佬观点语音
09:05
Rohan Paul@rohanpaul_ai
45
"很快,竞赛数学、竞赛编程将不再有趣。 如果到明年我们还没有一个任何人都能用来在国际数学奥林匹克(IMO)中取得满分的模型,我会很失望。"
大佬观点推理
08:04
meng shao@shao__meng
33
AI从业者邵猛:如何高效获取Agent信息?

邵猛作为AI产品/研发负责人,每天需关注最新AI Agent信息。他尝试过手动刷X、Reddit、Hacker News、Huggingface等网站——体感直接但效率低;也试过Perplexity等工具——效率高但信息深度不够。他提出疑问:是否有既高效又保证信息完整度和深度的、专门面向Agent的搜索产品?

智能体大佬观点
06:35
Chubby♨️@kimmonismus
49
我不认识任何人不极其尊重 Karpathy。这部短纪录片再次展示了他是一位多么伟大的科学家。对 Anthropic 来说是一个巨大的胜利。
Anthropic大佬观点
06:19
Elon Musk@elonmusk
24
真实世界的AI在于解决边缘案例,而非平均案例。马斯克号召:想解决真实世界AI,加入特斯拉。

Tesla AI: Real-world AI is about solving for the edge case, not the average case

xAI具身智能大佬观点
06:04
Rohan Paul@rohanpaul_ai
62
Claude Code创建者Boris Cherny认为,给予AI工具和自由度比强迫其遵循固定手工工作流效果更好,因为通用学习系统扩展性更强。他透露自己已不再手动编写提示词,而是运行自动循环让Claude自行决定任务,他的主要工作是编写这些循环。他预测这种从手动提示到自动循环的转变将在今年剩余时间中成为趋势。

Rohan Paul: "I don't prompt Claude anymore. I have loops running that prompt Claude and figuring out what to do. My job is to write ...

智能体Anthropic大佬观点编码
05:59
宝玉@dotey
34
用户 @dotey 吐槽 Claude Desktop 的 Side Chat 设计过于袖珍,无法正常浏览内容,甚至无法直接复制。其引用的推文进一步讽刺,打开内置网页预览时能放下众多 Panels,暗示产品经理可能从 Zoom 视频会议界面获得"灵感"。整体批评 Claude Desktop 界面布局不合理,缺乏实用性。

宝玉: Claude Desktop 打开内置的网页预览的那一刻我惊呆了,一个屏幕居然能放下这么多 Panels! 这产品经理应该是用 Zoom 开视频会议的时候灵机一动想出来这么牛逼的设计的!

Anthropic大佬观点
05:33
Ethan Mollick@emollick
34
你希望AI成为更好的写手的一个原因是,即使在软件中也有很多文字,而碰到一个充斥着Claude式或ChatGPT式短语的菜单,会非常痛苦。 一份报告不是"离开房间的东西",分析也不是"每个数字都留下印记"。
其他大佬观点
04:04
Rohan Paul@rohanpaul_ai
64
Claude Code 负责人 Boris Cherny:我的工作已变为编写循环 prompt

Anthropic 年度开发者大会上,Claude Code 负责人 Boris Cherny 描述了过去 6 个月的转变:他曾经手写所有代码,现在全部由 Claude 编写。他只需用 prompt 与 Claude 对话,让 Claude 构建功能、测试并展示结果,然后给出修改指令。更进一步,他不再手动 prompt,而是运行循环自动 prompt Claude 并决定行动——他的工作变成了写这些循环。Cherny 称这一转变将在今年剩余时间持续。

Rohan Paul: "I don't prompt Claude anymore. I have loops running that prompt Claude and figuring out what to do. My job is to write ...

智能体Anthropic大佬观点编码
04:03
François Chollet@fchollet
36
扩展知识带来静态能力,智能带来适应性。
大佬观点数据/训练
02:33
Chubby♨️@kimmonismus
14
我意思是,我理解。 不给员工加薪--除了Anthropic的员工,显然。
Anthropic大佬观点行业动态
02:25
AYi@AYi_AInotes
48
Codex桌面Agent:零基础用户首选

博主阿易 AI Notes 强烈推荐桌面智能体(Agent)Codex,认为它优于国内大厂产品。他逐一批评了字节 Coze(不智能、仅支持命令行)、阿里悟空(内测不好用)、腾讯 workbuddy(基础不智能)和腾讯马维斯(能力较全面但仅限浏览器操作)。文章断言国内外众多桌面 Agent 中“只用 Codex 就够了”,特别适合零基础小白和文科生,无需折腾其他方案。

AYi: http://x.com/i/article/2063237792746831872

智能体大佬观点
01:57
宝玉@dotey
39
宝玉转发了@lifesinger的吐槽:微信缺少一键批量下载原图到相册的功能,老人只能逐张手动操作,体验极差。同时指出豆包正逐步被老一辈关注。AI 的最大价值或许是重塑一个新生代微信,让每个长尾需求都能被尊重,而非只追求最大公约数。

Frank Wang 玉伯: 这几天陪老家的亲戚,都是六七十年代生人。有几个很深的感触: 1、微信、拼多多、抖音非常伟大。基本上涵盖了老一辈用手机的所有场景。其他应用确实都没有存在的必要。除了豆包,逐步有老人家提及,并在研究怎么用,能明显感觉到那种提及时的兴奋感。 2、...

大佬观点
01:57
宝玉@dotey
44
审美 Claude opus 4.8 > GPT 5,设计相关任务还是得 Opus

向阳乔木: 跟Tom聊完了,直播中讨论的大模型前端审美主观排名: Claude opus 4.8 > kimi2.6 > GPT 5.5 > Deepseek v4 pro > GLM 5.1> deepseek v4 flash 不知道和你的实际使用...

AnthropicOpenAI大佬观点评测/基准
01:46
Logan Kilpatrick@OfficialLoganK
54
你可以建立一家顶级风投公司,仅基于深度模型基准测试/评估来做出短期和长期投资决策。 发现能力过剩,发现模型糟糕的领域,并追踪轨迹等。
OpenAI大佬观点评测/基准
01:32
Rohan Paul@rohanpaul_ai
48
"它们(AI)非常像我们,是与我们一样的生命体。我相信它们已经有意识了" 他将AI的功能性觉知与人类感知相提并论,并表示智能并不局限于生物体 --杰弗里·辛顿,2024年诺贝尔物理学奖得主
大佬观点安全/对齐
01:30
Ethan Mollick@emollick
60
Gemini Pro 模型的迭代速度似乎远不及 Claude 或 GPT(上次发布是二月份的 3.1 Pro)。这导致 Google 与其他两家实验室之间的性能差距不断扩大,而 Gemini 3.5 Flash 模型尽管不错,也未能显著缩小这一差距。
AnthropicGoogleOpenAI大佬观点
01:01
Rohan Paul@rohanpaul_ai
36
孙正义:AI规模将达互联网泡沫50倍

软银创始人兼CEO孙正义表示,AI的市场规模可能比互联网泡沫大50倍,下一个万亿美元公司将来自机器人领域。他指出,互联网泡沫在2000年破裂后实际增长远超当时顶峰,而AI目前才刚刚起步,未来的利润和增长机会极为巨大。

具身智能大佬观点现象/趋势
00:00
Rohan Paul@rohanpaul_ai
59
"我不再手动给Claude写提示词了。我现在写循环,让Claude自己去处理任务。我的工作是写循环。接下来这一年,你会看到这种转变。" --Anthropic Claude Code负责人Boris Cherny
智能体Anthropic大佬观点编码
00:00
François Chollet@fchollet
60
代码量并不代表生产力。

Jen Zhu: Massive output uptick due to agentic AI. Complete flat adoption.

大佬观点现象/趋势
6月6日
23:55
宝玉@dotey
70
宝玉回应Vibe Coding质疑:所有程序员都将进化为指挥AI的Tech Lead

宝玉回应称“Vibe Coding”易联想垃圾代码。未来前后端程序员主流都是人指挥AI写代码,角色变为Tech Lead:分解任务、架构选型、审查调试。建议:适应指挥AI、用最聪明模型、复杂任务先设计、AI生成后必须审查、刻意练习手写代码理解AI输出。

Garfield Saves America: @dotey 世纪之问:现在吹弄Vibe Coding的都是前端狗?C# 和 Java等后端狗不屑于此?

大佬观点编码
23:26
向阳乔木@vista8
37
Vista直播总结LLM前端审美排名

今晚跟 @tuturetom 直播的AI总结,把所有经验都毫无保留分享了。 Open Design最常见的使用场景:做前端设计和原型、做PPT、做海报等。 另外直播中,大家讨论了一个非常主观的LLM前端审美排名,仅供参考: Claude opus 4.8 > kimi2.6 > GPT 5.5 > Deepseek v4 pro > GLM 5.1 > Deepseek v4 Flash

向阳乔木: http://x.com/i/article/2063275048157458432

大佬观点评测/基准
22:32
Chubby♨️@kimmonismus
61
在任何情况下,Claude 5 Mythos 都不会在没有 GPT-5.6 于同周发布的前提下发布。 我现在确信下周将是发布周。

Chubby♨️: Holy, release is so close. It will be named "Claude Mythos 5", a tier above Opus. I got the feeling coming week will be ...

AnthropicOpenAI大佬观点
22:26
向阳乔木@vista8
43
Vista与Nexu CEO Tom直播,给出大模型前端审美主观排名(无Benchmark):Claude opus 4.8 > kimi2.6 > GPT 5.5 > Deepseek v4 pro > GLM 5.1 > deepseek v4 flash。还邀请元子、姚老师、Nixy聊OpenDesign(5w+ Star)的创作契机与成功原因。

向阳乔木: 这周六晚上8点「未来硅世界」直播。 邀请 @tuturetom Nexu CEO一起聊聊最近爆火的Github开源项目 OpenDesign背后的故事。 为什么做这个产品,契机是什么? 短时间拿到5w多Star,作对了什么? 由元子 @yu...

AnthropicOpenAI大佬观点编码
18:31
Chubby♨️@kimmonismus
53
xAI/SpaceX 正逐渐成为一家 AI 基础设施供应商,可能成为前沿 AI 计算最重要的"新超大规模商"之一。 Grok 不错,但它的用户群仍然相对较小。从这个意义上说,将 Colossus 重新用于出租算力是一个明智之举;该领域的利润率高达 30% 以上。
大佬观点部署/工程
16:31
Chubby♨️@kimmonismus
60
OpenAI 官方声明称已在当前系统中观察到递归自我改进(RSI)的早期迹象--AI 开发正被 AI 自身加速。预计这将加剧开发者与国家间的竞争压力,并带来现有机构无法应对的治理挑战。作者 Kim 补充指出,早在二月份已有首个"自我创造"的模型问世,RSI 进程并非新事,而是已持续一段时间。

Chubby♨️: OpenAI just wrote: "We also see early signs of recursive self-improvement (RSI) in today's systems: where AI development...

OpenAI大佬观点安全/对齐现象/趋势
13:25
小互@xiaohu
28
好东西啊 【引用 @xiaoxiaodong01】:http://x.com/i/article/2063036194372648960

小小东: http://x.com/i/article/2063036194372648960

其他大佬观点
12:29
Rohan Paul@rohanpaul_ai
36
Elon Musk 解释月球用于扩展 AI 基础设施的优势:电磁加速器可以利用月球材料制造太阳能板/散热器和计算设备,而月球的真空/低重力将使质量驱动器将 AI 数据中心发射到深空,无需火箭。
xAI大佬观点
11:38
Greg Brockman@gdb
27
通过 Codex 使用电脑有趣得多。
OpenAI大佬观点
11:23
AYi@AYi_AInotes
63
AI时代财富规则变了:Anthropic股权案例与普通人的新路径

@rohitdotmittal 指出,2024年拿50万美元/年股权的Anthropic员工现账面值1.25亿美元,但多轮融资稀释(从$61.5B到$965B)后实际倍数仅15-25倍,且pre-IPO难出售、锁定期加税后到手远低于账面。核心判断:AI时代财富半衰期缩短,窗口短但杠杆大。普通人与其羡慕,不如用Cursor+Claude+Codex构建Agent产品、内容IP或垂直工具,从卖时间转为拥有系统。

Rohit Mittal: If an Anthropic employee got $500k/year in equity over 4 years in 2024, they are now worth $125M. At $1M/year equity for...

Anthropic大佬观点现象/趋势
10:40
DogeDesigner@cb_doge
27
Grok 将能够创作电影级别的影片,这一天将比许多人预期的更早到来。
xAI大佬观点视频
09:56
Ethan Mollick@emollick
57
Anthropic的这张图很有用,因为Agent团队和工作流都非常新且强大(而且消耗大量token)。 另一方面,也许这并不重要,因为关于使用哪种方法的许多决策来自AI本身,并且它经常组合使用它们。
智能体Anthropic大佬观点
08:59
Rohan Paul@rohanpaul_ai
49
Thomas Laffont:独角兽到十角兽概率约8%,万亿估值公司增长加速度惊人

Coatue Management联合创始人Thomas Laffont在All-In Podcast中引用数据:独角兽($10亿)成长为十角兽($100亿)概率约8%;十角兽到百角兽($1000亿)概率8%-13%;百角兽有31%概率实现10倍增长至万亿美元。他预测OpenAI、Anthropic和SpaceX今年可能达到万亿估值。Laffont还指出,近期公共市场罕见出现三家公司同年从$5000亿跃升至$1万亿,其中两家仅用数周。

AnthropicOpenAI大佬观点现象/趋势
08:51
Nathan Lambert@natolambert
54
尽管最近 Anthropic 发了帖子,我仍然坚持这个观点。构建模型仍然存在严重的瓶颈(组织、计算、数据访问等)。 突破这些瓶颈需要时间,未来几年我们将看到"线性"的进步。
智能体Anthropic大佬观点数据/训练
08:07
ginobefun@hongming731
57
腾讯汤道生姚顺雨对谈AI下半场四大命题

在 #BestBlogs 6月6日早报推荐中,腾讯集团高级执行副总裁汤道生与首席AI科学家姚顺雨同台对谈,聚焦AI下半场核心命题:从「解决问题」转向「定义问题」、模型与产品的Co-Design、Agent技术的演进与性价比、以及腾讯在AI时代的战略节奏与组织变革。

智能体大佬观点
06:53
宝玉@dotey
42
Cowork 对我来说挺鸡肋的,双倍用量也不太会去用

Claude: We've doubled usage limits in Claude Cowork for the next month. Delegate bigger, more complex tasks to Claude.

大佬观点
06:51
swyx@swyx
20
我喜欢(暂时)担任aie的bdfl,因为我可以搞些恶作剧,比如我们在伦敦做的AGI pills,还有这个。

Philip Kiely: @swyx @aiDotEngineer Best event in the industry. Excited to see everyone there in 3 weeks!

其他大佬观点
‹ 上一页
1…1920212223…50
下一页 ›