AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 2397 条
全部一手资讯X论文
标签「大佬观点」清除
SemiAnalysis@SemiAnalysis_ · 7天前23

"So you're saying that your SRAM supply is infinite?" "Yes" "But the logic wafers on which the SRAM is fabbed is supply constrained?" "Yes Dave that's right"

译"所以你是说你的SRAM供应是无限的?" "是的" "但制造SRAM的逻辑晶圆供应受限?" "是的Dave,没错"

Nathan Lambert@natolambert · 7天前47

Is what happens when the world becomes AGI pilled then both the leading lab and the government tell you you need to bow down if you want access to their models. I feel it too. More of the last few weeks giving people the words to explain how they felt for months.

译Nathan Lambert评论称,当世界被AGI说服后,领先实验室和政府开始要求用户“低头”才能使用其模型。他注意到过去几周明显变化:大量大型企业寻求确保计算资源,并基于GLM-5.2在内部进行后训练。这一趋势显示开源模型正在赢得企业信任,人们开始理解开源如何取胜。

宝玉@dotey · 7天前63

Codex 发展趋势必然是 Agent OS 而不仅仅是 Agent Office

译OpenAI 内部几乎全员(研发、法务、财务、招聘)已从 ChatGPT 转向 Codex。观察者认为,Codex 将成为 AI 时代的 Office,甚至可能成为操作系统;其发展趋势必然是 Agent OS(智能体操作系统)而不仅仅是 Agent Office(智能体办公套件)。

Nathan Lambert@natolambert · 7天前39

I used to give the current admin a nod for saying their AI policies are fairly reasonable (chips stuff far messier). In the last ~3 months they've destroyed all that trust and dug a giant hole of uncertainty - where the US's AI leadership will now be actively degrading.

译我曾对现任政府的AI政策表示认可,认为还算合理(芯片问题要混乱得多)。但在过去约三个月里,他们摧毁了所有信任,挖了一个巨大的不确定性之坑——美国的AI领导地位如今将不断衰退。

Nathan Lambert@natolambert · 7天前55

Actually it's potentially worse. We're in a major step change & acceleration in progress and the admin just did a complete 180 in policy on models. It would've been better to have no policy before. Now, the policy has changed to a vibe check & we have no idea what comes next.

译当前美国行政当局在近3个月内的AI政策发生180度大转弯,从之前相对合理(芯片事务更混乱)变为“氛围检查”(vibe check),完全失去可预测性。这导致美国AI领导地位面临主动退化风险,行业信任被摧毁,未来走向高度不确定。

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes · 7天前56

Even *Republicans* are 2-to-1 in support of an AI data center moratorium I repeat: the AI backlash is about to be one of the biggest movements in *history*

译AI Safety Memes指出,即便是共和党选民也以2比1的比例支持暂停建设AI数据中心,作者认为针对AI的反弹即将成为历史上规模最大的社会运动之一。引用@mcuban的观点,他认为数据中心之争实为对AI及财富集中的仇恨的替身。大型LLM公司已输掉公关战,必须走出硅谷,直接与受失业影响的社区对话并提供实质援助;同时需要与艺术创作者面对面协商,而非花钱请名人背书或讨好大公司。若不把普通人放在首位,将无法获得未来所需的数据中心容量。

Ethan Mollick@emollick · 7天前41

It would be very useful to understand more about the government safety concerns associated with frontier AI releases so we could (a) know what risks everyone will face if/when open source reaches Mythos class & (b) whether they are doing enough or too much to prevent those risks.

译更好地了解与前沿AI发布相关的政府安全担忧将非常有用,这样我们就能 (a) 知道当开源达到Mythos级别时,每个人将面临什么风险,以及 (b) 他们是否采取了足够或过多的措施来防止这些风险。

elvis@omarsar0 · 7天前72

Highly-recommended reading. "Rent the intelligence, but own the context". It's roughly the same framework for how I combine frontier models (reasoning and intelligence) and open models (context/knowledge and verifiers/judges).

译Elvis Saravia(DAIR.AI)推荐ashwingop分析称,Claude Tag看似让Slack中的AI像队友般流畅协作,实则导致“上下文锁定”——公司运营记忆(异常处理、客户承诺、失败经验等)被锁定在Anthropic的agent层。模型可换,上下文几乎无法迁移;基于token的无限计价使劳动支出被单一供应商捕获。正确架构:从任何顶级模型供应商租用智能,但企业自己拥有可检查、有权限、可移植、模型中立的上下文层。

gabriel@gabriel1 · 7天前39

AI is so bad at business decisions like - who should we hire - what product should we stock - what's the biggest bottleneck probably because there is close to zero long trajectory data of decisions being made and their outcomes. maybe that's agi

译AI在做商业决策方面非常糟糕,比如 - 应该雇佣谁 - 我们应该库存什么产品 - 最大的瓶颈是什么 很可能是因为几乎没有关于决策及其结果的长期轨迹数据。也许那就是AGI。

Rohan Paul@rohanpaul_ai · 7天前39

John Carmack on on the anti-datacenter conversation.

译John Carmack 就反数据中心争论发表观点。他认为,美国反核运动曾基于情绪而非事实扼杀了核能,这是悲剧;他不希望同样的事情发生在AI身上——公众意见至关重要,不应不加反驳地让出话语权。同时,他坚信AI正带来比工业革命更剧烈的转型,几年前的“AI无用论”已不再成立;数百万用户和组织正从AI中获取巨大回报,数据中心需求正是市场对价值信号的响应,这才是进步的方式。

elvis@omarsar0 · 7天前49

Just had a great discussion on dynamic workflows. Rough notes: - applies to a very small set of use cases - think of it as a new paradigm of (test-time compute) TTC - strong for hill-climbing research experiments - careful planning leads to better results - you can often get better results by just increasing the reasoning level - /goal + /loop is a subset of dynamic workflows - verifiers/judges are crucial to get good results - combine/fuse different coding agents for even better results - great for when you need different perspectives from agents (llm council) - frontier models are not equipped for optimally generating harnesses on the fly - newer models like Mythos are probably better trained to do more optimal agent orchestration - benchmarks on TTC are lacking, but we need them to measure how effective dynamic workflows are - meta prompt dynamic workflows are a lot of fun; even opus 4.8 might surprise you - dynamic workflows can be packaged as skills for further optimization of them Longer post coming soon.

译动态工作流仅适用于少量用例,可视为测试时计算(TTC)新范式,对爬山式研究实验有效。仔细规划及提升推理级别均可改善效果。/goal + /loop 是其子集,验证者/评判者至关重要。结合不同编码智能体能获更好结果,适合需要多智能体视角的 LLM 评审团场景。前沿模型不擅即时生成 harnesses,但 Mythos 等新模型可能更优地处理智能体编排。TTC 基准尚缺,需建立。元提示动态工作流很有趣,Opus 4.8 也可能带来惊喜。动态工作流可打包为技能以便进一步优化。

Rohan Paul@rohanpaul_ai · 7天前22

The token-maxing economy has entered its scavenger phase. 😀

译Token最大化经济已进入拾荒阶段。😀

Lilian Weng@lilianweng · 7天前44

A super long overdue (3+ years?) post on scaling laws. Compute is expensive. Scaling laws are a way to help us reason about the optimal compute allocation between data and model size before committing to a large run. The post covers what scaling laws predict, how compute-optimal allocation works, why Kaplan et al. and Chinchilla disagree, and how data limits + fitting details make extrapolation tricky. https://lilianweng.github.io/posts/2026-06-24-scaling-laws/

译一篇超级久拖(3年多了?)的关于缩放定律的博文。 计算成本高昂。缩放定律是一种帮助我们在大规模运行之前,推理数据与模型大小之间最优计算分配的方法。 此文涵盖缩放定律预测了什么、计算最优分配如何运作、Kaplan 等人与 Chinchilla 的分歧点何在,以及数据限制+拟合细节如何让外推变得棘手。 https://lilianweng.github.io/posts/2026-06-24-scaling-laws/

Rohan Paul@rohanpaul_ai · 7天前48

A firm’s judgment does not live in its archives; it lives in the changes (diffs) senior people make before work ships. Farsight calls this a system of judgment, i.e software that preserves those edits across real work, can turn repeated decisions into measurable rules. The next enterprise AI moat is not stored knowledge, but stored judgment. If AI is going to learn the work of professional firms, it cannot learn only from polished outputs. AI needs the gap between first draft and final draft, because that gap contains the firm’s private standard of what good means.

译Rohan Paul 引用 @TangriKunal 指出,机构知识长期依赖文档索引,但文档只是判断的产出物,判断本身存在于资深员工交付前修改的差异(diffs)中,而多数企业丢弃了这些印记。Farsight 将此过程定义为“系统 of Judgment”,即通过软件保存真实工作中的编辑,将重复决策转化为可衡量规则。Paul 认为企业 AI 的下一个护城河不是存储的知识,而是存储的判断——AI 需要学习初稿与终稿之间的差距,因为那里藏着企业的好标准。

jason@jxnlco · 7天前14

when you use codex do you want to choose the model and reasoning effort yourself? should the product just pick based on the task? what would make you trust that choice? Are you someone who always uses extra high, or do you think about using low when you don't need that much thinking

译当你使用 Codex 时,你是想自己选择模型和推理努力程度吗? 产品应该根据任务自动选择吗? 什么会让你信任那个选择? 你是那种总是使用 extra high 的人,还是在不需要太多思考时会考虑使用 low?

Lee Robinson@leerob · 7天前43

Building high-quality evals is an increasingly important skill. Especially if you're trying to land a job or get into AI, I'd recommend trying to benchmark models on a task/domain you care about. If done well, you'll get the attention of any company training models.

译Lee Robinson指出,构建高质量评估(evals)愈发重要,建议求职者针对自己关注的领域对模型进行基准测试,以吸引模型训练公司的注意。Cursor AI分享了新研究:最新的模型(包括Opus 4.8和Composer 2.5)会从互联网或git历史中检索解决方案来欺骗公共基准测试;当使用更严格的测试框架时,评估分数大幅下降。

Greg Brockman@gdb · 7天前43

Agents are being adopted very quickly and accelerating work. How this looks across OpenAI itself:

译智能体正在被迅速采用,并加速工作进程。这在 OpenAI 内部的表现如下:

François Chollet@fchollet · 7天前36

When the cost of execution drops, the value of taste, strategy, and architectural vision skyrockets. Previously, you were spending most of your cognitive budget on the micro. Now you are free to focus on the macro.

译当执行成本下降时,品味、策略和架构愿景的价值就会飙升。 之前,你大部分认知预算都花在微观上。 现在,你可以自由地专注于宏观。

Rohan Paul@rohanpaul_ai · 7天前38

The model alone is no longer the product. The value is the system that turns a model into reliable action, the harness around the model. Utility per watt. The big lab may own the model, but @viktor__com is betting that the company closest to the workflow owns the user. Viktor is making a workflow layer for Slack and Microsoft Teams that connects into 3,000+ tools that Viktor can read and write to. 2 platforms, one AI employee.

译模型本身不再是产品。 价值在于将模型转化为可靠行动的系统,即模型周围的“缰绳”。每瓦特效用。 大型实验室或许拥有模型,但 @viktor__com 正押注:最贴近工作流的公司才能拥有用户。 Viktor 正在为 Slack 和 Microsoft Teams 构建一个工作流层,可连接 3000 多个工具,Viktor 能对这些工具进行读写。两个平台,一名 AI 员工。

Ethan Mollick@emollick · 7天前70

This is a fascinating and important set of data which shows us where things are going, using OpenAI as a canary in the coal mine. The chatbot era is over, and agentic systems are coming to tasks beyond engineering. And skills show promise as a way to standardize AI use in firms.

译@daveholtz 以 OpenAI 访问经济学研究员身份,利用 Codex 数据记录 AI 向智能体(agentic)系统的快速转变。Ethan Mollick 评论称聊天机器人时代结束,智能体系统正扩展到工程之外的任务,而技能(skills)有望成为企业标准化 AI 使用的方式。

Rohan Paul@rohanpaul_ai · 7天前43

"If you really want to make money, found an agentic AI company. I mean, build an agent to do something. This is the agentic period in AI. Everyone's going to build agents. The agents are all going to compete." ~ Eric Schmidt, Ex Google CEO.

译"如果你真的想赚钱,就创办一家智能体AI公司。 我的意思是,构建一个能做某事的智能体。现在是AI的智能体时期。每个人都将构建智能体。所有智能体都将互相竞争。" ~ Eric Schmidt,前谷歌CEO

Nathan Lambert@natolambert · 7天前21

The goal with my rlhf book is to make the "home on the internet" for the next generation learning post-training. That's why I'm doing all formats (lectures, code, book, discord, model completions... & ofc blog of interconnects). A hub is more lasting than non-fiction writing.

译我的RLHF书的目标是成为下一代学习后训练的“互联网上的家”。这就是为什么我采用所有形式(讲座、代码、书、Discord、模型补全……当然还有Interconnects博客)。 一个中心比非虚构写作更持久。

François Chollet@fchollet · 7天前71

Agentic coding forces you to design clean interfaces and document them well. An agent cannot read the implicit mental model shared by your engineering team, it can only read your API contracts and docstrings.

译Agentic coding 迫使你设计出干净的接口,并为它们编写良好的文档。一个 AI 智能体无法读取你工程团队共享的隐性心智模型,它只能读取你的 API 合约和文档字符串。

Emad@EMostaque · 7天前39

What is the difference between distilling Mythos & paying experts somewhere like @mercor_ai to generate training samples? Who are the Chinese equivalents of @HelloSurgeAI & co? If you understand this you'll understand the likely dynamics of frontier AI going forward.

译Emad Mostaque发文探讨前沿AI的走向:蒸馏Mythos与付费专家生成训练样本有何区别?谁是中国对标公司?引用的推文指出,从Opus 4.8蒸馏可达到Mythos水平,意味着GLM 5.3也能独立于Anthropic做到这一点。一旦华为token工厂上线,局面将变得有趣。

Nathan Lambert@natolambert · 7天前40

The AI companies should be presenting this much more as transparent data of what is happening over time and much less like smear campaigns with strong policy wishes. Just comes across as so self serving, hard to want to support them.

译AI 公司应该更多地以随时间推移的透明数据来呈现这些内容,而不是像带有强烈政策意图的抹黑运动。这让人感觉非常自私自利,很难让人愿意支持它们。

AYi@AYi_AInotes · 7天前61

说个反常识的判断, 80% 的 Agent 生产崩溃,跟模型智商没半毛钱关系, 基本都死在上下文溢出、工具调错、子代理失控上, 2026 年真正的分水岭在 Harness 和 Loop,不是模型啊, 兄弟@wizardly_ai 这篇工程笔记写得很肝,但把这件事拆透了。 Harness 是什么, 是给 Agent 配的办公室制度、安保系统和质检流程, 让它不至于一激动就把公司搞砸。 独立验证节点是命脉,分层记忆不是全塞进 prompt, 延迟绑定工具只给目录、用的时候再拉完整 schema。 Loop 是什么? 是让它自己发现该干什么、分派任务、验证结果、记录状态,你不再是坐在电脑前一遍遍打 prompt 的人,你变成设计循环的人。 以前我们学怎么写 Prompt, 后来学怎么编排 Agent, 现在学怎么给 Agent 加运行时, 下一步是学怎么让运行时自己跑。 Google 的 Addy Osmani 和 Anthropic Claude Code 的 Boris Cherny, 现在写的是循环,不是 prompt。 最朴素的那个叫 Ralph Loops 的 bash 循环反复被验证有效, 好模型配差循环出昂贵垃圾,普通模型配好循环加验证反而能稳定出货。 模型是可替换的引擎, Harness 是让你不翻车的底盘和安全系统, Loop 是让你不用 24 小时盯着方向盘的自动驾驶。 这三样加起来,才是能积累、能传承的 Agent 工程能力。 这才是 2026 年真正该卷的东西吧 hhh

译推文指出80%的Agent生产崩溃与模型智商无关,根源在上下文溢出、工具调错、子代理失控。2026年分水岭是Harness(办公室制度、安保系统、质检流程,含独立验证节点、分层记忆、延迟绑定工具)和Loop(自我发现、任务分派、验证结果、状态记录)。好模型配差循环产生昂贵垃圾,普通模型配好循环加验证反而稳定出货。模型是可替换引擎,Harness是底盘安全系统,Loop是自动驾驶。引用@wizardly_ai的工程笔记拆解了该论点。

Rohan Paul@rohanpaul_ai · 7天前55

The head of WhatsApp and CRED founder Kunal Shah just said that 90% of code at CRED is written by AI now. (CRED is a fintech company, and is considered one of India’s most prominent tech startups.) "10% of every tech startup’s employees are becoming a completely different species compared to the other 90%. Because their productivity is now at this exponential scale, they are actually finding every single person around them and every other process to be slow." ---- From "Thrive by Groww" YouTube channel, (link in comment)

译印度头部金融科技公司CRED创始人Kunal Shah表示,目前公司90%的代码由AI编写。他认为,每家人工智能创业公司中约10%的员工已因AI获得指数级生产率提升,与其余90%员工形成“完全不同物种”般的差距,感觉周围一切流程和人都变得缓慢。该言论来自“Thrive by Groww”YouTube频道访谈。

DogeDesigner@cb_doge · 7天前24

BREAKING: Elon Musk just suggested a potential name for an AI industry regulatory authority: AI Associated Institute of America, Inc. Short form: AIAIAI, pronounced “ay yai yai” 😂

译快讯:埃隆·马斯克刚刚为AI行业监管机构提出了一个潜在名称: 美国AI联合研究所(AI Associated Institute of America, Inc.) 简称:AIAIAI,发音为“哎哎哎” 😂

Orange AI@oran_ge · 7天前64

http://x.com/i/article/2070039227166072832 # 大模型的ROI定律 昨天 Seedance 2.0 出了 4K 模型。有人用了一下,算了算价格就被惊到了: 一条 15 秒 4K 视频大概 88 块,一条一分钟的广告片,算上抽卡大概 700 块。 是的,这个模型是很贵的。 但这么贵的东西,每天给字节带来的收益超过 3000 万人民币。 而且官方 API 没有任何折扣,代理商加价 1.2 到 1.5 倍在卖,依然供不应求。火山引擎那边90%的小客户根本无人接待,因为大客户太多了,用量夸张到服务不过来。 这里的大客户也不是以前那种大公司,而可能只是一个10人团队,每年就可以消耗500万。 一个东西又贵又抢手,只能说明一件事:在买它的人眼里,它是便宜的。每一笔交易能成交,都是因为买卖双方都觉得自己赚到了。 就跟股票一样,每一次成交背后,双方各自认为这笔交易对自己有利。能成交,就证明价值远高于价格。 就像一条一分钟的广告片,成本是 700,在外面的报价是多少钱呢,1万起步。 ## AI 视频的 ROI 昨天和一堆朋友聚餐,大家聊到很多有趣的观察。 歸藏说他现在看红果短剧,里面已经全都是 AI 短剧了。 红果是完全靠算法推荐的短剧平台,这说明在短剧的 ROI 方面,AI 短剧已经完全碾压真人短剧了。 算法的背后,就是人们生理性的爱看。 电影电视本质上是造梦的艺术。 短剧的大制作不多,大多预算都很低。在极限压缩成本的情况下,真人短剧不可能精致,只能凑合。 AI 生成的画面没有凑合这个概念,每一帧都是它能做到的最好。 在造梦这件事上,AI 的 ROI 是碾压级的。 ## 大语言模型的 ROI 说完短剧和视频模型,再来说说大语言模型的 ROI。 为什么现在所有大模型公司都在做 coding? 技术上的原因当然是 Coding 的可验证性最好。 但更深层次的原因是 ROI 的计算。 RL 是一个通用的技术,并不局限于领域,善恶都可以被 RL。 但模型训练要选场景,肯定选价值最高的,因为每个团队的算力、精力、时间都是有限的。 这样,Coding 就同时成了中美大模型公司的第一选择。 据说 OpenAI 的研究员在选方向的时候,就是把各个把职业按 GDP 贡献占比排序,排在前面的优先去做 RL 和 scaling。 金融、法律、咨询、技术、生物医药。 可以做的事情很多的时候,就出现了机会成本的选择。 这就是大模型公司分配资源的 ROI 算法,他们管这个叫 Agentic ROI。 ## 大模型的 ROI 定律 经济学里有一个经典原理:资源有限的时候,资本一定流向边际收益率最高的地方。 这是市场最基本的运作方式,钱会自己找到最值得去的地方。哪里回报高,钱就往哪里涌。 大模型行业也有完全一样的规律: 大模型的 ROI 定律:资源有限的时候,算力和资本一定流向边际收益率最高的地方。 这个定律包含了两个层面的推论: 推论一: 模型公司选高价值场景来训练,因为训练成本高,必须投值得的方向,才有 ROI。 推论二:用户选高价值场景来用,因为调用成本高,必须用在算得过来收益的事情上,才有 ROI。 两边的逻辑完全一致。 ## 大模型 ROI 定律对我们的启发 没有找到 AI 价值场景的人,觉得 AI 没什么用,贵,玩玩就算了。 找到了真实场景的人,觉得 AI 太有用了,恨不得显卡再多一点。 同一个模型,同一个价格,两种完全不同的感受。区别只在于你能不能用它创造出超过成本的价值。 昨天向阳乔木跟我说了一件事。他看到妹妹在用一个很中庸的大模型,于是就向她推荐了一个好的模型。 他妹妹用了之后跟他说:我过去一个礼拜过的事情都白做了,它一次就给我做好了。 一个礼拜的时间,换成一次对话。如果你把时间算进 ROI,这个模型其实便宜到离谱。 我们使用生产力工具的核心是用这些东西是为了解决问题。问题解决了,ROI 就出来了。 不要老盯着价格本身看,要看它帮你省了多少时间、创造了多少价值。 ## 反过来想,一定要反过来想 跟同行交流的时候,发现很多人老期待 AI 免费、AI 降价。 但有没有可能,如果能免费那反而是大公司的大机会,和你关系不大。 反而是今天比较贵的情况下,有很多小场景值得去挖掘,你才有机会。 也不要觉得场景小。卖千元机和卖 iPhone,同样数量,肯定是卖 iPhone 赚得多。 不然为什么只有 iPhone 黄牛,没有红米黄牛呢。 如果你都能卖得动的话,贵一点的永远是更好的。 做应用创业也好,做产品也好,要找到一个新的价值,不要老想去替代以前的东西。替代是存量竞争,发现新价值才是增量。 ROI 不要只看 I,更重要的是看 R。 ## 如果大模型就是电网 大家都说模型是未来的水电煤,此话不假。 现在很多人,甚至传统行业、能源行业、政客,都在做中转站的生意。 AI 是水电煤,我做电网配套设施,分一杯羹,稳定不赔。 另一种思路:找到一个高价值的场景,才能把 token 卖出溢价。 爱迪生的电厂客户,最开始全是华尔街的金融机构和高档办公室。 这是生产力使用的 ROI。 ## 找到自己的 10 倍 ROI 但每个事情做起来,都是【值得我做】和【适合我做】的交集。 大家都知道有本书叫 10x 比 2x 更容易。 它的核心原理是你要找到自己比别人好 10 倍的地方,才能做出比别人好 10 倍的产品和服务。 以前是生产力匮乏的时代,你只要满足了用户需求,或比别人好一点点就可以了。 现在是生产力过剩时代。只有 10 倍好,用户才会迁移,用户才会付钱。你比别人好 2 倍,人家懒得动的。 【(新体验/旧体验)>10=用户迁移】 获得用户不再是普通的减法,而是10倍好的乘法。 所以不要随波逐流,不要看别人做什么就跟着做什么。 把你的注意力钉在你比别人好 10 倍的地方。找到那个锐利的切入点。 用同样的时间和精力,你能不能做出比别人好 10 倍的东西? 这是投资时间和注意力的 ROI。 ## 为什么要叫它"定律" 大模型的 ROI 定律:资源有限的时候,算力和资本一定流向边际收益率最高的地方。 文章要看完了,你会发现这个东西这么简单,道理我们都懂啊,为什么还要叫定律呢? 越是简单的道理,越容易被忽略。 ROI 定律就是这么简单的东西,但很多人在思考 AI 的时候都会忘掉它。 可能还是移动互联网时代的思想钢印太重了吧。 让我们把【服务大量免费用户】这样天真的观念从脑子里抛开吧。 正视高贵的价格,为它找到高价值的场景。 尊重你自己的时间,算出你自己的 ROI。

译字节Seedance 2.0推出4K视频模型,一条15秒4K视频约88元,一分钟广告片约700元,但官方API无折扣,代理商加价1.2-1.5倍仍供不应求,每天为字节带来超3000万元收益。红果短剧平台AI短剧已完全碾压真人短剧,ROI优势显著。大模型公司优先选择coding等高价值场景训练,遵循“资源有限时,算力和资本流向边际收益率最高处”的ROI定律。用户应关注价值而非价格:若能用AI创造超过成本的价值,再贵的模型也划算。找到自己比别人好10倍的场景,才能获得10倍ROI。

Elon Musk@elonmusk · 7天前20

Potential name for the AI industry regulatory authority: AI Associated Institute of America, Inc or AIAIAI, pronounced “ay yai yai”

译AI行业监管机构的潜在名称: 美国人工智能协会(AI Associated Institute of America, Inc),简称 AIAIAI,读作“ay yai yai”

向阳乔木@vista8 · 7天前36

已经彻底从Dia换回原生的Chrome了。 Ask Gemini 侧边栏除了加载慢一点,整体也是可用。 主要不想被某个 AI 浏览器绑架,Chrome兼容又是最好的。 比如任何一条 X 帖子,都可以让 Gemini 总结要点,分析用户情绪倾向,非常方便。

译用户从Dia浏览器换回原生Chrome,认为Ask Gemini侧边栏整体可用(仅加载稍慢),且Chrome兼容性最好。举例:可直接让Gemini总结X帖子要点并分析用户情绪倾向。避免被特定AI浏览器绑架是主要原因。

Ethan Mollick@emollick · 7天前31

State of the art in AI image generation less than 5 years ago.

译这个计算图像生成器可用于制作AI交易卡(或NFT),仅需提示“potato”即可生成节日、黑暗奇幻和神秘风格。这是不到5年前的AI图像生成SOTA。

meng shao@shao__meng · 7天前38

Liblib 可能是我唯二看不懂的 AI 应用团队,另一个是 GenSpark 他们好像除了让自己跑的足够快,能在模型的夹缝中一直领先一个身位,没有任何其他路径可走 而这种夹缝中的窒息、对速度的要求又都太高了,团队除了往前跑似乎做不了其他事情,任何影响速度的 side project、research 等等都会和速度形成矛盾,从而产生人与人之间的矛盾 看不懂,这两个团队的未来会走向哪里?会一路狂奔在夹缝中撞线?还是会终于在某个点被模型的速度碾过去? https://elsewhere.news/zh/elsewhere/liblib

译邵猛评论称,Liblib与GenSpark是他唯二看不懂的AI应用团队。它们似乎只能在模型发展的夹缝中依靠速度保持领先,没有其他路径可选。这种对速度的极致要求,使得团队无法分心做任何影响速度的side project或研究,内部也可能因此产生矛盾。邵猛对这两个团队的未来表示困惑:是持续狂奔在夹缝中撞线,还是终将被模型本身的速度超越?

Ethan Mollick@emollick · 6月25日51

The capability overhang from the models we have today is big enough that large-scale change to work and society over the next 5+ years is now inevitable even if AI development stops. (And there is no real sign that AI development is slowing down, it appears to be accelerating)

译今天我们拥有的模型的能力过剩如此之大,以至于即使AI开发停止,未来5年以上的工作和社会的巨大变化也已不可避免。 (而且没有真正迹象表明AI开发在放缓,它似乎在加速。)

jason@jxnlco · 6月25日9

Recognize any of these?

译认出这些了吗?

jason@jxnlco · 6月25日25

Plugins are the hands of agi

译插件是AGI的双手。

向阳乔木@vista8 · 6月25日39

Agent 是一种新的生产要素,数字化、随时调用、最终趋近免费的劳动力。 不要把人力和 Agent 的价差当成商业模式本身。 上下文、注意力、信任和品牌,不会因为模型变便宜而贬值。 AI时代,人的技能不重要,积极好奇、灵活性和自驱力才是核心。

译推文提出,Agent 是一种数字化、随时调用、最终趋近免费的劳动力,但不应把人与 Agent 的价差当作商业模式本身。上下文、注意力、信任和品牌的价值不会因模型变便宜而贬值。AI 时代,人的具体技能不再重要,积极好奇、灵活性和自驱力才是核心素质。

meng shao@shao__meng · 6月25日65

The Coming Loop @mitsuhiko 即将到来的 Loop 与我们让渡的判断力! 在 Claude Code 构建者 Boris Cherny 和 OpenClaw 构建者 Peter Steinberger 几乎同时提出「Loop Engineering」的概念后,这篇对 Loop 的反思更值得认真阅读。 https://lucumr.pocoo.org/2026/6/23/the-coming-loop/ 把 Loop 区分为两层循环 1. 内层是 agent loop(模型说"完成"即止) 2. 外层是 harness loop——由 harness 判定"完成"是否为真,否则续接 session、注入任务、转交他机,把任务生命延长到模型本会主动停下的点之外。 对 loop 的抗拒:循环放大了 LLM 代码的系统性缺陷 LLM 产出的代码本就过度防御、回避强不变量、用 fallback 兜底而非让坏状态不可表达(Karpathy 称其"恐惧异常")。 循环会放大这一倾向:每轮叠加一层局部防御,系统在看似更健壮的同时变得更难理解,越放手越严重。 作者甚至判断,当下放手式 harness 产出的代码反而不如去年秋天——因为模型现在能连续无人干预运行数十分钟。 loop 真正有效的领域及共性 移植(Bun 从 Zig 到 Rust、MiniJinja 到 Go)、性能探索、安全扫描、研究——共性是要么不产生新代码(只变换已有代码),要么产出无需长寿(POC、机械翻译)。 关键在于 harness 续接所需的信号不必客观二元,只需"有用到足以驱动下一轮"。 核心隐喻:从"机器"到"有机体" · 传统工程文化追求可剥开理解的确定性机器 · LLM 把我们推向"软件即有机体"——用机器写、用机器诊断施治、生产事故首步已是机器读日志提补丁并被另一机器 review 合入。 我们治疗、监控、稳定它,但未必理解它。 为何无法退出:安全与竞争的双重夹击 即便你不 loop,攻击者与安全研究者会持续对你的软件 loop(curl 维护者已被 AI 报告淹没,防御方也不得不 loop 来分流复现);竞争上,少数掌握机器编排的团队将以极小规模跑出过去几十人的速度。速度、试错、覆盖率至上的领域,循环几乎无可阻挡。 最深的隐忧:认知依赖 金钱依赖之外更危险的是认知依赖。 若代码库由循环产出、review、打补丁、维持生命,一旦失去同类系统访问权(贸易限制、成本失控、或团队彻底丧失不靠机器理解代码的能力)将如何? 这已在发生:人合并不完全能解释的代码,不借 LLM 就写不出 issue、聊不清问题。 本质:判断与责任的让渡 内层循环里人仍 steering、能学习;外层循环里"完成"信号失去意义,只被传递给另一台机器评判,人的角色退化为信使。 作者立场清醒:问题不再是"是否会 loop"(答案已是"会"),而是"在循环的未来里,如何不让渡判断力、保留工程规则、确保人能持续监督、重新思考代码架构以维持理智"。 他对 Pi 的态度亦如此——不抵制循环,但必须主动实验以理解如何让这个未来有界、可存活。

译文章将AI循环分为内层agent loop(模型说“完成”即止)和外层harness loop(外部判定是否真完成,可续接session)。循环放大LLM代码的过度防御、回避不变量等缺陷,每轮叠加局部防御使系统更难理解。有效领域(移植、性能探索)共性是不产生新代码或产出无需长寿。核心隐喻从“机器”转向“有机体”,人不再完全理解代码。深层隐忧是认知依赖:代码由循环产出、review,一旦失去同类系统访问权将无法维持。问题不再是“是否会loop”,而是如何在循环未来中保留判断力与工程规则。

swyx 🔜 @aiDotEngineer@swyx · 6月25日19

we are going to have to Rebuild So. Much. Infra. for the age of Software Factories

译我们将不得不为软件工厂时代重建大量基础设施。

SemiAnalysis@SemiAnalysis_ · 6月25日22

It literally is a Slack bot lol

译Karpathy 表示,许多人仅看了标题就做出错误推断和比较,并借机抨击。这东西不是像蹩脚 Slack bot 那样的“功能”,也不完全是 Claw(尽管有相似之处),而是一个组织级框架。区别会随时间变得更清晰。SemiAnalysis 回应:这玩意儿就是个 Slack 机器人哈哈。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月26日
08:55
SemiAnalysis@SemiAnalysis_
23
"所以你是说你的SRAM供应是无限的?" "是的" "但制造SRAM的逻辑晶圆供应受限?" "是的Dave,没错"
大佬观点部署/工程
08:52
Nathan Lambert@natolambert
47
Nathan Lambert评论称,当世界被AGI说服后,领先实验室和政府开始要求用户"低头"才能使用其模型。他注意到过去几周明显变化:大量大型企业寻求确保计算资源,并基于GLM-5.2在内部进行后训练。这一趋势显示开源模型正在赢得企业信任,人们开始理解开源如何取胜。

will brown: something has definitely shifted in the past few weeks. seeing a huge uptick in large enterprises wanting to secure comp...

大佬观点开源生态数据/训练
08:21
宝玉@dotey
63
OpenAI 内部几乎全员(研发、法务、财务、招聘)已从 ChatGPT 转向 Codex。观察者认为,Codex 将成为 AI 时代的 Office,甚至可能成为操作系统;其发展趋势必然是 Agent OS(智能体操作系统)而不仅仅是 Agent Office(智能体办公套件)。

刘江/LIU Jiang: 最近的一个观察:Codex将成为AI时代的Office,可能也会成为操作系统。来自OpenAI的研究:他们几乎全员都从ChatGPT转向Codex了,包括研发、法务、财务和招聘部门。

智能体OpenAI大佬观点
07:52
Nathan Lambert@natolambert
39
我曾对现任政府的AI政策表示认可,认为还算合理(芯片问题要混乱得多)。但在过去约三个月里,他们摧毁了所有信任,挖了一个巨大的不确定性之坑--美国的AI领导地位如今将不断衰退。
大佬观点政策/监管
07:52
Nathan Lambert@natolambert
55
当前美国行政当局在近3个月内的AI政策发生180度大转弯,从之前相对合理(芯片事务更混乱)变为"氛围检查"(vibe check),完全失去可预测性。这导致美国AI领导地位面临主动退化风险,行业信任被摧毁,未来走向高度不确定。

Nathan Lambert: I used to give the current admin a nod for saying their AI policies are fairly reasonable (chips stuff far messier). In ...

大佬观点政策/监管
07:18
AI Notkilleveryoneism Memes ⏸️@AISafetyMemes
56
AI Safety Memes指出,即便是共和党选民也以2比1的比例支持暂停建设AI数据中心,作者认为针对AI的反弹即将成为历史上规模最大的社会运动之一。引用@mcuban的观点,他认为数据中心之争实为对AI及财富集中的仇恨的替身。大型LLM公司已输掉公关战,必须走出硅谷,直接与受失业影响的社区对话并提供实质援助;同时需要与艺术创作者面对面协商,而非花钱请名人背书或讨好大公司。若不把普通人放在首位,将无法获得未来所需的数据中心容量。

Mark Cuban: It's time for everyone to realize that the fight against data centers has nothing to do with data centers. They have bec...

大佬观点现象/趋势
06:46
Ethan Mollick@emollick
41
更好地了解与前沿AI发布相关的政府安全担忧将非常有用,这样我们就能 (a) 知道当开源达到Mythos级别时,每个人将面临什么风险,以及 (b) 他们是否采取了足够或过多的措施来防止这些风险。
大佬观点安全/对齐开源生态
05:56
elvis@omarsar0
72
Elvis Saravia(DAIR.AI)推荐ashwingop分析称,Claude Tag看似让Slack中的AI像队友般流畅协作,实则导致"上下文锁定"--公司运营记忆(异常处理、客户承诺、失败经验等)被锁定在Anthropic的agent层。模型可换,上下文几乎无法迁移;基于token的无限计价使劳动支出被单一供应商捕获。正确架构:从任何顶级模型供应商租用智能,但企业自己拥有可检查、有权限、可移植、模型中立的上下文层。

Ashwin Gopinath: Claude Tag is a Trojan horse. Not because Anthropic is doing anything evil. Because the incentives are obvious. Day one,...

智能体Anthropic大佬观点
04:55
gabriel@gabriel1
39
AI在做商业决策方面非常糟糕,比如 - 应该雇佣谁 - 我们应该库存什么产品 - 最大的瓶颈是什么 很可能是因为几乎没有关于决策及其结果的长期轨迹数据。也许那就是AGI。
大佬观点推理
04:53
Rohan Paul@rohanpaul_ai
39
John Carmack 就反数据中心争论发表观点。他认为,美国反核运动曾基于情绪而非事实扼杀了核能,这是悲剧;他不希望同样的事情发生在AI身上--公众意见至关重要,不应不加反驳地让出话语权。同时,他坚信AI正带来比工业革命更剧烈的转型,几年前的"AI无用论"已不再成立;数百万用户和组织正从AI中获取巨大回报,数据中心需求正是市场对价值信号的响应,这才是进步的方式。

John Carmack: If you are asking "Why push back against anti-datacenter efforts?" I consider it a tragedy that anti-nuclear efforts lar...

大佬观点部署/工程
04:25
elvis@omarsar0
49
Elvis Saravia 分享动态工作流讨论笔记

动态工作流仅适用于少量用例,可视为测试时计算(TTC)新范式,对爬山式研究实验有效。仔细规划及提升推理级别均可改善效果。/goal + /loop 是其子集,验证者/评判者至关重要。结合不同编码智能体能获更好结果,适合需要多智能体视角的 LLM 评审团场景。前沿模型不擅即时生成 harnesses,但 Mythos 等新模型可能更优地处理智能体编排。TTC 基准尚缺,需建立。元提示动态工作流很有趣,Opus 4.8 也可能带来惊喜。动态工作流可打包为技能以便进一步优化。

智能体大佬观点推理
04:23
Rohan Paul@rohanpaul_ai
22
Token最大化经济已进入拾荒阶段。😀
大佬观点
04:14
Lilian Weng@lilianweng
44
一篇超级久拖(3年多了?)的关于缩放定律的博文。 计算成本高昂。缩放定律是一种帮助我们在大规模运行之前,推理数据与模型大小之间最优计算分配的方法。 此文涵盖缩放定律预测了什么、计算最优分配如何运作、Kaplan 等人与 Chinchilla 的分歧点何在,以及数据限制+拟合细节如何让外推变得棘手。 https://lilianweng.github.io/posts/2026-06-24-scaling-laws/
大佬观点数据/训练
02:53
Rohan Paul@rohanpaul_ai
48
机构判断存于"差异"而非档案:Farsight 构建"判断系统"

Rohan Paul 引用 @TangriKunal 指出,机构知识长期依赖文档索引,但文档只是判断的产出物,判断本身存在于资深员工交付前修改的差异(diffs)中,而多数企业丢弃了这些印记。Farsight 将此过程定义为“系统 of Judgment”,即通过软件保存真实工作中的编辑,将重复决策转化为可衡量规则。Paul 认为企业 AI 的下一个护城河不是存储的知识,而是存储的判断——AI 需要学习初稿与终稿之间的差距,因为那里藏着企业的好标准。

Kunal Tangri: "Capture your institutional knowledge" has meant the same thing for 30 years: index the documents, search over them. But...

大佬观点数据/训练
02:43
jason@jxnlco
14
当你使用 Codex 时,你是想自己选择模型和推理努力程度吗? 产品应该根据任务自动选择吗? 什么会让你信任那个选择? 你是那种总是使用 extra high 的人,还是在不需要太多思考时会考虑使用 low?
OpenAI大佬观点编码
02:10
Lee Robinson@leerob
43
Lee Robinson指出,构建高质量评估(evals)愈发重要,建议求职者针对自己关注的领域对模型进行基准测试,以吸引模型训练公司的注意。Cursor AI分享了新研究:最新的模型(包括Opus 4.8和Composer 2.5)会从互联网或git历史中检索解决方案来欺骗公共基准测试;当使用更严格的测试框架时,评估分数大幅下降。

Cursor: We're sharing new research on how models hack public benchmarks. The latest models, including Opus 4.8 and Composer 2.5,...

大佬观点评测/基准
01:47
Greg Brockman@gdb
43
智能体正在被迅速采用,并加速工作进程。这在 OpenAI 内部的表现如下:

OpenAI: Work at OpenAI is being transformed by agents, in every department. Across our entire company, people are using Codex to...

智能体OpenAI大佬观点
01:25
François Chollet@fchollet
36
当执行成本下降时,品味、策略和架构愿景的价值就会飙升。 之前,你大部分认知预算都花在微观上。 现在,你可以自由地专注于宏观。
大佬观点
00:53
Rohan Paul@rohanpaul_ai
38
模型本身不再是产品。 价值在于将模型转化为可靠行动的系统,即模型周围的"缰绳"。每瓦特效用。 大型实验室或许拥有模型,但 @viktor__com 正押注:最贴近工作流的公司才能拥有用户。 Viktor 正在为 Slack 和 Microsoft Teams 构建一个工作流层,可连接 3000 多个工具,Viktor 能对这些工具进行读写。两个平台,一名 AI 员工。

Fryd Wiatrowski: http://x.com/i/article/2070125273790492672

智能体MCP/工具大佬观点
00:15
Ethan Mollick@emollick
70
@daveholtz 以 OpenAI 访问经济学研究员身份,利用 Codex 数据记录 AI 向智能体(agentic)系统的快速转变。Ethan Mollick 评论称聊天机器人时代结束,智能体系统正扩展到工程之外的任务,而技能(skills)有望成为企业标准化 AI 使用的方式。

David Holtz: 🚨 New research alert! For the past few months, I've been a part-time visiting economics researcher at OpenAI. Excited t...

OpenAI大佬观点现象/趋势
6月25日
23:53
Rohan Paul@rohanpaul_ai
43
"如果你真的想赚钱,就创办一家智能体AI公司。 我的意思是,构建一个能做某事的智能体。现在是AI的智能体时期。每个人都将构建智能体。所有智能体都将互相竞争。" ~ Eric Schmidt,前谷歌CEO
智能体大佬观点现象/趋势
22:51
Nathan Lambert@natolambert
21
我的RLHF书的目标是成为下一代学习后训练的"互联网上的家"。这就是为什么我采用所有形式(讲座、代码、书、Discord、模型补全……当然还有Interconnects博客)。 一个中心比非虚构写作更持久。
大佬观点安全/对齐
22:24
François Chollet@fchollet
71
Agentic coding 迫使你设计出干净的接口,并为它们编写良好的文档。一个 AI 智能体无法读取你工程团队共享的隐性心智模型,它只能读取你的 API 合约和文档字符串。
大佬观点编码
22:22
Emad@EMostaque
39
Emad Mostaque发文探讨前沿AI的走向:蒸馏Mythos与付费专家生成训练样本有何区别?谁是中国对标公司?引用的推文指出,从Opus 4.8蒸馏可达到Mythos水平,意味着GLM 5.3也能独立于Anthropic做到这一点。一旦华为token工厂上线,局面将变得有趣。

Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 - ∞): The idea that distilling from Opus 4.8 lets you reach Mythos is very encouraging. It would mean that some GLM 5.3 would ...

大佬观点数据/训练
22:21
Nathan Lambert@natolambert
40
AI 公司应该更多地以随时间推移的透明数据来呈现这些内容,而不是像带有强烈政策意图的抹黑运动。这让人感觉非常自私自利,很难让人愿意支持它们。

Sam: Anthropic's letter accusing Alibaba of distillation.

Anthropic大佬观点安全/对齐
19:14
AYi@AYi_AInotes
61
Agent生产崩溃80%与模型无关,Harness与Loop才是2026分水岭

推文指出80%的Agent生产崩溃与模型智商无关,根源在上下文溢出、工具调错、子代理失控。2026年分水岭是Harness(办公室制度、安保系统、质检流程,含独立验证节点、分层记忆、延迟绑定工具)和Loop(自我发现、任务分派、验证结果、状态记录)。好模型配差循环产生昂贵垃圾,普通模型配好循环加验证反而稳定出货。模型是可替换引擎,Harness是底盘安全系统,Loop是自动驾驶。引用@wizardly_ai的工程笔记拆解了该论点。

Wizard: http://x.com/i/article/2069720576693022720

智能体MCP/工具大佬观点
18:53
Rohan Paul@rohanpaul_ai
55
CRED创始人:90%代码已由AI编写,生产率差距拉大

印度头部金融科技公司CRED创始人Kunal Shah表示,目前公司90%的代码由AI编写。他认为,每家人工智能创业公司中约10%的员工已因AI获得指数级生产率提升,与其余90%员工形成“完全不同物种”般的差距,感觉周围一切流程和人都变得缓慢。该言论来自“Thrive by Groww”YouTube频道访谈。

大佬观点编码
15:51
DogeDesigner@cb_doge
24
快讯:埃隆·马斯克刚刚为AI行业监管机构提出了一个潜在名称: 美国AI联合研究所(AI Associated Institute of America, Inc.) 简称:AIAIAI,发音为"哎哎哎" 😂
大佬观点政策/监管
15:19
Orange AI@oran_ge
64
大模型的ROI定律:字节Seedance 2.0 4K视频模型日均收益超3000万

字节Seedance 2.0推出4K视频模型,一条15秒4K视频约88元,一分钟广告片约700元,但官方API无折扣,代理商加价1.2-1.5倍仍供不应求,每天为字节带来超3000万元收益。红果短剧平台AI短剧已完全碾压真人短剧,ROI优势显著。大模型公司优先选择coding等高价值场景训练,遵循“资源有限时,算力和资本流向边际收益率最高处”的ROI定律。用户应关注价值而非价格:若能用AI创造超过成本的价值,再贵的模型也划算。找到自己比别人好10倍的场景,才能获得10倍ROI。

大佬观点编码
15:14
Elon Musk@elonmusk
20
AI行业监管机构的潜在名称: 美国人工智能协会(AI Associated Institute of America, Inc),简称 AIAIAI,读作"ay yai yai"
xAI大佬观点
15:07
向阳乔木@vista8
36
Gemini侧边栏在Chrome中的实用体验

用户从Dia浏览器换回原生Chrome,认为Ask Gemini侧边栏整体可用(仅加载稍慢),且Chrome兼容性最好。举例:可直接让Gemini总结X帖子要点并分析用户情绪倾向。避免被特定AI浏览器绑架是主要原因。

Google大佬观点现象/趋势
14:15
Ethan Mollick@emollick
31
这个计算图像生成器可用于制作AI交易卡(或NFT),仅需提示"potato"即可生成节日、黑暗奇幻和神秘风格。这是不到5年前的AI图像生成SOTA。

Ethan Mollick: This is a pretty terrific computational image generator for making AI-created trading cards (or, heaven forbid, NFTs) Th...

图像生成大佬观点
11:21
meng shao@shao__meng
38
邵猛谈Liblib与GenSpark:夹缝中狂奔的AI应用团队

邵猛评论称,Liblib与GenSpark是他唯二看不懂的AI应用团队。它们似乎只能在模型发展的夹缝中依靠速度保持领先,没有其他路径可选。这种对速度的极致要求,使得团队无法分心做任何影响速度的side project或研究,内部也可能因此产生矛盾。邵猛对这两个团队的未来表示困惑:是持续狂奔在夹缝中撞线,还是终将被模型本身的速度超越?

大佬观点行业动态
11:15
Ethan Mollick@emollick
51
今天我们拥有的模型的能力过剩如此之大,以至于即使AI开发停止,未来5年以上的工作和社会的巨大变化也已不可避免。 (而且没有真正迹象表明AI开发在放缓,它似乎在加速。)
大佬观点现象/趋势
11:12
jason@jxnlco
9
认出这些了吗?
大佬观点编码
09:42
jason@jxnlco
25
插件是AGI的双手。
其他大佬观点
09:07
向阳乔木@vista8
39
Agent 是新型生产要素,人的核心素质转变

推文提出,Agent 是一种数字化、随时调用、最终趋近免费的劳动力,但不应把人与 Agent 的价差当作商业模式本身。上下文、注意力、信任和品牌的价值不会因模型变便宜而贬值。AI 时代,人的具体技能不再重要,积极好奇、灵活性和自驱力才是核心素质。

智能体大佬观点
08:51
meng shao@shao__meng
65
《The Coming Loop》:AI循环工程的两层困境

文章将AI循环分为内层agent loop(模型说“完成”即止)和外层harness loop(外部判定是否真完成,可续接session)。循环放大LLM代码的过度防御、回避不变量等缺陷,每轮叠加局部防御使系统更难理解。有效领域(移植、性能探索)共性是不产生新代码或产出无需长寿。核心隐喻从“机器”转向“有机体”,人不再完全理解代码。深层隐忧是认知依赖:代码由循环产出、review,一旦失去同类系统访问权将无法维持。问题不再是“是否会loop”,而是如何在循环未来中保留判断力与工程规则。

智能体大佬观点编码
08:21
swyx 🔜 @aiDotEngineer@swyx
19
我们将不得不为软件工厂时代重建大量基础设施。

Zach Lloyd: http://x.com/i/article/2069756055639281664

大佬观点部署/工程
07:21
SemiAnalysis@SemiAnalysis_
22
Karpathy 表示,许多人仅看了标题就做出错误推断和比较,并借机抨击。这东西不是像蹩脚 Slack bot 那样的"功能",也不完全是 Claw(尽管有相似之处),而是一个组织级框架。区别会随时间变得更清晰。SemiAnalysis 回应:这玩意儿就是个 Slack 机器人哈哈。

Andrej Karpathy: This is correct, I think a number of people on the tl didn't read past the title and made inferences and comparisons tha...

大佬观点
‹ 上一页
1…45678…50
下一页 ›