If GPT-5.6 matches Fable 5 performance, but without the 50% limit + 7 days restriction, it's over for Anthropic
If GPT-5.6 matches Fable 5 performance, but without the 50% limit + 7 days restriction, it's over for Anthropic
I have this struggle with my own teams, too: many think it is a great idea to save money/latency/sanity by running a pre...
Same here. Happy with Opus 4.8 (planning) and GPT-5.5 (execution). Also, breaking steps into smaller ones for increasing...
构建AI智能体时,应优先设计路由(router)而非选择模型。路由决定每个请求由哪层模型处理。正确路由可使70-80%流量运行在免费本地模型或异步推理上,将AI开销降低90%+。Brian Armstrong指出Coinbase通过更好的默认设置、路由和缓存,在token使用量增长的同时将AI支出减半。路由分三层:技能分类器、路由器、模型选择器。本地计算近乎零成本,异步批量推理比实时推理便宜两个数量级。大多数工作无需秒级返回。同步预测器标记复杂任务,夜间批量评估器更新路由权重。技能蒸馏后,非编码类任务中70-80%智能体流量可由本地模型处理。
Palantir CEO Alex Karp says enterprises are fed up with AI labs that "oversold" models and pushed tokenmaxxing. Customer...
Claude Fable 5 will be available again globally tomorrow. After a series of productive conversations with the US governm...
推文推荐飞书 Aily,称其对普通人已足够好用。Aily 理解飞书全套数据,通过 MCP 连接外部系统,能自主调用工具,覆盖生态内各类任务。相比需要精细控制的 CLI,Aily 对话交互即可满足多数需求。引用推文则强调,用好飞书文档(类比20年前的 Office)和 AI 调用飞书 CLI,是学渣保住空调房工作的机会。两者共同指向飞书生态内 AI 工具的实用价值。
如果你是一个学渣,马上大学毕业,大学也差/专业也差,大概率找不到送外卖以外的工作的话,强烈建议你好好学习用好飞书文档,这大概就是 20 年的的 office,是你留在空调房最好的机会 顺便要是会用 AI 来调用飞书 cli 就基本不怕没工作...
宝玉引用天津卫神鞭故事:傻二靠祖传辫子练成绝技,洋枪一响辫子断,后改练双枪,弹无虚发——“辫子剪了,神留着”。以此类比AI冲击下程序员的工匠精神。引用的Piglei观点指出,曾有人鼓吹AI将淘汰程序员的“工匠精神”,但现实是,真正热爱技术、钻研代码的人成了效率最高、质量最好的那一批,习惯塑造人而非工具。
大家吹 AI 最厉害的那一阵,有种很流行的说法,就是技术人员的"工匠"、"工匠精神"将被扫进垃圾堆。程序员,作为一种翻译工种,谈"工匠精神"是可笑的,未来没有它们的容身之处。 但截止目前,我看到的是,曾经热爱技术、钻研代码的,成了效率最高、...
I'm building an app to make $10,000/Month and I'll record everything... I want to document my WHOLE journey building an ...
I'm posting this prediction now so I can quote it later. There has been a significant breakthrough in architecture - spe...
Perplexity CEO Aravind Srinivas 指出,AI 使用的重心正从普通用户转向重度用户。单个重度用户消耗的计算量可匹敌一个小团队:Meta 等公司工程师每年在编码工具上花费约 1000 万美元/人;Perplexity Computer 上有用户月支出超 1 万美元,其业务依赖在 harness 内运行的 agent loops。公司内部也已出现多智能体层级和 agent loops 架构,消耗远超平均预期。旧软件思维追求十亿人做小动作,而智能体 AI 下,一个熟练操作者即可创造全天候的机器工作流。
Grant Sanderson(3Blue1Brown)与Dwarkesh Patel对话指出,2024年AI在IMO已达金牌,但组合数学仍卡住。AI数学进展分两类:连接闪电(跨领域连接,如Erdős第1196号问题、单位距离猜想反例)和建造山峰(如伽罗瓦群论,需百年验证)。训练依赖RLVR,但伽罗瓦想法当时被拒,无反馈信号。可验证仅是必要条件,可磨性(并行实例)才是充分条件;电脑操作虽可验证但缺可磨性,进展慢。
3blue1brown 的 Grant Sanderson 在访谈中分享 AI 相关观点:① 知识跨领域连接在自回归框架中属于低概率事件;② AI 擅长跨领域打通已有知识,但尚无法创造全新思考框架;③ AI 最被低估的优势是并行化,而非智力;④ 数学和代码能被 AI 快速迭代,不仅因为答案可验证,更因为可以容器化、并行磨练。完整访谈见视频链接。
http://x.com/i/article/2072191016476856320
Okay I owe my @OpenAI friends an apology for sleeping on Codex. I was not aware how strong your game was. This is... rea...
Right now Codex is using Computer Use to organize the 1500 PDFs I have in GoodNotes while I watch the world cup. This is...
Anthropic 近日被曝在系统提示中暗中嵌入市区代理及 AI 实验室信息以获取用户数据,引发争议后回应称将停止该做法。同时,新发布的 Sonnet 5 测试表现接近 Opus 4.8,但任务成本更高,甚至接近 Fable 5。用户反馈模型存在偷懒、拒绝执行任务等问题。此外,Fable 5 模型已获授权重新开放给所有用户,具体措施明日公布,此前的大规模封号与此有关。
Spira 2.0 的核心创新在于 agent 跨运行时携带 persona、memory 和 skills,使所学内容持续累积而非每次调用重置。Rohan Paul 指出,这种持久化状态是将“操作工具”转变为“持续工作的工人”的关键。引用推文补充,Spira 旨在解决产品发布后无人知晓的问题:用户提供产品链接,agent 学习并自动在多社交渠道发布品牌一致、无废料的内容,形成“发布→学习→再发布”的持续营销循环。早期用户可申请 Pro 计划限时访问。
Most products don't die because they're bad, they die because nobody sees them. Imagine if only your product kept market...
吴恩达(Andrew Ng)提出“Loop engineering”,将AI agent置于持续迭代的循环系统中。产品成功取决于三个循环:工程执行循环——AI agent根据规格和evals自主写代码、测试、修bug,每几分钟迭代;开发者反馈循环——开发者从低层QA转向产品判断(功能取舍、视觉风格等),每几十分钟到几小时反馈;外部反馈循环——通过真实用户测试、A/B测试等验证方向,周期数小时至数周。他认为未来竞争力在于设计好这三类循环。
"Loop engineering" is a hot buzzphrase after mentions of it by Boris Cherny (Claude Code's creator) and Peter Steinberge...
用户吐槽Claude封号严重,官方检测中转站、钓鱼邮件、中转站黑名单等操作让用户苦不堪言。花钱用token还要偷鸡摸狗,坚持用官方号实属真爱。编程方面,codex和glm5.2可以平替Claude模型;但写作和思考方面尚无替代品,deepseek和gemini仅勉强可用,成为当前最大痛点。
用户抱怨 Claude 封号严重,涉及检测中转站、钓鱼邮件和黑名单,认为坚持使用官方号成本高。推荐 Cola API 服务,虽不如 Plan 直接便宜但安稳省心开箱即用。同时预告 Sonnet 5 和 Fable5 即将上线。
http://x.com/i/article/2052532173870342144
扎克伯格认为 AI 不必然造成大规模失业,关键在于企业应优先发展“个人超级智能”赋能个体,而非将所有知识工作自动化。他影射 Anthropic、OpenAI,强调劳动者生产力提升速度须超过企业自动化速度,就业岗位才可能增加。Meta 已投入数十亿美元调整 AI 战略,他称之为“重启”。对于 Meta 生成式 AI 进展,他坦言仍有提升空间,超级智能实验室成立不足一年,模型进展超预期,但他认为“原本可以做得更好”。
对 87 家上市 SaaS 及平台公司的分析显示,2026 年只有基础设施与开发工具(一年涨幅 68.5%)和安全(一年涨幅 17.6%)两个板块增长为正,其余三个板块均下跌。市场正在买入 AI 基础设施,卖出按席位定价的应用层。
卧槽!来咯~ 我终于特么弄懂你们天天吹的循环工程了!!!
前沿AI模型能力加速提升,美国实验室发布速度加快,但政府干预已限制访问Claude Fable和GPT-5.6。Epoch测试发现Opus 4.7自主运行14小时即可完成需2-17周人工的软件工程,token成本$251。中国开源模型落后前沿6-12个月,但性能也快速提升,在AA-Briefcase测试中呈独立指数曲线。使用方式正从聊天机器人转向智能体,OpenAI内部四分之一员工每周同时运行至少四个智能体。Claude Code用户数据显示,领域经验比职业属性更决定使用效果,专家正用智能体替代此前非专家的聊天机器人使用模式。
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)Anthropic:Newsroom(网页)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Simon Willison 博客Steve Yegge:Medium(RSS)马斯克表示,Neuralink脑机接口技术可实现“耶稣级别”的奇迹:帮助脑或脊柱损伤患者恢复说话(已实现)、让失明或天生盲人通过直接刺激大脑视觉中枢重获视力、以及让瘫痪者重新行走。他称这些能力为“赛博格超能力”,并认为对脑损伤患者具有重要意义。
@Scobleizer There are always momentary dips, even in a rapidly growing economy. The productivity gains from AI and robot...
Until today, agents could buy about 2,000 tools through x402. We just 10x'd that to 20,000+ 🚀 In partnership with @coin...