http://x.com/i/article/2053655813877870592
Good take My guess is - demand for intelligence is near infinite - but 80% of workloads will be running on 99% cheaper m...
Here's your monthly reminder that you shouldn't be prompting coding agents anymore. You should be designing loops that p...
小互分享个人经验:此前追求完全自动化,导致不断与AI扯皮、对技能和系统频繁修改,效果反而更差。现在删除所有规则,只在关键节点人工介入,与AI共同完成任务,不仅效果更好,人也轻松许多,不再频繁抱怨AI。
郭明錤指出,Apple 當前多頭核心敘事是「AI 雖落後但最終後來居上」。供應鏈調查顯示其業績將好到今年底,進一步強化此敘事。WWDC26 上無論發布什麼,只要該敘事不被破壞,Apple 2H26 股價正向趨勢就不易改變。真正觀察點在於:Apple 能否用 Gemini 做出比 Google 更好的 AI 應用、AI 智能體工作流及設備端+雲端混合體驗。答案肯定則利好敘事延續;否則「Gemini 決定 Apple AI 上限」的質疑將削弱「後來居上」共識。
郭明錤指出,苹果核心看涨叙事是“AI暂时落后但最终会迎头赶上”。供应链显示业务势头年底前强劲,强化“无AI已不错,有AI更想象”叙事。故无论WWDC26内容,只要叙事不变,苹果2026下半年股价趋势积极。WWDC26真正看点在于苹果能否用同款Gemini做出比谷歌更好的AI应用、智能体工作流及端云混合体验。若能,叙事延续;若不能,Gemini设定AI上限,“苹果最终领先”将受质疑。
银行业正公开为AI驱动的裁员做准备。摩根大通、花旗、高盛、渣打银行高管承认,随着AI技术普及,许多岗位将被淘汰。初级分析师班级规模削减幅度高达三分之二,导致学生难以进入金融行业,尽管银行仍主要从这些初级群体中招募AI人才。与此同时,银行也在推出针对性AI应用,如花旗的财富管理化身和Revolut的APP内助手。不过,有人质疑并非所有宣布的裁员都真正由AI驱动,可能只是掩盖之前的过度招聘。
95分钟AI电影《Hell Grind》由15人14天完成,成本50万美元(80%为算力)。相比中位数美国电影(约200人2年、1800万美元),实现660倍人时、50倍时间、36倍成本改善。影片从约100小时AI生成素材(使用字节跳动Seedance等模型)中按64:1比率剪辑。质量方面,角色一致性、摄像机角度和写实感基本解决,但剪辑过多、角色口音多变、AI合成声音明显,动作和编排生硬——整体平庸,主因是导演选择而非模型限制。作者认为这是AI电影最差、最慢、最贵的时刻,未来创作者将直接投放YouTube。
Seeing a number of benchmarks showing Opus is the best model for long-running work. Five tips for running Opus autonomou...
The thing about people talking about building with AI is that they always talk about how they're building, what tools th...
邵猛发文批评某公众号文章,称其是典型中国自媒体风格——咋咋呼呼、定论多、论据靠嘴。文章提到“大厂抢青少年”(最小6岁学Agent、Coding),邵猛认为这只是培训机构的生意。文章还声称“靠AI裁员”,邵猛斥之为企业借口。邵猛特别质疑脉脉CEO林凡的数据:去年AI人才需求增长10倍、今年再增长8.7倍,怀疑这些数字来自脉脉内部职位,且可能只是旧职位改名加“AI”关键词,并非真实需求。
Anthropic Claude Code 负责人 Boris Cherny 表示,他不再手动写提示词,而是编写 Loops 让 AI 自主决策和解决问题。伴随 Claude Opus 4.8 和 GPT-5.5 等高智能模型出现,手把手写 Prompt 的模式将被取代。但 Loops 方案消耗 Token 过快,一个 Goals 可能耗尽 5 小时用量,企业仍需严格审查 Token 消耗的 ROI,因此实践中会通过前置的 Spec、AGENTS.md 等约束让 AI 做确定性可控的部分。Boris 预测这一转变将在今年剩余时间持续。
"I don't prompt Claude anymore. I have loops running that prompt Claude and figuring out what to do. My job is to write ...
宝玉不认同“选HTML而非React”的观点。首先,设计稿需要动态数据交互,HTML难以胜任,而Claude Design是UX交互工具。其次,复杂UI必须拆分为小组件,React能实现重用与低上下文修改,大型HTML则维护困难。再者,React天然形成结构化树形设计,方便coding agent开发,HTML结构割裂、难以与设计映射。至于文章说模型注意力需放在React运行准确率上,宝玉认为当前大模型能力已使此问题不复存在。
http://x.com/i/article/2063275048157458432
I have a new kind of big button that I can press for Codex. Over the next 100 days, we will select one person per day wh...
未来几周将有超强AI模型发布,模型能力可能迎来阶段性提升。DAIR.AI创始人Elvis Saravia认为,当前最大的错误是从成本或工程角度锁定单一供应商,建议开始利用模型组合(包括开源模型),保持“模型无关”,以便随时切换模型以发挥其各自优势。对于编程智能体,开源模型表现已媲美前沿模型。他建议将“AI模型路由”作为核心策略,高效分配任务/工作给不同模型,这是一项高回报的AI工程投入。
Google DeepMind 联合创始人兼 CEO Demis Hassabis 在新采访中表示,社会需要意识到我们没有多少时间准备了,人类正站在奇点的山麓。他认为 AGI 可能只需几年,大约 2030 年(±1 年)就能实现。推文作者评论指出,真正的颠覆不在于 AGI 何时精准到达,而在于机构能否适应——后 AGI 世界技术变化远快于人类系统响应速度,学校、公司、政府均未做好准备。若 AGI 按前沿实验室时间线到来,这一滞后将压缩成危险鸿沟。
商汤资本市场主管 Phil Wong 在汇丰私人银行圆桌会议上指出,中国 AI 优势日益体现于成本、产品质量及提升终端客户生产力与效率。真正差异化在于大规模创造可衡量业务成果。商汤实践包括:多模态模型 SenseNova U1 以较小规模实现强性能;AI 工具 Office Raccoon(数据分析与 PPT 生成)和 Seko(视频制作);AI 基础设施 SenseCore 通过算力协同优化降低能耗、提升效率。此外需关注空间智能、世界模型等前沿领域。
DeepMind创始人Demis Hassabis在Google I/O上表示,AGI(约2030年)的到来将等同于奇点——一个不可逆转的技术突破点。他直言社会需要尽早准备,因为时间不多了;回顾当下,我们正站在奇点的山脚。推文作者将其视为比工业革命快10倍、强10倍的深刻革命,人类社会正面临前所未有的变革。
本周一篇AI论文探讨自我改进智能体是否真正发现新知识,还是仅重新组合已知信息。作者将行为分为三类:检索(查询已有笔记本)、搜索(组合现有工具)和发现(发明新概念),并用范畴论和左Kan扩展定义——若旧版本能产生相同结果则非发现。他们构建Builder/Breaker agent研究蛋白质力学,四轮中R²从0.48升至0.68再降至0.54和0.41,看似变差实则不断挑战更难蛋白质并重写理论:数据增长近10倍,模型代码仅增长1.3倍。论文提出用代码压缩率作为真实发现信号。链接:arxiv.org/abs/2606.01444。
Tomorrow could be Apple's most important AI moment yet. WWDC 2026 is expected to be all about one thing: making Siri rel...
邵猛此前在法国企业做数据分析软件,节奏极慢,两天就能完成一周工作。14-15年左右,他加入AI CV四小龙旷视,周围多是清华姚班的全职或实习生,智商极高、学东西快且深。作为算法封装与商业化工程师,他硬学CV知识,两三个月后跟上节奏。曾与一位算法伙伴两周用古法编程跑通人脸关键点和美颜贴纸算法,获公司认可。此后心态彻底改变,不再畏惧跨领域挑战。后来离开旷视,在创业公司担任CTO等。
While I'm no fan of socialism or arbitrary confiscations of wealth, I can see why Bernie Sanders' proposal (for the gove...
Anthropic's Opus 4.7 and 4.8 models are experiencing degraded performance, which is causing a higher rate of failures fo...
Suddenly it hit me. What happened to DeepSeek? Sora? GitHub Copilot? Llama? Cursor? Perplexity? What happened?
博主清晨提出几个灵魂拷问:法国人假期多却生活优渥(难道不是越努力越赚钱?);中国为何不能效仿?未来AGI后中国能否成为法国?随后直指Gemini难用,批评谷歌连基本的chatbot都做不好。