未来几周将有超强AI模型发布,模型能力可能迎来阶段性提升。DAIR.AI创始人Elvis Saravia认为,当前最大的错误是从成本或工程角度锁定单一供应商,建议开始利用模型组合(包括开源模型),保持“模型无关”,以便随时切换模型以发挥其各自优势。对于编程智能体,开源模型表现已媲美前沿模型。他建议将“AI模型路由”作为核心策略,高效分配任务/工作给不同模型,这是一项高回报的AI工程投入。
未来几周将有超强AI模型发布,模型能力可能迎来阶段性提升。DAIR.AI创始人Elvis Saravia认为,当前最大的错误是从成本或工程角度锁定单一供应商,建议开始利用模型组合(包括开源模型),保持“模型无关”,以便随时切换模型以发挥其各自优势。对于编程智能体,开源模型表现已媲美前沿模型。他建议将“AI模型路由”作为核心策略,高效分配任务/工作给不同模型,这是一项高回报的AI工程投入。
Google DeepMind 联合创始人兼 CEO Demis Hassabis 在新采访中表示,社会需要意识到我们没有多少时间准备了,人类正站在奇点的山麓。他认为 AGI 可能只需几年,大约 2030 年(±1 年)就能实现。推文作者评论指出,真正的颠覆不在于 AGI 何时精准到达,而在于机构能否适应——后 AGI 世界技术变化远快于人类系统响应速度,学校、公司、政府均未做好准备。若 AGI 按前沿实验室时间线到来,这一滞后将压缩成危险鸿沟。
商汤资本市场主管 Phil Wong 在汇丰私人银行圆桌会议上指出,中国 AI 优势日益体现于成本、产品质量及提升终端客户生产力与效率。真正差异化在于大规模创造可衡量业务成果。商汤实践包括:多模态模型 SenseNova U1 以较小规模实现强性能;AI 工具 Office Raccoon(数据分析与 PPT 生成)和 Seko(视频制作);AI 基础设施 SenseCore 通过算力协同优化降低能耗、提升效率。此外需关注空间智能、世界模型等前沿领域。
DeepMind创始人Demis Hassabis在Google I/O上表示,AGI(约2030年)的到来将等同于奇点——一个不可逆转的技术突破点。他直言社会需要尽早准备,因为时间不多了;回顾当下,我们正站在奇点的山脚。推文作者将其视为比工业革命快10倍、强10倍的深刻革命,人类社会正面临前所未有的变革。
本周一篇AI论文探讨自我改进智能体是否真正发现新知识,还是仅重新组合已知信息。作者将行为分为三类:检索(查询已有笔记本)、搜索(组合现有工具)和发现(发明新概念),并用范畴论和左Kan扩展定义——若旧版本能产生相同结果则非发现。他们构建Builder/Breaker agent研究蛋白质力学,四轮中R²从0.48升至0.68再降至0.54和0.41,看似变差实则不断挑战更难蛋白质并重写理论:数据增长近10倍,模型代码仅增长1.3倍。论文提出用代码压缩率作为真实发现信号。链接:arxiv.org/abs/2606.01444。
Gary Marcus在金融时报上看到John Burn-Murdoch的一张图表,认为它精准提炼了自己一直试图表达的观点。
Tomorrow could be Apple's most important AI moment yet. WWDC 2026 is expected to be all about one thing: making Siri rel...
邵猛此前在法国企业做数据分析软件,节奏极慢,两天就能完成一周工作。14-15年左右,他加入AI CV四小龙旷视,周围多是清华姚班的全职或实习生,智商极高、学东西快且深。作为算法封装与商业化工程师,他硬学CV知识,两三个月后跟上节奏。曾与一位算法伙伴两周用古法编程跑通人脸关键点和美颜贴纸算法,获公司认可。此后心态彻底改变,不再畏惧跨领域挑战。后来离开旷视,在创业公司担任CTO等。
While I'm no fan of socialism or arbitrary confiscations of wealth, I can see why Bernie Sanders' proposal (for the gove...
Jane Street 博客上的一篇文章中,作者表示如今自己使用 Claude 进行设计的时间已经超过了使用 Figma。该观点引发了 Hacker News 上的讨论,原文标题即为“现在我用Claude进行设计的时间比用Figma还要多”。
小岛秀夫近日接受《华盛顿邮报》采访,谈及生成式AI在艺术领域的角色。他表示AI或许能创造艺术,但在自己有生之年无法见证,对此不感兴趣。此前他曾在Prada Satellites II装置艺术展中因AI生成数字形象引发争议。小岛形容AI最适合扮演“清洁工”角色,人类应继续留在艺术创作的核心房间,生成式AI应用于提升效率而非取代创造力。
Anthropic's Opus 4.7 and 4.8 models are experiencing degraded performance, which is causing a higher rate of failures fo...
Suddenly it hit me. What happened to DeepSeek? Sora? GitHub Copilot? Llama? Cursor? Perplexity? What happened?
博主清晨提出几个灵魂拷问:法国人假期多却生活优渥(难道不是越努力越赚钱?);中国为何不能效仿?未来AGI后中国能否成为法国?随后直指Gemini难用,批评谷歌连基本的chatbot都做不好。
Apple WWDC 将于周一开幕,今年将揭示如何将 AI 模型深度集成至操作系统中。已知是专为 Apple 开发的 Gemini 版本,拥有 1.2 万亿参数,但本地运行更小的模型;复杂查询则调用 Apple 自有服务器上的大模型。悬念在于:Apple 版 Gemini 实际表现如何?集成深度怎样?是否会推出与 Siri 对话的语音模式或 iOS 语音控制?
邵猛作为AI产品/研发负责人,每天需关注最新AI Agent信息。他尝试过手动刷X、Reddit、Hacker News、Huggingface等网站——体感直接但效率低;也试过Perplexity等工具——效率高但信息深度不够。他提出疑问:是否有既高效又保证信息完整度和深度的、专门面向Agent的搜索产品?
Real-world AI is about solving for the edge case, not the average case
"I don't prompt Claude anymore. I have loops running that prompt Claude and figuring out what to do. My job is to write ...
Claude Desktop 打开内置的网页预览的那一刻我惊呆了,一个屏幕居然能放下这么多 Panels! 这产品经理应该是用 Zoom 开视频会议的时候灵机一动想出来这么牛逼的设计的!
Anthropic 年度开发者大会上,Claude Code 负责人 Boris Cherny 描述了过去 6 个月的转变:他曾经手写所有代码,现在全部由 Claude 编写。他只需用 prompt 与 Claude 对话,让 Claude 构建功能、测试并展示结果,然后给出修改指令。更进一步,他不再手动 prompt,而是运行循环自动 prompt Claude 并决定行动——他的工作变成了写这些循环。Cherny 称这一转变将在今年剩余时间持续。
"I don't prompt Claude anymore. I have loops running that prompt Claude and figuring out what to do. My job is to write ...
博主阿易 AI Notes 强烈推荐桌面智能体(Agent)Codex,认为它优于国内大厂产品。他逐一批评了字节 Coze(不智能、仅支持命令行)、阿里悟空(内测不好用)、腾讯 workbuddy(基础不智能)和腾讯马维斯(能力较全面但仅限浏览器操作)。文章断言国内外众多桌面 Agent 中“只用 Codex 就够了”,特别适合零基础小白和文科生,无需折腾其他方案。
http://x.com/i/article/2063237792746831872
这几天陪老家的亲戚,都是六七十年代生人。有几个很深的感触: 1、微信、拼多多、抖音非常伟大。基本上涵盖了老一辈用手机的所有场景。其他应用确实都没有存在的必要。除了豆包,逐步有老人家提及,并在研究怎么用,能明显感觉到那种提及时的兴奋感。 2、...
跟Tom聊完了,直播中讨论的大模型前端审美主观排名: Claude opus 4.8 > kimi2.6 > GPT 5.5 > Deepseek v4 pro > GLM 5.1> deepseek v4 flash 不知道和你的实际使用...
软银创始人兼CEO孙正义表示,AI的市场规模可能比互联网泡沫大50倍,下一个万亿美元公司将来自机器人领域。他指出,互联网泡沫在2000年破裂后实际增长远超当时顶峰,而AI目前才刚刚起步,未来的利润和增长机会极为巨大。
Gary Marcus 在文章中分享了对 AI 领域刚刚发生事件的看法,表达了对当前 AI 发展方向的思考。