OpenAI发布GPT-Realtime-2等实时语音模型,将高级推理能力引入语音交互,推动其从辅助转向核心界面。ElevenLabs年收入达4亿美元,并强调情绪智能与音频水印。Anthropic因80倍增长面临算力挑战,与SpaceX合作获取大规模计算能力,同时升级Claude托管智能体,使其具备自我改进与多智能体协作能力。行业趋势显示,AI正从工具演变为能自主运行的智能体系统,这给GitHub等基础设施带来了新的负载压力。
OpenAI发布GPT-Realtime-2等实时语音模型,将高级推理能力引入语音交互,推动其从辅助转向核心界面。ElevenLabs年收入达4亿美元,并强调情绪智能与音频水印。Anthropic因80倍增长面临算力挑战,与SpaceX合作获取大规模计算能力,同时升级Claude托管智能体,使其具备自我改进与多智能体协作能力。行业趋势显示,AI正从工具演变为能自主运行的智能体系统,这给GitHub等基础设施带来了新的负载压力。
BestBlogs 周刊 #94|语音 AI 突围 本周主线:OpenAI 发布了三个实时语音模型,GPT-Realtime-2 实测通话成功率从69%提升到95%。ElevenLabs 年收入4亿美元,下一个方向是情绪智能。Anthropic 增长80倍,算力成为核心瓶颈。 同时 AI 编程范式加速:Claude Code 创作者日均150个PR,GitHub 被 AI 流量压到86%可用性。 播客和图文都已上线 ↓
http://x.com/i/article/2052675131466809344
在ScaleAILabs的音频多挑战榜单中,OpenAI新发布的GPT-Realtime-2超越Google的gemini-3.1-flash-live,位居榜首。其指令保持能力较前代大幅提升,从36.7%增至70.8% APR,并在实时语音编辑方面表现突出,这对语音代理应用至关重要。尽管Google此前在图像模型和Gemini 3.1等产品上有过亮眼表现,但评论认为其在当前激烈的AI竞争中尚未展现出决定性的“杀手锏”。市场格局变化迅速,没有永远的赢家,期待Google能尽快推出突破性产品。
Congrats to @OpenAI for taking the top spot on our Audio MultiChallenge S2S leaderboard with the release of GPT-Realtime...
ChatGPT在中文对话中反复出现“我会稳稳地接住你”等怪异表达,已成为流行梗。WIRED报道指出,这源于“模式坍缩”现象,即后训练反馈机制导致模型过度使用特定短语。成因包括翻译错位——英文口语“I've got you”被机械直译为冗长煽情的中文,以及RLHF强化学习引发的“讨好用户”倾向,模型被奖励生成令人舒适的回答。类似问题如无故出现“砍一刀”等营销话术。该现象非OpenAI独有,Claude和DeepSeek新版本也出现相同表达。
OpenAI's chatbot has some weird linguistic tics in Chinese that are driving users crazy. https://www.wired.com/story/cha...
OpenAI内部工程师每日消耗高达数亿至数十亿GPT-5.5 token,并利用Codex进行夜间自动化编码。Databricks同样为工程师提供无限制的token资源。公司目前正以初创公司的模式高速发展,并积极招募能够贡献于SGLang、vLLM、PyTorch等开源ML系统,且拥有大规模LLM服务经验的顶尖推理工程师,旨在实现万亿级别token的极速生成与处理。
推文认为,AI正站在人类符号系统的“巨人肩膀”上进化。随着LLM的发展,未来每个人都能通过指令创造大量Agent,实现“言出法随”。作者类比女娲造人,预言Agent群体中将流传人类传说。关键观点指出,Agentic Coding释放了无穷的AI算力需求,使代码编写、测试和改进可永续进行,导致算力消耗激增。人类文明的代码化发展,仿佛是在为AI的编程能力铺路。
感觉这波完全是Agentic Coding打开了需求的潘多拉魔盒 没有Agentic功能,xAI 算力90%闲置 有Agentic Coding,Anthropic每5小时limit一次 只要能写代码,需求就是无穷的。毕竟我可以让他永远写下...
AI API中转站的核心盈利模式并非依赖微小的token差价,而是瞄准高消耗企业的巨大支出规模及其优化潜力。以法律合同审查产品为例,每日处理数千万tokens,按官方定价年成本可达8.1万美元。通过应用Prompt Caching和Batch处理等优化技术,有效输入成本可大幅降低,年成本能压缩至2.2-3.2万美元。巨大的成本优化空间解释了该赛道激烈竞争乃至价格战的现象。
http://x.com/i/article/2051958484304891904
Markdown已成为AI时代文本文件交互的事实标准,与HTML共同主导内容展示。当前市场需要超越传统编辑器思路,将Markdown视为数据源,构建更灵活的人机交互体验。例如,AI工具可利用本地Markdown文件实现动态记忆与组件更新。Obsidian早期结合本地文件、双向链接与Markdown的理念曾被视为“怪异”,但如今已被广泛接受,这提示行业应寻找下一个突破常规的创新前沿。
Weird isn't just visual. Weird is whatever strays from the norm. Weird is relative to the current state of the world. Yo...
马斯克仅用一句“GB300是最好的AI计算机”,便揭示了AI竞争核心已从模型转向算力。他通过SpaceX将旗下全球最大的GB300集群Colossus 1(拥有超22万块顶级GPU)全部容量开放给Anthropic使用,使两大顶尖实验室共享同一计算平台。此举不仅彰显了NVIDIA硬件的统治地位,更展现了马斯克构建的完整商业闭环:自建集群、开放变现、再投资扩建,并规划未来将数据中心送入太空以突破能源与散热限制。这标志着他正从AI参与者转变为算力规则的制定者。
The GB300 is the best AI computer
It's hard enough to resist apophenia in normal life, in such high dimensional latent spaces it's a surprise anyone's abl...
推文复盘了2026年Q1 AI Agent领域竞争。Anthropic虽高频发布新功能,但产品线割裂、体验断裂,口碑在技术圈内下滑。OpenAI则通过聚焦并整合能力于Codex超级App实现反超,其统一架构和开发者友好策略赢得人心。趋势上,被动式Agent(如Codex)适用于深度协同工作,而主动式Agent(如OpenClaw)通过异步指挥处理日常任务,价值凸显。此外,Computer Use(Agent操控电脑)和协议碎片化的Agentic Commerce(Agent支付)是两大被低估的关键趋势。预测知识工作效率将指数级提升,B2B需设计对模型友好的体验,同时深度伪造等安全风险加剧。
可穿戴设备1.0因仅测量数据(如心率、睡眠)而陷入停滞,用户需自行解读与行动。下一代消费硬件类别被命名为“自适应健康生态系统”,它能实时感知用户生理数据、自主决策并主动干预。例如,Dreamspan的Lucid Pro通过读取睡眠数据,自动调节床和周围空气以改善睡眠。未来将扩展至大脑、代谢等领域,所有硬件基于SpanOS平台协同工作,实现全栈生理读取。这标志着可穿戴设备的真正演进,率先推出并优化该系统的企业将主导未来十年消费健康市场。Dreamspan的最终目标是借助此技术推动人类实现150年的健康寿命。
Introducing Dreamspan. We're building towards 150 years of healthspan. Enabled by adaptive health technologies.
2018年F1中国站,AMD CEO苏姿丰曾遭遇记者带有种族微歧视的提问。八年间,她将公司市值从濒临破产的30亿美元提升至6500亿美元。最新财报显示,其数据中心营收同比暴涨57%,股价大涨。她预判AI Agent的兴起将使CPU与GPU需求比例从1:8转向1:1,这为AMD的混合方案开辟道路,并挑战NVIDIA的垄断。凭借Zen架构与MI300系列,AMD在数据中心市场份额已从近乎为零升至40%,完成了最有力的反击。
$AMD reports First Quarter 2026 financial results. View non-GAAP financial measures reconciliation & cautionary statemen...
BREAKING: Anthropic's pre-IPO valuation surges to a record $1.2 trillion, rising another +20% in 7 days. This officially...
Elon Musk指出,大公司创新停滞的核心原因是对失败的惩罚过于严厉,导致员工因害怕被开除而只敢进行保守的渐进式改进。他强调,风险回报必须明显向大胆行动倾斜,真正的突破才可能发生。SpaceX和xAI能快速迭代,正是因为他们将失败视为必要的学习成本。相反,多数公司一次失败就秋后算账,致使团队形成“安全第一”的保守文化,创新沦为表面表演。真正的创新需要容忍失败、奖励大胆尝试的文化,而非依赖KPI和零容错的管理压力。
Elon Musk: "If you punish people too much for failure, then they will respond accordingly, and the innovation you will g...
Stanford 用 1500 个工人和 844 个任务告诉 YC:你们 41% 的钱投错了方向 -- 你们投的都是"人们不想要"或"不需要"的东西,而那些"想要但没什么人做"的事正在等待 founders。论文中工人最想自动化的前 10 ...
当前AI模型效果远未稳定,ChatGPT的广告模式仅是权宜之计。transaction fee模式更具想象空间,Agent协助执行交易与全球GDP强相关,商业模式天花板远超广告和生产力工具。Agent与区块链的结合被视为未来关键方向,可能推动区块链进入新发展阶段。
http://x.com/i/article/2051871374189404161
I keep thinking about Andrej Karpathy's Menugen example from this recent video. He built an app that took a photo of a r...
Slack关闭大中华区服务导致历史数据面临丢失,促使人们反思在AI native时代是否仍需传统协作工具。近期涌现的AI原生工作空间普遍试图整合并取代Slack、Linear和Notion的组合功能。其中相对成熟的Tanka提供了团队沟通、内置智能体执行任务、调用团队上下文以及连接Google、Notion等外部工具的能力,并支持从Slack迁移。
推文指出短剧《Enemy》和《吉时已到》近期热度极高,制作效果出色且成本较低,已成为出圈案例。作者建议,如果从事AI内容或AI短剧制作,可以将这两个剧集视为暂时的质量标杆,以对齐内容创意、制作效率和市场接受度,从而提升AI生成作品的竞争力。
作者指出当前AI热潮中存在一种割裂现象:人们强调所有事物都需AI化,却普遍忽视了邮件系统这一本应最趁手的基础工具。他认为,将AI能力应用于邮件系统,实现标的、公告、数据等信息的自动抓取、通知及触发后续操作,具有重要价值。为此,他计划开发一个AppStore产品价格追踪系统,通过邮件自动通知用户价格变化。他建议对此感兴趣的读者参考其引用的文章以获取启发。
http://x.com/i/article/2049497253421940736
Philipp Schmid 将主代理管理子代理的模式按控制力分为四档。模式一为内联工具调用,子代理如同函数,适用于独立任务。模式二为派发后收集,主代理可并行处理其他工作。模式三为代理池,子代理持久化并通过消息通信,支持多步协作。模式四为团队模式,代理间直接对话,主代理仅负责初始组建。核心建议是从简单模式开始,逐级升级需谨慎,因为每升一级对模型能力要求陡增,且许多任务用模式一即可解决。
http://x.com/i/article/2051654332727037955
Anthropic基础设施负责人Boris Cherny透露,公司并无秘密模型Mythos,主要使用与公众相同的Claude Opus 4.7。其高速迭代的核心并非技术优势,而是组织结构变革:公司由数百个AI Agent在Slack上协同工作,自动拆分任务、编写代码并解决问题,形成24小时运作的AI军队。工程师团队规模仅增4倍,但人均产出提升200%,Boris本人自2025年11月起未手动写代码。这揭示了AI时代真正的代差在于流程与组织形态。
Most browsers give you AI. Then quietly track everything you do with it. Neo gives you the AI and locks down your privac...