OpenRouter 正式上线文本转语音和音频转录功能。平台通过两个新的 API 端点,集成了多家供应商的语音合成与音频转录服务。用户现在可以统一调用单一 API,便捷访问多提供商的高质量语音生成与语音转文本能力,无需再为不同服务商单独集成。这简化了开发流程,为应用添加语音交互与内容转录功能提供了更高效的一站式解决方案。
PixVerseV6が登場! 変形ロボ動画もご覧の通り! いかがでしょうか? #PixVerseV6 #V6PowerUp @PixVerse_
优步公司在短短四个月内耗尽了原定2026年全年的AI预算,所有资金全部投入到Claude代码的开发中。这一支出速度远超预期,突显了公司在人工智能领域的激进投资策略,可能预示着对Claude相关技术的高度优先推进。预算的快速消耗或影响后续AI项目的资金分配,反映科技巨头在AI竞赛中的加速布局。
传统多智能体系统依赖文本消息传递,导致令牌膨胀、延迟和上下文稀释。RecursiveMAS提出新范式:将多智能体系统视为递归计算,智能体在共享潜在空间中通过递归传递潜在表征进行协作,而非传递完整文本。其核心是RecursiveLink模块,能在异构智能体间直接生成和传递潜在状态,并采用内外环学习与基于梯度的团队信用分配机制。这如同智能体用内部语言传递笔记,实现“少交谈,多思考”。在数学、科学、医学等9个基准测试中,该方法平均准确率提升8.3%,推理速度加快1.2-2.4倍,令牌使用减少34.6%-75.6%,为突破智能体间通信瓶颈提供了高效可扩展的路径。
早期,ODM服务器组装的核心在于大规模制造标准化硬件,优势在于成本、产能与良率。进入AI时代,服务器机架因GPU/ASIC、高功率系统、液冷及高速互联等技术而变得高度复杂,需确保各子系统协同工作,无线缆设计也可能兴起以简化部署。这促使ODM角色发生根本转变,从纯制造商演变为涵盖设计、集成与大规模生产的合作伙伴。未来,ODM将支持多元GPU/ASIC平台与数据中心设计,助力厂商构建更广阔的AI基础设施生态。
尽管长期存在唱衰言论,X在4月的App Store下载量却创下历史新高,较此前峰值增长40%,呈现断层式跳跃。这反驳了用户流向Bluesky、Threads或产品被毁的论调,下载量被视为用户“用脚投票”的最硬指标。增长归因于团队过去18个月对Grok集成、视频体验、社区功能的持续改进,以及4月新闻周期让X重回“刷大事”的核心场景。许多用户从Bluesky回流,凸显了“实时、开放、全球共时讨论”的护城河效应。然而,下载量只是领先指标,bot泛滥、创作者变现政策不稳定、应用性能等问题若不能解决,增长可能昙花一现。未来6-12个月的关键在于提升留存与变现,若能实现,X将进入全新增长周期。此事冲击行业认知,证明“安全可控的算法投喂”并非唯一答案,“言论自由、实时、开放”的模式依然拥有强大生命力。
八家科技公司已与五角大楼签署协议,为美国军方机密网络供应人工智能技术,这是推动构建“AI优先作战力量”计划的关键部分。Anthropic公司未参与其中,因其拒绝了协议中的使用条款并被标记为安全风险。该举措旨在通过AI整合提升机密军事网络的作战效能,标志着五角大楼加速军事AI化的战略部署。
在监管部门明确希望上市企业国内注册的导向下,月之暗面(Moonshot AI)和阶跃星辰(StepFun)等中国AI初创公司正考虑解散境外控股架构,直接在中国境内注册。此举是北京加强对人工智能产业管控的一部分,此前中国已阻止了Meta对迈纳斯的收购。这一转变意味着初创公司为寻求在国内资本市场上市,正主动调整公司结构以符合监管要求。
谷歌I/O开发者大会即将在不到三周后举行,官方现面向公众征集创意倒计时视频。参与者需使用Google AI Studio或Gemini应用中的Canvas功能,通过代码创作一个包含1到10之间大数字的倒计时概念,并在5月6日前提交。官方在推文回复中提供了示例项目以供参考或混音创作,更多提交信息可通过指定链接获取。