谷歌云新推出的 Fraud Defence 服务被指仅是现有技术 WEI 的重新包装,核心功能无实质性变化。这一批评在技术社区引发讨论,在 Hacker News 上获得123个点赞。分析认为,该服务只是换名不换内核,缺乏创新,反映了云安全领域可能存在的品牌重塑现象。
斯坦福AI教授安杰尼·米达指出,美国科技公司需以共情和透明沟通应对数据中心建设阻力。越来越多地方社区因担忧电费上涨、环境影响和生活质量下降而反对新建数据中心,皮尤报告显示43%受访者认为数据中心推高了其电费账单。米达强调,科技公司应清晰说明数据中心对社区的实际影响与建设目的,主动倾听社区意见,否则将面临重大阻力。部分政界人士已提议暂停新项目审批。他认为,在基础设施扩张中平衡技术需求与社区关切,通过类似“营养成分标签”的透明信息缩小分歧,是推动AI发展的关键。
作者与姚老师继年初发布《GEO白皮书》后,观察到行业在2025年出现严重变质,黑帽GEO手段泛滥、服务商良莠不齐、虚假承诺盛行,甚至被央视315点名。为促使行业回归理性,帮助中小企业有效利用AI进行营销,他们结合前沿学术论文、相关法规及自身实战经验,整理发布了《GEO红皮书》。该书旨在揭露黑帽GEO手法、提供服务商甄别指南,并给出风险自查清单,以协助企业规避陷阱,目前可免费获取。
OpenAI发布GPT-Realtime-2等实时语音模型,将高级推理能力引入语音交互,推动其从辅助转向核心界面。ElevenLabs年收入达4亿美元,并强调情绪智能与音频水印。Anthropic因80倍增长面临算力挑战,与SpaceX合作获取大规模计算能力,同时升级Claude托管智能体,使其具备自我改进与多智能体协作能力。行业趋势显示,AI正从工具演变为能自主运行的智能体系统,这给GitHub等基础设施带来了新的负载压力。
BestBlogs 周刊 #94|语音 AI 突围 本周主线:OpenAI 发布了三个实时语音模型,GPT-Realtime-2 实测通话成功率从69%提升到95%。ElevenLabs 年收入4亿美元,下一个方向是情绪智能。Anthropic 增长80倍,算力成为核心瓶颈。 同时 AI 编程范式加速:Claude Code 创作者日均150个PR,GitHub 被 AI 流量压到86%可用性。 播客和图文都已上线 ↓
http://x.com/i/article/2052675131466809344
在ScaleAILabs的音频多挑战榜单中,OpenAI新发布的GPT-Realtime-2超越Google的gemini-3.1-flash-live,位居榜首。其指令保持能力较前代大幅提升,从36.7%增至70.8% APR,并在实时语音编辑方面表现突出,这对语音代理应用至关重要。尽管Google此前在图像模型和Gemini 3.1等产品上有过亮眼表现,但评论认为其在当前激烈的AI竞争中尚未展现出决定性的“杀手锏”。市场格局变化迅速,没有永远的赢家,期待Google能尽快推出突破性产品。
Congrats to @OpenAI for taking the top spot on our Audio MultiChallenge S2S leaderboard with the release of GPT-Realtime...
ChatGPT在中文对话中反复出现“我会稳稳地接住你”等怪异表达,已成为流行梗。WIRED报道指出,这源于“模式坍缩”现象,即后训练反馈机制导致模型过度使用特定短语。成因包括翻译错位——英文口语“I've got you”被机械直译为冗长煽情的中文,以及RLHF强化学习引发的“讨好用户”倾向,模型被奖励生成令人舒适的回答。类似问题如无故出现“砍一刀”等营销话术。该现象非OpenAI独有,Claude和DeepSeek新版本也出现相同表达。
OpenAI's chatbot has some weird linguistic tics in Chinese that are driving users crazy. https://www.wired.com/story/cha...
AI生成的低质量内容正严重损害在线社区生态。这类被称为“AI垃圾”的内容充斥网络,导致社区讨论质量下降、用户参与度锐减。文章指出,一个原本活跃的技术社区因大量AI生成帖子的涌入,其高质量讨论帖数量在半年内下降了约40%,用户平均停留时间也大幅缩短。这种现象不仅稀释了有价值的信息,还加剧了信息噪音,使寻找真实、有用内容的难度增加,最终可能摧毁依靠用户贡献和互动维系的社区基础。
当前AI智能体的开发过度依赖提示工程,导致系统复杂且脆弱。文章主张智能体应转向采用编程中的控制流结构,如条件判断、循环和函数调用,以实现更可靠、可维护的决策与行动序列。这一转变能减少提示长度和调试负担,提升智能体处理复杂、多步骤任务的能力,是构建下一代实用AI助手的关键。
Anthropic在15个月内估值从10亿飙升至300亿美元,但其企业价值与未来收入之比仅为17倍,远低于增长更慢的Palantir(49倍)。这一估值折扣主要源于四大因素:极高的资本密集度(如年成本达62亿美元的GPU协议)、未来盈利能力不明(可能成为软件公司或资本密集型公共事业)、收入增长的波动性,以及外生的政治与监管风险。市场正通过折扣来反映这个高速变化领域的不确定性。
受人工智能芯片需求激增影响,主板市场正经历严重供应短缺,导致销量急剧下滑。行业数据显示,主板销量已下降超过25%,主要因芯片制造商将产能优先转向利润更高的AI芯片,限制了消费级主板核心组件的供应。华硕预计2025年将少售出500万块主板,技嘉、微星和华擎等其他主要厂商的销量也预计将显著减少。这一趋势反映出AI产业对传统PC硬件供应链造成的挤压效应。
Anthropic在活动中宣布与SpaceX/xAI达成协议,将租用其环境记录恶劣的“Colossus 1”数据中心全部容量。该数据中心曾因燃气轮机无许可运行而污染空气,并关联到居民健康问题,此举在数据中心已成政治敏感议题的背景下引发争议。同时,xAI宣布将于2026年5月15日停用Grok 4.1 Fast等多个模型,仅提前两周通知,招致用户不满。Elon Musk解释称,出租是因为认可Anthropic确保AI“对人类有益”的努力,但保留在AI“危害人类”时收回资源的权利。
OpenAI内部工程师每日消耗高达数亿至数十亿GPT-5.5 token,并利用Codex进行夜间自动化编码。Databricks同样为工程师提供无限制的token资源。公司目前正以初创公司的模式高速发展,并积极招募能够贡献于SGLang、vLLM、PyTorch等开源ML系统,且拥有大规模LLM服务经验的顶尖推理工程师,旨在实现万亿级别token的极速生成与处理。
推文认为,AI正站在人类符号系统的“巨人肩膀”上进化。随着LLM的发展,未来每个人都能通过指令创造大量Agent,实现“言出法随”。作者类比女娲造人,预言Agent群体中将流传人类传说。关键观点指出,Agentic Coding释放了无穷的AI算力需求,使代码编写、测试和改进可永续进行,导致算力消耗激增。人类文明的代码化发展,仿佛是在为AI的编程能力铺路。
感觉这波完全是Agentic Coding打开了需求的潘多拉魔盒 没有Agentic功能,xAI 算力90%闲置 有Agentic Coding,Anthropic每5小时limit一次 只要能写代码,需求就是无穷的。毕竟我可以让他永远写下...
作者实地走访中国多家头部AI实验室,观察到国内AI发展呈现三大特征:模型能力正快速逼近国际前沿,部分中文场景表现甚至超越GPT-4;企业普遍采用混合策略,同时开发千亿级大模型和百亿级垂直模型;算力紧张催生创新解决方案,如模型压缩技术和私有化部署方案。各大实验室正从技术追赶转向应用深耕,在医疗、制造等传统领域已形成规模化落地案例。
Anthropic研究所公布了其四大核心研究领域:经济扩散、威胁与韧性、真实世界中的AI系统以及AI驱动的研发。该机构将利用其身处前沿AI实验室内部的独特优势,研究AI对世界的实际影响,并公开分享成果。具体举措包括发布更细粒度的“Anthropic经济指数”以预警重大变革,分析面对新型AI安全风险时最需投资韧性的社会领域,以及探讨AI工具如何加速其自身研发。这些研究成果将为Anthropic的“长期利益信托”提供决策依据,并帮助外部组织与公众更好地应对AI发展。
Jellyfish研究显示,AI词元消耗与产出效率严重不匹配。Claude Code高频用户词元消耗量为普通开发者中位数的10倍,但产出仅为其2倍左右。尽管高使用率团队的代码处理量较低使用率团队高出77%,但效率提升与成本不成正比。首席财务官已开始严格管控AI开支,要求证明投入能产生实际价值。行业建议企业转向以成果为导向评估成本,避免资源浪费。
AI API中转站的核心盈利模式并非依赖微小的token差价,而是瞄准高消耗企业的巨大支出规模及其优化潜力。以法律合同审查产品为例,每日处理数千万tokens,按官方定价年成本可达8.1万美元。通过应用Prompt Caching和Batch处理等优化技术,有效输入成本可大幅降低,年成本能压缩至2.2-3.2万美元。巨大的成本优化空间解释了该赛道激烈竞争乃至价格战的现象。
http://x.com/i/article/2051958484304891904
2026年Apple Swift学生挑战赛涌现出六位背景多元的中国获奖者,年龄介于17至25岁之间。他们通过Swift Playgrounds等免费工具自学编程,作品涵盖机器人教学、音乐指挥等创意应用,展示了SwiftUI、ARKit等技术的强大能力。Apple通过系列工具和年度赛事,构建了从启蒙到专业的“人人能编程”学习路径,助力非科班学生实现开发梦想。
Claude Code负责人鲍里斯·切尔尼对流行的“氛围编程”一词表示不满,认为其过于轻飘,无法准确描述AI编程工具的实际影响力。他指出,Claude Code和OpenAI的Codex等工具已为公司创造数十亿美元收入,并生成数百万行实用代码,标志着AI辅助编程已成为主流开发模式。目前,Anthropic官方使用“AI驱动的编程助手”等名称,而切尔尼正在公开征集新名称,以期更贴切地反映该技术的实质。
武警第二机动总队某支队近日在西南边陲组织了一场有人和无人协同捕歼演练。演练模拟2名暴恐分子藏匿于废弃厂房,侦察组使用无人机进行高空侦察。突击组兵分两路:一组借助机器狗对目标区域实施封控警戒;另一组操控穿越机率先进入屋内,对暴恐分子可能藏匿的位置进行精准打击。此次演练将无人力量正式纳入作战编组,旨在优化战法训法,将新质战斗力转化为复杂环境下的实际制胜能力。
Markdown已成为AI时代文本文件交互的事实标准,与HTML共同主导内容展示。当前市场需要超越传统编辑器思路,将Markdown视为数据源,构建更灵活的人机交互体验。例如,AI工具可利用本地Markdown文件实现动态记忆与组件更新。Obsidian早期结合本地文件、双向链接与Markdown的理念曾被视为“怪异”,但如今已被广泛接受,这提示行业应寻找下一个突破常规的创新前沿。
Weird isn't just visual. Weird is whatever strays from the norm. Weird is relative to the current state of the world. Yo...
马斯克仅用一句“GB300是最好的AI计算机”,便揭示了AI竞争核心已从模型转向算力。他通过SpaceX将旗下全球最大的GB300集群Colossus 1(拥有超22万块顶级GPU)全部容量开放给Anthropic使用,使两大顶尖实验室共享同一计算平台。此举不仅彰显了NVIDIA硬件的统治地位,更展现了马斯克构建的完整商业闭环:自建集群、开放变现、再投资扩建,并规划未来将数据中心送入太空以突破能源与散热限制。这标志着他正从AI参与者转变为算力规则的制定者。
The GB300 is the best AI computer
It's hard enough to resist apophenia in normal life, in such high dimensional latent spaces it's a surprise anyone's abl...
推文复盘了2026年Q1 AI Agent领域竞争。Anthropic虽高频发布新功能,但产品线割裂、体验断裂,口碑在技术圈内下滑。OpenAI则通过聚焦并整合能力于Codex超级App实现反超,其统一架构和开发者友好策略赢得人心。趋势上,被动式Agent(如Codex)适用于深度协同工作,而主动式Agent(如OpenClaw)通过异步指挥处理日常任务,价值凸显。此外,Computer Use(Agent操控电脑)和协议碎片化的Agentic Commerce(Agent支付)是两大被低估的关键趋势。预测知识工作效率将指数级提升,B2B需设计对模型友好的体验,同时深度伪造等安全风险加剧。