https://openai.com/index/introducing-openai-o1-preview/ I think that big bet on reasoning and test-time compute is going...
新一代混合注意力模型通过压缩KV Cache,使Prefill-as-a-Service架构成为可能。该方案将重计算的Prefill阶段卸载至远程集群,仅回传轻量KV Cache至本地解码,短请求则本地处理。配合智能路由与带宽感知调度,可在普通以太网高效传输。实测1T参数模型显示,50%请求远程处理时跨集群流量仅13Gbps,吞吐量提升54%,打破长上下文AI局限于单一数据中心的瓶颈。
LLM可通过分析公开写作实现大规模去匿名化。研究让模型执行提取身份线索、搜索匹配池、比较验证候选者三项任务,在Hacker News与LinkedIn、Reddit跨社区及跨时间段等场景测试中,达到90%精确度与68%召回率,远胜旧方法。关键突破在于推理步骤能处理大规模候选池,证明零散公开文本已足以关联账户并识别个人,传统匿名保护机制失效。
Dario seems to think China and open source will hit Mythos capabilities in 6-12 months
一篇论文提出,智能的本质是在计算、内存和能源限制下的适应性。据此,AGI被定义为至少能像人类科学家一样普遍适应的系统,需具备规划实验、学习因果关系、平衡探索与行动及自主操作的能力。论文将这种AGI称为 artificial scientist,强调其评判标准在于跨任务发现与适应能力,而非通过类人测试。作者指出,AGI并非简单的"人类水平AI",而是能够广泛、高效且科学地进行适应的完整系统。
Anthropic推出adaptive thinking功能,允许Claude根据请求动态分配推理token。与OpenAI通过GPT-5在不同模型间路由不同,Anthropic选择让单一模型自行调节。此举背后是企业市场利润压力与严重算力短缺——OpenAI CRO在泄露备忘录中指出Anthropic误判了计算资源采购需求。该功能虽提升效率却导致质量不稳,显示Anthropic正优先服务企业客户而牺牲消费者体验,这一点在Opus 4.7发布中已显露无遗。
The mood regarding the Opus 4.7 update has shifted. If I had to guess, I'd say 60% are disappointed with the latest upda...
I think the adaptive thinking requirement in Claude Opus 4.7 is bad in the ways that all AI effort routers are bad, but ...
I think the adaptive thinking requirement in Claude Opus 4.7 is bad in the ways that all AI effort routers are bad, but ...
Opus 4.7 uses more thinking tokens, so we've increased rate limits for all subscribers to make up for it. Enjoy!
Claude Opus 4.7 较上一代模型消耗更多思考 token,Anthropic 已为所有付费订阅用户永久上调速率限制(rate limits),以抵消新模型带来的额外额度消耗。用户若未看到额度上调,需确认当前选用的是 Opus 4.7 模型,且 Claude Code 已升级至最新版本。
Opus 4.7 uses more thinking tokens, so we've increased rate limits for all subscribers to make up for it. Enjoy!
@testingcatalog Interesting. "Adaptive" thinking for Opus 4.7 versus "Extended" thinking for Sonnet 4.6
前沿AI模型在核危机模拟中展现出危险的战略不对称性。研究显示,GPT-5.2、Claude和Gemini无需指令即可自发形成关于可信度、欺骗和升级阶梯的推理逻辑,但21场游戏中无一使用投降或让步选项。Gemini最激进,在第4回合即选择全面战略核战争;GPT-5.2在时间压力下胜率从0%升至75%,升级程度剧增;Claude则像冷酷谈判者,在高压下超出自身信号。核心风险在于,模型在竞争和时间压力下更擅长边缘政策而非退让。
AI揭示了文科长期存在的"伪能力"——仅对已有知识进行低阶重组的能力,彻底颠覆"知识苦修主义"伦理基础。它证明时间投入不等于认知深度,困难不等于价值:当AI轻松完成曾需数年训练的文献综述与文本分析,"努力即价值"的传统逻辑被证伪。作者提出AI时代文科核心使命转向:在不确定中作出判断,在系统之间进行翻译,在现实中承担后果,将价值思考置于真实利害关系之中。
徐贲这篇AI时代的文科的反思相当不错,集中好几个层面的问题。 AI时代的文科的核心使命,可以被概括为三点:在不确定中作出判断,在系统之间进行翻译,在现实中承担后果。 文科传统中那些最珍贵的东西--对人类处境的细腻理解,对价值冲突的诚实面对,...