AIHOT

5月1日

00:14

Noam Brown@polynoamial

在1亿个标记之后，性能仍在持续提升。我们在这里看到的并非能力上限。报告指出："TLO上的性能随着推理计算量的增加而持续扩展，我们尚未在最佳模型中观察到性能平台期。" 【引用 @AISecurityInst】：OpenAI的GPT-5.5是第二个端到端完成我们多步骤网络攻击模拟的模型🧵

OpenAI安全/对齐推理

00:13

Artificial Analysis@ArtificialAnlys

阿里发布Qwen3.6系列开源模型，27B版本成150B参数以下最强开源模型

阿里巴巴开源了Qwen3.6系列两款模型：27B密集模型和35B A3B混合专家模型。其中，Qwen3.6 27B在Artificial Analysis智能指数上得分46，成为150B参数以下最智能的开源模型，领先于Gemma 4 31B等。但其运行完整测试消耗的输出token约为后者的3.7倍，成本高出约21倍。两款模型均采用Apache 2.0许可，支持262K上下文，具备多模态能力。值得注意的是，其幻觉率较前代大幅下降，但准确率基本持平。更大的Plus和Max Preview版本未开源。

多模态开源生态推理评测/基准

4月30日

23:14

Ethan Mollick@emollick

我越来越认为，我们将看到前沿模型API与前沿实验室原生应用（如Codex、Claude Code）之间的能力差距。针对其原生框架开发和训练的模型，在其框架内具备更多功能。

智能体大佬观点部署/工程

23:10

阿绎 AYi@AYi_AInotes

Anthropic被曝检测Git提交以限制第三方工具，引发社区不满

开发者Theo实验发现，Anthropic的官方工具Claude Code会主动扫描用户Git仓库的近期提交记录。一旦检测到包含“openclaw”字符串（无论出现在JSON、文件名或注释中），便会触发“out of extra usage”错误，导致请求被拒绝或强制额外收费。这证实了Anthropic有意通过字符串匹配规则，打压第三方工具OpenClaw，旨在将用户锁定在其自家产品中。此举与其此前宣称的“不做监控”形象相悖，被社区批评为反竞争行为，并引发了用户转向开源替代方案的强烈呼声。

Anthropic开源/仓库行业动态

23:10

Berryxia.AI@berryxia

GPT效果空间理解力惊人，一键生成纪念碑谷风格场景

用户惊叹于GPT在效果空间理解方面的强大能力，尝试使用其文生图功能复现经典游戏《纪念碑谷》的风格场景，仅一次尝试便成功生成兼具静谧感与孤独美的图像。推文强调GPT能够准确捕捉并传递特定的美学氛围，同时作者已将生成所用的提示词公开分享供他人尝试。

图像生成教程/实践

22:43

Qwen@Alibaba_Qwen

精选73

Qwen-Scope开源套件发布：稀疏自编码器助力模型内部特征操控

Qwen团队推出开源稀疏自编码器套件Qwen-Scope，将SAE特征转化为实用工具。该套件支持四大应用方向：无需提示工程即可通过直接操控内部特征引导模型输出；用极少样本对目标数据进行分类与合成，提升长尾能力；追踪代码切换和重复生成问题的根源并进行修复；通过分析特征激活模式优化评测基准并减少冗余。团队希望社区利用Qwen-Scope深入探索Qwen模型内部机制，并开发出超越现有研究范围的应用。相关资源已开放。

Hugging Face开源/仓库开源生态数据/训练

推荐理由：可解释性工具从学术走向工程，Qwen-Scope 把内部特征操控、数据合成、问题溯源打包成套装，做模型调试和长尾优化的团队值得立刻上手试试。