5月12日

01:03

Anthropic@AnthropicAI

Claude的宪法现已推出有声书，由两位作者阿曼达·阿斯克尔和乔·卡尔史密斯亲自朗读。书中包含关于写作过程的问答，塑造该文件的哲学思想，以及随着模型能力增强它可能发生的变化。收听地址：http://anthropic.com/constitution

Anthropic 安全/对齐

00:50

Yuchen Jin@Yuchenj_UW

以HTML为桥：利用LLM生成交互文档构建个人知识库

作者提出一种高效学习方法：让Claude等大语言模型生成HTML文档来辅助深入学习与研究。相比纯文本或播客，HTML能嵌入图表和交互元素，支持主动探索。通过迭代提问和修改，文档随理解深入而演化，最终累积成个人知识库。文章引用观点指出，人机交互的输入输出融合尚有巨大发展空间，当前阶段可探索让LLM以HTML格式输出。信息呈现方式正从纯文本、Markdown向HTML及未来的交互式神经视频演进，以充分利用人类强大的视觉处理能力。作者认为，音频可能是人类偏好的AI输入方式，但视觉内容则是更高效的AI输出形式。

Andrej Karpathy: This works really well btw, at the end of your query ask your LLM to "structure your response as HTML", then view the ge...

Anthropic 教程/实践编码

00:35

阿绎 AYi@AYi_AInotes

Anthropic在AWS推出直营平台，云锁定策略升级引关注

Anthropic在AWS正式推出Claude Platform，从通过Bedrock批发模型转变为直接运营。新平台使企业客户能使用与原生Claude完全同步的最新功能，包括测试版能力，并实现了与AWS的计费、身份认证和承诺消费额度无缝打通。此举提供了双轨选择：敏感数据项目可通过Bedrock留在AWS边界内，而追求创新的项目则可使用Platform获取最快最新的能力。这种深度集成大幅提高了企业更换AI模型的迁移成本，因为切换意味着要重构整个AWS的IAM、账单和权限体系，被视作强大的“云锁定”策略升级。

Claude: The Claude Platform on AWS is now generally available. AWS customers get the full set of Claude API features, with AWS a...

智能体 Anthropic 大佬观点部署/工程

00:04

Claude@claudeai

Claude平台现已在AWS全面上线。 AWS客户可获得全套Claude API功能，并享受AWS身份验证、计费及承诺金抵扣服务。

Anthropic 产品更新部署/工程

00:02

凡人小北@frxiaobei

精选85

Anthropic在GitHub开源了金融服务行业AI解决方案完整模板库，包含10个端到端智能体、7个垂直行业插件及11家主流金融数据商的MCP连接器，覆盖投研、投行、风控等核心工作流。该库提供了从个人插件到企业API的部署方式，支持集成至Microsoft 365及私有云。此举为金融AI落地提供了开箱即用的标准作业程序，与OpenAI的消费级路线形成鲜明对比，凸显了其深耕企业场景、通过开源构建行业生态的战略意图。

Jason Zhu: Anthropic 真的惊为天人直接把金融服务行业的 AI 工作流模板全开源了投资银行 / 股票研究 / 私募 / 财富管理 / 基金管理 / KYC 风控七大业务线的参考 agent / 技能包 / 数据连接器全部公开这超出了 ...

智能体 Anthropic MCP/工具产品更新

推荐理由：Anthropic 把金融行业 AI 落地的完整 SOP 开源了，10 个 agent 加 11 家数据商 MCP 连接器，这不是 demo，是逼迫全行业在 Claude 轨道上长，金融 AI 格局就此定型。

5月11日

23:57

Artificial Analysis@ArtificialAnlys

人工智能分析发布编码代理基准指数，揭示模型与执行框架组合表现

人工智能分析发布编码代理基准指数，评估不同模型与执行框架组合在三大编码基准中的表现。Opus 4.7在Cursor CLI中以61分领先，GPT-5.5与Opus 4.7在其它框架中得分60紧随其后。开源模型GLM-5.1在Claude Code中获得53分，表现竞争但仍显著落后顶尖闭源模型。经济性差异悬殊：每任务成本从Composer 2的0.07美元到GLM-5.1的2.26美元不等，后者因任务循环令牌使用高达480万；任务耗时差异超7倍，Opus 4.7仅需6分钟而Kimi K2.6需40分钟。缓存命中率普遍较高，影响实际运行成本。

智能体 Anthropic DeepSeek OpenAI

13:34

阿绎 AYi@AYi_AInotes

大神用Claude Code复刻完整游戏开发工作室，48个AI智能体覆盖全岗位

开源项目Claude Code Game Studios利用Claude Code构建了完整的虚拟游戏开发工作室。该项目包含48个AI智能体，1:1还原从创意总监到关卡设计师等全部岗位，覆盖游戏开发全流程。系统提供36条斜杠指令一键启动工作流，适配Godot、Unity、Unreal三大游戏引擎，并集成自动化校验钩子及28套行业标准文档模板。所有AI仅负责梳理方案，最终决策权由用户掌握。项目采用MIT开源协议，可免费商用，克隆仓库即可快速部署。

智能体 Anthropic 开源/仓库开源生态

13:18

向阳乔木@vista8

当前AI代码生成最难的基准测试ProgramBench

ProgramBench是Meta、斯坦福和哈佛团队推出的高难度AI代码生成基准测试。它要求AI仅根据二进制文件及文档，在无法反编译和联网的条件下，从零重写原程序。测试项目涵盖从jq到FFmpeg、SQLite乃至PHP编译器级别。目前表现最佳的Claude Opus在“接近完成”指标上仅达3%，GPT-5和Gemini系列通过率均为零，凸显了AI在复杂软件工程任务上的巨大挑战。

Anthropic OpenAI 编码评测/基准