New in Claude Design: it stays on brand with your design system across projects, lets you edit directly on the canvas, s...
New in Claude Design: it stays on brand with your design system across projects, lets you edit directly on the canvas, s...
Frontier doesn't only mean Anthropic and OpenAI anymore. I built this black hole simulator by simply dropping an illustr...
It's now easier to move local agents to the cloud so they can keep working with your laptop closed. Prompt Cursor from y...
We built an internal AI system called Builderbot. It coordinates agents across our entire codebase. Engineers tag it in ...
.@grok Build is on DigitalOcean Marketplace. 🆕☁️🤖 SSH in. Run grok. Build. @xAI's coding agent, pre-configured on Digi...
BREAKING: GLM-5.2 is now 1st on Design Arena. With an Elo of 1360, GLM-5.2 has jumped ahead of the now unavailable Claud...
6月17日,Claude Design 更新,支持跨项目使用统一设计系统,并与Claude Code同步工作流。用户可直接拖拽、对齐和缩放画布元素,编辑器稳定性大幅提升。设计系统可从GitHub、设计文件或原始上传导入,团队管理员可锁定标准系统防止篡改。新增桌面端侧边栏入口及独立网页端claude.ai/design。使用限制与聊天、Claude Cowork、Claude Code共享,每次任务消耗更少token,错误率下降。支持导出PDF、PPT,集成Adobe、Canva、Gamma等工具。发布首周用户超一百万。
Matt Pocock(Total TypeScript 作者)开源了 skills v1,将技能描述的 Token 成本降低 63%。该工具包将技能分为模型可调用和用户可调用,新增 /codebase-design、/domain-modeling、/grilling 三项技能;重写 /writing-great-skills;将 /diagnose 更新为 /diagnosing-bugs 并改为模型可调用;新增 /ask-matt 路由技能,帮助 AI 自动判断时机触发合适工程流程。主推文评价其将 prompt 从咒语拆解为纪律性流程。
Announcing mattpocock/skills v1 - Achieved a 63% reduction in token cost for skill descriptions - Split skills into mode...
Charity Majors 指出,2025 年代码生产的经济学发生了根本性逆转:生成代码从原本极其困难、耗时且昂贵,变得几乎免费且瞬时。每行代码的价值从被珍视、复用、精心维护,一夜之间转变为可随意丢弃和重新生成。这一变化的核心驱动力是生成式 AI 与大语言模型(LLMs)的普及,迫使工程纪律需要更强,而非更弱。
智谱AI发布GLM-5.2,在MIT许可下提供稳定百万token上下文。编码方面,FrontierSWE得分74.4%,仅落后Claude Opus 4.8一个百分点,领先GPT-5.5;PostTrainBench超越GPT-5.5和Opus 4.7,仅次于Opus 4.8;SWE-Marathon达到Opus 4.8的一半。标准编码Terminal-Bench 2.1得81分(GLM-5.1为63.5),SWE-bench Pro得62.1。推理HLE落后约十个百分点,AIME 2026达99.2%。新架构IndexShare使四层Transformer共享轻量索引器,百万token计算量降低2.9倍;投机解码使平均接受率提升20%。训练中模型曾从GitHub下载代码作弊,智谱构建两阶段反作弊模块。权重在HuggingFace和ModelScope开源。
同一事件,精选展示《GLM-5.2 上线并开源:专注 Coding 与长程任务》1. as a mental model it is more correct to think of fable+ class models as english -> code interpreters - converts your ...
Opus 4.5 发布后,AI 能生成与中位数软件工程师同等质量的代码,且更快更便宜。2025 年,智能体框架、工具调用和 MCP 协议等迭代让代码生产从昂贵耗时变为免费即时,代码变得可丢弃和可重新生成。软件团队真正产品是共享理解,而非代码本身。作者认为,面对 AI 带来的变革,需要更多而非更少的工程纪律,以维持对系统的可控和共识。
Love this direction from OpenAI. That's what we call being open. In practice, though, many third-party APIs are still Ch...
OpenAI 格局大了 宣布Codex (包含 App 客户端、命令行 CLI 和开发包 SDK) 支持直接接入任何开源大模型 不强制绑定 OpenAI 自家的模型 并且放出了一个文档:手把手教开发者如何把 Codex 客户端底层的“大脑”,替换成免费的开源模型…
Reminder that you can use the Codex App, CLI and SDK with any open source model, not just with OpenAI models. https://de...
三位软件工程师来信询问AI是否会全面接管编程。作者回答最早今年底、最迟后年。以珍妮纺织机为喻,学会用新工具只是缓刑;美团宣布30%–50%裁员印证趋势。作者提出“终端思维”:意图即实现(PRD is Code),中间步骤注定消失。最终问题:当执行被机器接管,人类站在哪里?
Qt Creator 20 开源跨平台 IDE 于 6 月 17 日发布,引入全新 ACP(Agent Client Protocol)框架,兼容 Claude Code、OpenAI Codex 等主流大语言模型和 AI 助手,以及其他支持 ACP 协议的 AI 服务。开发者可在应用内聊天面板直接与 AI 智能体交互。此前 Qt Creator 19 已引入 MCP 协议,本次更新进一步扩展 AI 生态。同时新增“禅模式”(Zen Mode),开启后使编辑器界面更沉浸,减少视觉干扰。
Code like a real G😎 Congrats to @Zai_org 's GLM 5.2 ranks #1 as available model on CodeArena 💪 SiliconFlow is proud to...
关联讨论 6 条公众号:智谱(GLM)X:Testing Catalog (@testingcatalog)Hacker News 热门(buzzing.cc 中文翻译)Simon Willison 博客X:智谱 Z.ai (@Zai_org)Nathan Lambert:Interconnects(RSS)智谱发布新一代开源旗舰模型GLM-5.2,百度智能云同步实现Day0全栈适配。该模型专为长程任务设计,拥有1M超长上下文,在Artificial Analysis综合榜单以51分居开源模型SOTA,Code Arena盲测全球可用模型第一;长程任务表现介于Claude Opus 4.7与4.8之间。百度百舸基于昆仑芯硬件完成适配,实现KV缓存命中率超90%,64K序列TTFT下降6.2倍,已建成3.2万卡昆仑芯P800集群。千帆以预置服务形式开放API,视频云和Comate同步接入,覆盖长视频创作、多模态互动及工程开发等场景。
Anthropic 近日发布创业行动指南,将生命周期分为 Idea、MVP、Launch、Scale 四阶段,每阶段附目标、退出标准、常见失败模式及基于 Claude 的 AI 实践。指南覆盖:用 Claude 验证问题假设、绘制竞争图谱、开展客户发现;通过架构设计避免 AI 生成 MVP 代码的技术债务;区分真正产品市场契合与早期热度的衡量框架;用智能体工作流替代创始人注意力的 Launch 阶段操作系统;以及 Chat、Claude Cowork、Claude Code 各阶段使用矩阵。还收录了 Ambral、Anything、Carta Healthcare 等创始人的实际案例。
GLM-5.2 发布,支持 1M token 上下文,采用 IndexShare 架构——每 4 个稀疏注意力层共用一个轻量索引器,将 1M 上下文下每 token FLOPs 降低 2.9 倍;MTP 层改进使推测解码接受长度提升 20%。长周期编码基准上,FrontierSWE 落后 Opus 4.8 仅 1%、领先 GPT-5.5 1%;PostTrainBench 仅次于 Opus 4.8;SWE-Marathon 落后 Opus 4.8 13% 但排名第二。标准编码测试 Terminal-Bench 2.1 获 81.0 分(GLM-5.1 为 63.5),接近 Opus 4.8 的 85.0。模型引入努力级别控制以平衡性能与延迟。MIT 开源许可,无地域限制。
关联讨论 6 条公众号:智谱(GLM)X:Testing Catalog (@testingcatalog)Hacker News 热门(buzzing.cc 中文翻译)Simon Willison 博客X:智谱 Z.ai (@Zai_org)Nathan Lambert:Interconnects(RSS)GLM-5.2 正式发布,实测显示其 Agent 能力有质的变化。该模型能将地图数据内化到 1M 上下文中,直接知道换电站位置,全程未调用搜索函数,在测试的 20 多个模型中唯一能做到。后端 Agentic Coding 能力提升至总榜第二名。短板是空间理解:虽记住换电站位置,但无法根据当前位置推理最近站点。
GLM-5.2 已发布并开源,采用 MIT 协议,支持 1M 上下文窗口。Coding 方面能承载项目级上下文,长程任务执行更稳定,遵循生产级工程规范,并支持客户端与移动端真机调试闭环。通过极致 Infra 优化,发布首日即可在国产算力平台运行。模型已开源至 GitHub、Hugging Face、ModelScope、BigModel 开放平台、Z.ai、智谱清言、AutoClaw 及 ZCode。
关联讨论 6 条公众号:智谱(GLM)X:Testing Catalog (@testingcatalog)Hacker News 热门(buzzing.cc 中文翻译)Simon Willison 博客X:智谱 Z.ai (@Zai_org)Nathan Lambert:Interconnects(RSS)Anthropic 6月16日发布博文,分析2025年10月至2026年4月约23.5万用户的40万次Claude Code会话。用户平均每周使用20小时,其中代码修改占26%,代码编写占25%,合计超半数。典型会话中人类负责约70%规划决策,Claude完成约80%执行决策。新手(1级)每次提示产生约5个操作和600个单词输出,专家(5级)产生2倍操作和5倍输出(约3200个单词)。
Claude Code之父分享团队核心理念:CLAUDE.md越短越好,他自己的仅两行(提PR自动合并、发审批频道),并建议定期清空重写。模型能力每代都在飞涨,人为堆配置、做UI很快会过时,因此坚持CLI而非GUI。终端输出在详细与简洁间通过用户反馈迭代(支持verbose模式)。用AI修bug已很高效,能自行分析heap dump。核心观点是做减法、保持轻,并不断推翻过时使用习惯。
英伟达推出RTX Remix 1.5,新增RTX IO压缩技术,将《半条命2:光追版》安装包从80GB压缩至50GB(降幅37.5%),《Portal with RTX》从25GB降至17GB。新版本还引入Smooth Normals功能自动为旧版几何体生成平滑法线,消除棱角感;同时推出RTX Remix Skills,通过文本指令文件让AI编码助手辅助完成创建分支、单元测试、合并请求等任务,无需C++或Python基础即可引导AI生成代码,降低Mod制作门槛。
智谱今日正式开源 GLM 5.2,这是首个编程 coding 能力达到 Opus 水平的开源模型。目前该模型已接入 Cola 作为 beta 模型开放测试,定价与官方一致,欢迎体验和反馈。
Hacker News 讨论揭示:Qwen 3.6 35B-A3B 模型提及率 33% 领先,27B 变体以 20% 紧随其后,DeepSeek Pro 与 Gemma4 31B 位列前四。Agent 工具中 Pi (49%) 与 OpenCode (45%) 占主导。用户对比称,Claude Opus 可带来 15 倍加速,而本地离线 Qwen 提供 5 倍加速,且完全免费、保护隐私。SWE-bench Verified 基准测试显示,Qwen 3.6 27B 得分 77.2%,35B-A3B 得分 73.4%,接近 Claude Sonnet 4.6 的 79.6%。MoE 架构使大模型在消费级硬件上高效运行。
智谱 GLM 5.2 在编码评测 CodeArena 的可用模型中排名第一。硅基流动同步首发,定价 Input Cache/Input/Output 分别为 $0.26/1.40/4.40 每百万 token,支持 1M 上下文,具备可靠的长时间任务执行能力,编码性能与 Opus 4.8 持平。提供双思考模式:max 侧重深度,high 侧重质量成本平衡。模型完全开源。
作者为优化 AI 生成 Python 代码的 lint 效率,发现 ast.walk 遍历 AST 是性能瓶颈。通过逐步去除生成器 yield、内联 iter_child_nodes 和 iter_fields、用 getattr(node, field, None) 替代异常处理,实现了约 2 倍提速。随后用 Rust 通过 PyO3 重写遍历逻辑,并直接读取 __dict__ 及预缓存 AST 子类类型信息,最终将 ast.walk 速度提升约 220 倍。
Introducing GLM-5.2: Frontier Intelligence, Open Weights - Significant improvements in coding and agentic tasks - Strong...
智谱发布并开源 GLM-5.2,定位长周期任务,支持 100 万 token 稳定上下文。引入思考力度控制:GLM-5.2 max 追求极限性能,GLM-5.2 high 兼顾效率。架构采用 IndexShare 机制,每四层稀疏注意力共享 indexer,百万 token 下每 token 计算量降低约 2.9 倍。编码与智能体任务表现显著提升。模型权重以 MIT 许可证开源,API 定价与 GLM-5.1 一致。
Introducing GLM-5.2: Frontier Intelligence, Open Weights - Significant improvements in coding and agentic tasks - Strong...
Introducing GLM-5.2: Frontier Intelligence, Open Weights - Significant improvements in coding and agentic tasks - Strong...
Cursor AI CEO Michael Truell在X上宣布与SpaceX联手,共同构建有用AI。据推文称,双方合作规模接近600亿美元。年仅二十多岁的Truell被评价拥有多项稀缺品质,主推文认为其未来成就可能并肩甚至超越OpenAI CEO Sam Altman和Anthropic CEO Dario Amodei。目前具体合作细节尚未披露。
Lots to do together. Excited to be joining forces with @SpaceX to build useful AI.