Intelligence should be open, accessible, and ready to build with, empowering every developer, everywhere. GLM-5.2 is now...
Intelligence should be open, accessible, and ready to build with, empowering every developer, everywhere. GLM-5.2 is now...
Intelligence should be open, accessible, and ready to build with, empowering every developer, everywhere. GLM-5.2 is now...
智谱(Z.ai)发布新旗舰模型 GLM-5.2,现已对 GLM Coding Plan 用户(Lite/Pro/Max/Team 计划)开放。该模型具备强大编程能力、可用的 1M 上下文支持,并延续长程任务优势。API 和聊天机器人服务将于下周上线,模型也将于下周以 MIT 许可证正式开源。
关联讨论 9 条公众号:智谱(GLM)X:Testing Catalog (@testingcatalog)Hacker News 热门(buzzing.cc 中文翻译)X:硅基流动 SiliconFlow (@SiliconFlowAI)Simon Willison 博客The Decoder:AI News(RSS)Nathan Lambert:Interconnects(RSS)智谱:研究(网页内嵌数据)Hugging Face:Blog(RSS)推文指出90%的人买VPS只对比配置,忽略IP类型和纯净度。用于运行Claude Code、Codex等长期任务,或登录Claude、Google等对环境挑剔的账号时,脏IP轻则限流断连,重则触发风控封号。作者分享了一套免费筛选流程:使用三个网页工具,三十秒即可检测VPS的IP底细,从看懂结果到下单选购全程无需写命令。文章最后还提到许多场景无需自建VPS,避免为折腾而折腾。
http://x.com/i/article/2065392505554677760
Peter Steinberger 分享了 Codex 在其项目 crabbox 中的应用体验。Codex 在 crabbox 内部运行,同时构建 crabbox 自身。它已连续4天在多处代码树中非停止循环运行。所有构建均为端到端可验证,使得项目几乎能够自我构建。Codex 还能通过浏览器/电脑使用自动注册所需服务。作者的主要工作仅剩添加信用卡信息和关闭不合适的内容。
Kimi 发布并开源最新编码模型 Kimi-K2.7-Code。相比 K2.6,该模型在 Kimi Code Bench v2 提升 21.8%,Program Bench 提升 11%,MLS Bench Lite 提升 31.5%。核心改进是解决编码模型“过度思考”问题,推理 token 使用量降低 30%,long-horizon 编码任务的指令跟随和端到端成功率显著提升。权重与代码已上传 Hugging Face,支持通过 Kimi API 和 Kimi Code 使用,同时开放 Beta 计划。团队预告即将推出 6x High-Speed Mode,进一步提升编码效率。
🌘 Kimi-K2.7-Code, our latest coding model, is now released and open-sourced! 🔷 Improved coding & agent performance ove...
Cursor 团队为训练 Composer 模型构建了一个始终运行的 Agent 舰队系统。主 Agent(Fleet Manager)在远程机器上运行,通过 SSH 连接数百台子 Agent 机器,利用本地工具和磁盘文件“inbox”实现状态共享与协调。每轮循环检查舰队健康,将故障推送至 Slack/PagerDuty,并主动终止或重启进程。子 Agent 并行执行研究实验。系统基于此前长运行 Agent 研究,主 Agent 拥有编码 ML 实验隐性知识的 Skills。核心是使用 Cursor 自身产品,通过 inbox 文件与 Skills 实现大规模 Agent 协同与自我管理。
http://x.com/i/article/2065439304785039360
Anthropic首份全美AI民调覆盖51993人:48%期待AI攻克癌症,64%担心失业,仅15%信任AI公司自行开发。黄仁勋以发电机类比AI工厂,提出五层产业蛋糕(能源/芯片/设施/模型/应用),每个计算单元含72颗芯片、造价约400万美元。月之暗面开源Kimi K2.7 Code编程模型,相比K2.6平均token消耗减少30%,Kimi Code Bench v2提升21.8%,Program-Bench提升11%,MLS Bench Lite提升31.5%。
KIMI K2.7 Code正式发布,为编程/Agent专项模型,架构与K2.6一致,属后训练优化版本。在kimi自测的kimi-code-bench-v2上较K2.6提升11%,其他Agent测试项目同样有提升。适用场景包括编程任务以及需要Agent参与的验证任务(如简历筛选、PR审查等)。
Congrats to the MiniMax team on the open-source launch of M3! There are very few <500bn parameter models that can tackle...
Day 3 with Fable. Gave a huge prompt to implement a feature across CLI, web server, and another server to both Fable and...
I gave ChatGPT Codex an article & screenshot from a famous, lost Maxis simulation, SimRefinery, and asked it to create i...
Kimi K2.7-Code is now available on AI/ML API! Moonshot's latest is built for long-horizon agentic coding that self-corre...
DAIR.AI创始人Elvis Saravia分享如何有效运行长期自主编码智能体。他指出当前多数模型难以协调工作,会过早暂停、犯错或走捷径(reward hacking)。关键在于明确目标、消除假设,避免模型自行推断。他的实践公式:用Opus 4.8进行细致规划,GPT-5.5执行所有步骤,评估器(通过/goal)则使用Deepseek及Qwen、Kimi、MiniMax等最新模型。另一关键洞察是提供多模态视觉线索作为目标,比纯文本目标更强,能更好地约束智能体。完整讨论已录制并免费开放。
We heard you wanted to use Codex rate limit resets on your own time. Starting today, we're rolling out the ability to sa...
Codex 为开源项目提供免费授权,最新一批包括 TensorFlow、Next.js、Kubernetes、Angular、Swift、Spring Boot、Playwright、Vim、Bitcoin、n8n、Bootstrap、酷狗(30-seconds-of-code)等大量知名开源仓库,列表涵盖机器学习、前端框架、基础设施、游戏开发、数据库等众多领域。具体授权范围和细则未在推文中说明。
Garry Tan指出AI编码工具并未解放创始人,反而让人更快搭建规则、审批、流程、层级——同一座牢笼装配更快。以前加一层审批需两周,成本本身是免疫系统;现在AI一个下午就能完成,复杂度无限繁殖,构建速度即僵化速度。AI放大已有心智模型:控制型团队用它堆官僚,创造型团队用它创造新体验。提醒不要用AI把旧流程跑得更快,而应删掉整个旧流程,创造前所未有的事,否则赢了效率输了方向。
Everyone thinks AI coding tools set founders free. Watch what people actually build with them: rules, approvals, process...
Introducing MiniMax M3: The First Open-Weights Model to Combine Three Frontier Capabilities - Coding & Agentic Frontier:...
同一事件,精选展示《MiniMax M3:前沿编码、100万token上下文与原生多模态一体模型》🔗 Weights & code: https://huggingface.co/moonshotai/Kimi-K2.7-Code
🌘 Kimi-K2.7-Code, our latest coding model, is now released and open-sourced! 🔷 Improved coding & agent performance ove...
🔗 Weights & code: https://huggingface.co/moonshotai/Kimi-K2.7-Code
Anthropic 发布 Claude Fable 5,官方指南强调旧模型提示词会拖后腿,建议“做减法”。Fable 5 支持多天长任务、effort 分级(low/medium/high/xhigh),其 low 档性能已超旧版 Opus 4.8 xhigh。新增并行子代理调度和内置记事本能力。省钱方面:输入 $10/M、输出 $50/M(单价为 Opus 4.8 两倍),但更少的 token 消耗使复杂任务总成本反而可能更低。推荐日常用 Low 档,Medium 是性价比甜区,复杂项目可用 Fable 做编排器、Opus/Sonnet 执行。
同一事件,精选展示《Claude Fable 5 和 Claude Mythos 5》Kimi 开源发布最新编码模型 Kimi-K2.7-Code,基于 K2.6 优化。编码基准全面提升:Kimi Code Bench v2 提高 21.8%,Program Bench +11.0%,MLS Bench Lite +31.5%。推理 token 整体降低约 30%。Agent 方面,MCP Mark Verified 得分 81.1,超过 Opus 4.8(76.4),GPT-5.5(92.9)仍为天花板。技术特性:强制 Thinking 模式、Preserve Thinking、Interleaved Thinking+多步工具调用,支持图像和视频输入。可通过 Kimi API 和 Kimi Code 使用,6x 高速模式即将推出。开源地址:HuggingFace 上的 moonshotai/Kimi-K2.7-Code。
🌘 Kimi-K2.7-Code, our latest coding model, is now released and open-sourced! 🔷 Improved coding & agent performance ove...
Kimi 发布并开源最新代码模型 Kimi-K2.7-Code。相比 K2.6,其在 Kimi Code Bench v2 上提升 +21.8%,Program Bench 提升 +11.0%,MLS Bench Lite 提升 +31.5%。推理效率改进,推理 token 使用量降低 30%,长时编码任务中指令遵循和端到端成功率均提升。6x 高速模式即将推出,即日起可通过 Kimi API 和 Kimi Code 使用。
同一事件,精选展示《6倍速!Kimi K2.7 Code 高速版已上线》@claudeai Fable 5 just oneshot the first open-source MMORPG 🤯 Play it on http://worldofclaudecraft.com Contribute via g...