全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态

全部一手资讯 X 论文

标签「编码」清除

5月27日周三

19:22AYi62DeepSWE新基准揭露旧评测体系的缺陷

17:39Greg Brockman35Codex被低估但现状正快速改变

17:03xAI：News（网页）54在 Kilo Code 中使用 Grok

16:31向阳乔木55开发者转向Codex App，终端使用减少

16:27Emad69Poolside AI宣布开源其基础模型

16:22karminski-牙医56测试 Qwen3.7-max 的 Rust 编程能力

14:39Greg Brockman56Codex 适用于各类计算机工作

14:27Berryxia.AI56用Vibe Coding打造个性化开源Chrome插件

11:33歸藏(guizang.ai)65Qwen3.7 Max在编程智能体榜单排名第四

11:31向阳乔木70通过对话记录实现Codex技能自动进化

11:31向阳乔木71提炼个人经验，让Codex技能每周无痛进化

10:09Peter Steinberger 🦞72autoreview技能大幅提升代码审查效率

09:58公众号：数字生命卡兹克65精选从0到1速通OpenAI Codex：安装、设置与实操教程

09:39凡人小北68Claude Code 新插件 security-guidance：一个写代码，另一个独立的 Claude 实例审查

09:33Claude Code：GitHub Releases（RSS）71精选Claude Code v2.1.152 更新发布

09:31Qwen68同事件精选Qwen3.7-Max代码竞技场排名第四，与Claude Opus 4.6持平同一事件，精选展示《Qwen3.7-Max：面向智能体时代的最新专有模型》

09:29宝玉57AI 技能管理：无需复杂工具，按项目组织即可

08:29meng shao63开发者 AlexFinn 在长期并行对比后，为何选择转向 Codex？

08:27Berryxia.AI71Gemma 4新玩法：开源地牢游戏让AI实时构建Web应用

08:13IT之家（RSS）50IT早报 0527：卢伟冰称小米不能简单地把内存涨价成本转移给消费者；美光科技总市值突破 1 万亿美元；小米 MiMo-V2.5 系列 API 永久降价；尊界 V800 实车上路…

08:09Peter Steinberger 🦞69用WASM重写Opus依赖，提升会议笔记体验

06:08Greg Brockman31GPT-5.5 编程能力获开发者高度认可

06:03Chubby♨️62Codex风评逆转：GPT-5.5领跑新基准测试DeepSWE

05:39ClaudeDevs68精选Claude Code推出安全漏洞识别插件

04:59xAI51Grok Build Beta 用量限制已重置

03:40OpenAI Developers53Codex Mobile 让我意外成为更好的开发者

03:04Rohan Paul60Uber CEO：5年内AI智能体投资回报率将超人类工程师

02:10OpenCode66Qwen3.7 Max 现已登陆 Go 平台

01:32Yuchen Jin29挑战一周纯手写代码，禁用所有AI工具

00:29宝玉45Markdown作为AI生成源码的局限性

00:27Berryxia.AI74Anthropic黑客松冠军团队开源AI编程工作台ECC

5月26日周二

23:39🚨 AI News | TestingCatalog44一个新的Grok Build部分已开始出现在用户的导航栏中

23:29Ant Ling68同事件精选KPop 新方法让 Ring-2.6-1T 在 SWE-bench Verified 上突破 76 分同一事件，精选展示《蚂蚁 inclusionAI 推出万亿参数推理模型 Ring-2.6-1T》

23:03Rohan Paul61论文提出Self-play SWE-RL方法，通过自我博弈提升软件智能体能力

19:59向阳乔木38AI编程产出与Token消耗量直接相关

19:19AYi62Cursor：从代码编辑器到AI代理平台的进化

18:00Chubby♨️19Codex质量明显下降引用户担忧

14:59Alibaba Cloud68Qwen3.7-Max 成为全球第二AI编程模型

14:18AYi69小白零基础教程：Grok Build安装使用指南（专为非技术型SuperGrok及X Premium+用户制作）

14:11IT之家（RSS）63国产第一：阿里 Qwen3.7-Max 模型 AI 编程能力超 Claude Opus 4.6

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

5月27日

19:22

AYi@AYi_AInotes

62

DeepSWE新基准揭露旧评测体系的缺陷

DeepSWE新基准模拟了真实的长链编程任务，如定位文件、复现bug和验证修复，挑战了旧有基准的局限性。测试显示，在顶级模型上分数差异模糊的SWE-Bench，被新基准拉开了差距：GPT-5.5达到70%，而Claude Opus为54%。研究发现，使用简单的mini-swe-agent即可取得与复杂定制工具相当的成绩，表明许多高分可能源于提示词工程。该基准作者@theo评论称，这是首个与真实编码体验相符的评测。

Theo - t3.gg: This is the first code bench that actually aligns with how it feels to use these models coding.

Anthropic OpenAI 编码评测/基准

17:39

Greg Brockman@gdb

35

确实如此，但情况正在迅速变化

Austen Allred: Codex remains underrated

OpenAI 大佬观点编码

17:03

xAI：News（网页）

54

在 Kilo Code 中使用 Grok

开源智能体编程平台 Kilo Code 现已集成 xAI 的 Grok 模型。用户可使用其 SuperGrok 或 X Premium+ 订阅，在 VS Code、JetBrains IDE 及终端等环境中调用最新的 Grok 模型，包括专为智能体编程设计的 Grok Build。连接过程无需单独的 API 密钥，通过 OAuth 认证即可使用。Kilo Code 本身支持 500+ 种模型，并集成了工具使用、浏览器自动化及 MCP 扩展等能力，适用于软件工程与智能体工作流。

智能体 xAI 产品更新编码

16:31

向阳乔木@vista8

55

已经很少用 Terminal 了，基本都用 Codex App 开发。连朋友送的 API 都用的少了，不然还要折腾装插件，开启 OpenAI 订阅账号才能有的功能。

OpenAI 大佬观点编码

16:27

Emad@EMostaque

69

很高兴看到 @poolsideai（美国实验室）承诺未来将开源其基础模型。 Laguna 是一个有趣的发布，去看看吧。

Jason Warner: @Shaughnessy119 https://poolside.ai/blog/introducing-laguna-xs2-m1 All models will be open going forward

开源生态模型发布编码

16:22

karminski-牙医@karminski3

56

测试 Qwen3.7-max 的 Rust 编程能力

测试显示，Qwen3.7-max 在 Code Arena 上的编程得分仅次于 Anthropic 模型。使用该模型通过 Rust 开发了一款磁盘恢复软件，实测运行流畅。该软件设计了三层恢复功能，并利用该模型智能重建文件名和内容。

编码评测/基准

14:39

Greg Brockman@gdb

56

Codex 适用于任何用计算机完成的工作：【引用 @bran_don_gell】：如果你现在对 every 有所了解，那就是我们深度使用 Codex。因此我们撰写了一份指南，介绍如何像我们一样将 Codex 用于知识工作。你不想错过这个…… https://every.to/guides/codex-for-knowledge-work

Brandon Gell: If you know one thing about every right now, it's that we're heavily Codex pilled. So we wrote a guide on how to use Cod...

OpenAI 教程/实践编码

14:27

Berryxia.AI@berryxia

56

用Vibe Coding打造个性化开源Chrome插件

开发者@vista8（乔帮主）利用Vibe Coding开发了一个功能集成的Chrome新窗口插件并开源。该插件整合了番茄钟、音乐播放、Todo、便签等独立开发者常用工具，并基于个人兴趣加入了天气信息以便判断钓鱼条件。此过程展示了Vibe Coding如何帮助用户实现现有软件无法满足的个性化、小众需求。插件还支持通过Command + K快捷键唤起，集成了谷歌搜索和ChatGPT带提示词跳转功能。

向阳乔木: 说好不熬夜的,但 AI Coding 太上瘾! 昨晚开发了个 Chrome 新窗口插件,超方便。 1. 番茄钟、音乐播放、Todo、便签、天气、换背景等,独立开发者多件套整合到了一起 😂 2. 支持谷歌搜索,ChatGPT跳转官网带提示词...

开源/仓库编码

11:33

歸藏(guizang.ai)@op7418

65

Qwen 3.7 Max 在 Arena Coding Agent 上排第四

Arena.ai: Qwen3.7 Max (20250517) debuts at #4 in Code Arena: Frontend - the top-ranked Chinese lab on the board, surpassing GLM-5....

智能体编码评测/基准

11:31

向阳乔木@vista8

70

通过对话记录实现Codex技能自动进化

一种提升Codex表现的方法是让其自动从用户交互中学习。具体做法是让Codex扫描本周的对话记录，由AI提炼用户的开发经验与审美偏好等信息，并将其写入Skill（技能）中。这个过程可以让Codex持续、自动地更新其能力。参考案例显示，有开发者借此实现了其Skill waza的每周无痛更新，从而使工具“越来越聪明，越来越懂你”。

OpenAI 教程/实践编码

11:31

向阳乔木@vista8

71

推文分享了一种提升 Codex 能力的方法：通过让 Codex 扫描本周的对话记录，让 AI 自动提炼其中的开发经验与个人审美偏好，并将这些洞察写入技能（Skill）中。此过程可实现技能的每周无痛更新，从而使 Codex 越来越"懂你"。最终会生成一份贴合个人风格的复盘经验文档。

向阳乔木: 如何让你的Codex变的越来越聪明,越来越懂你? 上周跟 @HiTw93 直播时,很多人可能没注意他的一段话,他说他的开发Skill waza,每周都能无痛更新。因为他会让Codex扫描本周对话记录,让AI提炼他的开发经验、审美偏好并写入...

智能体教程/实践编码

10:09

Peter Steinberger 🦞@steipete

72

autoreview是我添加到技术栈中最具影响力的技能（仅次于http://crabbox.sh）。它能在PR合并前自动审查你的代码。发现许多边缘情况。有时运行数小时。

智能体 GitHub 教程/实践编码

09:58

公众号：数字生命卡兹克

精选65

从0到1速通OpenAI Codex：安装、设置与实操教程

近日OpenAI的AI智能体Codex热度飙升。教程涵盖完整使用流程：从官网下载安装，支持从Claude Code和Cowork一键导入配置；界面分对话区和项目区，权限可选默认、自动审查或完全访问；模型推荐GPT-5.5，推理等级用高或超高，速度可选快速（1.5倍速度、2倍token消耗）或标准；建议开启引导模式、记忆功能，并设置全局AGENTS.md规则（卡帕西模板）；通过Skills和插件管理扩展能力；演示了开发网页（使用计划模式、批注功能圈选修改）和开发用药提醒App（需安装Xcode编译到手机）。

智能体 OpenAI 教程/实践编码

推荐理由：如果你还在观望要不要入坑Codex，这篇保姆级教程把安装、设置、开发网页到打包APP全流程踩了一遍，那个@Computer Use帮你装Xcode的操作一看就懂，想动手的现在就能跟做。

09:39

凡人小北@frxiaobei

68

Claude Code 新插件 security-guidance：一个写代码，另一个独立的 Claude 实例审查

Claude Code 推出新插件 security-guidance，通过一个写代码的 Claude 实例和一个审查代码的独立 Claude 实例进行协作。两个实例完全隔离，拥有全新上下文和独立提示词。审查过程分三层：每次编辑进行正则匹配、对话轮次结束时审查 diff、在提交/推送时进行读取调用链的智能体审查。任何一层都不直接阻断写入，审查结果会反馈给写代码的实例进行自我修正。关键创新在于审查实例因无“路径依赖”，能发现原实例的盲点。该插件基于 hooks 实现并公开源码，同时支持通过 claude-security-guidance.md 文件添加组织特定策略。

ClaudeDevs: You can add org-specific rules in a claude-security-guidance.md file. Drop it in your repo or distribute via MDM. The pl...

Anthropic 产品更新编码部署/工程

09:33

Claude Code：GitHub Releases（RSS）

精选71

Claude Code v2.1.152 更新发布

Claude Code 发布 v2.1.152 版本更新。核心改进包括：/code-review --fix 现在会将审查建议直接应用于工作目录；技能与斜杠命令支持通过 frontmatter 的 disallowed-tools 移除模型工具；新增 /reload-skills 命令可不重启会话重新扫描技能目录；SessionStart 钩子现可返回 reloadSkills: true 重新扫描技能，并可通过 hookSpecificOutput.sessionTitle 设置会话标题；新增 MessageDisplay 钩子事件以变换或隐藏助手消息。其他更新涉及插件市场管理、主模型不可用时自动切换至 --fallback-model、会话用量统计优化等。同时修复了终端样式退化、沙箱警告显示、思考摘要、MCP 服务器去重、远程会话连接及多种会话卡顿问题。

智能体 Anthropic 产品更新编码

推荐理由：Claude Code 这次更新把代码审查从'查问题'推进到'直接修'，Skills 系统补上了热加载和工具限制，做工程自动化的团队应该立刻更新。

09:31

Qwen@Alibaba_Qwen

同事件精选68

🚀🚀 Qwen3.7-Max 刚刚在 Code Arena 上升至第 4 名，与 Claude Opus 4.6 持平，是榜单上排名最高的中国实验室！@arena 更多内容即将发布。敬请期待。🕶️

Arena.ai: Qwen3.7 Max (20250517) debuts at #4 in Code Arena: Frontend - the top-ranked Chinese lab on the board, surpassing GLM-5....

模型发布编码评测/基准

同一事件，精选展示《Qwen3.7-Max：面向智能体时代的最新专有模型》

推荐理由：Qwen3.7-Max 在 Code Arena 前端任务上排第四，跟 Claude Opus 4.6 打平，国产模型第一次在 agentic web dev 摸到第一梯队，做 Web Agent 的可以认真看看。

09:29

宝玉@dotey

57

针对 Agent 框架中的技能管理，@dotey 的建议是无需依赖专门的 skill 管理工具。核心观点是，实际常用的 Skills 数量很少，只需将少量高频技能置于全局，其余技能跟从各自项目存放和管理即可。这为处理多个 Agent 或项目的技能配置提供了一种轻量化的思路。

Raymond Zhu: @dotey 宝玉老师,有没有比较好的skill管理工具推荐

教程/实践编码

08:29

meng shao@shao__meng

63

开发者 AlexFinn 在长期并行对比后，为何选择转向 Codex？

开发者 AlexFinn 在连续两个月、每天数小时并行使用 Codex 和 Claude Code 后，决定转向 Codex。其核心原因在于 Codex 拥有强大的自测闭环功能：每次代码改动后，它会在内置浏览器中自动验证，形成“改→测→修”的自动化循环。这一机制将首次交付有 bug 的改动比例从约 40% 显著降低至 ≤3%，可靠性大幅提升，更利于开发者保持心流。他建议开发者不要对任何公司忠诚，应始终使用当下最好的工具。

Alex Finn: I'm 100% Codex pilled now Been using Codex and Claude Code side by side hours a day for 2 months straight No longer usin...

智能体编码评测/基准

08:27

Berryxia.AI@berryxia

71

Gemma 4新玩法：开源地牢游戏让AI实时构建Web应用

Google Gemma团队开源了AIventure项目，这是一款地牢爬行游戏。玩家可以向游戏中的NPC输入提示词，AI会实时构建可运行的Web应用。AI核心由Gemma 4驱动，负责理解指令、规划步骤并生成代码。项目将智能体工作流与氛围编程融入游戏，是面向开发者的实操大师课，从游戏设计到智能体集成均已开源。

Google Gemma: Gemma 4 meets retro gaming! 🕹️✨ Introducing AIventure: an open-source dungeon crawler designed as a developer mastercla...

智能体 Google 开源生态教程/实践

08:13

IT之家（RSS）

50

IT早报 0527：卢伟冰称小米不能简单地把内存涨价成本转移给消费者；美光科技总市值突破 1 万亿美元；小米 MiMo-V2.5 系列 API 永久降价；尊界 V800 实车上路…

推理编码行业动态

08:09

Peter Steinberger 🦞@steipete

69

Opus周围的所有依赖都过时或糟糕，所以我凭感觉自己重写了，并替换了octoscript和opus-native。现代WASM在Node/V8上的性能与原生代码大致相当。现在你的Claw可以自动做会议笔记，并且你可以在会议中与它对话。 https://github.com/openclaw/libopus-wasm

开源/仓库开源生态编码

06:08

Greg Brockman@gdb

31

GPT-5.5 是一个非常出色的编程模型

Theo - t3.gg: It took me like 2 months, but I've grown to love gpt-5.5. You have to prompt entirely different and put some time into y...

OpenAI 大佬观点编码

06:03

Chubby♨️@kimmonismus

62

近期开发者社区对Codex的评价显著转好，许多观点认为搭配GPT-5.5的Codex表现优异，其部分使用体验甚至常被优先选择。与此同时，新发布的智能体编码基准测试DeepSWE显示，GPT-5.5在此评测中位列第一。该基准测试旨在打破顶尖模型在公开排行榜上能力相近的表象，更真实地反映模型在开发者日常任务中的实际差异。

Serena Ge (Datacurve): Today we're releasing DeepSWE, a new standard for agentic coding benchmarks. On public leaderboards, top models often lo...

OpenAI 大佬观点编码

05:39

ClaudeDevs@ClaudeDevs

精选68

我们为Claude Code发布了一个安全指导插件，可在编写代码时帮助识别和修复漏洞。所有Claude Code用户均可使用。从插件市场（/plugins）安装。

Anthropic 产品更新安全/对齐编码

推荐理由：给Claude Code装上安全扫描，边写代码边修漏洞，比事后用Snyk扫一圈要快。对已经All in Claude Code的团队是个小甜点，其他人可略过。

04:59

xAI@xai

51

非常感谢大家对 Grok Build Beta 的所有反馈。部分用户反馈很快达到了使用限制。我们的团队发现了缓存方面可以改进的地方，因此已为所有账户重置了 Grok Build 的使用限制。请继续分享反馈--团队会提供帮助。

xAI 产品更新编码

03:40

OpenAI Developers@OpenAIDevs

53

Codex Mobile 以一种我没想到的方式让我成为更好的开发者：我离开笔记本电脑，不再事无巨细地管理。我给它更宏大的提示词（这是模型最擅长的方式）。我获得了思考的空间，而不是坐在那里眼睛酸痛地疯狂输入提示词。

Matt Shumer: Codex Mobile is making me a better developer in a way I didn't expect: I step away from my laptop and stop micromanaging...

OpenAI 大佬观点编码

03:04

Rohan Paul@rohanpaul_ai

60

Uber CEO：5年内AI智能体投资回报率将超人类工程师

Uber CEO Dara Khosrowshahi表示，目前Uber 90%的工程师使用AI，其中顶尖30%的用户获得前所未有的生产力提升，在代码库中提交的“diffs”数量最多。他预测，5年内增加更多AI智能体和NVIDIA GPU算力的投资回报率（ROI）将超过人类工程师，届时公司将选择雇佣更多AI智能体并支付GPU算力成本，而非增聘人类软件工程师。该观点来自YouTube频道“The Diary Of A CEO”。

智能体大佬观点编码

02:10

OpenCode@opencode

66

Qwen3.7 Max 现已在 Go 平台上线 - 仅支持文本 - 1M 上下文 - 迄今为止 Qwen 家族中最智能的模型

模型发布编码

01:32

Yuchen Jin@Yuchenj_UW

29

我向所有人发起挑战，连续一周每天手写代码8小时以上： 1. 不使用编程智能体：Claude Code、Codex、Cursor 2. 不使用GPT/Claude，或任何AI模型如果你能坚持下来，你就是真正的勇士。

大佬观点编码

00:29

宝玉@dotey

45

Markdown作为AI生成源码的局限性

推文指出，Markdown作为AI编程的“源代码”存在根本缺陷。首先，其结果缺乏确定性，同一份Markdown因使用模型、Agent Harness及操作者的不同，最终产品千差万别。其次，难以清晰描述UI交互，导致生成的界面质量仅为“凑合能用”，不足以达到商用标准。该观点引用了@jianshuo的相关讨论作为背景。

Jianshuo Wang: http://x.com/i/article/2059196541693562880

现象/趋势编码

00:27

Berryxia.AI@berryxia

74

Anthropic黑客松冠军团队开源AI编程工作台ECC

Anthropic黑客松冠军团队使用Claude Code耗时8小时开发出产品zenith.chat并赢得1.5万美元API credits。赛后，他们将背后的完整工作流开源为ECC项目。该项目包含61个智能体、246个技能和76个预设命令，并配备规则引擎、Hook系统、安全扫描器和MCP配置，支持Claude Code、Cursor、Codex等多平台。它提供了一套可让AI持续工作的完整工业级编程环境框架，而非简单的提示词集合，已完全开源在GitHub。

泊舟: Anthropic 黑客松冠军,把自己的 AI 编程工作台开源了。项目叫 ECC。作者 Affaan Mustafa 和队友用 Claude Code 8 小时做出 http://zenith.chat 拿了冠军,后来把背后的工作流整理成...

智能体 Anthropic GitHub MCP/工具

5月26日

23:39

🚨 AI News | TestingCatalog@testingcatalog

44

Grok网站的导航栏近期出现了一个新的"Grok Build"板块，目前该板块尚不可用，但可能暗示Grok Build网页体验即将发布。专用页面grok.com/build正在开发中，将成为直接在grok.com上的主入口，取代此前仅在x.ai/cli上提供的访问方式。该页面将允许SuperGrok、Premium+和SuperGrok Heavy用户通过简单命令安装Grok Build，并在终端中运行。

Myrhex: A new tab dedicated to Grok Build is being worked on in Grok Web. It is called "Build" and links to https://grok.com/bui...

xAI 产品更新编码

23:29

Ant Ling@AntLingAGI

同事件精选68

团队推出 KPop，用于稳定大规模 MoE 模型的智能体强化学习训练。它用基于二元 KL 散度的自适应掩码机制，替代了此前 IcePop 方法中的固定比例掩码，能根据训练过程中的训练-推理不匹配程度动态调整。这一改进使得 Ring-2.6-1T 模型在无需修改基础设施或路由重放的情况下，仅通过纯 RL 训练，在 SWE-bench Verified 上取得了超过 76 分的成绩。

Jia Guo: Curious about the secret sauce behind our trillion-scale agentic foundation model? Here it comes!🥳 Last year, we releas...

智能体数据/训练编码论文/研究

同一事件，精选展示《蚂蚁 inclusionAI 推出万亿参数推理模型 Ring-2.6-1T》

推荐理由：蚂蚁团队把 IcePop 升级成 KPop，从固定掩码变成自适应 KL 区域，思路很巧。Ring-2.6-1T 纯 RL 直接冲到 SWE-bench 76+，做 agentic RL 训练的同学值得翻一下博客。

23:03

Rohan Paul@rohanpaul_ai

61

论文提出Self-play SWE-RL方法，通过自我博弈提升软件智能体能力

Meta、CMU等机构在论文中提出了Self-play SWE-RL方法。该方法让编程智能体通过“自我博弈”生成训练数据，而非仅依赖人工标注的问题。具体而言，一个模型探索代码库、注入bug并留下测试用例来描述问题；另一个模型则学习根据测试修复系统。其中，测试成为了描述问题的核心语言。该方法在SWE-bench Verified上提升了+10.4分，在SWE-Bench Pro上提升了+7.8分。值得注意的是，评估使用了该系统未训练过的自然语言问题，表明其可能学到了更深层的软件理解能力。

智能体 arXiv Meta 编码

19:59

向阳乔木@vista8

38

AI Coding 产出果然和Token消耗量直接相关。这才两天，已用了一半多，感觉也没干啥。

现象/趋势编码

19:19

AYi@AYi_AInotes

62

Cursor：从代码编辑器到AI代理平台的进化

推文强调，Cursor被收购后已从代码编辑器进化为能交付成品的AI代理平台。用户实例显示，其能快速生成可直接使用的六维雷达图Excel模板和HTML可视化版本，类似一个“全职执行助理”。引用指出，Cursor内部模式已变，工程师扮演“AI团队经理”角色，其内部30%的合并PR由异步云代理自动创建，单周运行2000+并发代理，生成300万行代码，消耗数十亿token。一个任务被自动拆分为规划、编码、测试、发PR四个角色并行处理，人类仅需定义范围和最终审核。

AYi: 拿到Cursor赠送的$10000额度之后,我专门研究下这家公司, 看到Cursor CEO这个演讲,我突然意识到, 我们对AI编程的理解,从根上就错了, 当大多数人还在纠结哪个模型写代码更快更准的时候, Cursor已经直接进入了下一个时...

智能体现象/趋势编码

18:00

Chubby♨️@kimmonismus

19

顺便说一下，Codex的质量明显变差了。是我一个人这么觉得，还是你们也看到了同样的质量下降？

Chubby♨️: So... its not fixed, yet?

OpenAI 大佬观点编码

14:59

Alibaba Cloud@alibaba_cloud

68

Qwen3.7-Max 正式成为全球第二大 AI 编程模型。在 Code Arena 上得分 1541，仅次于 Claude。专为生产环境打造：可运行 35 小时任务、1000+ 次工具调用，并在数小时内交付两周的项目。

推理模型发布编码

14:18

AYi@AYi_AInotes

69

小白零基础教程：Grok Build安装使用指南（专为非技术型SuperGrok及X Premium+用户制作）

这是一条面向非技术用户的 Grok Build 安装与使用教程视频。教程演示了如何通过一行命令快速安装 Grok Build，并展示了如何用它创建真实可用的网站。其核心功能包括：利用 Grok Imagine 自动生成图片与视频，以及支持在多个文件夹中同时运行不同的项目。在使用过程中，Grok 会自动执行所需命令，无需用户具备任何编程经验。该教程由原作者 Daniel_Farinax 制作，以解答朋友们的疑问，并获得了马斯克的转发认可。

Dan: Beginner video: How to install & use Grok Build (made for non-technical SuperGrok and X Premium+ users) I got so many qu...

教程/实践编码部署/工程

14:11

IT之家（RSS）

63

国产第一：阿里 Qwen3.7-Max 模型 AI 编程能力超 Claude Opus 4.6

编码评测/基准

1…35 363738 39…50