AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「编码」清除
6月2日周二
12:34Hacker News 热门(buzzing.cc 中文翻译)67Chipotlai Max 项目在 Hacker News 获得关注
12:07IT之家(RSS)50微软 Copilot 超级应用曝光:整合多款工具,常驻 AI 智能体 Scout
12:07Ethan Mollick70AI编程智能体生产力提升显著但受限于人类瓶颈
12:03Tibo27Codex 可以生成一个农场
11:53MiniMax (official)78MiniMax开源M3模型发布:结合编程智能体、长上下文与多模态能力
10:56Claude Code:GitHub Releases(RSS)54Claude Code v2.1.160 发布
10:35小互28Codex 今晚将有重大更新
10:13Chubby♨️53OpenAI Codex 即将发布重大更新
09:35meng shao54用户邵猛的 $10K Cursor 额度使用体验回顾
09:05meng shao64Lee Robinson 分享四条「Agent 友好型代码库」原则
09:05meng shao78精选Anthropic 开发者分享 Claude Code「理解验证」工作流
09:04Baidu Inc.44百度 MeDo 3.0 本周五直播演示
08:48OpenCode25OpenCode 团队沉迷使用 Little Frank 模型
08:48OpenAI Developers35OpenAI展示Codex在企业工作流中的应用
08:12Rohan Paul75精选Karpathy 分享学习方法论
08:00HuggingFace Daily Papers(社区热门论文)49EvoTrainer:为自主智能体 RL 共同进化 LLM 策略与训练端工具
07:54ginobefun71BestBlogs 早报:MiniMax M3 开源模型发布,集成前沿能力
07:54ginobefun71MiniMax发布开源模型M3:集成编码、长上下文与多模态
07:35Alibaba Cloud83通义千问 Qwen3.7-Plus 多模态代理模型发布
07:19MiniMax (official)81同事件精选MiniMax M3 模型上线 Cloudflare AI Gateway同一事件,精选展示《MiniMax M3:前沿编码、100万token上下文与原生多模态一体模型》
07:14Cursor Blog64精选Cursor Teams计划定价方案更新
06:44Peter Steinberger 🦞63Codex 通过语音助手处理阻塞任务
06:43Ars Technica:AI(RSS)65GitHub Copilot 用户对全新按量计费系统反应强烈
06:30宝玉61Cursor 为团队用户提升使用额度
06:27eric zakariasson15Eric Zakariasson 分享 Cursor 使用体验
06:01jason62OpenAI前沿模型与Codex登陆AWS Bedrock
06:00宝玉59Cursor 在为用户增加使用额度。
05:48OpenAI:官网动态(RSS · 排除企业/客户案例)66精选OpenAI前沿模型与Codex现可在AWS上使用
05:37jason30Jason Liu 寻求 PyPI 合作发布 Python Codex SDK
05:17Lee Robinson71帮助AI智能体理解代码库的四点建议
04:16🚨 AI News | TestingCatalog53Grok Build 集成 Cursor Composer 2.5 模型
03:53Replit ⠕73精选Replit 用单个提示词构建完整业务
02:18MiniMax (official)69MiniMax M3上线Happycapy,多模态处理能力强化
02:09Yuchen Jin50OpenAI、Anthropic、Gemini 三足鼎立 AI 编程
01:59宝玉50Claude 重置 Pro/Max 用户速率限制
01:18MiniMax (official)76MiniMax M3模型登陆Qubrid AI平台,早期用户享半价
00:38Hugging Face:Blog(RSS)71精选JetBrains 发布 Mellum2:12B 参数混合专家模型
00:35StepFun57Step 3.7 Flash 在 Kilo Code 免费开放使用
00:10Chubby♨️82MiniMax发布开源模型M3,集成编码、长上下文与多模态三大能力
6月1日周一
23:43🚨 AI News | TestingCatalog58MiniMax M3已上线Atomic Chat
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月2日
12:34
Hacker News 热门(buzzing.cc 中文翻译)
67
Chipotlai Max 项目在 Hacker News 获得关注

“Chipotlai Max”项目在 Hacker News 上获得了 102 点热度,并提供了其 GitHub 仓库地址。

GitHub开源/仓库编码
12:07
IT之家(RSS)
50
微软 Copilot 超级应用曝光:整合多款工具,常驻 AI 智能体 Scout

根据曝光的截图,微软正在开发“Copilot 超级应用”,内部口号是“Delivering one Copilot”,旨在统一所有 Copilot 工具入口。该应用计划整合 GitHub Copilot、Copilot 聊天、Copilot Cowork 及内部代号为 Autopilot 的新智能体能力。应用内包含一个代码页,形态类似 Claude Code 面板,带有一个名为 Scout 的常驻 AI 智能体。用户可通过该页面管理代码仓库、切换模型并安排定时任务。另一个 Cowork 标签页用于汇总数据并提供提示词。

智能体产品更新编码
12:07
Ethan Mollick@emollick
70
关于使用Github及其他数据的AI编程智能体的重要论文 自动补全工具(如Copilot)使代码量增加2.2倍,本地智能体(如初版Claude Code)增加7.4倍,而当前远程编程智能体增加17.3倍(!) 但编程中的人类瓶颈意味着实际发布量"仅"增加了30%
智能体编码论文/研究
12:03
Tibo@thsottiaux
27
你只需用 Codex 就能……生成一个农场 https://chatgptpro.substack.com/p/hiroki-tomiyasu
OpenAI教程/实践编码
11:53
MiniMax (official)@MiniMax_AI
78
MiniMax宣布推出首个开源权重模型M3。该模型结合了三大前沿能力:在编程与智能体方面,它在SWE-Bench Pro等评测上取得了具体分数;通过MiniMax Sparse Attention技术,其上下文窗口可扩展至1M tokens;并且模型从零开始原生支持多模态。模型的权重与技术报告将在约10天后发布。

MiniMax (official): Introducing MiniMax M3: The First Open-Weights Model to Combine Three Frontier Capabilities - Coding & Agentic Frontier:...

开源生态模型发布编码
关联讨论 11 条MiniMax:Blog(网页)X:MiniMax (@MiniMax_AI)X:Testing Catalog (@testingcatalog)HuggingFace Daily Papers(社区热门论文)公众号:MiniMax(稀宇科技)X:OpenRouter (@OpenRouter)X:karminski (@karminski3)X:硅基流动 SiliconFlow (@SiliconFlowAI)X:歸藏 (@op7418)MarkTechPost(RSS)IT之家(RSS)
10:56
Claude Code:GitHub Releases(RSS)
54
Claude Code v2.1.160 发布

Claude Code v2.1.160版本主要增强安全性和稳定性。新版本在向shell启动文件和.git/config等文件写入内容前增加提示,防止意外命令执行;acceptEdits模式在写入.npmrc等构建配置文件前也会提示。此次更新修复了多个问题,包括Windows/WSL剪贴板、会话恢复、后台会话连接等,并优化了自动模式延迟和后台清理流程。此外移除了JetBrains插件建议,将动态工作流触发词从workflow重命名为ultracode。

Anthropic产品更新编码
10:35
小互@xiaohu
28
今晚 codex 将有大更新…
编码行业动态
10:13
Chubby♨️@kimmonismus
53
OpenAI 将于明天发布一次重要的 Codex 更新。 经过数月开发,这将是一个相当特别的功能。 它听起来与 GPT-5.6 确实不同。

Rohan Varma: Tomorrow, we're launching something special into Codex. It's been months in the making and it's the feature I've persona...

OpenAI产品更新编码
09:35
meng shao@shao__meng
54
用户邵猛的 $10K Cursor 额度使用体验回顾

用户邵猛在获得 Cursor 团队赠送的 $10K 额度及两个月 Ultra 订阅后,实际使用了约 $2 千美元。其使用体验显示,100% 的时间都在使用 Agent Windows 模式,很少进行多模型切换。模型选择上,有外网访问时偏好 GPT-5.5,否则常用 Composer 2.5,因其 Fast 模式速度快且喜欢输出 Diagram 流程图。优点在于 Context 使用明细清晰,但 Agent 输出界面默认非 Markdown 且不支持拷贝为 Markdown。此外,Agent 界面右侧的扩展窗口(Terminal、Browser、File、Canvas)被认为比较实用。

meng shao: 收到 @cursor_ai 团队成员私信,随后 $10K 到手,非常感谢! 5月份是 Cursor Token 自由的一个月 😃 把 Cursor 新功能用起来,多多给团队提反馈,自己也试试在 Token 自由的情况下,看看能做出什么有趣...

智能体教程/实践编码
09:05
meng shao@shao__meng
64
Lee Robinson 分享四条「Agent 友好型代码库」原则

Lee Robinson 分享了四条构建适合AI智能体的代码库的原则:1. 源码应为真相或提供可读路径(如将内容从CMS迁移回代码);2. 智能体需能通过类型系统、测试和Linter验证工作;3. 维护精简有效的AGENTS.md文件,提供项目特有上下文;4. 设置自动化流程(如安全扫描)持续改进。他以Cursor官网迁移为例,该过程耗时3天,消耗344次Agent请求,花费$260,证明降低抽象层成本能带来可量化的投资回报。

Lee Robinson: Some tips to help agents understand your codebase: 1. The source code either needs to be the source of truth, or have so...

智能体教程/实践编码
09:05
meng shao@shao__meng
精选78
Anthropic 开发者分享 Claude Code「理解验证」工作流

Anthropic 核心开发者分享了一套用于 Claude Code 的「理解验证」工作流。该工作流将 AI 定位为“高效且睿智的教师”,成功标准不仅是完成任务,更是确保人类对问题、方案及影响有可复述、可辩护的掌握。它通过增量教学、用户复述、清单+测验等方式,围绕问题域、方案域和语境域三条轴线展开,具体包含8个可执行步骤,强调在进入下一阶段前需确认用户已真正理解。此工作流旨在对抗长会话中人类易沦为“审批按钮”的“智能体黑箱”问题,强制沉淀决策上下文,实现可审计的深度理解。

Thariq: been asking others at Anthropic how they stay in the loop with Claude and fully understand the work being done this is o...

智能体Anthropic教程/实践编码

推荐理由:Anthropic内部的「理解验证」工作流,把结对编程的认知摊到全程,用清单和测验逼你真正懂。做AI辅助开发又不想当审批按钮的,可以直接套用。
09:04
Baidu Inc.@Baidu_Inc
44
我们将于本周五北京时间上午9点直播演示 MeDo 3.0! @Medo_CodeFree 将介绍其变化、工作原理以及你可以用它构建的一些东西。 🧵 点击此处观看 ↓
产品更新编码
08:48
OpenCode@opencode
25
我们的团队对 little frank 上瘾了 猜猜这是什么模型
其他编码
08:48
OpenAI Developers@OpenAIDevs
35
今天与客户通话。明天开始新的产品工作流程。 Proaction是一个5人团队,他们使用Codex构建车队管理软件,涵盖销售演示、客户支持跟进、营销资产和工程工作。
OpenAI教程/实践编码
08:12
Rohan Paul@rohanpaul_ai
精选75
🎯 Andrej Karpathy 谈如何学习。
教程/实践编码

推荐理由:Karpathy的学习方法贴,虽然只是一张图,但可能是你今年最该抄的作业,直接改掉低效学习模式。
08:00
HuggingFace Daily Papers(社区热门论文)
49
EvoTrainer:为自主智能体 RL 共同进化 LLM 策略与训练端工具

EvoTrainer 是一个自主训练框架,通过经验反馈共同进化 LLM 策略与训练端工具。它诊断 rollout 级证据、修正诊断、回测干预并积累可复用技能。在数学推理、竞赛编程代码生成和仓库级软件工程评估中,EvoTrainer 在相同数据、代码库和协议下匹配或超越人工设计的 RL 参考,最大收益在长 horizon SWE 任务上。轨迹分析显示,保留的策略跨领域发散,进化的诊断阻止无效高分分支被提升,可复用技能塑造后续搜索。

智能体推理编码论文/研究
07:54
ginobefun@hongming731
71
BestBlogs 早报:MiniMax M3 开源模型发布,集成前沿能力

本期早报聚焦三个主题。核心是 MiniMax 发布其开源模型 M3,这是国内首个同时具备前沿 Coding 能力、1M 超长上下文和原生多模态的模型。M3 在 SWE-Bench Pro 上得分 59.0%,其自研 MSA 稀疏注意力架构显著降低了长上下文计算开销。实测中,M3 可在 24 小时内自主完成 CUDA 算子优化。此外,早报还简述了 Chromium 项目对 AI Coding 的规范化实践,以及 xAI 工程师关于视频 Agent 发展前景的观点。

智能体xAI模型发布现象/趋势
07:54
ginobefun@hongming731
71
MiniMax发布开源模型M3:集成编码、长上下文与多模态

MiniMax开源发布了国内首个集成前沿Coding能力、1M超长上下文和原生多模态的模型M3。该模型能在24小时内自主完成145次CUDA算子迭代。与此同时,xAI前负责人指出,视频模型的上限将由LLM决定,下一个类似Sora的产品应是视频Agent,而非单纯的视频生成模型。

多模态开源/仓库模型发布编码
07:35
Alibaba Cloud@alibaba_cloud
83
通义千问 Qwen3.7-Plus 多模态代理模型发布

阿里云发布了 Qwen3.7-Plus,这是一款统一了视觉与语言能力的多模态代理模型。该模型旨在成为通用的代理基础,支持图形界面与命令行操作,能够处理视觉和文本任务,充当编程代理和效率助手。其能力涵盖视觉感知、推理、目标定位以及搜索增强问答,并可跨多种代理框架进行泛化。该模型现已在阿里云百炼平台提供 API 服务。

智能体多模态模型发布编码
关联讨论 6 条IT之家(RSS)X:Kim (@kimmonismus)X:阿里云 / Alibaba Cloud (@alibaba_cloud)Qwen:Blog Retrieval(API)公众号:通义实验室(千问)X:通义千问 / Qwen (@Alibaba_Qwen)
07:19
MiniMax (official)@MiniMax_AI
同事件精选81
M3 on Cloudflare AI Gateway, day one ⚡ 前沿编码能力,1M 上下文,原生多模态,现在一次 fetch 即可调用。 是时候构建些东西了。 🦞

Cloudflare Developers: M3 from @MiniMax_AI is now available on Cloudflare AI Gateway: - First open model to push SOTA coding frontier - 1M cont...

多模态开源/仓库模型发布编码
同一事件,精选展示《MiniMax M3:前沿编码、100万token上下文与原生多模态一体模型》
推荐理由:MiniMax的M3把开源编码模型拉到新高度,1M上下文加原生多模态是惊喜,上线首周5折,值得跑一下看是不是真能干翻闭源。
07:14
Cursor Blog
精选64
Cursor Teams计划定价方案更新

Cursor Teams计划推出三项更新:增加Composer特定使用池,将第一方模型(Composer和Auto)与第三方API的使用额度分开计费;推出Premium席位,提供5倍于标准席位($40/月)的使用量,价格为$96/月(年付);仪表盘现可实时显示用户额度使用情况,管理员可通过Slack或邮件配置智能提醒。

智能体产品更新编码

推荐理由:Cursor这个定价更新把「用不用得起第三方模型」的问题从团队开支里切出去了,标准席位加量不加价,重度用户直接上Premium可能比现在更划算,做Agent开发的团队不妨算算账。
06:44
Peter Steinberger 🦞@steipete
63
我告诉 Codex,当我分心且它需要我的帮助来解除阻塞时,使用 http://sag.sh。偶尔我会听到它在跟我说话,这是有史以来最酷的事情。(例如,对于需要 npm 且受 1Password 门控的发布任务)
MCP/工具教程/实践编码
06:43
Ars Technica:AI(RSS)
65
GitHub Copilot 用户对全新按量计费系统反应强烈

GitHub Copilot 正从固定订阅制转向基于使用量的计费系统。部分用户反映,其单日用量就消耗掉了整月的“AI credit”配额,引发用户对成本控制的担忧。

GitHub编码行业动态
06:30
宝玉@dotey
61
Cursor 为团队用户提升使用额度

Cursor 宣布提升所有团队用户使用额度,并推出 Premium 团队席位。用户反馈其 Agent 模式效果好,支持多任务并行、灵活选择各类模型,且 Plan 模式步骤详细。对比中,用户认为其表现优于 Claude Desktop,略低于 Codex App。当前不足包括不支持 /goal 与手机版,且调试功能仅限内置浏览器。

Cursor: We're increasing usage limits for every Teams user. Inspired by the success of our Ultra plan, we're also introducing a ...

智能体编码评测/基准
06:27
eric zakariasson@ericzakariasson
15
我玩这个玩得太久了。感谢构建它,@DanHollick https://cursor.com/insights
其他编码
06:01
jason@jxnlco
62
现已在Bedrock上可用! 【引用 @OpenAI】:OpenAI前沿模型和Codex现已在AWS上全面可用,为企业提供了一种新方式,通过其现有的安全、合规和治理工作流,在Amazon Bedrock上使用OpenAI进行构建。 这同时也是OpenAI在AWS上更广泛能力扩展的开端,包括未来将提供Daybreak等网络安全能力。 https://openai.com/index/openai-frontier-models-and-codex-are-now-available-on-aws/

OpenAI: OpenAI frontier models and Codex are now generally available on AWS, giving enterprises a new way to build on Amazon Bed...

OpenAI产品更新编码部署/工程
06:00
宝玉@dotey
59
Cursor 在为用户增加使用额度。

Cursor 宣布为所有 Teams 用户提升使用额度,并受其 Ultra 计划启发,将推出一个提供 5 倍用量、价格 3 倍的 Premium 团队席位。有用户分享了重度使用其 Agent 的体验,认为效果不错,亮点包括:可开启多任务并行的 multitask 模式、能灵活选择各种模型(如 composer 2.5),以及步骤详细的 Plan 模式配合使用效果稳定。目前不足之处是不支持 /goal、手机版,以及缺乏类似 Codex 的 Chrome use 和 Computer use 调试功能,仅有内置浏览器调试。

Cursor: We're increasing usage limits for every Teams user. Inspired by the success of our Ultra plan, we're also introducing a ...

智能体编码评测/基准
05:48
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选66
OpenAI前沿模型与Codex现可在AWS上使用

OpenAI的前沿模型与Codex现已在AWS上全面可用。企业客户可通过其现有的AWS环境、控制与采购流程来使用OpenAI的AI技术,从而加速从评估到生产部署的过程。

智能体OpenAI产品更新编码
关联讨论 3 条X:Testing Catalog (@testingcatalog)X:OpenAI Developers (@OpenAIDevs)X:OpenAI (@OpenAI)
推荐理由:这不是模型发布,而是渠道开闸,企业拿着现有 AWS 安全体系就能用上 GPT-5.5,合规部门终于不用再纠结。Codex 也直接嵌入开发流程,落地阻力小了一大截。
05:37
jason@jxnlco
30
我们希望有人能帮助我们发布 Python Codex SDK,并希望能与 PyPI 的相关人员沟通。有人能帮我们吗?
OpenAI编码行业动态
05:17
Lee Robinson@leerob
71
帮助AI智能体理解代码库的四点建议

文章分享了四条让AI智能体有效理解代码库的实用建议。1. 确保源代码是唯一真实来源,或通过MCP、CLI等方式让外部内容对智能体可读。2. 智能体需具备自我验证能力,这依赖于使用类型语言、高质量测试和配置良好的linter。3. 编写简洁有效的AGENTS.md文件,并融入符合模型预期的直观命名,可借助Cursor等工具自定义智能体。4. 配置自动化流程,用于代码重构建议、安全问题检查和持续文档生成,以实现一个能自我改进的“自动驾驶”代码库。

智能体MCP/工具教程/实践编码
04:16
🚨 AI News | TestingCatalog@testingcatalog
53
XAI 🔥:SuperGrok 和 X Premium+ 用户现在可以通过 Grok Build 使用 Cursor 的 Composer 2.5 模型! Grokposer 🤖
xAI产品更新编码
03:53
Replit ⠕@Replit
精选73
你能用单个提示词免费构建一个真实的业务吗? 从今天起,在 Replit 上,答案是肯定的。 从一个提示词开始,获得一个网站、移动应用、幻灯片和发布视频。 此外,还能解锁使用 @stripe @atlas, @QuickBooks, @mercury & @doolaHQ 运营业务的福利。
产品更新编码部署/工程
关联讨论 1 条X:Replit (@Replit)
推荐理由:Replit 从写代码进化到了‘一个提示生成网站+App+PPT+视频’,还串起了 Stripe 和 QuickBooks,‘建个生意玩玩’的成本降到史低,产品人和独立开发者值得试。
02:18
MiniMax (official)@MiniMax_AI
69
MiniMax M3现已在Happycapy上线,主要升级在于处理复杂、多模态、大规模任务的能力。该模型支持原生多模态输入,包括PDF、视频、图像、截图及长文档,并在编程和智能体任务(如仓库级调试、问题追踪)上表现较强。此外,M3采用开源权重,价格约为Sonnet的三分之一。

Happycapy: MiniMax M3 @MiniMax_AI is now live on Happycapy 🎉 A major upgrade for agent workflows, especially when the task is mess...

多模态开源/仓库模型发布编码
02:09
Yuchen Jin@Yuchenj_UW
50
OpenAI 在编程领域睡着了,于是 Anthropic 抢走了王冠。 Anthropic 没有获得足够的 GPU/TPU 来将这一领先优势转化为垄断。现在 Codex 已经追上来了。 Gemini 也会追上来。这只是时间问题。 AI 编程正在成为一个三体问题。
AnthropicOpenAI大佬观点编码
01:59
宝玉@dotey
50
活久见,Claude 也重置了额度!

ClaudeDevs: We've reset 5-hour and weekly rate limits for all users on Pro and Max plans. We fixed an issue that caused some Claude ...

智能体Anthropic产品更新编码
01:18
MiniMax (official)@MiniMax_AI
76
MiniMax的M3模型现已在Qubrid AI平台上线。该模型具备100万token上下文、原生多模态、前沿的代码性能,并支持长期智能体工作流,被评为年度技术上最有趣的开放权重模型之一。Qubrid AI作为首发合作伙伴,为早期用户提供50%的折扣。

Qubrid AI: @MiniMax_AI M3 is now live on Qubrid AI. https://platform.qubrid.com/model/minimax-m3 - 1M-token context. - Native multi...

智能体多模态开源/仓库模型发布
关联讨论 11 条MiniMax:Blog(网页)X:MiniMax (@MiniMax_AI)X:Testing Catalog (@testingcatalog)HuggingFace Daily Papers(社区热门论文)公众号:MiniMax(稀宇科技)X:OpenRouter (@OpenRouter)X:karminski (@karminski3)X:硅基流动 SiliconFlow (@SiliconFlowAI)X:歸藏 (@op7418)MarkTechPost(RSS)IT之家(RSS)
00:38
Hugging Face:Blog(RSS)
精选71
JetBrains 发布 Mellum2:12B 参数混合专家模型

Mellum2 是 JetBrains 从头训练的 12B 参数混合专家(MoE)模型,专注于自然语言与代码。每个 token 仅激活 2.5B 参数,推理速度可达同类模型的 2 倍以上,适合高吞吐、低延迟场景。该模型支持路由、RAG、摘要、子智能体及私有部署,以 Apache 2.0 许可证开源。在代码生成、推理、科学和数学基准测试中,Mellum2 与同等规模的开放模型竞争力相当。

推理模型发布编码

推荐理由:JetBrains 开源了 Mellum2,一个激活参数仅 2.5B 的 12B MoE 模型,专为代码和问答管道设计的快模型。做实时 RAG 或子代理时,终于不用硬扛大模型了。
00:35
StepFun@StepFun_ai
57
Step 3.7 Flash 现已在 @kilocode 免费提供 🎉 它专为编码智能体的实际工作方式而构建。这意味着在真实代码库上进行多步骤编排和可靠工具使用,而不仅仅是快速回复。 在编辑器中尝试一个真实任务吧,比如多文件更改或修复一个实际的 bug!

Kilo: Update: We didn't get the blog out yet. It's been a busy weekend. But @StepFun_ai Step 3.7 Flash is currently FREE in Ki...

MCP/工具产品更新编码
00:10
Chubby♨️@kimmonismus
82
MiniMax发布开源模型M3,它是首个将前沿编码能力、1M token上下文窗口与原生多模态集成于单一系统的开源模型。M3在SWE-Bench Pro上得分为59.0%,略高于GPT-5.5(58.6%)与Gemini 3.1 Pro(54.2%);在BrowseComp自主浏览任务中以83.5%领先Opus 4.7。此外,模型在Terminal Bench 2.1(66.0%)、MCP Atlas(74.2%)等基准上表现优异。其每token成本约为GPT-5.5的十二分之一,模型权重及技术报告预计在10天后发布。

MiniMax (official): Introducing MiniMax M3: The First Open-Weights Model to Combine Three Frontier Capabilities - Coding & Agentic Frontier:...

智能体多模态开源生态模型发布
关联讨论 11 条MiniMax:Blog(网页)X:MiniMax (@MiniMax_AI)X:Testing Catalog (@testingcatalog)HuggingFace Daily Papers(社区热门论文)公众号:MiniMax(稀宇科技)X:OpenRouter (@OpenRouter)X:karminski (@karminski3)X:硅基流动 SiliconFlow (@SiliconFlowAI)X:歸藏 (@op7418)MarkTechPost(RSS)IT之家(RSS)
6月1日
23:43
🚨 AI News | TestingCatalog@testingcatalog
58
MiniMax M3模型现已集成至Atomic Chat。在一项测试中,Atomic Chat使用M3模型读取了一张手绘的涂鸦风格平台跳跃游戏草图,并一次性完成了游戏逻辑编写、界面绘制以及最终交付一个可运行的独立HTML游戏。测试数据显示,该任务消耗输入6,920模型token,生成输出9,933模型token,总成本仅为$0.028。此外,MiniMax计划于下周在HuggingFace发布M3模型。

atomic.chat: MiniMax M3 turned a napkin sketch into a playable game We handed MiniMax M3 a hand-drawn draft of a Doodle Jump style pl...

Hugging Face多模态模型发布编码
‹ 上一页
1…2930313233…50
下一页 ›