http://x.com/i/article/2061439796745297920
http://x.com/i/article/2061439796745297920
Qwen3.7-Max实测显示其前端测试能力较3.6版本有显著进步。后端能力测试在34个参与模型中表现突出,以6947分登顶,远超此前GPT-5.5-Pro(xhigh)的4000分,且是唯一实现IVF-PQ + ADC索引方案的模型。测试也指出其输出分布稳定性有待提升,建议使用中多加review代码。此外,其Agent能力已达到第一梯队水平,并可实际用于构建AI磁盘恢复系统等工程任务。
MiniMax M3 现已在 SiliconFlow 平台上线,并提供限时7天的50%折扣。定价为:缓存 $0.06、输入 $0.30、输出 $1.20(每百万 token)。M3 是首个同时具备三大前沿能力的开源模型:一是编码与智能体能力,在 SWE-Bench Pro 评测中击败了 GPT-5.5 和 Gemini 3.1 Pro;二是支持 100万 token 上下文窗口(通过 MiniMax Sparse Attention 技术实现);三是具备原生多模态能力,支持图像、视频与计算机操作。
关联讨论 7 条X:MiniMax (@MiniMax_AI)MiniMax:Blog(网页)X:Kim (@kimmonismus)HuggingFace Daily Papers(社区热门论文)公众号:MiniMax(稀宇科技)MarkTechPost(RSS)IT之家(RSS)CodePilot发布了0.55.0-preview.5版本。本次更新包含大量内容优化和UI整体重构,并支持将Codex作为其Agent引擎。用户可选用Codex内置模型或自定义模型。该版本目前为测试版,未公开推送,可能存在重大Bug,开发者欢迎用户带日志反馈问题。
跟祖传的 20K context 说 bye bye 了。 MiniMax M3 发布了,三个亮点: 1M context、原生多模态、Agentic。 我这次做了一次完整评测,使用CC workflow 、 @ZenMuxAI和MiniM...
Introducing MiniMax M3: The First Open-Weights Model to Combine Three Frontier Capabilities - Coding & Agentic Frontier:...
关联讨论 7 条X:MiniMax (@MiniMax_AI)MiniMax:Blog(网页)X:Kim (@kimmonismus)HuggingFace Daily Papers(社区热门论文)公众号:MiniMax(稀宇科技)MarkTechPost(RSS)IT之家(RSS)MiniMax M3 might be the most underrated coding model right now. I gave it nothing but a screenshot of a chaotic 90s GeoC...
Blown away by MiniMax M3 I've been using it for free inside @orca_build with the @opencode agent Mostly UI tasks & code ...
MiniMax 发布了其大版本号模型升级 MiniMax M3。该模型标配 1M 超长上下文,采用新的 MSA(MoE with Segment-wise Attention)稀疏注意力架构,在 100 万上下文下每 token 计算量降至约上一代的 1/20。M3 从训练起即融合了原生多模态能力。在基准测试中,其取得了 SWE-Bench Pro 59.0%、Terminal Bench 2.1 66.0%、MCP Atlas 74.2% 等成绩。此外,其 API 推出小于 512k 调用的限时七天五折优惠。模型权重与技术报告预计约 10 天后发布。
Introducing MiniMax M3: The First Open-Weights Model to Combine Three Frontier Capabilities - Coding & Agentic Frontier:...
关联讨论 7 条X:MiniMax (@MiniMax_AI)MiniMax:Blog(网页)X:Kim (@kimmonismus)HuggingFace Daily Papers(社区热门论文)公众号:MiniMax(稀宇科技)MarkTechPost(RSS)IT之家(RSS)作者解决了其Codex推理速度异常缓慢且频繁断联的问题。在同一网络环境下,其他设备运行正常,这排除了网络原因。最终发现根源是配置文件中错误地写死了两个参数,并强制加载了两个MCP,导致了性能问题。建议遇到类似情况的用户,可尝试利用Codex自身能力来检查其配置文件。
推文指出,当人们还在关注使用 Opus 4.8 制作小游戏的案例时,Codex 中的 GPT-5.5 模型早就能很好地完成这类开发任务。作者强调,即使是零基础的用户,也可以通过 Codex(或其“0-1”版本)完成一款体验不错的游戏开发,并对此进行了强烈推荐。此观点建立在与日本人使用 Opus 4.8 开发游戏这一被广泛传播的案例的对比之上。
http://x.com/i/article/2061202487412215808
Cursor推出学生福利,在校大学生凭.edu邮箱通过验证可免费使用Cursor Pro一年,价值$240。套餐包含Claude、GPT、Gemini全部模型及Agent多文件编辑功能,每月附赠$20模型额度,无需信用卡,有效期至2026年6月。同时,OpenAI为开源项目维护者开放ChatGPT Pro申请,任何公开开源项目(无星数要求)的维护者均可申请,获批后可免费使用6个月,价值$1200。
免费领6个月ChatGPT Pro, 价值$ 1200🤩 这可能是今年对开发者最实在的福利了, 没有硬性Star数要求, 有项目链接基本都能过, 只要你是任何一个公开开源项目的维护者,哪怕只有你一个人在维护, 都可以去申请试试: http...
MiniMax发布了新开源权重模型M3,现已通过API和MiniMax Agent提供服务。该模型在SWE-Bench Pro上得分59.0%,在Terminal Bench 2.1上得分66.0%,并支持高达1M的上下文窗口。同时,MiniMax Agent更新了持久记忆与进化技能等能力。此外,MiniMax Code也已发布,模型权重与技术报告将在约10天后公开。
Introducing MiniMax M3: The First Open-Weights Model to Combine Three Frontier Capabilities - Coding & Agentic Frontier:...
关联讨论 7 条X:MiniMax (@MiniMax_AI)MiniMax:Blog(网页)X:Kim (@kimmonismus)HuggingFace Daily Papers(社区热门论文)公众号:MiniMax(稀宇科技)MarkTechPost(RSS)IT之家(RSS)The new MiniMax-M3 is their first model to have 1m context, multimodal, and agentic coding capability. Congratulations t...
MiniMax M3 是一个开源前沿模型,具备先进的编码与AI智能体能力。它支持100万token的超长上下文窗口,并采用名为MSA(MiniMax Sparse Attention)的新型稀疏注意力架构。该架构使模型在100万token上下文下的每token计算成本降至前代的1/20,预填充速度提升9倍以上,解码速度提升15倍以上。在SWE-Bench Pro编码基准上,MiniMax M3得分59.0%,超越GPT-5.5和Gemini 3.1 Pro,性能接近Opus 4.7。该模型可通过MiniMax Code、Token Plan和API服务使用。
关联讨论 7 条X:MiniMax (@MiniMax_AI)MiniMax:Blog(网页)X:Kim (@kimmonismus)HuggingFace Daily Papers(社区热门论文)公众号:MiniMax(稀宇科技)MarkTechPost(RSS)IT之家(RSS)MiniMax-M3 is live on OpenRouter! A frontier-class open-weight model that combines a 1M-token context window, frontier c...
关联讨论 7 条X:MiniMax (@MiniMax_AI)MiniMax:Blog(网页)X:Kim (@kimmonismus)HuggingFace Daily Papers(社区热门论文)公众号:MiniMax(稀宇科技)MarkTechPost(RSS)IT之家(RSS)MiniMax-M3 by @MiniMax_AI is now live on Venice. The first open-weight model to deliver frontier coding and agentic perf...
MiniMax M3 will be launching soon You can try it right now in OpenCode For free
在人工智能时代,产品原型设计的速度正迎来显著变化。文章探讨了AI工具如何影响原型制作的流程与效率,讨论了从概念到实现的加速可能性。
该推文指出,当编程智能体被用于处理更复杂的长时间任务时,会产生从用户体验到后台系统的多重挑战。前端表现为各种奇怪问题,后端则存在严重的token浪费、无限循环和智能体间低效交互。作者强调,在这种更复杂的用例下,拥有并控制运行框架变得至关重要,并指出多智能体系统是另一个需要应对的难题。
OpenAI 的 AI 编程工具 Codex 在推特上分享,它为缺少 sudo 权限的电脑系统找到了一种变通方法。该发现获得了 Hacker News 社区的关注,目前有 117 个赞。
v2.1.159 版本更新包含内部基础设施改进,未引入任何面向用户的功能变更。此次更新预计不会影响现有功能或用户接口。
GitHub 2026年学生大礼包全面升级,总价值提升至$3500+。核心福利包括:GitHub Pro永久免费、GitHub Copilot Pro无限使用、Cursor Pro 1年免费、JetBrains全家桶免费,以及DigitalOcean $200和Azure $100等云服务额度。申请门槛极低,13岁以上持有.edu邮箱即可,无项目要求。此外,开源项目维护者还可申请OpenAI提供的6个月免费ChatGPT Pro(价值$1200)。
免费领6个月ChatGPT Pro, 价值$ 1200🤩 这可能是今年对开发者最实在的福利了, 没有硬性Star数要求, 有项目链接基本都能过, 只要你是任何一个公开开源项目的维护者,哪怕只有你一个人在维护, 都可以去申请试试: http...
作者引用David Wilson的观察指出,AI编码工具(如Claude)能将模糊想法在不到一小时内转化为带测试和文档的完整项目,但用户往往因此创建超过16个难以维护的项目。这些工具输入门槛低、反馈即时,却像“热核级ADHD放大器”,导致注意力严重分散和项目废弃。文章质疑这种“廉价奖励”模式的可持续性,认为当前缺乏有效管理方式,关键可能在于培养使用纪律。
thoughtshmmz.org 于2026年5月31日发布的文章《解决办法可能是取消我的AI订阅》,在Hacker News上获得114积分。
Five million users would agree. Resetting the limits tomorrow morning to celebrate. Time to go /fast
推文对比了当前iOS应用发展与Windows Phone时代的开发氛围,认为尽管Vibe Coding让App开发更普及,但作者最欣赏的应用却来自十几年前的Windows Phone平台。文中以“贴纸天气”和“627 AM”为例,强调这些应用的UI与UX设计优雅,令人享受。作者表达了对Windows Phone个人开发者时代的怀念,并表示这也是后来对微软感到失望的原因之一。
We're updating our ChatGPT Pro and Plus subscriptions to better support the growing use of Codex. We're introducing a ne...
版本控制系统 Rsync 的 3.4.3 版本代码库中,包含数百个由 AI 模型 Claude 完成的代码提交。
Anthropic自始至终专注编程,被视为“智能力公司”而非编程公司。其策略基于Claude智能扩展后将应用于所有人类智能领域。相比之下,OpenAI和Google频繁分心开发其他产品(如Sora、图像模型、音乐模型等),OpenAI甚至停用Sora。Anthropic凭借专注在企业计算领域取得领先,而OpenAI正效仿其路线,放弃副项目,聚焦Codex与ChatGPT等核心模型竞争。
Anthropic is not a coding company. It is an intelligence company that chose to focus on coding first. As Claude's intell...
Five million users would agree. Resetting the limits tomorrow morning to celebrate. Time to go /fast
nothing like switching to claude for a few days to try out a new model and going back to codex xhigh to remind you how m...
Codex(由OpenAI发布)提供四个可选模型。其中,gpt-5.5作为质量优先的旗舰模型,适用于复杂编码、推理及知识工作,其定价较高,为输入$5.00、输出$30.00每百万tokens。主推文旨在帮助用户根据任务类型与成本考量进行选择。
http://x.com/i/article/2060676761914888194