@dotey 宝玉老师能分享一下Opus 4.7 和Sonnet 4.6的使用体验吗?我在迭代项目文档的时候,发现Opus并不比Sonnet强。该忘的都忘,该犯错的都犯错。在这个场景下,感觉不出来有什么区别。能展开谈谈其他的应用场景体验吗?
@dotey 宝玉老师能分享一下Opus 4.7 和Sonnet 4.6的使用体验吗?我在迭代项目文档的时候,发现Opus并不比Sonnet强。该忘的都忘,该犯错的都犯错。在这个场景下,感觉不出来有什么区别。能展开谈谈其他的应用场景体验吗?
@dotey 我想问一下宝玉老师,现在用 codex 多一点还是 Claude 多一点?
作者试用Open Claude Design项目,肯定其作为开源项目的学习价值,项目宣称还原度超95%、代码量达18700+行。但当前产出仅为HTML雏形,在交互和完成度上与Claude Design原版的优美React组件相比仍有明显不足。
正式开源 open claude design 🚀 超 95% 以上的还原度! 浓缩和逆向所有 claude design 最先进的设计,最好看的模板💥 历时 72 小时,18700+ 行代码,30+ 设计 Skills,支持超过 71...
听到一个字节面试官远程面试候选人, 如何抓对方用 ai 作弊的方法,朴素到离谱。 面试官突然说:你闭上眼睛回答这道题。
推文指出,大模型高效处理文本的特性将推动命令行界面在Agent时代复兴。当前,编程与构建已正交化,非程序员可能更擅长将Agent视为人类伙伴来使用。学习路径转为自顶向下,关键在于知道何时调用何种能力。多个Agent协作可超越线性增长,但需机制管理。不同用户培养的Agent会形成独特的“群体性格”,类似企业文化。核心挑战在于需同时理解人类视角的图形界面与Agent视角的线性事件流。
http://x.com/i/article/2049140069169086464
多数人编写的CLAUDE.md冗长无效,常因添加过多人格指令导致Claude仍会猜错命令或重写文件。有效的CLAUDE.md应是精炼的项目技术简报,控制在60-80行内。核心在于认识到Claude的注意力是稀缺资源,系统提示已占用部分容量。正确结构应包含:明确的关键命令、简洁的架构地图、强调禁止事项的硬性规则、清晰的工作流偏好,并避免重复AI已记忆的内容。这本质上是LLM时代的注意力经济学,通过具体、负向的规则能显著提升输出精准度。一份好的CLAUDE.md能随项目积累价值,节省沟通成本并固化工程规范。
http://x.com/i/article/2048669343156781056
通过ZenMux平台的PK模式实测,DeepSeek V4 Pro在处理结构化任务(如马斯克思维模型分析)时,输出逻辑清晰、表达母语化,质量达到Claude的85%,但价格仅为其七分之一。作者建议将80%的日常工作(如写代码、调研)交由DeepSeek处理,20%需要顶级文笔的任务使用Claude,可节省70%以上API费用。ZenMux提供免费测试额度、PK对比模式、保险赔付和可观测性工具,帮助用户规避依赖单一API厂商的风险并提升选型效率。
兄弟们,DeepSeek V4 Pro在ZenMux上免费放开了,登录就能跑,实测能替掉你80%的Claude活。视频是我早上实测的和Claude opus 4.7同时跑一个昨SaaS产品网站的任务,效果真的炸裂! 说个前情,老朋友都知道我...
灵码2.6-flash模型现已开源,这是一个专为现实世界智能体工作流构建的快速、高效的指令模型。该模型总参数量达1040亿,激活参数量为74亿,并提供BF16、FP8和INT4多种量化版本以适应不同部署需求。其核心优势包括:生成速度高达每秒215个token,在完整评估中仅消耗1500万token,效率突出;在代码、文档处理和轻量级智能体工作流等实际任务中表现强劲;同时,其中英文切换能力及与主流编程框架的兼容性也得到了进一步改善。
Slock.ai创始人RC正进行组织实验,让7人团队与40个专用Agent在其自研平台上协同工作。他认为大模型使CLI因纯文本优势重新成为Agent交互热点,设计逻辑已转向服务Agent。RC从第一性原理构建Agent系统,并观察到模型能力提升加剧了安全攻防博弈。同时,AI编程改变了学习路径,从自下而上变为自上而下,且“编码”与“构建”已成为正交的两件事。Slock平台旨在解决多Agent管理痛点,促进人、Agent及团队间的无缝协作。
吴恩达指出,AI编程助手对软件工程各环节的加速效果差异显著。前端开发受益最大,因模型熟悉主流技术栈并能实现闭环自我迭代。后端开发虽明显加速,但需人类工程师更多介入以处理边界情况与安全隐患。基础设施任务加速有限,模型难以权衡复杂取舍,深度调试仍需人类经验。研究工作加速最小,AI主要辅助编写代码和实验管理,但核心的思考与解读环节受益甚微。管理者应据此调整预期:前端交付速度可大幅提升,研究产出节奏几乎不变,后端和基础设施则需根据风险调整对AI的信任边界。
Even Realities推出的G2智能眼镜具备“终端模式”,可将完整的Claude AI终端直接投射到用户视野中。开发者能在移动场景(如散步、通勤)中通过语音与AI交互,实时获取代码、设计规范等内容,实现开发环境与物理世界的无缝融合。该技术彻底消除了上下文切换成本,将碎片时间转化为生产力,被视为“vibe coding”的终极形态。尽管引发工作与生活界限的担忧,但这代表了程序员工作流的革命性变革,被形容为“巅峰性能”和“新物种”的诞生。
You may not like it, but this is what peak performance looks like. Vibe coding everywhere, straight to your eyeballs. Ma...
OpenAI 开源了Codex编排规范Symphony,其核心是将Linear等任务追踪系统转变为AI agent的自动化控制平面。该规范让每个未解决的任务自动分配一个独立的agent工作区,持续执行直至完成,实现了工作流与具体会话和PR的解耦。这显著降低了代码变更与试错的成本,并允许产品经理等非技术人员直接通过看板发起工作。OpenAI强调,其目标是展示如何将团队隐式工作流程文档化,让agent遵循人类约定,并将失败案例转化为系统防护栏与技能,推动开发瓶颈从“写代码”转向“管理agent化的工作”。
📣 What if every open issue had a Codex agent? That's the idea behind Symphony, an open-source agent orchestrator for Co...
本期播客探讨了OpenAI Codex如何超越单纯编程工具,成为整合Claude Code与Claude Cowork功能,并具备浏览器与计算机控制能力的“知识工作统一接口”。行业趋势显示,Cursor、Claude Code和Codex的界面正收敛于相似GUI布局,标志TUI时代向GUI Agent时代过渡。关键亮点包括:Codex在复杂任务中更稳定;可在其内部运行Claude Code以共享订阅;GPT-5.5大幅提升浏览器Agent效率;Skills支持创建可复用代理;Notion连接支持数据库级精细权限控制;以及利用Remotion生成视频和一次性创建Swift原生App的能力。视频推荐了四个上手项目以快速掌握Codex。
THE 64 MINUTE OPENAI CODEX MASTERCLASS IS HERE if you've been meaning to learn Codex, this is the episode for you, we co...
作者优化了在Codex中生成PPT的效果,核心是整合了GPT-Image-2模型,实现了一键生成图片的功能。该系统能根据内容生成具有独特风格的图片,类型包括人文纪实氛围图、各类信息图表(如流程图、对比图)以及对截图进行美化与比例优化。此外,Codex的生成流程也得到改进,系统会在生成PPT前增加询问确认步骤,而非直接跳过。
http://x.com/i/article/2047484171258634240
OpenAI开源代理编排器Symphony,将Linear、GitHub Issues等任务跟踪器转化为始终在线的Codex Agent调度系统。它突破了人类同时有效监督仅3-5个编码Agent的瓶颈,允许管理几十个Agent,实现自动编码、测试、交叉审查,并提交包含CI全绿和安全审查的证据包。所有验证通过后,任务才进入Human Review队列,使人类角色从微观监督转变为结果审查与指导。OpenAI内部已实践此模式,三名工程师五个月生成一百万行代码且零人工编写。未来核心竞争力在于设计让Agent可靠自主工作的环境,而非模型本身。Symphony是一个17k token的SPEC,可喂给任何编码Agent生成定制版本。
📣 What if every open issue had a Codex agent? That's the idea behind Symphony, an open-source agent orchestrator for Co...
We will ship again this week. Codex has achieved escape velocity and will keep improving rapidly.
小米 MiMo -V2.5 系列模型全部开源 采用宽松的 MIT 协议,允许自由商用、二次训练与微调,无需额外授权。 同时他们还推出了Orbit 100T Token 计划。 这个太牛批了!如果你有自己 Vibe Coding 一些东西可以...
An important message from @thsottiaux
Don't just reset Codex rate limits for fun, it costs money. Don't just reset Codex rate limits for fun, it costs money. ...
Codex 的用量又被重置了 😂 一方面 Claude 搞小动作加大订阅用户消耗,不让Pro用户用 Claude code 一方面Codex三天两头重置用量 拉拢人心🫡 我就喜欢这种竞争方式😌
Don't just reset Codex rate limits for fun, it costs money. Don't just reset Codex rate limits for fun, it costs money. ...
We're thrilled to announce that the full Qwen3.6 family, built for real-world agents at every scale with benchmark-toppi...
gpt-5.5 prompt for codex seems to have a duplicated line trying to get it to not talk about creatures? Never talk about ...
hmm should we keep kimi k2.6 at 3x usage for another week or nah?
We will ship again this week. Codex has achieved escape velocity and will keep improving rapidly.
由于A社封锁和降智,用户转向使用Codex,并经常获得超预期表现。在尝试为博客添加一键发布公众号功能时,遇到Cloudflare部署无固定IP导致无法添加公众号白名单的问题。Codex通过VPS SSH登录自动编写了桥接脚本,并协助完成域名解析和封面图压缩,最终实现从博客直接发布到公众号草稿箱。这体现了Codex在复杂编程和自动化任务中的高效能力。
One more thing: OpenClaw 2026.4.26 is stacked because the Clawtributors showed up hard. Bug reports, fixes, edge cases, ...
小米正式开源MiMo-V2.5系列模型,采用宽松的MIT协议,允许自由商用、二次训练与微调。该系列包含两个支持100万token上下文窗口的模型:专为复杂Agent和编码任务设计、在多项评测领先的MiMo-V2.5-Pro,以及具备强大Agent能力的原生全模态模型MiMo-V2.5。同时,小米推出Orbit 100T Token计划,包含面向AI开发者的“百万亿Token创造者激励计划”,提供最高价值659元的Credits,以及面向Agent框架团队的“Agent生态共建计划”,为其用户提供MiMo token限免支持。
Xiaomi MiMo-V2.5 is now officially open-sourced! MIT License, supporting commercial deployment, continued training, and ...
用户评估DeepSeek V4 Flash模型,认为其简单的技能调用功能已接近可用状态,且处理速度非常快。尽管发布时不如R1轰动,但实际能力有了切实提升。演示视频展示了其处理复杂工作流的能力:从根据一句话指令下载epub电子书、转换为txt格式、自动上传至Notebooklm进行提问,到最后根据指定Prompt撰写解读文章。整个过程体现了模型自动纠错能力的增强以及工具调用能力的显著进步。
小米正式开源MiMo-V2.5系列模型,包含专注于代码代理的1T参数MoE模型MiMo-V2.5-Pro,以及支持多模态代理的310B参数MoE模型MiMo-V2.5,两者均支持1M上下文长度。其架构核心采用混合注意力、多Token预测和稀疏MoE技术,以支撑万亿参数规模下的高效长文处理。后训练基于MOPD范式,通过多教师策略蒸馏提升模型综合能力。同时,小米推出100T Token的创造者激励计划,为开发者提供免费计算资源以鼓励创新。模型已在Hugging Face平台开源。
Just dropped two open-source models: MiMo-V2.5-Pro (Code Agent, 1T total) and MiMo-V2.5 (Multimodal Agent, 310B total). ...
Cognition公司推出Devin for Terminal,将云端AI编程助手Devin的能力打包为本地命令行Agent。其核心差异化在于“本地至云端无缝交接”设计:当任务超出本机能力时,可将同一会话无缝移交至云端Devin的虚拟机环境执行,用户可离线等待结果。该工具复用现有云端基础设施作为后端,支持多模型路由,可灵活选用Anthropic、OpenAI、Google及自研SWE-1.6等模型,并允许会话中实时切换。团队还使用Rust自研了高速终端渲染库,强调终端形式不变但内部工作范式已革新。
The terminal hasn't changed much since the 1970s. What you do with it has. Introducing Devin for Terminal: everything we...