作者体验了KroWork平台的“对话生成软件”功能。他通过自然语言提示Kro代理,要求创建一个新闻仪表盘。该工具更新后可展示其系统逻辑的思维映射过程,并借助Kro Browser Bridge扩展程序实现浏览器实时操作。整个应用生成过程仅耗时约五分钟,全程无需编写代码。关键在于,由于生成结果是编译后的真实本地软件,后续运行不会消耗任何token。
Cursor's new Composer 2.5 takes third on the Artificial Analysis Coding Agent Index and is ~10-60x lower cost than the h...
新发布的Qwen 3.7 Max正被用户通过“递归分形二叉树”生成测试进行评估。该测试要求模型编写HTML代码,模拟树木从生长到摇曳的动画。此前,Gemini 3.5 Flash已用同一测试进行了展示,其生成完整动画耗时77.56秒,效果被评测者认为惊艳。该测试已成为比较不同AI模型代码生成与创意能力的一种常见方式,用户可借此对比各模型的表现。
兄弟们! 今天已经可以在ZenMux上免费体验Gemini 3.5 Flash 了! 我第一时间用它跑了那个经典的「AI模型递归二叉树生长测试」. 同一个 Prompt ,不同模型画出的树形态完全不一样。(见视频-Prompt见评论区) G...
用户宣布从Claude cowork全面转向Claude Code,核心原因是Claude cowork的沙盒权限控制过于严格,难以支持复杂任务。相比之下,Claude Code与Codex提供了更开放的权限,允许更自由的系统级操作,被形容为“脱缰野马”般灵活。
Codex在ChatGPT iOS app上进行快速迭代,推出多项手机端功能更新。核心改进包括实现代码轮次编译完成的实时推送通知,优化断线重连UI以增强网络恢复顺畅性,对话界面设计更紧凑精致并向桌面端应用看齐。新增/fork命令,并大幅优化代码差异对比功能,支持直接打开完整文件查看差异。这些更新聚焦于提升移动端交互效率和视觉体验,体现了Codex在移动场景下的持续优化。
Codex in ChatGPT iOS app got better in latest update! - Receive turn completion push notifications - Better reconnection...
用户将Codex工具指向一个现有产品,仅用30分钟就自动分析并输出了该产品的完整技术蓝图,包括架构、数据模型、带有成本估算的提示词,并生成了一份长达378行的重建计划。更令人惊叹的是,现在可以通过一条明确的指令(“/goal implement...”),让Codex尝试一次性重建出与目标产品功能完全一致的成果,展示了其强大的逆向工程与代码生成能力。
codex is actually insane 🤯 if you thought frontend cloning was impressive, check this out: I just pointed codex at anot...
Alibaba's new Qwen3.7 Max model scores 56.6 on the Artificial Analysis Intelligence Index, 4.8 points higher than Qwen3....
关联讨论 9 条公众号:通义实验室(千问)X:通义千问 / Qwen (@Alibaba_Qwen)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)Qwen:Blog Retrieval(API)Hacker News 热门(buzzing.cc 中文翻译)X:OpenRouter (@OpenRouter)IT之家(RSS)阿里云发布新旗舰模型Qwen3.7 Max,定位为“代理时代”的基础模型,强调其在端到端编码、办公自动化等实际任务中的执行能力。模型在一个内核优化任务中展示了35小时无人干预的自主运行能力,完成了超过1000次工具调用。但这并非模型的全面自我进化,而是针对特定优化目标的迭代改进。更值得关注的是,Qwen声称其代理能力能从多样化的训练环境中泛化,如同语言能力从文本中泛化。这一观点若成立,其意义将远超任何基准测试成绩。
📣Meet Qwen3.7-Max - our latest flagship, made for the Agent Era. A versatile foundation for agents that actually get th...
阿里云发布了通义千问系列的新旗舰模型Qwen3.7-Max,定位为面向智能体时代的通用基础模型。该模型旨在为“能真正完成任务”的智能体提供强大支撑,其核心能力包括:支持端到端的复杂编码任务,可作为集成多智能体协作的办公助手,并能执行超过35小时的长期自主任务。该模型具有框架无关的兼容性,可适配Claude Code、OpenClaw等多种工具链。目前,用户已可通过Model Studio平台调用其API。
关联讨论 9 条公众号:通义实验室(千问)X:通义千问 / Qwen (@Alibaba_Qwen)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)Qwen:Blog Retrieval(API)Hacker News 热门(buzzing.cc 中文翻译)X:OpenRouter (@OpenRouter)IT之家(RSS)Alibaba's new Qwen3.7 Max model scores 56.6 on the Artificial Analysis Intelligence Index, 4.8 points higher than Qwen3....
关联讨论 9 条公众号:通义实验室(千问)X:通义千问 / Qwen (@Alibaba_Qwen)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)Qwen:Blog Retrieval(API)Hacker News 热门(buzzing.cc 中文翻译)X:OpenRouter (@OpenRouter)IT之家(RSS)Qwen3.7-Max is live! 🚀 Introducing the latest proprietary model, built for advanced agentic coding, complex reasoning, ...
阿里云发布闭源旗舰模型Qwen3.7 Max,在Artificial Analysis智能指数上获得56.6分,较前代Qwen3.6 Max Preview提升4.8分,与国际前沿模型的差距有所缩小。其进步主要体现在科学推理、智能体及编码能力上。值得注意的是,本次评分提升很大程度上源于模型在“AA-Omniscience”基准上主动选择“不回答”的次数增多,从而将幻觉率从44.2%显著降至22.9%。此外,该模型的上下文窗口已扩大至100万token,但仍延续了Max系列的闭源策略。
http://x.com/i/article/2057247064115838976
该推文解析了AI时代的“T型开发者”能力模型。模型核心包含三个维度:顶层,生成式AI应用成为所有开发者必须掌握的通用基础能力;纵向,借助AI进一步深化核心软件工程的专业技能;横向,借助AI更高效地拓展至相邻工程领域及产品思维、沟通等非工程技能。此模型旨在帮助开发者构建兼具专业深度与跨界广度的知识结构。观点指出,该T型能力框架不仅适用于开发者,也适用于所有职业。
Great slide from the "How to thrive as an AI-era developer" session at Google I/O today I think this T-shape will apply ...
Cursor发布了其编程智能体模型Composer 2.5,在Artificial Analysis编程智能体指数中排名第三,仅次于Claude Opus 4.7和GPT-5.5。该模型的核心优势在于极高的性价比:其标准版任务成本仅为0.07美元,比顶级竞品便宜约60倍。性能方面,它在SWE-Bench-Pro-Hard-AA等基准测试上较前代有显著提升。模型基于月之暗面的Kimi K2.5开源权重进行训练,目前仅限在Cursor产品内使用,未提供独立API。
xAI为Grok Build推送的更新看似平淡,无炫酷新功能,但专注于修复致命的“后台子代理静默失败”、支持更多平台及中文字符路径等基础问题。这体现了其工程优先策略,在竞争对手比拼模型参数与演示时,xAI默默填补那些会导致生产环境崩溃、劝退用户的“隐形坑”。这一系列底层优化与漏洞修复,正悄然构筑其编码Agent的长期护城河。
Bug fixes shipping to Grok Build (release notes will be available in the TUI) - macOS x86_64 (Intel) support - Windows A...
Alex Finn 提出的远程开发架构核心在于将“执行代码的主机”与“发送指令的终端”分离。一台主力机(如Mac Studio)常开,作为唯一执行环境,集中所有代码与依赖;其他设备(如iPad、iPhone)仅作为“遥控器”发送指令。通过Codex的远程控制功能与Tailscale私有网络连接,开发者可在任何地点、任何设备无缝推进同一项目,实现开发能力与物理位置的解耦,从而提升灵活性和效率。
You need to set up this Codex system I have Been taking advantage of their new remote features and my productivity has 1...
Bug fixes shipping to Grok Build (release notes will be available in the TUI) - macOS x86_64 (Intel) support - Windows A...
Codex已从单纯的代码生成工具,进化为能处理各类电脑任务的“全能打工人”。其核心在于利用持久对话流实现长期记忆,并能调用浏览器、电脑操控等工具,打破工作流限制。通过自动化与目标设定,Codex可离线持续工作,大幅提升生产力。
本文将AI辅助编程类比为新的编译器范式:提示词(Prompt)是源代码,程序代码是中间表示(IR),大模型则充当编译器。这一认知框架试图缓解程序员在效率与控制感之间的焦虑,同时也反映了传统开发习惯与新兴工作方式之间的摩擦与碰撞。
我至今还是无法接受不看 AI 写的代码,大到代码的架构,小到模块化的设计、写的 SQL、甚至是 Key 的设计,我都要自己把握才能心安。这就导致我效率上不去,从来没用完过五小时/周限额,是不是已经算是老派程序员了。
作者通过亲身经历指出,AI正在成为像水电煤一样的基础服务,变得简单、普遍且不可或缺。一位70岁阿姨用ColaOS为公益组织轻松搭建了受欢迎的网站,而歌手胡彦斌也通过AI进行vibe coding开发了自己的应用。这些例子共同印证了作者的观点:AI的核心价值是放大人类意志,让技术门槛消失,使其融入各行各业与不同年龄层的日常创造力中,开启一个生产力普遍增强的时代。
Where could we improve Composer 2.5? We're working on the next model and would love your feedback. Lots of work to do (o...
Last weeks London Codex Meetup was star studded with epic builders ⭐️ 45 mins hacking and 4 top demos walked away with 1...
We just shipped a major design update to Base44 - built to help you make something that's truly yours. Collaborate on a ...
Kimi 2.6能够一键生成获奖级别的网站,全程无需代码。配套的详细视频教程时长近10分钟,可指导用户快速上手,在极短的时间内产出可用于销售的成品网站,大幅降低了利用AI进行独立开发与变现的门槛。
Kimi做网站设计这么牛逼吗? 这个视频分享了怎么用Kimi 2.6做获奖10美元的网站, 教程讲的特别细, 需要字幕学习的可以评论区留言告诉我!
🚀 We're hiring! DeepSeek is forming a new Harness team to build Code Harness from the ground up-may be you can call it ...
推荐QodoAI出品的播客《Agentic Review》,该节目以平衡的视角探讨AI代码生成的真实场景。通过主持人与Dexter Horthy、Scott Hanselman等嘉宾的深度对话,节目强调了上下文工程作为关键技术壁垒的重要性,并指出AI无法弥补破碎的开发流程,反而更凸显了代码审查与工程技艺的持续价值。核心观点认为,尽管编码方式可能变革,但软件开发生命周期的本质与严谨性将更加重要。节目避免了过度炒作或悲观论调,为AI工程师提供了有价值的实践参考。
ai studio mobile: build your ideas, wherever you are coming soon to an app store near you http://ai.studio/mobile
Larry Ellison says AI is now writing Oracle's Code. "We just tell the model what we want the program to do, and then the...