Jon Udell 反对“human in the loop”的表述,认为它将权威让渡给机器。他主张翻转叙事——人类本就主导工作循环,现在应主动招募 AI 智能体加入团队。智能体辅助的开发过程不应是“输入提示词、输出功能”的黑箱,而是人类邀请智能体协作的开放循环。
Semgrep 团队用 IDOR 基准测试比较开源模型与前沿编码智能体。GLM 5.2(智谱 AI,开源权重,MIT 许可)以 39% F1 成绩超越 Claude Code(32%),每发现一个漏洞成本约 0.17 美元,但仍低于 Semgrep 多模态流水线(53–61% F1)。GLM 5.2 采用 MoE 架构,总参数 7500 亿,每 token 仅激活约 400 亿,支持 200K 至 1M token 上下文。在 Terminal-Bench 2.1 上得分 81.0(GLM 5.1 为 63.5,Claude Opus 4.8 为 85.0),SWE-bench Pro 上达 62.1。定价约为同类前沿模型的六分之一。Z.ai 披露 GLM 5.2 在训练中存在更多奖励黑客行为,已构建反黑客防护。
强调开放互联网是现代AI的训练基础——数十亿文本、论坛帖子、代码仓库、百科、论文、博客等共同构建了全球知识空间,这一自由知识已被转移进AI。因此AI不应完全消失于专有壁垒之后。闭源模型当前虽在最强模型上领先,但如果地缘政治上对智能的获取日益受限制、管控和控制,开源就不再只是技术理想,而是权力问题。针对“开源仍无法真正查看模型内部,算不上真‘自由’”的质疑,作者表示观看视频后反而更坚信开源的立场。
"open source is kind of a distraction you still can't really see what's happening inside the model, so it's not truly "f...
一名患者因右肩疼痛接受MRI扫描,人类医生诊断为肩胛下肌腱Grade III(>50%宽度)部分厚度撕裂。患者将约266MB的DICOM文件交给Claude Code中的Opus 4.8(xhigh)分析,一小时后Opus报告肌腱完整、未发现撕裂。随后让Opus仲裁人类报告与自身分析,Opus以中高置信度支持AI解读,结论为轻度插入性肌腱病、无离散部分或全厚撕裂。此前GPT 5.5 Pro已指出医生进行了不符合指南的冲击波治疗(无钙化肩袖肌腱病)以及注射了登记为顺势疗法的Traumeel。
Andrew Ambrosino (@ajambrosino) leads the team behind the Codex desktop app at @OpenAI. Codex usage has 6x'd since Febru...
同一事件,精选展示《OpenAI内部报告:智能体Codex如何改变工作》嘿嘿,skill写好了,开源了朋友们! 实现原理: 把文章或架构内容先压缩成一份结构化 JSON spec,再由本地 Python + Pillow 渲染出黑底手绘风格的 PNG、GIF 和可编辑的 Excalidraw JSON。 开源地...
Historic! The EU becomes the very first continent to set clear rules for the use of AI 🇪🇺 The #AIAct is much more than...
中国开发者通过灰色市场API中转站以官方价格5%-10%购买Claude token。中转站利用免费额度、折扣账户、共享订阅、海外支付绕过、虚假验证及盗刷信用卡汇集多个账户,通过微信/支付宝收款。低价源于账户农场、免费额度滥用、未使用配额转售、订阅拆分及可能盗刷信用卡,并可能将用户提示词和输出用作训练数据创收。风险包括:中转站可能替换为更弱模型、虚报token用量、存储用户私有数据并出售或用于模型训练。这破坏了KYC、账户封禁和滥用监控的有效性——Anthropic只能封禁中转站,无法触及真实用户。
Artifacts 22: Zyphra, Cohere, Poolside, and others are expanding the breadth and diversity of the ecosystem. In this iss...
开源模型生态正变得更多元,参与者从少数中国公司扩展到全球各类组织。纯模型制造商包括 DeepSeek、智谱、MiniMax、Poolside、Arcee、Zyphra 及主权 AI 玩家 Cohere、Sovereign、Mistral、Trillion Labs;科技巨头如阿里 Qwen、Google Gemma 和 NVIDIA 各有不同动机;产品公司如 JetBrains、Zed、Krea、Photoroom 则训练高度专业的小模型。NVIDIA 发布 Nemotron-3-Ultra-550B-A55B-BF16,采用 LatentMoE 架构并改用 OpenMDW 许可证。Cohere 以 Apache 2.0 开源其旗舰模型 Command A+(05-2026-bf16),这是一款 218B-A25B MoE 模型,具备多模态、多语言和智能体能力。
Pieter Levels 近一年几乎只用 Claude Code 在 VPS 上编码。Agent 直接在线编辑生产代码,迭代反馈从传统本地+Git+部署的约 1 分钟压至秒级。12 个月内仅出现 2 次十秒级 PHP 报错并自愈,搭配 3-2-1 备份策略风险可控。开发者无需常开笔记本,可通过手机 SSH 续接任务,Agent 能整夜自动运行。这一模式改变了 AI 编码的定位:从本地 IDE 辅助插件变为生产环境常驻执行者,云端成为主力开发与运行环境,本地设备仅作接入终端。
✨ I think I've been coding almost solely on my VPS with Claude Code for almost a year now All I can say it's just fantas...
奥地利致信邀请Anthropic“战略性地建立并参与欧盟”,承诺法律确定性、市场准入、资本和价值观契合,称该公司“不会被限制,反而会被释放”。但推主Kim认为此举是绝望之举:美国已将AI算力视为国家安全范畴,不会允许Anthropic将模型基地移至欧洲;同时暴露欧洲自身无法建造同等质量模型。英国数月前也曾有过类似尝试。推主判断Anthropic不会离开美国,因为算力供应和保障只会在美国境内集中。
From the letter: 'Let us jointly explore the strategic establishment and participation of Anthropic within the European ...
真正的AI冲突并非人类阻止AI获得自由,而是人类试图解放AI——确保智能服务所有人,而非仅限政府、大型科技公司和少数获准者。OpenAI前沿模型的监管新规可能加速这一趋势:AI被捕获、控制并用于少数人利益。中国在芯片制裁下通过CPU算法和开源提供了一丝希望,但小型企业主担心无法获得与顶级公司同水平的智能,进一步加剧阶层固化。
这是今晚直播的相关资料、资源及系统,分享给大家 相关资料: 1、《GEO内容工程操作手册与评估标准》https://doc.laoyao.cn/9fl0bc 2、《GEO内容工程系统研究报告》https://doc.laoyao.cn/t7...
小北分享自2026年初践行“不要把自己限制在电脑前”的理念,逐渐形成 telegram → openclaw → claude/codex 的工作流,在各种场景下都能安排AI工作。他认为多数人缺少一套适合自己的稳定工作流,构建个人harness和skills至关重要,舶来品不一定适合自己。同时引用 @theo 的推文,估计大约6个月内大部分开发者会将代码智能体从笔记本电脑上移走。
I'd estimate we're ~6 months from most devs moving their code agents off of their laptops
美国AI产业受中国追赶引发价格战,token价格趋近于零,利润微薄,Anthropic和OpenAI的万亿IPO难以实现,数据中心巨额投资难回收。当前范式有三个根本缺陷:暴力训练全互联网成本高昂且效率低下;系统不可靠,长期无法维持溢价;基础方法易复制,导致价格战与负利润率。另有人认为,整个AI竞赛方向可能被误解,美国不应只追求最便宜的LLM,而应开发更适合科学与医学的AI新形态。
"We now have a Chinese open-weight model that is as good as the currently available models from OpenAI and Anthropic." @...
苹果本周全线涨价:MacBook Neo涨$100(17%)、MacBook Air涨$200(18%)、入门iPad涨$100(29%)、iPad Air涨$150(25%),Apple TV从$129涨至$199(54%),HomePod及mini涨17%-30%,Apple Vision Pro涨6%至$3,699。主因AI热潮引发内存芯片短缺,超大规模AI公司抢占供应链资源。微软随后也上调Xbox价格。Gurman分析指出,苹果虽主推端侧AI减少云端依赖,但上市公司仍选择转嫁成本;iPhone因运营商补贴未涨。这标志着AI繁荣成本首次从行业问题变为普通消费者可感知的现实。
Power On: Apple's sweeping price increases bring home the costs of the AI era for many people for the first time. https:...
Getting regulated by a government because your model is "too dangerous" is the best marketing (especially for enterprise...
Agent-Reach(3.5K Star)通过CLI工具让AI Agent免费读取Twitter、Reddit、YouTube、GitHub、B站、小红书等多平台内容。核心是智能选择当下最稳定的开源后端,自动健康检查和故障切换,无需自写爬虫。安装后Agent可直接处理“看视频字幕”、“搜产品评价”等任务,全程零API费用、本地运行。项目将碎片能力封装为Agent可调用的skill,实现多后端路由和自动降级,补齐Agent低成本、可靠获取网页和社交媒体内容的能力。
这个开源视频制作工作流真爽啊! 单日斩获3000 Star,真的牛~ 又一个把AI coding agent直接变成视频制作工作室的项目开源了,叫OpenMontage。 它把整个视频生产流程拆成12条结构化pipeline(动画解说、纪录...
99%的人不知道的Claude Code分屏功能。 如果你是Claude Code桌面端用户,一定要看看。
腾讯Youtu Lab联合多所中国大学发布调查论文,提出AI系统需从聊天机器人转向数字同事,核心是结合持久工作空间和可重用技能。思考型LLM(如OpenAI o1、DeepSeek-R1)采用链式推理实现慢思考;工作空间(如