风投机构SignalFire追踪8000万家公司数百万员工数据发现,工程是2025年最具韧性的岗位。大型科技公司总招聘较2019年下降25%,工程岗仅降11%;工程岗占Alphabet、Meta等12家“Tech Majors”新招员工的55%(2019年为46%)。早期初创公司2025年工程师招聘比2019年增长7%。Anthropic CEO警告AI可能消灭一半入门级白领,但该公司经济主管称尚未看到显著影响。NVIDIA CEO黄仁勋表示AI让工程师更忙碌,是杰文斯悖论的典型例证。
风投机构SignalFire追踪8000万家公司数百万员工数据发现,工程是2025年最具韧性的岗位。大型科技公司总招聘较2019年下降25%,工程岗仅降11%;工程岗占Alphabet、Meta等12家“Tech Majors”新招员工的55%(2019年为46%)。早期初创公司2025年工程师招聘比2019年增长7%。Anthropic CEO警告AI可能消灭一半入门级白领,但该公司经济主管称尚未看到显著影响。NVIDIA CEO黄仁勋表示AI让工程师更忙碌,是杰文斯悖论的典型例证。
AI 行业商业化的核心是“2boss”——付费方不是使用者(程序员、抽卡员),而是他们的老板。以 Claude/Codex 和 Seedance 为例,老板愿为提升效率的工具付费。中国 2B 市场进入“2boss”时刻,老板买单意愿强烈;独立开发者等自费者也扮演自己的老板。
Notion 通过 Cursor SDK 在数周内将编码智能体嵌入产品。用户可在文档中@Cursor、在讨论串中提及或向数据库指派任务,Cursor 即可端到端完成规划、构建、测试、验证并自动创建 PR。集成基于一套 Provider 无关的智能体框架,Notion 的讨论串对应一个 Cursor 智能体,每条消息对应一次智能体运行;结果通过 SSE 流式传输,支持断连恢复。Cursor SDK 提供与生产环境相同的模型、运行时和远程 MCP 支持,让 Notion 无需自建智能体基础设施即可获得完整栈编码能力。用户还可自定义模板、MCP 服务器、技能和子智能体,并设置自动触发规则。
How can we train small agentic models that are highly capable of terminal use and coding? Announcing OpenThoughts-Agent ...
Snowflake 内部基准测试显示,在每项任务三次尝试下,GLM-5.2 解决 66% 的编程问题,Anthropic 的 Opus 4.7 解决 67%,两者几乎持平。首次尝试准确率 Opus 为 53.7%,GLM 为 47.6%;GLM 每任务平均迭代 99 次、消耗 8.6 亿 token,Opus 则为 80 次、4.39 亿 token。成本方面,GLM-5.2 输出 token 价格为 $4.40/百万,远低于 Opus 的 $25 和 GPT-5.5 的 $30;输入 token 仅 $1.40/百万。GLM 存在过早放弃和过度检查等弱点,但其定价优势可能对西方 AI 公司的高估值构成压力。
Matt Pocock 推出 /loop-me 技能,旨在帮你梳理日常工作中的重复“循环”。它采用“严苛面试法”逐一追问直到模糊点消除,最终输出清晰的 workflows/.md 规范文件,任何实施者(人类或AI)看完即可执行。核心包括定义 Trigger、Checkpoint、输出等要素,确保达到“完成的定义”。技能目前仍处于进行中状态,但已可直接使用。它强调先打磨工作流程,使之能被 AI 精确理解,从而降低认知负荷,将重复劳动真正委托出去。
New in-progress skill: /loop-me Interviews you about your work and finds opportunities for delegating your day-to-day wo...
Figma在Config 2026将设计画布扩展至代码、动画、3D深度和着色器效果,并集成去年收购的Weave工作流系统。新功能包括Code Layers(代码与设计并存)、Motion动画、深度层、Shader及Generative Plugins。协作方面,团队可搜索复用AI提示词、保存工作流为技能、共享插件。Figma的AI功能依赖Anthropic、OpenAI和Google等外部模型,推理成本挤压利润率。同时,Anthropic等公司的竞争产品可直接生成界面,构成威胁。
Figma在年度Config大会上发布多项设计及编码更新。核心亮点:Code layers允许在设计画布内直接操作代码、克隆仓库并通过Agent生成新方向;Motion功能支持通过提示词生成动画和过渡效果,可应用预设样式或手动调整时间线;Shaders借助WebGPU实现抖动、像素化、多种模糊等着色器效果。Figma Weave工作流集成20余种工具,将复杂AI流程简化为画布上的简易操作。此外,Agent技能支持第三方连接器和文件附件上下文,生成式插件允许无代码创建可共享的自定义工具。
Figma本周三发布更新,直接在协作画布中加入代码层,支持团队克隆仓库并将代码流程提取为设计图层。新增对动画、转场和3D变换的支持,并允许用AI生成着色器效果和填充。用户可通过文本提示创建可重复使用的技能供AI智能体使用,还能连接Notion、Granola、Excel、GitHub等工具。Figma计划今年晚些时候深度整合去年收购的节点工具Weavy,支持直接在Figma内生成Weavy工作流。
RubyLLM 是一个统一的 Ruby 框架,以相同接口对接 OpenAI、xAI、Anthropic、Gemini、DeepSeek、Mistral、Ollama 等十余家 AI 提供商的 API。支持聊天、图像/视频/音频分析、PDF/CSV/JSON 文档处理、图像生成、嵌入向量、内容审核、工具调用与 Agent 定义,并提供结构化输出(JSON Schema)和流式响应。仅依赖 Faraday、Zeitwerk 和 Marcel 三个库。内置 800+ 模型注册表,包含能力检测与定价信息。可与 Rails 集成(acts_as_chat),支持异步 Fiber 并发。
Genspark 推出 Genspark Design,由 Claude Opus 4.7 驱动。用户可将粗糙提示词转化为可编辑的 UI 原型、海报、视频、HTML 动画和工作代码。设计作为可复用系统,支持保存 Logo、颜色、字体、间距和组件并跨资产应用。核心是分层输出:文本、图像、背景、组件保持分离,用户可直接修改设计本身,无需要求模型重新生成。支持上传 Figma 文件或保存设计,一键生成可交付代码(基于 Genspark Code),无需设计背景即可使用。
🎨 Introducing Genspark Design The next-gen AI for design and creation, powered by Claude Opus 4.7. From rough idea to p...
ACL 2026发表的EverOS推出HyperMem超图记忆架构,替代传统向量RAG。长期对话召回率达93%(RAG约45%)。27B参数模型借助记忆与Skills自进化策略,任务成功率提升234.8%,性能追平397B模型。本地优先,记忆存为Markdown文件,支持Git版本控制与Obsidian。三行命令安装,Apache 2.0开源,GitHub获7200星,兼容Claude Code、Codex等Agent框架。
字节火山引擎大会上,洪定坤分享了AI开发的三个核心方法论:1. 原型驱动开发——用AI生成可交互原型替代PRD,提前暴露分歧。2. AI Development系统化——AI写Spec→功能实现→Browser Use验证→自动提交上线。3. Harness基建——上下文工程、架构约束、团队知识Memory、技术债梳理,能将可交付性从40~60分提升至80分。
OpenAI 正紧急修复 Codex CLI 日志过量写入缺陷。开发者 Rui Fan 报告称,其机器运行约 21 天后主 SSD 写入约 37TB SQLite 日志,推算每年约 640TB;对于 1TB、额定 600TBW 的消费级 SSD,不到一年可能耗尽质保写入耐久度。另一开发者引用 Codex 自估,该缺陷在 3 月至 6 月可能造成全体用户低位数百万美元 SSD 写入耐久度损失。问题源于 2026 年 2 月将服务器 SQLite 日志输出级别改为 TRACE,且本地诊断日志默认开启。OpenAI 确认工程师正在修复,部分修复已实装,但用户仍持续报告。
在火山引擎Force大会,字节跳动技术副总裁洪定坤分享AI Coding实践。过去一年,字节AI代码贡献率增长6倍,tokens消耗增长5倍,但过度关注单一指标可能失真——TRAE团队代码超90%由AI生成,人均需求吞吐率仅提升60%。900次实验显示,主流Coding模型组合代码正确率超80%,但可交付性仅40-60分;结合Harness基建后提升至80分。AI降低编程门槛但需优化指标、治理、协作。字节探索原型驱动开发,能力沉淀至TRAE(日均Token消耗5.6万亿,增长50倍),并推出TRAE Work。
OpenAI 部署负责人 Arnaud Fournier 在采访中透露,DeployCo 团队正通过派驻自家工程师将 AI 深度嵌入大型企业。他称 Codex 正经历爆发式增长,客户反馈已直接回传至模型开发环节,并指出 AI 智能价格已大幅下降。
邵猛分享其 AI 编程工具 Zcode 开始使用 GLM-5.2 模型,第一天体验感受:速度快、好用。但对比另一工具 Codex,Zcode 在能力全面性上仍有差距,尤其缺少 Computer Use 功能。最后感谢 @SeTriones 提供 GLM API Key。
Cola 刚刚上线了最新的 Seed 2.1 Pro 原生多模态模型,号称目前多模态最强模型。相比 2.0 版本,该模型显著增强了 coding 和 Agent 能力。具体评测细节可参考藏师傅的文章。体验地址:colaos.ai。
http://x.com/i/article/2069421203073490944
Anthropic 推出 Claude Tag,允许团队在 Slack 任意频道中通过 @Claude 标记并分配任务。该公司表示,其内部产品团队已有 65% 的代码由该工具生成。
生成式AI已重塑软件开发,从逐行自动补全扩展到全应用生成、多智能体构建管道和自然语言代码库交互。文章对比了16个最佳工具:Atoms*支持自然语言生成可部署应用并并行运行多模型;GitHub Copilot提供IDE内智能补全与代理模式;Tabnine主打本地化私密代码补全;Replit为云端IDE与AI代理;Warp增强终端AI;Hugging Face提供开源模型平台;Codacy自动化代码质量分析;Metabob基于图神经网络检测深层缺陷;aiXcoder可本地运行开源代码模型;Bloop将代码搜索转向AI智能体基础设施;Mintlify等覆盖IDE插件、云部署到代码质量管理多种场景。
邵猛使用 TRAE Work 测试了字节跳动最新发布的豆包2.1 Pro 模型。官方称豆包2.1 系列在 Coding 和 Agent 能力上显著提升,VLM 能力保持领先,综合能力介于 Claude Opus 4.6 和 4.8 之间。实测中,模型先思考整体规划与实现过程,再读取设计图理解场景和细节,调用最合理的 Skill 规划网页逻辑,分步骤实现后通过本地预览和视觉验证确保效果。最终输出在视觉还原、交互和技术实现上非常细致,包括布局、字体选择、自适应布局,甚至为每个部分配上具有实际意义的图片而非占位符。
I almost stopped testing new models altogether. Not because they were bad. Because every call left a number climbing in ...
贝恩在测试收购目标时,使用vibecoding(AI快速原型开发)重建目标软件的粗略AI副本。这些副本并非完美克隆,但能暴露产品界面、分析、自动化或工作流逻辑是否容易被复制,帮助评估公司的竞争护盾。贝恩已构建数百个原型,该工具已从专业工程师扩展到普通顾问。案例:销售数据分析工具,AI可快速生成类似仪表盘和推荐。该方法揭示软件价值实际所在(代码、工作流、客户关系、数据等),也让买家预见AI如何重塑产品未来。此举正值生成式AI降低软件开发成本、挑战SaaS商业模式。
为解决多 Agent 下 Skills 存放混乱问题,宝玉提出:Skills 只装在项目内以节省 LLM 上下文窗口;所有原件统一存放于 ~/GitHub,每个项目通过软链接指向原件,再为 Claude Code 创建 .claude/skills → .agents/skills 入口。更新只需拉取一次源码,所有项目自动同步;修复 bug 可直接反哺开源项目。用户可用自然语言让 Agent 自动创建软链接,无需记忆命令。
我快疯了。日常同时用 4个 coding agent,skills 各写各的: /.agents/skills、/.codex/skills、~/.claude/skills 已经一团浆糊,CC 里找不到 Codex 的 skill,反过来...
OpenAI 发布 Codex Remote 工程实践官方博客。核心心智模型:手机是“控制面”而非终端——开发机跑代码,手机负责启动、指挥、审批、审查。十大高杠杆能力包括 Queue vs Steer、Side Chat、Plan vs Goal、对话内 Code Review、细粒度权限管理等。另有 /status /compact /fork 命令与五个典型工作流(Release Captain、中断修复、移动端审查等)。对 AI coding agent 的启示:异步协作、注意力与状态机管理、目标约束、生产级权限粒度。
If you missed last week, Mastering Codex Remote for Engineering is now available as a blog post on our developer platfor...
Anthropic 为 Claude Tag 推出智能体身份模型,Claude 在团队频道拥有独立账号,权限按频道配置可覆写,撤销身份即可终止访问。AI 编码代价方面,Meta 一次 AI 生成代码(无人工验证)导致 Instagram 密码重置漏洞,CISO 离职;Amazon 核心平台中断;GitHub 因负载增长三倍不稳定。腾讯云开发者介绍 Harness 工程:同一 LLM 换装更精巧外架构后,TerminalBench 2.0 通过率从 52.8% 升至 66.5%,排名从 30 名外进入前 5。
Anthropic 为 Claude Tag 推出智能体身份访问模型,赋予 AI 独立账号体系。Meta 因 AI 生成代码未经人工复核导致 Instagram 漏洞
http://x.com/i/article/2069568375752445952
随着基础模型推理能力与工程框架增强,生成长代码方案已不困难,可靠验证反成瓶颈。验证器仅为人类意图的代理,意图天然欠指定,优化会拉大代理与意图差距(奖励破解或信号饱和)。论文沿可扩展性、忠实性、鲁棒性三维度刻画验证信号质量,研究测试验证器、评分标准验证器、用户验证器及自动化智能体验证器四种构造。实验表明针对性设计能抑制奖励破解、提升任务质量。核心结论:无固定奖励函数能随策略能力增长保持有效,验证必须与生成协同进化。
GLM-5.2 近期火爆出圈,尤其海外用户兴奋,国内用户则因抢不到 coding plan 而不爽。Flowith 的 Matrix 产品已接入智谱 GLM-5.2,提供 1M 上下文窗口,适用于 long-horizon coding、产品构建和复杂多步执行。Matrix 作为 agentic workspace,用户可直接在其中构建产品、部门、工作流甚至整个 agent 公司。所有 Matrix beta 用户可领取 1000 万免费 tokens(限时),这标志着强模型与执行环境的进一步融合,个人或小团队的能力边界被推远。
matrix @matrix_build is partnering with @Zai_org to bring glm-5.2 directly into the hands of anyone who creates real com...
Lineup for Inside The AI Coding Stack (7/1): @nvidia - Harry Kim on GPU infra for AI-native workloads @FriendliAI - Gon ...
Claude Code v2.1.187 新增 sandbox.credentials 设置,可阻止沙箱化命令读取凭证和秘密环境变量;模型选择器及相关参数现已支持组织配置的模型限制,选中受限模型时显示“受组织设置限制”提示。全屏模式下选择菜单支持鼠标点击。修复多项问题:--resume 在 -p 无模型回合时失败、--json-schema 和工作流智能体结构化输出循环、远程 MCP 工具调用 5 分钟无响应后阻塞、Remote 会话启动延迟约 2.7 秒、韩文/中日韩文本粘贴乱码、子智能体深度追踪不准确、被杀智能体工作树注册残留未清理等。
Run Cline on Local AI models with Atomic Chat! @cline is a coding agent trusted by 8M+ developers. Write, refactor, ship...
http://transitions.dev 这个网站的动画过渡效果很不错👍 还可以安装技能,这样 Agent 可以自己为你的网页添加炫酷的动画 npx skills add jakubantalik/transitions.dev
Added new transitions to http://transitions.dev There are now 21 transitions you can copy as CSS or React code or use as...
Anthropic 将 Claude Code 嵌入 Slack,推出 Claude Tag。AI 以团队成员身份加入频道,具备频道专属记忆、主动监控、独立跑代码并提 PR,任务完成自动标记 ✅。内部产品团队 65% 新增代码由 Claude Code 产出。三层架构:独立身份+频道隔离记忆(不同项目上下文不混淆,沙箱任务结束销毁);主动自主执行(设置规则后全天盯频道、答疑、汇总);原生 Claude Code 代码能力(拉取仓库、调试、测试、提 PR),多层安全防护。支持知识库检索、新人答疑、代码迭代、故障排查等。仅 Enterprise 与 Team 付费计划开放 Beta。建议低风险频道测试并人工复核。
Introducing Claude Tag, a new way for teams to work with Claude. In Slack, Claude joins as a team member with access to ...