GitHub 宣布从6月1日起更新 Copilot 个人计划阵容,基于用户反馈进行调整。主要变化包括在现有 Pro 和 Pro+ 计划中引入弹性配额机制,允许用户更灵活地分配使用量;同时新增 Max 计划,扩展高级选项。此次更新旨在提升计划的可定制性,为开发者提供更个性化的编程辅助服务,优化整体使用体验。
http://x.com/i/article/2031521021342388224
一位 GitHub 员工利用 GitHub Copilot CLI 开发了一款扩展程序,能够将任何代码库转换成一个独特的 Roguelike 风格地下城。该工具通过 AI 辅助的代码生成,实现了程序化关卡创建,展示了 Copilot CLI 在创意编码和游戏原型开发中的实际应用潜力。项目核心是自动解析代码结构并生成对应的可探索地下城布局。
读了一篇叫HeavySkill的论文,非常有意思。 让多个 AI先并行"独立思考",生成多条独立推理。 再用另一轮推理来综合所有思路,得出最终答案。 按论文测试结果,回答质量会提升非常多。 正在按这个思路写一个Skill,Claude Co...
全球权威评测机构Artificial Analysis发布全新Coding Agent Index,包含SWE-Bench-Pro-Hard-AA、Terminal-Bench v2和SWE-Atlas-QnA三项基准,用于衡量模型与Agent harness组合的真实编程能力。闭源模型Opus 4.7(在Cursor CLI中运行)全球第一,智谱GLM-5.1(在Claude Code中运行)获开源第一,代表国产大模型在实际编程Agent场景达到SOTA水平。
同一事件,精选展示《GLM-5.1开源:一个独立工作8小时的模型》随着AI智能体热潮兴起,技术从业者为保持AI编码任务持续运行,不得不抱着半开笔记本电脑在公共场所走动。报道采访了多位有此习惯的人,他们出现在溜冰场、机场、高中走廊等地,因任务一旦合盖中断就会丢失进度。有人将电脑开合角度调至最小以避人耳目。这种行为已形成网络梗文化,当事人常感尴尬,但在旧金山湾区等技术密集区已较常见。
Codex can now help you build AI apps and agents faster with OpenAI APIs using the OpenAI Developers plugin.
Claude Code 2.1.139 added /goal You set a completion condition and Claude keeps working across turns until it's met Work...
Anthropic的Fiona Fung指出,AI使代码生成成本趋近于零,工程瓶颈已从“写代码慢”转向验证、评审与协作。基于“写代码贵”假设的旧流程(如冗长路线图、繁琐评审)必须重构。技术辩论应从白板讨论转为让AI生成多个PR进行对比;代码成为唯一事实来源。经理需从一线工程师做起,组织应扁平化。质量保障需“左移”,依赖自动化。代码评审中,AI处理风格检查等常规任务,人类则专注于合规、安全及产品体验等关键决策。
self-verification (Outcomes) + self-learning (Dreaming) are two of the most interesting new features we shared at Code W...
作者利用人工智能开发了一款工具,用于监测和分析夜间可能吵醒他的声音。该工具通过记录和分析环境音频,识别并分类噪音来源,帮助作者找出睡眠中断的具体原因。这一实践展示了AI在解决个人生活问题上的实际应用潜力。
Claude Code新增Agent View功能,将所有会话集中在一个视图中,按状态分类显示任务名和输出摘要。用户可快速inline回复或后台运行任务,减轻处理并行任务时的脑力负担。这标志着Claude Code从单兵AI向多代理统一管理演进,适合PR看护、性能审计等长任务。该功能作为研究预览发布,针对终端重度用户设计,旨在抢占开发者操作系统入口。
New in Claude Code: agent view. One list of all your sessions, available today as a research preview.
尽管AI代码生成工具日益强大,但学习Python等传统编程语言依然重要。文章指出,AI无法替代开发者对问题分解、逻辑理解和代码审查的核心能力。Python凭借其简洁语法、庞大生态和广泛的应用场景,正转变为人类与AI协作的关键桥梁。它的价值将更侧重于快速原型设计、概念验证以及让开发者更高效地指导AI完成复杂任务,而非仅仅是一门手动编写的语言。因此,在AI辅助编程的时代,Python的角色是演进而非被取代。
GitLab宣布为适应“智能体时代”进行组织与战略调整,包括计划将设有小团队的国家数量减少高达30%,并扁平化管理结构,在某些职能中移除最多三层管理层。公司重组研发部门,建立约60个拥有端到端所有权的小型赋能团队,使独立团队数量近乎翻倍。同时,公司价值观框架从CREDIT更改为“速度与质量、主人翁心态、客户成果”。GitLab认为智能体时代将成倍增加软件需求,但其股价在过去一年从约52美元跌至26美元,增长前景面临市场不确定性。
Claude Code发布了智能体视图功能,该功能旨在将多智能体协作过程中的组织成本和认知负担转移给工具本身。这一设计预计将显著改变Claude Code的实际使用方式,通过工具层面的优化来简化复杂的Agent协同工作流程。
OpenAI于5月12日推出企业级安全项目Daybreak,旨在将网络安全防御前置至软件开发流程中。该项目对标Anthropic的Glasswing,提供基于GPT-5.5的三个模型,用于标准防护、授权环境及专门工作流。Daybreak并非一次性扫描工具,而是嵌入开发环节的持续安全工具链,支持代码审查、威胁建模等场景。企业目前可申请评估,具体价格尚未公布。
Claude Code 推出 Agent View,解决了多任务运行时需在多个终端窗口间切换、状态难以区分的痛点。该工具将所有会话集中在一个界面管理,用户可直观查看各Agent状态(如工作中、等待输入、已完成),并快速切换或接管任务,实现了类似“AI多任务调度中心”或“AI IDE任务栏”的高效管理体验。
Claude Code 推出“Agent View”工具,旨在解决用户同时运行多个任务时需在不同终端窗口间切换、难以区分任务状态的问题。该工具将所有会话集中到一个界面进行统一管理,使用户能直观查看所有Agent的实时状态(如工作中、等待输入或已结束),并可随时切换至特定任务进行处理,无需返回原始终端,提升了多任务协作的效率。
Artificial Analysis发布Coding Agent指数,首次将AI模型与Cursor CLI等具体编码环境组合评估。测试基于SWE-Bench-Pro等三大真实编码基准。结果显示,Opus 4.7在Cursor CLI上以61分领先,开源模型GLM-5.1最佳为53分,但仍落后顶尖闭源模型。成本与效率差异显著:每任务成本最高相差30多倍,耗时相差7倍。该榜单揭示了不同组合在性能、成本与效率上的巨大差异,为开发者选择编码助手提供了实用参考。
Announcing the Artificial Analysis Coding Agent Index! Our new coding agent benchmarks measure how combinations of agent...
New in Claude Code: agent view. One list of all your sessions, available today as a research preview.
After being a Claude Code devotee for a year, I finally tried Codex on a new project this weekend. Once again, in the ma...
OpenAI宣布为Codex新增“OpenAI Developers”插件,开发者可直接在终端内创建API Key并调用所有OpenAI API。该功能旨在将想法自动转化为完整可运行的AI应用和智能体,无需手动配置开发环境或编写基础模板代码,显著简化了AI产品的开发流程。
Claude Code 上线新功能 Agent View,允许开发者在单一界面集中管理所有正在运行的 AI 编程会话,解决了以往依赖多个终端标签页或 tmux 分屏、需手动记忆进度的繁琐问题。用户可通过按左箭头或运行 claude agents 命令进入总览界面,直观查看每个会话的状态(如等待回复、运行中或已完成)。其核心便利在于无需切换上下文即可直接回复特定会话,并能“偷看”进展后输入指令,不中断当前工作。此外,支持通过 /bg 命令将会话置于后台,或直接用 claude --bg 启动后台任务。该功能目前以研究预览形式向 Pro、Max、Team、Enterprise 及 API 用户开放。
New in Claude Code: agent view. One list of all your sessions, available today as a research preview.
Claude Code 近日推出“智能体视图”功能,为用户提供了一个集中管理所有会话的统一界面。该功能解决了并行运行多个智能体时需要切换终端标签、管理复杂网格的痛点,允许用户一键启动新智能体并将其发送至后台运行。在视图中,用户可以直观查看每个智能体的状态(等待输入、运行中或已完成)、最后响应内容及交互时间,并支持内联回复或进入完整会话。用户可通过 /bg 命令或将现有会话加入后台,也可直接使用 claude --bg [task] 启动后台任务。此功能已作为研究预览版向 Pro、Max、Team、Enterprise 及 Claude API 用户开放。
New in Claude Code: agent view. One list of all your sessions, available today as a research preview.
James Shore 强调,AI 编码代理必须降低代码维护成本,否则编码速度的提升反而会导致长期维护负担剧增。如果编码输出速率加倍,维护成本需减半;输出速率提升三倍,维护成本需降至三分之一。数学关系显示:输出加倍且维护成本加倍时,总维护成本将翻四倍;输出加倍但维护成本稳定时,总成本仍翻倍。这警示开发者,AI 工具应在提升效率的同时,以成反比的方式减少维护开销,避免用短期速度换取永久性债务。
本次更新引入了多项新功能与优化。核心新增包括:集中管理会话的Agent视图(研究预览)、可设置目标并持续工作的/goal命令、实时调整滚轮速度的/scroll-speed命令,以及查看插件详情的claude plugin details命令。交互界面导航与控制能力得到增强。底层优化涵盖MCP服务器可获取CLAUDE_PROJECT_DIR环境变量、/context all的令牌估算会考虑模型分词器并显示舍入值。此外,修复了超过20项问题,如凭证死锁、内存无限制增长、权限规则、UI显示错误及路径处理等缺陷。
文章探讨了在Swift语言中训练大型语言模型时,如何将矩阵乘法的性能从每秒千兆次浮点运算(Gflop/s)提升至每秒万亿次浮点运算(Tflop/s)。这是系列文章的第一部分,聚焦于通过优化技术实现计算性能的数量级飞跃,旨在展示Swift在高效执行核心机器学习运算方面的潜力。
作者提出一种高效学习方法:让Claude等大语言模型生成HTML文档来辅助深入学习与研究。相比纯文本或播客,HTML能嵌入图表和交互元素,支持主动探索。通过迭代提问和修改,文档随理解深入而演化,最终累积成个人知识库。文章引用观点指出,人机交互的输入输出融合尚有巨大发展空间,当前阶段可探索让LLM以HTML格式输出。信息呈现方式正从纯文本、Markdown向HTML及未来的交互式神经视频演进,以充分利用人类强大的视觉处理能力。作者认为,音频可能是人类偏好的AI输入方式,但视觉内容则是更高效的AI输出形式。
This works really well btw, at the end of your query ask your LLM to "structure your response as HTML", then view the ge...
人工智能分析发布编码代理基准指数,评估不同模型与执行框架组合在三大编码基准中的表现。Opus 4.7在Cursor CLI中以61分领先,GPT-5.5与Opus 4.7在其它框架中得分60紧随其后。开源模型GLM-5.1在Claude Code中获得53分,表现竞争但仍显著落后顶尖闭源模型。经济性差异悬殊:每任务成本从Composer 2的0.07美元到GLM-5.1的2.26美元不等,后者因任务循环令牌使用高达480万;任务耗时差异超7倍,Opus 4.7仅需6分钟而Kimi K2.6需40分钟。缓存命中率普遍较高,影响实际运行成本。
Shopify创始人Tobias Lütke介绍了公司内部的编码智能体工具River,其独特之处在于完全在Slack公共频道中运行,拒绝私聊,确保所有对话可被搜索且任何员工都能参与。Lütke的个人频道已有超100人参与互动、补充背景或协助审查,形成了一个“教学车间”。这种模式通过公开工作实现渗透式学习,无需正式课程或管理计划,让员工在观察与协作中自然成长。文章同时类比了Midjourney早期在Discord公共频道的成功,认为公开分享提示词有效促进了集体学习与早期发展。
Introducing Pareto Code: a new, free, experimental coding router Set `min_coding_score` in your request and route to the...