Boris Cherny公开其高效AI编码工作流,核心基于三点反直觉原则:1. 坚持使用最昂贵、最聪明的模型(如Claude),因其能一次性清晰规划,避免笨模型反复试错消耗更多token;2. 团队仅维护一个纯文本知识库文件,记录Claude的每次错误并每周更新,形成长期记忆;3. 始终让Claude查看自身代码的运行结果(包括执行和渲染)。其工作模式是在手机上并行启动多个Claude实例,基于规划模式制定方案后自动执行修改,从而高效完成任务。
"我"请大家免费喝星巴克了哈哈😂 只需要下载Trae 手机客户端,问答一次即可,5/8 日 开启。 地址:北/上/广/深/杭州/成都 赶紧啊! 地址:https://www.trae.cn/h5/events/solo-starbucks...
写教程时,经常需要拼接多张图,如果打开Figma处理就很笨重。 跟AI讨论,它推荐了一个HTML5 Canvas库。 打算把它整合到Markdown编辑器,拼好图再插入文章中。 Github项目见评论区
前沿模型SubQ基于创新的Subquadratic Sparse Attention架构,实现了1200万token的实用上下文窗口。其核心技术SSA通过内容依赖的选择机制,让每个查询仅动态计算与相关键的注意力,使计算和内存成本随序列长度线性增长,而非传统Transformer的二次方增长。实测在100万token时比FlashAttention-2快52.2倍,成本低于Opus的5%。该模型针对需要一次性处理完整代码库、长文档等企业真实长上下文场景优化,旨在弥合“名义上下文”与“功能上下文”窗口的差距。
Introducing SubQ - a major breakthrough in LLM intelligence. It is the first model built on a fully sub-quadratic sparse...
Anthropic的Claude Code项目负责人Boris Cherny指出,编程正从手动编写转向管理AI Agent。他本人2026年未手写代码,日常工作转为合并AI生成的PR,并通过数百个运行Loop模式的Agent自动化处理任务。他认为AI将抹平软件开发的切换成本和流程效力护城河,使编程像识字一样普及,未来跨学科通才将激增,因为理解业务比编写代码更为关键。Anthropic的核心优势在于其彻底改造、全员使用Claude协作的组织流程。
Unsloth发布指南,演示如何利用Gemma 4和Qwen3.6的GGUF模型,在仅需24GB RAM的本地机器上运行完整的agentic coding工作流。该方案通过Unsloth API端点和llama.cpp驱动,支持自愈式tool calls、代码执行和网页搜索。此举打破了以往必须在Claude Code等高端界面的性能与本地部署的隐私/成本之间二选一的困境,使得开发者能以近乎零成本在本地享受顶级交互体验,标志着开源模型开始无缝接管复杂的AI智能体工作流。
We made a guide on how to run open LLMs in Claude Code, Codex and OpenClaw. Use Gemma 4 and Qwen3.6 GGUFs for local agen...
OpenAI Codex的npm周下载量达4600万,远超Claude Code的49.1万,但社区指出对比存在偏差。Claude Code数月前已弃用npm安装方式,而Codex的巨大下载量可能包含大量自动化流水线拉取,未必反映真实使用。Sam Altman也回应数据可能不准确。竞争核心已从能力比拼转向商业化阶段,关键并非安装量,而是工具的实际留存率和日活跃度。Codex凭借生态绑定获得分发优势,Claude Code则以体验吸引高忠诚度用户,胜负取决于产品黏性。
Google推出Code Wiki项目,旨在解决“阅读现有代码”这一开发瓶颈。该工具能自动扫描代码仓库,实现文档随代码变更实时更新,避免过时。其核心功能包括由Gemini驱动的智能聊天,可将整个Wiki作为知识库进行问答,并支持超链接跳转至具体代码行;还能自动生成架构图、类图、时序图等可视化图表,并链接到源码。工具适用于各种规模的仓库,帮助新人快速上手或理解遗留代码。目前公共仓库已开放预览。
It's been quite a week. Good stuff is coming though. I hired a team! https://openclaw.ai/blog/openclaw-rough-week
用户反馈Codex执行/goal指令时不到半小时自动结束。核心解决方案是设定清晰任务目标、验收标准和文档指导,而非单纯追求运行时长。作者以逆向Codex App项目运行17小时为例,指出需与AI共同制定计划并保存为文档,提供样板文件明确输出格式,再分阶段执行、记录进度并迭代优化。关键在于让AI清楚知道要做什么、如何验证及何时完成,而不是仅靠权限或口头指令。
@dotey 您好,现在已成功录入😄,可还有一个问题,我用chatgpt pro给我写的/goal在codex上运行每次不到半小时它就自己结束了,我给chatgpt pro说了我的需求是长期让他自主化运行,也给codexCLI最高权限了,...
yo, i'm actually worried. codex limits are genuinely insane so it's sus af .. i feel this is an intentional move for a h...
Meta研究发现,强制大语言模型(LLM)在分析代码时遵循检查清单、逐步展示推理证明,能将其代码补丁错误率降低近50%。常见错误源于模型过早识别熟悉名称(如“format”)并直接套用通用含义,而非实际检查项目文件,导致其依赖自信猜测而非深入分析。通过要求模型明确写出修改内容、追踪执行路径并用具体证据证明结论,这一方法迫使其实际阅读本地文件、遵循真实逻辑,从而将准确率提升至93%。该方法无需昂贵的新训练或复杂系统,仅通过基本的结构化提示即可实现高可靠性的代码验证,节省了运行软件测试的巨大计算成本。
we are gonna do something nice for everyone who applied for the GPT-5.5 party and that we didn't have space for. hope yo...
Anthropic内部研发已由Claude主导,工程师基本不再手写代码,转而专注于编写提示词、审查代码和确定架构。这使得其工程师效率达到行业十倍以上,仅52天就推出50多个重大功能。这标志着递归自我改进(RSI)迈出关键一步:AI接管了生产自身的整个工厂。人类角色从生产者转变为监督者。结合OpenAI的Auto-review,一个能自我运行和改进的AI闭环正在形成。Anthropic CEO指出,未来仅约5%的开发者能留在核心领域,核心价值将转向驾驭和设计整个智能系统的系统思维能力。这是一个不可逆的进程。
Anthropic CEO Dario Amodei把所有程序员和独立开发者的终局和心里模糊的不安都说透了:未来只有5%的人能真正留在牌桌上。 他平静但无比坚定,说最先被商品化的,是写代码这件事, 再往后,软件工程里从需求分析、架构设计到测...
兄弟们!花半小时,一定要看完它! Claude Code的缔造者Boris Cherny,亲自站上台,用整整30分钟把这个工具的全部高级用法一次性讲透了。 免费、干货真的夯到爆!。 他从最基础的全局安装开始,一路讲到: - 如何通过CLAU...
Cursor团队认为,模型能力决定上限,而Harness(模型控制框架)决定其实际表现。他们采用愿景驱动与实验闭环的方法,通过线上A/B测试和离线评估持续优化。随着模型能力提升,Harness设计正从“守卫式”转向“动态获取式”,即减少静态信息注入,赋予模型更多动态获取上下文的权力。衡量体系结合离线基准、在线A/B测试及留存率、LLM判读等质量指标。Harness需为不同模型重度定制,贴合其工具格式与Prompt风格。团队判断AI编程的未来是多Agent协作,其成功关键取决于能协调任务分配与工作流缝合的Harness工程。
Claude Code创始人Boris Cherny通过30分钟视频,系统讲解了该工具的高级工程化用法。核心观点是:为Claude提供越多上下文,它就越智能。视频详细演示了如何通过CLAUDE.md文件在企业、项目、本地层级注入上下文规则,如何将内部工具集成到Agent工作流,并优化了数十个终端设置与权限管理等细节。他指出,多数用户仅发挥其10%潜力,仅用于简单对话,而未能将其作为驱动整个工程团队的生产力基础设施。
WHAT THE HELL I LOVE YOU @OpenAIDevs 10X RATE LIMITS ON CODEX IS FRICKING CRAZYYYYYYYY
一个名为CLAUDE.md的百行文件在GitHub上迅速走红,一周内获得超4.4万星。它没有依赖和配置,仅将Andrej Karpathy总结的LLM编码坏习惯浓缩为四条核心规则:先思考再编码、简约至上、手术式修改、目标驱动执行。开发者只需将其置于项目根目录,Claude Code等工具便能自动读取并遵循,从而显著提升代码质量,减少返工和token浪费。此举被视为对当前需要反复纠正AI模型的开发体验的集体反叛,以零成本方案为AI编码设定明确规范。
Context may be the most under-engineered layer in AI coding today. In this keynote, @patrickdebois, argues that if agent...
Cursor官方团队将其内部使用的开发工作流打包成名为“cursor-team-kit”的插件。该插件集成了17个核心Skills、1个Agent和2条Rules,旨在提升团队协作与代码质量。核心Skills涵盖五大领域:CI/合并循环自动化、PR全流程管理、验证与测试、总结复盘以及代码治理。其中,ci-watcher Agent可后台监听CI状态,而两条Rules则强制规定了TypeScript的代码风格。该插件是团队用于构建Cursor产品自身经验的封装,专注于验证变更、驱动本地工具和交付可评审的PR。
this is cursor team kit: a plugin for some skills we use to build cursor at cursor skills for verifying changes, driving...
针对AI编程工具常犯的“默默假设”、“过度自信”和“无效重构”等问题,一份名为CLAUDE.md的文档被整理出来,旨在为AI设定工程纪律。其核心四条原则是:编码前先思考并澄清歧义;优先用最简代码实现需求;仅修改与需求直接相关的代码;为任务设定明确、可验证的目标。这套规则旨在约束AI行为,使其更接近靠谱工程师的作风,解决其“太积极、太爱脑补、太喜欢顺手优化”的痛点。
Codex is my favorite coding app right now. It's clean, but has everything I need to ship fast. It's also quite delightfu...