An early beta of Grok Build, an agentic CLI for coding, building apps, and automating workflows is now available for Sup...
An early beta of Grok Build, an agentic CLI for coding, building apps, and automating workflows is now available for Sup...
You've been asking for this one... Now in preview: Codex in the ChatGPT mobile app. Start new work, review outputs, stee...
用户现可通过 ChatGPT 移动应用随时随地使用 Codex。该功能支持跨设备和远程环境实时监控、引导及批准编码任务,实现了对编程工作的无缝移动端管理。
Grok Build is a fully interactive CLI, which means you can actually use your mouse to click. No flickers. Especially use...
You've been asking for this one... Now in preview: Codex in the ChatGPT mobile app. Start new work, review outputs, stee...
An early beta of Grok Build, an agentic CLI for coding, building apps, and automating workflows is now available for Sup...
First codex meetup in London! And since it is new feature Thursday, we learnt that Codex Mobile is coming in a few hours...
作者反思过度依赖AI工具导致自身认知能力下降。具体表现为:使用AI辅助编程后,自行编写代码的能力减弱;依赖AI总结文章,导致阅读理解深度不足;习惯AI快速生成初稿,削弱了独立构思与写作能力。文章指出,AI在提升效率的同时,也可能使人疏于深度思考和实践,从而造成“变笨”的负面效应。这引发了对人机协作中如何保持并锻炼人类核心思维能力的讨论。
xAI推出了Grok Build的早期测试版,这是一个面向开发者的智能命令行界面(CLI)工具。它将Grok直接集成到终端中,旨在帮助开发者更快地编写代码、构建应用程序、自动化工作流程以及规划复杂项目。该工具支持使用子代理进行并行研究、构建和审查,并可通过技能和插件自定义工作流。目前,该功能仅面向SuperGrok Heavy订阅者开放,处于早期测试阶段,未来将根据用户反馈持续改进。
xAI 面向 SuperGrok Heavy 订阅用户推出 Grok Build 早期测试版。这是一个直接在终端运行的新型编程智能体与命令行工具,专为专业软件工程和复杂任务设计。其核心功能包括:支持“计划模式”,允许用户在代码执行前审阅和修改详细步骤;能无缝集成现有开发工具链;可将大型任务分解,交由并行运行的专用子智能体处理。此外,该工具提供无头模式,便于脚本和自动化流程集成。用户可通过单行命令安装并立即在项目中使用。
An early beta of Grok Build, an agentic CLI for coding, building apps, and automating workflows is now available for Sup...
Anthropic公司发布了一份面向AI原生初创企业的实用指南,旨在重塑2026年创业生命周期的构思、最小可行产品、发布和规模化四个核心阶段。该手册为每个阶段提供了具体目标、退出标准、常见失败模式及AI驱动练习,涵盖如何利用Claude进行问题验证与客户发现、避免AI生成代码的技术债务、区分真实产品市场契合度与早期炒作,并引入智能工作流替代创始人手动操作。指南还整合了多家初创企业的实践案例,为从零开始围绕AI构建公司的创始人提供架构、范围与安全方面的最佳实践。
为解决datasette.io网站遭受恶意爬虫频繁访问的问题,作者借助Codex开发了一款可配置的IP速率限制插件。该插件能够监控并阻止在设定时间窗口内对特定路径发起过多请求的IP地址。文中给出了当前生产环境的配置示例:通过Fly-Client-IP请求头识别IP,设置最大跟踪键值数为10000,并豁免静态文件等路径;针对“/global-power-plants/*”和“/legislators/*”两类路径,规则限定60秒内最多允许60次请求,违规IP将被封锁20秒。
Supports Kimi Code CLI, Claude Code, Cursor, Codex, Hermes, and more. Try it at: http://kimi.com/features/webbridge and ...
Cline发布了全新的SDK、CLI和Skills,对其早期智能编码代理工具进行了全面升级。其CLI在Terminal Benchmark 2.0测试中表现优异,在Claude Opus等前沿模型上超越或比肩Claude Code等对手,在开源模型上领先优势更明显。SDK核心重构了“Harness”,包括重写提示词、简化循环、改进工具暴露方式。关键特性包括强大的Plugin层、开放的Provider支持、原生Agent Teams功能,以及开箱即用的CRON、Web搜索等工具。团队基于2024年以来的经验,将这一运行时开源供开发者使用。
Introducing the Cline SDK. We rebuilt the Cline harness for our extension and CLI from scratch using all the lessons lea...
HOLY FUCKING SHIT OMG CLAUDE JUST CRACKED THIS SHIT, THANK YOU @AnthropicAI THANK YOU @DarioAmodei NAMING MY KID AFTER Y...
开发者发布了一款名为“克劳德代码与《代码书》技能”的GitHub工具,旨在通过刻意练习提升编程技能。该工具利用AI模型生成特定主题的代码示例与解释,帮助用户进行针对性学习。项目在Hacker News上获得104点热度,关注度较高。其核心变化在于将传统的广泛学习转化为聚焦、可重复的技能训练模式,通过结构化练习提升学习效率。
Gemini 3.2 Flash - Capitalizing on DeepMind's clever distillation techniques... Rumors are that benchmarks show it's hit...
Anthropic首席财务官透露,公司内部AI已承担约90%的代码编写工作,财务报告等任务也能在人工介入前完成90%-95%。员工角色正从执行者转变为AI系统的监督者与战略决策者,部分报告处理时间从数小时缩短至30分钟。AI提升了团队效率,公司因此继续招聘,更注重“高密度人才”与AI的结合。行业趋势呈现分化:一些企业要求员工学习使用AI工具,另一些则以效率提升为由裁员。尽管自动化可能取代部分岗位,但若需求持续,企业招聘未必停止。
用户反馈Cursor的“Plan New Idea”设计模式存在语言不一致问题。当使用中文提示词时,系统生成的最终设计文档却默认输出为英文。用户指出,这影响了使用体验,核心问题在于设计文档的生成语言未能自动与初始提示词的语言保持一致。用户建议,系统的默认逻辑应调整为设计文档语言与用户输入的提示词语言(例如中文)自动匹配,并已通过@功能向相关人员提出该优化建议。
BREAKING: MiMo V2.5 Pro (Thinking) takes 3rd overall out of open weights models on Design Arena. MiMo V2.5 Pro (Thinking...
BREAKING: MiMo V2.5 Pro (Thinking) takes 3rd overall out of open weights models on Design Arena. MiMo V2.5 Pro (Thinking...
用户分享Cursor的高效服务:联系后一天内即获得Ultra版本和$10000使用额度。用户表示感谢,计划深度探索agent workflows、大规模测试和构建项目,并提供结构化反馈。另一用户也经历类似服务,即使延迟回复近一周,Cursor团队仍主动跟进赠送额度,对比传统SaaS公司的冷淡服务,凸显其以用户为中心的理念。用户赞誉Cursor为惊艳开发工具,计划迁移所有代码工作并深度使用Ultra版本以贡献优化建议。
Cursor这公司真的把我整懵了, 长这么大第一次见,主动给用户送$10000额度的公司👍 之前他们同事私信我,说要送我一万刀的使用额度, 我那几天忙到飞起,隔了快一周才看到消息回过去, 当时我心里已经默认这事黄了, 换任何公司都不可能再...
Anthropic近期调整了Claude的计费策略,自6月15日起将自动化使用从订阅额度剥离,改为独立信用额度,导致重度用户成本激增。随后,官方宣布为Claude Code提供截至7月13日的周限额50%临时提升,并与前期福利叠加。分析认为,此举旨在通过短期福利缓解开发者情绪,同时引导高消耗的自动化用户转向高付费API模式,而普通交互式编程用户则被临时福利留住,以适应新的计费规则。
Claude Code weekly limits are increasing 50%, now through July 13. Live now for all Pro, Max, Team, and seat-based Enter...
研究将数据集聚合(DAgger)算法应用于长视野大语言模型智能体训练,以解决监督微调中的协变量偏移与强化学习反馈稀疏的困境。该方法通过学生与教师策略的逐轮插值收集交互轨迹,并利用教师提供的密集监督信号进行训练,使模型接触真实环境状态。在软件工程智能体训练中,经DAgger式训练的4B和8B学生模型在SWE-bench Verified基准上显著提升,最终4B智能体成功率超越已发布的代表性8B系统,8B智能体性能接近更强32B规模模型,验证了该方法的有效性。
Anthropic宣布,自2026年6月15日起,所有付费版Claude计划将在现有对话额度外,新增月度专用额度用于程序化调用。该额度覆盖通过Agent SDK、claude-p命令行工具、Claude Code在GitHub Actions中的任务及基于SDK的第三方应用的调用。此举将程序化访问能力正式纳入订阅,用户无需单独申请API Key和建立计费账户即可在订阅费内运行自动化工作流,降低了个人开发者和小团队构建Agent工作流的门槛。同时,Claude Code的每周使用限额将从6月起临时提升50%,持续至2026年7月13日。
Starting June 15, paid Claude plans can claim a dedicated monthly credit for programmatic usage. The credit covers usage...
http://x.com/i/article/2054632650636152832
Solvita 是一个无需更新底层大语言模型权重的智能体演化框架,旨在提升模型在竞技编程中的推理能力。它将解题过程重组为由 Planner、Solver、Oracle、Hacker 四个专用智能体执行的闭环系统。每个智能体配备一个可训练的图结构知识网络,系统运行时产生的通过/失败结果、测试质量与对抗漏洞等信号,会转化为对这些网络的强化学习更新,使智能体能基于历史经验动态路由后续查询,持续积累可迁移的推理经验。在多个基准测试及实时编程比赛中,Solvita 在代码生成智能体中取得了新的最优性能,显著超越了现有方法。
Claude 工具发布 v2.1.141 版本,带来多项功能新增与优化。主要更新包括:为钩子输出添加 terminalSequence 字段以支持无控制终端的桌面通知;新增 CLAUDE_CODE_PLUGIN_PREFER_HTTPS 环境变量,便于通过 HTTPS 克隆插件源码;引入 ANTHROPIC_WORKSPACE_ID 变量以在多工作区联盟中限定令牌范围。会话管理方面,claude agents 命令新增 --cwd 参数用于按目录筛选,并优化后台代理的状态归类。用户体验改进包括:在倒带菜单添加“总结至此”选项以压缩早期上下文;长思考超时后旋转指示器变色提供更明确反馈;此外,还修复了 Markdown 表格渲染异常、权限提示逻辑、历史记录管理等超过 30 项问题。
Claude Code的周限额直接拉高50%了,而且是立刻生效,一直持续到7月13日。 Anthropic这次动作很快,所有Pro、Max、Team和企业座席用户都能享受到。 CLI、IDE插件、桌面端、网页端全部生效,还能和上周刚加的5小时限额翻倍叠加。
Claude Code weekly limits are increasing 50%, now through July 13. Live now for all Pro, Max, Team, and seat-based Enter...
Anthropic揭示其AI模型Computer Use点击不准是因界面截图被静默压缩导致坐标偏移。OpenAI分享了在Windows系统上为Codex构建安全沙箱的方法。一份基于超百次生产部署的Agent评估框架提出12项指标,并给出关键警示:基准测试准确率可达95%,但生产环境中幻觉率可能高达30%。此外,推文还提及李想对AI转型的看法及Shopify在多Agent应用中的实践经验。