Anthropic通过三重机制控制Claude智能体的部署风险,包括用户误用、模型异常行为和外部攻击。其防护策略聚焦于三个层面:通过沙箱、虚拟机和网络出口控制限制智能体运行环境;利用系统提示词和模型训练引导其行为;以及对MCP服务器、第三方插件等外部内容实施细粒度权限管理。文章以Claude Code、claude.ai和Claude Cowork为例,阐述了不同产品如何设计对应的隔离架构。
Anthropic通过三重机制控制Claude智能体的部署风险,包括用户误用、模型异常行为和外部攻击。其防护策略聚焦于三个层面:通过沙箱、虚拟机和网络出口控制限制智能体运行环境;利用系统提示词和模型训练引导其行为;以及对MCP服务器、第三方插件等外部内容实施细粒度权限管理。文章以Claude Code、claude.ai和Claude Cowork为例,阐述了不同产品如何设计对应的隔离架构。
MiMo-V2.5系列API价格宣布永久性大幅降低,最高降幅达99%,并统一了所有上下文长度的定价。同时,Token计划升级,用户支付同等价格可获得的可用Token数量增加了5至8倍,计费规则更简单透明。作为对现有用户的回馈,当前所有Token计划额度将被完全重置。MiMo-V2.5-TTS功能限时免费。这些改进源于整个MiMo技术栈的持续推理优化和系统服务效率提升,详细技术博客后续发布。
MiMo-V2.5 系列 API 永久降价,新定价最高降幅达 99%,不再区分上下文窗口长度,于北京时间 5 月 27 日 0 点生效。Token Plan 计费优化,用量提升至原来 5-8 倍,计费规则更清晰。百万亿 Token 创造者激励计划提前收官,100T Tokens 已全部发放。现有 Token Plan 用户额度于 5 月 27 日 0 点全量重置,按新规则执行。推理优化基于 SGLang HiCache 支持 SWA,KV Cache 搬运量降至近 1/7,可缓存 token 数量提升至近 5 倍。
一项分析指出,通过将任务外包给第三方并结合本地部署的大语言模型(LocalAI),企业或很快能在成本效益上超越仅依赖前沿实验室(如 OpenAI 或 Anthropic)的方案。该观点预测了 AI 服务交付模式的转变。
Uber's COO has said that it's getting "harder to justify" its AI costs because there was no way to show a link between A...
Introducing Merge Gateway - Build Your Own Router. You're three sprints into your coding assistant. You pick the most hy...
What you say is true, but nonetheless our AI will be great. Whether it is the best remains to be seen, but I will never ...
百度伐谋2.0产业决策智能体落地排产场景,业务人员用自然语言描述优先级和现场变化(如设备故障、工人请假),系统自动将约束转化为优化模型并迭代求解,将顾问数小时的建模压缩到对话内完成。每次纠偏实时调整方案,隐性经验被结构化沉淀为企业可复用模型。在日均数百订单、十几条产线的大型家具制造企业中,产能提升20%。
华为将不依赖更小制程节点,通过封装与架构创新来扩展其昇腾AI芯片。根据何庭波的论文,华为计划在2025年至2030年间,通过Chiplets、2.5D扇出封装和3D堆叠技术,推进其昇腾SuperPoD系列,具体产品包括2025年的910C、2026年的950及后续的990。约2030年,Ascend 990将引入LogicFolding技术,目标是到2035年实现100倍的集成度跃升。
这是一条面向非技术用户的 Grok Build 安装与使用教程视频。教程演示了如何通过一行命令快速安装 Grok Build,并展示了如何用它创建真实可用的网站。其核心功能包括:利用 Grok Imagine 自动生成图片与视频,以及支持在多个文件夹中同时运行不同的项目。在使用过程中,Grok 会自动执行所需命令,无需用户具备任何编程经验。该教程由原作者 Daniel_Farinax 制作,以解答朋友们的疑问,并获得了马斯克的转发认可。
Beginner video: How to install & use Grok Build (made for non-technical SuperGrok and X Premium+ users) I got so many qu...
思特威与紫光展锐达成战略合作,将结合思特威的光电技术与紫光展锐的高速 SerDes 等核心技术,联合研发新一代 MicroLED CPO 光互连解决方案。该方案采用并行架构,单位传输能耗可降至铜缆方案的 5%,旨在解决传统光互连成本高、集成度低、功耗高的痛点。合作目标是为 AI 数据中心算力集群、智能汽车、工业机器人等场景提供高带宽、低功耗的国产化核心方案。
英特尔计划将新墨西哥州里奥兰乔工厂改造为全球首个玻璃基板量产基地,以推进先进封装技术。相比传统有机基板,玻璃基板更平整、不易翘曲,可提升封装密度与芯片互连能力。该工厂占地218英亩,自1980年启用,2021年后转向先进封装,现已成为美国最先进的一体化封装设施,同时也在为外部客户制造硅光子产品。从产能布局看,该工厂比钱德勒的试产线更接近规模化量产。
Anthropic 工程师 Ara 分享内部使用 Claude Code 的三项核心实践:将规格说明升级为 HTML 以提升结构密度;让模型通过 ask_user_question 工具主动采访需求;采用智能体原生 DOM 验证框架,实现人工、Opus 4.7 无头浏览器及 CI/CD 的统一验证。Every 公司 CEO Dan Shipper 用团队一年内从 15 人扩张至近 30 人的数据,反驳 AI 会大规模裁员的叙事,认为自动化反而催生需求增长与质量管控需求。百川智能创始人王小川透露,公司已收缩通用模型与金融等业务线,All in 医疗大模型,并即将发布新医疗大模型 M4。
SK海力士推出“iHBM”控温散热存储技术,在HBM封装内直接集成名为“ICE”的冷却元件,为芯片热点构建专用散热通道。该技术使热阻降低超过30%,并兼容现有封装设计。SK海力士计划将其应用于下一代HBM5产品。
"I'm out of free API credits" is officially over 🤯 FreeLLMAPI is an open-source proxy. Each provider's free tier is a t...
根据报道,挪威采购了2拍字节(PB)的华为闪存存储设备。这批高性能存储设备将被用于支持大型语言模型(LLM)的训练工作。此举反映了AI模型开发对大规模、高吞吐量存储解决方案的持续需求。
from prompt to context to harness engineering. three terms keep coming up in AI engineering, and they get conflated all ...
Together AI开源OSCAR,一种用于长上下文大语言模型服务的注意力感知2位KV缓存量化方法。该方法在离线状态下,从注意力感知的协方差结构中为键和值推导出独立的旋转。在2.28 bits per KV element的量化精度下,OSCAR将通义千问(Qwen3-4B-Thinking-2507)和通义千问(Qwen3-8B)的BF16精度差距分别缩小至3.78点和1.42点,同时实现约8倍的KV内存缩减,并在100K上下文长度下带来高达3倍的解码速度提升。
Jensen Huang explains how blocking China from Nvidia does not mean blocking China from AI. The usual export-control stor...
该推文介绍了Quickshare工具,用于将AI生成的HTML、Markdown等内容转化为可分享链接,以解决在微信中分享此类内容不便的问题。工具新推出基于Cloudflare的一键部署版本,并新增管理后台。用户可通过AI智能体安装部署,其核心功能还包括为链接添加密码保护,方便审核等场景。
用户通过Codex在VPS上自部署了umami统计工具,可为网站添加无限量流量监控。相比官方版有限制,自部署方案支持对任意网站通过指令快速启用统计功能。整个过程包括网站搭建、域名配置及数据统计均可由Codex通过SSH自动化完成,体现了“口喷建站”的便捷性。
有作者分享了一个技术实践,其核心是利用一台树莓派来构建(或安装、设置)另一个树莓派的操作系统。这本质上是一个计算机领域的“自举”(bootstrapping)过程,即系统用自身来构建或启动自身。该文章(原英文标题为“Building Pi with Pi”)的分享在 Hacker News 社区获得了关注。此摘要严格依据原文信息生成。
随着MCP月SDK下载量超过9700万且AI智能体进入生产工作流,认证已成为团队面临的关键基础设施决策。文章评估了八家领先平台——WorkOS、Stytch、Auth0 by Okta、Composio、Nango、Arcade、TrueFoundry和Cloudflare在规范合规性、企业身份深度、集成广度以及2026年部署的现实适用性方面的表现。
WorkOS 推出 auth.md 协议,为 AI 智能体提供标准化注册流程。这是一个部署在应用域名的 Markdown 文件,告知智能体支持哪些注册流程、请求哪些权限范围以及如何获取绑定真实用户的凭证,无需人工填写表单。该协议建立在现有 OAuth 标准之上。
翻译一下,Kimi 自己基于 Python 写的 kimi-cli,在今天换成了基于 Typescript 和 pi-tui 写的新 kimi-code。 已经在 PUA 对应的研发小哥哥加一些我在 Claude Code 上用得很爽的功能...
苹果公司的研究探讨了感知图像编解码器,分析其在实用学习型图像压缩中的关键作用。该研究聚焦于提升压缩效率与视觉质量平衡的实际需求。