Raycast发布V2 Beta版本,核心转变是从一个单纯的启动器升级为“启动器+AI Agent”的集成工具。新版对整体UI和基础架构进行了全面重构,包括重做启动器底层、重新设计搜索与扩展功能。搜索功能得到升级,文件搜索被整合进主搜索框以提升速度。AI能力显著增强,新增了独立的AI Chat输入框和聊天窗口,并支持Skills、Agent和Memory功能,同时内置了语音输入。
Raycast发布V2 Beta版本,核心转变是从一个单纯的启动器升级为“启动器+AI Agent”的集成工具。新版对整体UI和基础架构进行了全面重构,包括重做启动器底层、重新设计搜索与扩展功能。搜索功能得到升级,文件搜索被整合进主搜索框以提升速度。AI能力显著增强,新增了独立的AI Chat输入框和聊天窗口,并支持Skills、Agent和Memory功能,同时内置了语音输入。
美国已批准约10家中国公司,包括阿里巴巴、腾讯、字节跳动和京东,购买英伟达H200芯片,但至今芯片尚未发货。这一批准实质是外交谈判筹码,华盛顿以芯片换取中国在稀土、贸易或台湾问题上的让步;英伟达CEO黄仁勋的行程也被用作政治杠杆。瓶颈可能在北京方面:中国正推动企业采用国产硬件如华为昇腾,购买H200会重建其试图摆脱的对美技术依赖。当前僵局对双方政府有利:美国鹰派不希望芯片流入中国,而北京追求自给自足。批准但不兑现看似进展且无需承诺。关键指标是发货量而非批准公司数;发货量为零表明这是外交手段伪装成商业行为。
OpenAI 为在 Windows 上实现 Codex 的“默认安全”体验,从免提权沙箱演进到提权沙箱。Windows 缺乏原生进程级约束,初期方案通过合成 SID 和 Write-Restricted Token 限制文件写入,但网络封锁只能依赖环境变量软拦截,无法强制生效。团队最终放弃免提权约束,转向创建独立本地用户(在线与离线沙箱用户),需一次性管理员权限安装并配置防火墙规则。通过引入 codex-command-runner.exe 作为中介,解决跨用户创建受限令牌进程的权限难题,形成四层架构,在保障安全的同时最小化对主流程的侵入。
We are continuing to invest in making agents work better on Windows. Highly recommend reading David's engineering post o...
UnslothAI创始人Daniel Han发布了实验性的Qwen3.6 MTP GGUF模型,显著提升了推理速度。其中,27B模型在单GPU上达到每秒140个token,35B-A3B版本更是高达每秒220个token,相比原版GGUF速度提升超过1.4倍且精度无损。关键优化在于将draft tokens设置为2,这是性能与接受率的最佳平衡点。这项MTP投机解码技术极大提升了消费级显卡运行大模型的效率,推动了本地AI的性能边界。
We released experimental MTP Qwen3.6 Unsloth GGUFs! Qwen3.6 27B MTP now runs at 140 tokens/s. Qwen3.6 35B-A3B MTP gets 2...
OpenAI团队为Codex在Windows上构建沙箱时,因系统缺乏原生内核级工具,评估并否决了AppContainer、Windows Sandbox和强制完整性控制(MIC)三个现成方案。最终自研方案结合专属Windows SID与写受限令牌,在内核层实现无需管理员权限的文件系统隔离;网络隔离则通过创建特定本地用户账户绑定防火墙规则来强制执行。该架构虽复杂,但为所有需在Windows上实现文件系统隔离的AI Agent系统提供了关键设计范式。
http://x.com/i/article/2054632650636152832
作者介绍了将智能体与可交互的HTML组件(Artifacts)结合的工作流。这些组件超越了静态文件,能主动执行或辅助完成任务。其核心优势在于数据完全自主(存储于Markdown中,无需数据库)、维护简单且回报率高,并能实现高度个性化的功能扩展。作者已将其应用于写作、研究、设计等多个领域,并指出简化工具栈是提升效能的关键。他将于下周进行直播,详细讲解具体实现方法。
本文结合AI时代背景解读《启示录》,指出多数产品失败源于早期方向错误,而非执行力。产品经理核心职责是“评估产品机会”与“定义要开发的产品”。书中强调用“机会评估”框架聚焦问题本身,并主张以高保真原型(现可用Figma等工具快速制作)替代传统PRD,通过约5名目标用户的测试提前验证体验。在AI降低原型成本的当下,团队更应警惕盲目添加功能,回归产品探索本质。
Anthropic将企业客户从固定费用转向基于使用量的定价模式,同时新的分词器导致单次请求消耗增加,致使客户成本急剧上升。例如,有企业CIO发现30个席位的Claude账单在30天内翻了三倍,ServiceNow则在数月内耗尽了年度预算。尽管其Claude Opus已是定价最高的前沿模型,但Anthropic年化收入仍高达300亿美元,仅微软一家年支出就近5亿美元。这标志着企业AI定价正从Salesforce式的固定模式转向类似AWS的用量计费,但Anthropic展现出前所未有的强势定价权。
近期CopyFail、YellowKey、Mini-Shai Hulud等系列安全事件,标志着软件安全范式正发生根本转变。AI不仅辅助发现漏洞(如732字节脚本攻破Linux root),更被直接用于驱动零日漏洞的在野利用和武器化。漏洞从发现到武器化的时间急剧缩短。供应链成为最薄弱环节,Mini-Shai Hulud事件揭示被广泛信任的CI/CD管道(如GitHub Actions)可能成为最大后门。安全模式正从“被动修补”转向构建“AI实时免疫”体系。应对核心是将供应链审计提升至最高优先级,审查CI/CD、强制实施SLSA等标准。未来3-5年,安全能力将直接决定企业生存成本。
Security things from the last few days: - CopyFail (linux pwn'd) - CopyFail 2/Dirty Frag - 13 advisories in Next.js - Ov...
自己的博客,想了大半年,终于上线了。 说来惭愧,"搭一个自己的写作阵地" 这件事在我 TODO 里躺了很久。 选框架、挑主题、搞部署、接公众号...... 每次一想就觉得工程量太大,然后就搁置了。 直到看到 @vista8 乔木老师开源了他...
BenchLoop 提供了一套对本地大模型进行基准测试的标准化流程。用户只需拉取模型并运行该工具,即可实时获取模型在质量、速度和可靠性方面的综合评分。平台支持对比不同提示框架(如原生模式与 Hermes 模式)下的性能表现。测试完成后,结果可自动发布至公开排行榜,便于横向比较不同模型的优劣。
Google博客以“新员工入职协调Agent”为例,指出AI智能体从演示走向生产需完成三大架构转变,核心是上下文与状态解耦。首先,采用持久化状态机,通过明确进度节点替代对话历史记录状态,解决上下文污染、token成本爆炸和推理幻觉问题。其次,引入事件驱动休眠门控,使Agent在等待外部事件时挂起以零资源消耗。最后,通过多Agent委托机制,将专项任务交由独立子Agent处理,避免提示词膨胀并支持独立优化。完整示例代码已开源。
AI Agent落地聚焦技术、测试与基础设施三大层面。技术实现上,Google ADK通过持久化状态机和事件驱动机制,解决了长流程Agent的空闲等待与上下文丢失难题。测试环节中,小红书QCon实战揭示GUI Agent测试的真实瓶颈在于业务理解,而非仅靠执行自动化。基础设施方面,PingCAP复盘TiDB支撑Kimi海量站点的案例,说明处理规模是可扩展架构的核心考题。
微软推出新型多模型智能体安全系统,整合了超过100个基于前沿和定制模型的专用智能体,用于发现可利用的安全漏洞。该系统在CyberGym基准测试中取得了顶级性能。在最近的Patch Tuesday之前,该系统已帮助发现并修复了16个漏洞。微软宣布客户现可申请加入该系统的私有预览测试。
We're excited to announce our partnership with @MiniMax_AI! Read more at https://getlilac.com/blog/minimax-m2-7-partners...
通过RoCEv2 CX-7以太网和Tomahawk交换机连接多台B200 8-GPU机器,并采用名为PD disaggregation的推理优化技术,单GPU的token吞吐量最高可提升7倍。吞吐量的大幅提升使得每百万token的成本也相应降低了最多7倍。这一成果得益于Inferact和vLLM项目开发的开源引擎,以及NVIDIA团队构建的动态推理编排器。未来针对B200 disaggregation的性能还将有进一步改进。
Theo发出严重警告,新型软件供应链攻击“Mini Shai-Hulud”通过污染GitHub Action缓存,在CI/CD环节注入恶意依赖,已毒化从TanStack扩散到UiPath、Mistral AI相关包等总计205个制品。攻击速度极快,6分钟内发布84个恶意版本,并利用窃取的凭证形成蠕虫式自我繁殖闭环。由于攻击发生在上游,恶意包拥有合法签名,使传统安全机制失效。AI编程助手和自动化工具的普及使得零人工审查成为常态,加剧了风险。当前,更新依赖已成为极高风险操作,必须采取强制lockfile、手动批准升级、轮转所有凭证等严格措施。
I hope you guys understand that this is going to keep getting worse
Claude Code发布智能体视图,将多会话管理集成于单一面板,旨在降低开发者并行工作的认知负担,标志着AI辅助编程进入“多线程”阶段。OpenAI宣布成立独立部署子公司,初始投入超四十亿美元,并派驻约150名前线部署工程师进入企业,表明AI竞争焦点已从模型能力转向实际落地能力。同时,行业观点认为,AI的“英雄主义时代”已经过去,当前稀缺的是靠谱、细致、负责任的工程执行力,而非天才洞察。
OpenAI宣布成立独立子公司OpenAI Deployment Company,旨在解决企业AI落地难题。该公司通过收购AI咨询公司Tomoro,组建了约150名前线部署工程师团队,将常驻企业内部,识别高价值场景并将AI系统整合至工作流。OpenAI指出,当前企业AI的瓶颈已从模型能力转向实际业务落地。此轮融资超40亿美元,由TPG领投。此举标志着AI竞争焦点转向落地能力,OpenAI将该业务提升至战略层级,直接与主要云厂商的企业服务竞争。
Anthropic在AWS上正式推出Claude Platform,与现有的Claude on Amazon Bedrock形成两条独立产品线。平台版由双方共同运营,数据由Anthropic处理,但功能与原生API完全对齐且同步更新。其核心优势在于整合了AWS的IAM认证、CloudTrail审计、统一账单及承诺消费抵扣,同时提供Claude全功能套件,包括Managed Agents、Skills、联网搜索等。该服务适合需要完整功能并能接受数据由Anthropic处理的客户,而Bedrock版则面向对数据必须驻留AWS有严格合规要求的场景。
The Claude Platform on AWS is now generally available. AWS customers get the full set of Claude API features, with AWS a...
Anthropic正式在AWS上推出Claude Platform,使开发者能在其自有AWS环境中使用与原生API相同的模型和功能,包括Claude Managed Agents。关键突破在于工作负载、计费和IAM权限全部保留在企业自身的AWS账户内,无需数据出境。此举直接解决了大型企业以往采用前沿AI代理时面临的数据安全、采购流程和安全审查等核心障碍,为企业级应用扫清了最后的关键阻碍。
We're introducing the Claude Platform on AWS. This gives developers access to the same models and features as our native...
Build and deploy agents at scale with Claude Managed Agents, or use features like the advisor strategy, code execution, ...
Anthropic在AWS上推出了Claude平台,此举并非发布新模型,而是旨在简化企业采购与部署流程的战略举措。AWS客户现在可以直接通过AWS的身份验证、账单系统、承诺消费抵扣及治理工具访问原生Claude平台,无需强制使用Amazon Bedrock服务。该平台为客户提供完整的原生Claude体验,但服务本身由Anthropic运营,数据处理在AWS的边界之外进行。这显著降低了企业用户的采用门槛,是Anthropic推动其模型在企业市场广泛采用的关键一步。
Today we're launching the OpenAI Deployment Company to help businesses build and deploy AI. It's majority-owned and cont...
Anthropic在AWS正式推出Claude Platform,从通过Bedrock批发模型转变为直接运营。新平台使企业客户能使用与原生Claude完全同步的最新功能,包括测试版能力,并实现了与AWS的计费、身份认证和承诺消费额度无缝打通。此举提供了双轨选择:敏感数据项目可通过Bedrock留在AWS边界内,而追求创新的项目则可使用Platform获取最快最新的能力。这种深度集成大幅提高了企业更换AI模型的迁移成本,因为切换意味着要重构整个AWS的IAM、账单和权限体系,被视作强大的“云锁定”策略升级。
The Claude Platform on AWS is now generally available. AWS customers get the full set of Claude API features, with AWS a...
OpenAI正从单纯销售模型转向深入企业技术栈,其新成立的“部署公司”旨在通过“前沿部署工程师”帮助客户将AI深度集成到实际业务流程中。此举意在增强其企业市场竞争力,对标Palantir的深度集成服务模式。OpenAI收购Tomoro,将立即获得150名经验丰富的部署工程师与专家,以加速这一战略。其核心目标是成为AI经济的“部署层”,而不仅仅是模型提供商。
We've also agreed to acquire Tomoro, which will bring 150 experienced Forward Deployed Engineers and Deployment Speciali...
OpenAI宣布成立由其控股的独立子公司OpenAI Deployment Company,旨在帮助企业将前沿AI技术深度集成至核心业务流程。该公司通过收购英国咨询公司Tomoro获得了约150名部署专家,并联合了包括TPG、贝恩资本、高盛等在内的19家顶级投资机构和咨询集成商,形成覆盖数千家企业的服务网络。启动资金超过40亿美元,将用于扩大运营和持续收购。其核心工作模式是派遣“前置部署工程师”驻场,为客户量身定制并部署AI生产系统。
Today we're launching the OpenAI Deployment Company to help businesses build and deploy AI. It's majority-owned and cont...
OpenAI 成立由其控股的部署公司,引入麦肯锡、贝恩、凯捷等咨询公司及多家投资机构作为股东,旨在共同推动前沿AI在企业生产环境中的落地。其核心模式是私募机构提供资金与被投企业客户资源,咨询公司负责将AI深度集成至企业工作流,使OpenAI能快速承接庞大B端客户网络。几乎同时,Anthropic也与高盛等成立了类似合资公司。这标志着企业AI落地战役进入新阶段,单纯售卖API的模式面临瓶颈,深度驻场交付成为新竞争壁垒。预计国内厂商将跟进类似策略。
Today we're launching the OpenAI Deployment Company to help businesses build and deploy AI. It's majority-owned and cont...