Today we're launching the OpenAI Deployment Company to help businesses build and deploy AI. It's majority-owned and cont...
Today we're launching the OpenAI Deployment Company to help businesses build and deploy AI. It's majority-owned and cont...
Anthropic公司正式在AWS上推出Claude平台,为AWS客户提供了通过其现有身份验证、账单及承诺消费抵扣使用完整Claude功能的新途径。该平台首次将全套Claude API功能引入AWS生态,新功能与原生API同日上线。平台包含Claude托管智能体、代码执行、文件API等多项核心功能,并支持最新模型。与Amazon Bedrock上的服务不同,此平台由Anthropic直接运营,数据在AWS边界外处理,适合需要完整平台体验的企业客户。服务将在多数AWS商业区域提供。
马斯克已提交SpaceXAI商标申请,标志着其人工智能公司xAI正式并入SpaceX,成为其AI产品线。合并后实体估值达1.25万亿美元。SpaceXAI业务将聚焦太空算力,涵盖基于卫星的数据中心、轨道计算设施及AI服务。公司计划发射多达100万颗卫星构建轨道AI数据中心,并同步研发太空专用AI芯片。尽管愿景宏大,但该计划面临技术复杂性与商业可行性的双重挑战。
Anthropic在AWS正式推出Claude Platform,从通过Bedrock批发模型转变为直接运营。新平台使企业客户能使用与原生Claude完全同步的最新功能,包括测试版能力,并实现了与AWS的计费、身份认证和承诺消费额度无缝打通。此举提供了双轨选择:敏感数据项目可通过Bedrock留在AWS边界内,而追求创新的项目则可使用Platform获取最快最新的能力。这种深度集成大幅提高了企业更换AI模型的迁移成本,因为切换意味着要重构整个AWS的IAM、账单和权限体系,被视作强大的“云锁定”策略升级。
The Claude Platform on AWS is now generally available. AWS customers get the full set of Claude API features, with AWS a...
OpenAI成立了一家名为DeployCo的控股子公司,专注于咨询和实施业务,旨在帮助企业将AI系统集成到核心运营中。这一举措借鉴了Palantir的策略,通过深入企业实际工作流程来构建竞争壁垒,这些复杂流程是实验室环境难以模拟的。DeployCo的成立标志着OpenAI正从单纯的技术提供者转向深度参与企业落地的服务方。
OpenAI宣布成立一家由其控股的新公司“OpenAI部署公司”,初始投资超40亿美元,旨在帮助企业搭建和落地AI系统。为快速壮大业务,OpenAI同时收购了AI咨询公司Tomoro,此举将引入约150名资深工程师与实施专员。Tomoro于2023年与OpenAI合作成立,客户包括美泰、红牛等企业。此举被视为OpenAI在竞争对手Anthropic企业级业务快速发展背景下,深化商业布局、推动技术大规模应用的关键举措。
MiniMax宣布启动“10x Team”合作计划,旨在邀请各行业顶尖专业人士共同推动AI模型在特定领域的深度优化与十倍增长。该计划面向具备行业积累、能自主参与问题定义与工作流搭建的专业人士,提供无限Token、完整多模态模型能力及研发资源。合作采用全职入职或不少于四个月的Fellowship短期协作模式,办公地点覆盖上海、北京、香港、旧金山及伦敦。合作成果将开源并用于模型迭代,参与者可获得具国际竞争力的薪酬、股票激励及学术成果共享权益。此前,MiniMax已在工业软件、游戏引擎等多个领域与专家展开合作验证。
Runway开源了Python库confingy,旨在解决机器学习系统配置的长期痛点。该库允许开发者用纯Python代码(支持懒加载、类型检查和序列化)替代传统YAML配置文件,从而摆脱YAML作为图灵完备领域特定语言所带来的维护困境。confingy无需重构现有代码,即可满足跟踪构造函数参数、避免实例化昂贵对象(如大语言模型)等核心需求,有效改善了因复杂YAML配置导致的无法跳转定义、类型提示失效和重构困难等开发体验问题。
OpenAI正从单纯销售模型转向深入企业技术栈,其新成立的“部署公司”旨在通过“前沿部署工程师”帮助客户将AI深度集成到实际业务流程中。此举意在增强其企业市场竞争力,对标Palantir的深度集成服务模式。OpenAI收购Tomoro,将立即获得150名经验丰富的部署工程师与专家,以加速这一战略。其核心目标是成为AI经济的“部署层”,而不仅仅是模型提供商。
We've also agreed to acquire Tomoro, which will bring 150 experienced Forward Deployed Engineers and Deployment Speciali...
OpenAI宣布成立由其控股的独立子公司OpenAI Deployment Company,旨在帮助企业将前沿AI技术深度集成至核心业务流程。该公司通过收购英国咨询公司Tomoro获得了约150名部署专家,并联合了包括TPG、贝恩资本、高盛等在内的19家顶级投资机构和咨询集成商,形成覆盖数千家企业的服务网络。启动资金超过40亿美元,将用于扩大运营和持续收购。其核心工作模式是派遣“前置部署工程师”驻场,为客户量身定制并部署AI生产系统。
Today we're launching the OpenAI Deployment Company to help businesses build and deploy AI. It's majority-owned and cont...
OpenAI 成立由其控股的部署公司,引入麦肯锡、贝恩、凯捷等咨询公司及多家投资机构作为股东,旨在共同推动前沿AI在企业生产环境中的落地。其核心模式是私募机构提供资金与被投企业客户资源,咨询公司负责将AI深度集成至企业工作流,使OpenAI能快速承接庞大B端客户网络。几乎同时,Anthropic也与高盛等成立了类似合资公司。这标志着企业AI落地战役进入新阶段,单纯售卖API的模式面临瓶颈,深度驻场交付成为新竞争壁垒。预计国内厂商将跟进类似策略。
Today we're launching the OpenAI Deployment Company to help businesses build and deploy AI. It's majority-owned and cont...
针对如何管理日益增长的AI技能(SKILL)以及同步Claude、Codex等不同AI工具的技能问题,建议将技能创建和管理目录统一设置在.agent/skills路径下。对于Claude、Codex等其他工具的目录,推荐使用软链接方式,以实现最大程度的兼容性。同时,推荐使用CC Switch的Skill管理工具,其可视化界面便于升级管理、点亮图标以及开启对不同工具的支持。
向大家讨教两个问题: 1. 你是如何管理日益增长的 SKILL 的? 2. 大家是如何同步 Claude Code 和 Codex 的 SKILL 的?有没有什么好的同步方案?
OpenAI 正式推出全新企业部署公司 DeployCo,旨在帮助各类组织将前沿人工智能技术投入实际生产,并转化为可衡量的商业影响。该举措标志着 OpenAI 进一步深入企业服务领域,专注于解决 AI 模型从测试到规模化部署的落地挑战,助力企业通过定制化部署方案提升运营效率与业务成果。
本文梳理了本地大模型推理的主流格式。GGUF是llama.cpp推出的单文件格式,集成头文件、元数据和权重,加载快且支持灵活的K-quants量化(2-8bit),兼容llama.cpp等工具,适合CPU与低配设备跨平台使用。MLX是Apple为M系列芯片优化的框架,采用目录结构,在Mac上利用统一内存架构实现高效加载与处理,支持4bit量化,为Mac用户提供最佳体验。其他如PyTorch/Safetensors是训练分享标配,ONNX侧重跨框架部署。建议Mac用户优先MLX,跨平台或低配选GGUF,训练分享用Safetensors。
针对市场上Claude中转站普遍用Sonnet模型冒充Opus的问题,重度用户自建新站ccode.dev,宣称通过自研技术解决了信任痛点。该站经cctest.ai和hvoy.ai两个独立平台检测,显示为100%官方Claude Opus行为指纹,且延迟与速度表现优秀。其提供官方直连、AWS Bedrock和逆向渠道三种分层服务以确保稳定性,并推出1:1.5充值优惠及公测返额。此外,站点承诺假一赔三、支持开票与对公账户,旨在解决用户售后无门的普遍担忧。
SenseNova U1图像生成模型现已在ComfyUI上可运行,并获得包括REBEL AI在内的评测者高度认可。REBEL AI发布的实践教程展示了该模型的部署工作流,并对其图像生成能力进行了真实场景测试。模型支持8步快速推理,生成速度极快,应用场景涵盖人像、超现实艺术、文字标志和生物设计等。相关资源已在Hugging Face、GitHub和Discord平台开放。
AI芯片制造商Cerebras Systems因IPO订单超出发行股票20倍以上,计划提高IPO规模和价格。市场普遍认为其芯片仅推理速度更快,但其核心优势在于能效。传统GPU在推理时受内存带宽限制,每个token生成都需从内存读取整个模型,导致算力闲置。Cerebras的Wafer-Scale Engine采用单一大芯片设计,以片上SRAM替代片外HBM,每次内存访问能耗降低约100倍。减少数据移动既降低了延迟,也显著减少了每token的功耗,这解释了其IPO被超额认购的原因。
优必选与日立(中国)有限公司签署战略合作协议,共同探索人形机器人在智能制造场景中的应用,以推动制造业智能化转型。合作涵盖电梯、楼宇系统、医疗健康、工业设备及半导体制造设备等领域,结合优必选的技术优势和日立的系统集成经验。目前合作已进入实质性验证阶段,日立在部分制造场景引入优必选的工业级人形机器人Walker S2,并围绕电梯智能制造现场开展深度二次开发,实现全流程柔性化智能流转与数据贯通。
软银集团在日本大阪启动电池业务,以满足AI数据中心激增的电力需求。业务将研发生产电芯及储能系统,计划2028财年投产,并优先供应自有数据中心。软银与韩国企业合作,研发采用水系电解液、火灾风险更低的锌卤素电芯,以及高容量储能集装箱。该业务是软银AI基础设施投资的重要部分,目标到2030财年销售额突破1万亿日元。
随着企业广泛应用GPT、Claude等AI模型,如何安全、高效地管理和分配内部员工的AI API调用权限成为普遍痛点。出于数据安全考虑,企业通常不会直接使用普通中转服务。尽管Azure和亚马逊云提供相关解决方案,但不同公司的规模与定制化需求差异显著,这为专门的企业级API网关产品创造了市场空间。海外已有此类产品出现,国内市场也存在相应机会。
英伟达CEO黄仁勋在卡内基梅隆大学获科学与技术荣誉博士学位,由英特尔CEO陈立武授位。陈立武透露双方正基于此前英伟达的50亿美元投资,合作开发新产品。合作核心是通过NVLink技术整合英伟达AI加速计算与英特尔x86 CPU架构。具体包括:英特尔将制造集成英伟达RTX GPU的x86系统芯片用于PC,并为英伟达制造定制x86 CPU用于数据中心AI平台。双方目标直指深度集成NVLink的新一代至强处理器及AI主机节点,未来Serpent Lake处理器也将采用此联合方案。
中国移动推出的AI模型中转平台MoMA,标志着“国家队”正式进入AI基础设施领域。该平台已接入DeepSeek、通义千问等300多个主流模型,并通过央视新闻进行宣传。其核心逻辑在于,AI中转站被视为未来AGI时代的“智能电网”,是掌握行业定价权与未来的关键。用户可在移动云官网搜索“MoMA”获取体验包,建议先行测试实际效果。此举意味着AI行业竞争已上升至基础设施层面。
说个暴论,AI 行业的天,今天真的要变了, 前几天刚写了几篇推文分析过孙哥和特朗普家族为啥下场做AI 中转站,底层逻辑是中转站本质是AI水电煤的生意。 结果今天就看到央视新闻,中国移动上线了AI中转站! 各大社区里很多人都以为中国移动发的 ...
据报道,英伟达已敲定Vera Rubin AI平台最终生产方案,将分阶段上市。试产将于下月启动,首批产品计划7月出货至北美大型AI数据中心及云服务商,微软、谷歌、亚马逊、Meta和甲骨文等预计成为首批客户。该平台芯片采用台积电3nm工艺制造,富士康、广达、纬创资通等合作伙伴将于下半年启动全面量产,并在第三季度大规模出货。据悉,单个Vera Rubin AI服务器机柜价值约1.8亿美元,并配备强大的软件生态系统。
马里兰州居民将承担高达20亿美元的电网升级费用,以支持主要为州外人工智能数据中心供电的项目。该州已向联邦能源监管机构投诉,认为这笔额外成本违反了保护本地用户的承诺。升级计划旨在满足数据中心急剧增长的电力需求,但费用转嫁至本州居民,引发了关于成本分摊公平性的争议。
Eric Ries提出用公益公司章程等“不锈钢螺栓”结构将使命嵌入组织,以对抗成功后的腐化。Eric Allam探讨长时AI Agent的持久化方案,通过分层实现毫秒级恢复。Samuel Humeau展示音频生成正复刻LLM技术路径,并以17毫秒首包延迟为当前标杆。
http://x.com/i/article/2053591256110940160
文章主张本地人工智能应成为常态,而非依赖云端服务。当前AI工具大多基于云端,存在延迟、隐私、成本和网络依赖等问题。本地AI模型在个人设备上运行,能提供即时响应、更好保护隐私、降低长期成本并确保离线可用。随着硬件性能提升和模型优化,本地运行7B至13B参数级别的模型已具备可行性。这一转变将使用户真正掌控自己的AI助手,推动技术向更开放、可定制和以用户为中心的方向发展。
MachinaCheck是一款基于多智能体AI的系统,旨在革新小型CNC机加工车间的报价分析流程。传统上,车间经理需花费30-60分钟手动分析图纸,而该系统在上传STEP文件及材料、公差等简单输入后,能在30秒内生成完整的可制造性报告,明确指出零件能否制造、所需工具及生产前需采取的行动。其核心在AMD MI300X加速卡上本地运行Qwen 2.5 7B模型,利用192GB HBM3显存确保客户设计数据无需离开本地,满足了制造业对数据隐私的严格要求。系统采用五组件流水线,结合精确的几何特征提取与LLM的制造知识推理,最终输出结构化报告。
Introducing Pareto Code: a new, free, experimental coding router Set `min_coding_score` in your request and route to the...
Levelsio的推文揭示了电子邮件发送服务正快速商品化。价格对比显示,发送百万封邮件的月费差异巨大:Postmark为1206美元,Resend为650美元,SendGrid为600美元,而Cloudflare仅需354美元,Amazon SES甚至低至100美元。传统提供商在SDK和投递可靠性上的优势已消失,AI工具(如Cursor或Claude)能通过迁移提示在十分钟内完成系统切换,极大降低了技术门槛和集成成本。Cloudflare的定价已接近SES,同时提供更优的域名管理和生态体验,预计将推动独立开发者及中小型SaaS向低成本方案迁移。
✉️ Trying @Cloudflare's new Email Sending feature today If you send 1,000,000 emails per month: - Postmark: $1,206/mo - ...
自DeepSeek-V4发布后14天内,AMD ROCm软件栈性能提升超过75倍。这一飞跃主要得益于融合mHC操作和RoPE哈达玛变换,有效降低了CPU开销并提高了HBM内存利用率。同时,团队使用TileLang和Triton快速开发了注意力索引器和KV缓存压缩器等核心组件。为追赶业界标杆,AMD仍需再提升5倍性能以匹配单节点聚合B200,并额外提升1.5倍以达到PD disaggregated B200水平,预计未来几周内有望实现这一目标。此快速进展离不开HaiShaw、Thomas、@roaner和@AnushElangovan等人的贡献。
智能体RAG流程的瓶颈通常不在大语言模型调用,而在于底层数据平面的序列化与分布式协调开销。新研究提出的AAFLOW是一个统一分布式运行时,将智能体工作流建模为基于Apache Arrow和Cylon的算子抽象,通过零拷贝数据平面直接连接预处理、嵌入和检索环节,并采用资源确定性调度与异步批处理降低协调成本。该方案实现了高达4.64倍的流水线加速,嵌入与更新阶段性能提升2.8倍,且所有收益均源于数据流优化,并未涉及大语言模型推理加速。
字节跳动将2026年人工智能支出计划上调至超过2000亿元人民币(约合300亿美元),较原计划至少增长25%。公司正加速转向采用国产芯片。然而,这一投入规模与谷歌、亚马逊、微软和Meta四家公司合计规划的7250亿美元相比,仍显保守。
OpenAI 将 GPT-5.5 的官方定价较 GPT-5.4 提高了一倍,声称更短的响应能抵消成本上涨。但 OpenRouter 对实际使用数据的分析显示,真实成本涨幅在 49% 到 92% 之间,具体取决于输入长度。与此同时,Anthropic 也提高了其 Opus 4.7 模型的价格。由于两家公司都在考虑首次公开募股,这一涨价趋势可能将持续。
企业AI使用量激增,代码生成量暴涨,但收入未同步增长。核心问题在于企业混淆了“投入”与“成果”:AI生成的大量代码只是成本投入,而非能带来收入的商业成果。AI按Token消耗定价,增加了企业成本,却未直接提升价值。过去开发资源有限迫使团队聚焦高价值想法,如今“代码免费”导致糟糕想法和团队协作问题激增,浪费资源。为抵消激增的AI支出并维持现金流,裁员成为直接的财务手段。只有当企业学会将AI增加的成本转化为相应收入增长时,裁员潮才可能停止。
新加坡外交部长维维安·巴拉克里希南将在@AIDOTENGINEER新加坡会议上发表主题演讲,分享他使用开源AI工具构建“第二大脑”工作流的经验。此前,他在GitHub上公开了个人AI技术栈的完整架构,涉及树莓派、Claude、本地嵌入和知识图谱等技术,这一举动受到全球AI社区关注,体现了政府高层对AI技术的直接、公开且务实的参与态度。继英国设立首席AI官后,新加坡内阁部长的深度参与标志着政府正积极拥抱AI。巴拉克里希南的实践表明,有意义的AI讨论应超越抽象层面,需通过实际技术参与来理解其参数,而新加坡正成为此类深度实践的发生地。
Where in the world can you find a senior government leader with a personal AI stack published on GitHub? How many would ...