5月12日

01:27

Greg Brockman@gdb

OpenAI宣布成立一家由其控股的部署公司，旨在帮助企业成功部署和应用AI技术。该公司整合了19家领先的投资机构、咨询公司和系统集成商作为合作伙伴，并获得了40亿美元的初始投资。启动团队包括150名前沿部署工程师和部署专家，核心目标是协助各类组织将前沿AI技术投入生产环境，以产生实际的商业影响。

OpenAI: Today we're launching the OpenAI Deployment Company to help businesses build and deploy AI. It's majority-owned and cont...

OpenAI 行业动态部署/工程

01:22

Claude：Blog（网页）

精选70

Anthropic在AWS上正式推出Claude平台

Anthropic公司正式在AWS上推出Claude平台，为AWS客户提供了通过其现有身份验证、账单及承诺消费抵扣使用完整Claude功能的新途径。该平台首次将全套Claude API功能引入AWS生态，新功能与原生API同日上线。平台包含Claude托管智能体、代码执行、文件API等多项核心功能，并支持最新模型。与Amazon Bedrock上的服务不同，此平台由Anthropic直接运营，数据在AWS边界外处理，适合需要完整平台体验的企业客户。服务将在多数AWS商业区域提供。

Anthropic 产品更新部署/工程

推荐理由：Anthropic 第一次把完整 Claude 平台功能全量搬到 AWS 上，用 AWS 账号就能直接拿原生 API 最新特性，对于 AWS 生态里的开发者是个省心的一站式选择，不用再纠结该走 Bedrock 还是原生。

01:02

SemiAnalysis@SemiAnalysis_

众所周知，卫浴制造商Toto和鲜味发明者味之素正为AI提供动力，但你们听说过英伟达服务器里的台湾厨房设备供应商吗？（1/5） 🧵

行业动态部署/工程

00:35

IT之家（RSS）

SpaceXAI 组建进行时，马斯克已提交商标注册申请

马斯克已提交SpaceXAI商标申请，标志着其人工智能公司xAI正式并入SpaceX，成为其AI产品线。合并后实体估值达1.25万亿美元。SpaceXAI业务将聚焦太空算力，涵盖基于卫星的数据中心、轨道计算设施及AI服务。公司计划发射多达100万颗卫星构建轨道AI数据中心，并同步研发太空专用AI芯片。尽管愿景宏大，但该计划面临技术复杂性与商业可行性的双重挑战。

行业动态部署/工程

00:35

阿绎 AYi@AYi_AInotes

Anthropic在AWS推出直营平台，云锁定策略升级引关注

Anthropic在AWS正式推出Claude Platform，从通过Bedrock批发模型转变为直接运营。新平台使企业客户能使用与原生Claude完全同步的最新功能，包括测试版能力，并实现了与AWS的计费、身份认证和承诺消费额度无缝打通。此举提供了双轨选择：敏感数据项目可通过Bedrock留在AWS边界内，而追求创新的项目则可使用Platform获取最快最新的能力。这种深度集成大幅提高了企业更换AI模型的迁移成本，因为切换意味着要重构整个AWS的IAM、账单和权限体系，被视作强大的“云锁定”策略升级。

Claude: The Claude Platform on AWS is now generally available. AWS customers get the full set of Claude API features, with AWS a...

智能体 Anthropic 大佬观点部署/工程

00:09

The Decoder：AI News（RSS）

OpenAI子公司DeployCo采用Palantir策略，通过实验室无法模拟的工作流程构建护城河

OpenAI成立了一家名为DeployCo的控股子公司，专注于咨询和实施业务，旨在帮助企业将AI系统集成到核心运营中。这一举措借鉴了Palantir的策略，通过深入企业实际工作流程来构建竞争壁垒，这些复杂流程是实验室环境难以模拟的。DeployCo的成立标志着OpenAI正从单纯的技术提供者转向深度参与企业落地的服务方。

OpenAI 行业动态部署/工程

00:04

Claude@claudeai

Claude平台现已在AWS全面上线。 AWS客户可获得全套Claude API功能，并享受AWS身份验证、计费及承诺金抵扣服务。

Anthropic 产品更新部署/工程

5月11日

23:35

IT之家（RSS）

OpenAI 豪掷 40 亿美元成立新公司，要帮企业部署 AI

OpenAI宣布成立一家由其控股的新公司“OpenAI部署公司”，初始投资超40亿美元，旨在帮助企业搭建和落地AI系统。为快速壮大业务，OpenAI同时收购了AI咨询公司Tomoro，此举将引入约150名资深工程师与实施专员。Tomoro于2023年与OpenAI合作成立，客户包括美泰、红牛等企业。此举被视为OpenAI在竞争对手Anthropic企业级业务快速发展背景下，深化商业布局、推动技术大规模应用的关键举措。

OpenAI 行业动态部署/工程

23:35

IT之家（RSS）

MiniMax 启动"10x Team"合作计划，提供无限的 Token

MiniMax宣布启动“10x Team”合作计划，旨在邀请各行业顶尖专业人士共同推动AI模型在特定领域的深度优化与十倍增长。该计划面向具备行业积累、能自主参与问题定义与工作流搭建的专业人士，提供无限Token、完整多模态模型能力及研发资源。合作采用全职入职或不少于四个月的Fellowship短期协作模式，办公地点覆盖上海、北京、香港、旧金山及伦敦。合作成果将开源并用于模型迭代，参与者可获得具国际竞争力的薪酬、股票激励及学术成果共享权益。此前，MiniMax已在工业软件、游戏引擎等多个领域与专家展开合作验证。

行业动态部署/工程

22:54

Runway：News（网页）

精选68

告别编写YAML：使用confingy配置机器学习系统

Runway开源了Python库confingy，旨在解决机器学习系统配置的长期痛点。该库允许开发者用纯Python代码（支持懒加载、类型检查和序列化）替代传统YAML配置文件，从而摆脱YAML作为图灵完备领域特定语言所带来的维护困境。confingy无需重构现有代码，即可满足跟踪构造函数参数、避免实例化昂贵对象（如大语言模型）等核心需求，有效改善了因复杂YAML配置导致的无法跳转定义、类型提示失效和重构困难等开发体验问题。

开源/仓库部署/工程

推荐理由：Runway把自家ML训练的YAML坑填平了，开源了confingy。如果你还在用YAML管实验参数，这可能是今年最该装的pip包。

22:53

Chubby♨️@kimmonismus

OpenAI成立部署公司，深入企业AI应用层

OpenAI正从单纯销售模型转向深入企业技术栈，其新成立的“部署公司”旨在通过“前沿部署工程师”帮助客户将AI深度集成到实际业务流程中。此举意在增强其企业市场竞争力，对标Palantir的深度集成服务模式。OpenAI收购Tomoro，将立即获得150名经验丰富的部署工程师与专家，以加速这一战略。其核心目标是成为AI经济的“部署层”，而不仅仅是模型提供商。

OpenAI: We've also agreed to acquire Tomoro, which will bring 150 experienced Forward Deployed Engineers and Deployment Speciali...

OpenAI 行业动态部署/工程

22:34

meng shao@shao__meng

OpenAI成立部署公司，携40亿美元助企业落地AI

OpenAI宣布成立由其控股的独立子公司OpenAI Deployment Company，旨在帮助企业将前沿AI技术深度集成至核心业务流程。该公司通过收购英国咨询公司Tomoro获得了约150名部署专家，并联合了包括TPG、贝恩资本、高盛等在内的19家顶级投资机构和咨询集成商，形成覆盖数千家企业的服务网络。启动资金超过40亿美元，将用于扩大运营和持续收购。其核心工作模式是派遣“前置部署工程师”驻场，为客户量身定制并部署AI生产系统。

OpenAI: Today we're launching the OpenAI Deployment Company to help businesses build and deploy AI. It's majority-owned and cont...

OpenAI 行业动态部署/工程

22:31

凡人小北@frxiaobei

OpenAI 成立控股部署公司，联合投资机构与咨询公司构建生态

OpenAI 成立由其控股的部署公司，引入麦肯锡、贝恩、凯捷等咨询公司及多家投资机构作为股东，旨在共同推动前沿AI在企业生产环境中的落地。其核心模式是私募机构提供资金与被投企业客户资源，咨询公司负责将AI深度集成至企业工作流，使OpenAI能快速承接庞大B端客户网络。几乎同时，Anthropic也与高盛等成立了类似合资公司。这标志着企业AI落地战役进入新阶段，单纯售卖API的模式面临瓶颈，深度驻场交付成为新竞争壁垒。预计国内厂商将跟进类似策略。

OpenAI: Today we're launching the OpenAI Deployment Company to help businesses build and deploy AI. It's majority-owned and cont...

OpenAI 行业动态部署/工程

21:50

向阳乔木@vista8

优化AI技能管理：统一目录与可视化工具推荐

针对如何管理日益增长的AI技能（SKILL）以及同步Claude、Codex等不同AI工具的技能问题，建议将技能创建和管理目录统一设置在.agent/skills路径下。对于Claude、Codex等其他工具的目录，推荐使用软链接方式，以实现最大程度的兼容性。同时，推荐使用CC Switch的Skill管理工具，其可视化界面便于升级管理、点亮图标以及开启对不同工具的支持。

Yihui: 向大家讨教两个问题: 1. 你是如何管理日益增长的 SKILL 的? 2. 大家是如何同步 Claude Code 和 Codex 的 SKILL 的?有没有什么好的同步方案?

智能体教程/实践部署/工程

21:38

OpenAI@OpenAI

今天我们正式启动OpenAI Deployment Company，以帮助企业构建和部署人工智能。该公司由OpenAI持有多数股权并控制。它汇聚了19家领先的投资公司、咨询机构和系统集成商，共同帮助各组织将前沿AI技术部署到生产环境中以实现商业影响。https://openai.com/index/openai-launches-the-deployment-company/

OpenAI 产品更新部署/工程

21:11

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选78

OpenAI 推出 DeployCo 以协助企业围绕智能构建业务

OpenAI 正式推出全新企业部署公司 DeployCo，旨在帮助各类组织将前沿人工智能技术投入实际生产，并转化为可衡量的商业影响。该举措标志着 OpenAI 进一步深入企业服务领域，专注于解决 AI 模型从测试到规模化部署的落地挑战，助力企业通过定制化部署方案提升运营效率与业务成果。

OpenAI 行业动态部署/工程

推荐理由：OpenAI 把部署单独拆成一家公司，说明企业落地不再是副业，而是和模型研发并列的支柱，做 toB 生意的同行可以重新想想自己的定位了。

20:48

Berryxia.AI@berryxia

一次将大模型的格式搞清楚！盘它！

本文梳理了本地大模型推理的主流格式。GGUF是llama.cpp推出的单文件格式，集成头文件、元数据和权重，加载快且支持灵活的K-quants量化（2-8bit），兼容llama.cpp等工具，适合CPU与低配设备跨平台使用。MLX是Apple为M系列芯片优化的框架，采用目录结构，在Mac上利用统一内存架构实现高效加载与处理，支持4bit量化，为Mac用户提供最佳体验。其他如PyTorch/Safetensors是训练分享标配，ONNX侧重跨框架部署。建议Mac用户优先MLX，跨平台或低配选GGUF，训练分享用Safetensors。

教程/实践端侧部署/工程

20:34

阿绎 AYi@AYi_AInotes

用户自建Claude中转站ccode.dev，宣称彻底解决模型冒充与售后难题

针对市场上Claude中转站普遍用Sonnet模型冒充Opus的问题，重度用户自建新站ccode.dev，宣称通过自研技术解决了信任痛点。该站经cctest.ai和hvoy.ai两个独立平台检测，显示为100%官方Claude Opus行为指纹，且延迟与速度表现优秀。其提供官方直连、AWS Bedrock和逆向渠道三种分层服务以确保稳定性，并推出1:1.5充值优惠及公测返额。此外，站点承诺假一赔三、支持开票与对公账户，旨在解决用户售后无门的普遍担忧。

产品更新部署/工程

18:53

Chubby♨️@kimmonismus

SK海力士正在测试英特尔的EMIB技术！这家全球排名第一的HBM供应商（为英伟达及整个AI热潮提供动力）刚开始接收英特尔EMIB基板，并正在运行真实的2.5D封装测试，结合HBM与逻辑芯片。这可能最终打破台积电CoWoS的垄断--让英特尔在AI封装竞赛中获得巨大推动（并解释其股价暴涨原因）减少对台湾依赖。增强美国实力？英特尔正重返赛道？

行业动态部署/工程

18:39

SenseTime@SenseTime_AI

精选72

SenseNova U1图像生成模型登陆ComfyUI平台

SenseNova U1图像生成模型现已在ComfyUI上可运行，并获得包括REBEL AI在内的评测者高度认可。REBEL AI发布的实践教程展示了该模型的部署工作流，并对其图像生成能力进行了真实场景测试。模型支持8步快速推理，生成速度极快，应用场景涵盖人像、超现实艺术、文字标志和生物设计等。相关资源已在Hugging Face、GitHub和Discord平台开放。

GitHub Hugging Face 图像生成模型发布

推荐理由：商汤把新模型U1的ComfyUI部署流程完整放出，还有实测视频，想在自己机器上跑国产图像模型的开发者可以直接抄作业了。

17:53

Chubby♨️@kimmonismus

Cerebras凭借其推理芯片能效优势，瞄准今年全球最大规模IPO

AI芯片制造商Cerebras Systems因IPO订单超出发行股票20倍以上，计划提高IPO规模和价格。市场普遍认为其芯片仅推理速度更快，但其核心优势在于能效。传统GPU在推理时受内存带宽限制，每个token生成都需从内存读取整个模型，导致算力闲置。Cerebras的Wafer-Scale Engine采用单一大芯片设计，以片上SRAM替代片外HBM，每次内存访问能耗降低约100倍。减少数据移动既降低了延迟，也显著减少了每token的功耗，这解释了其IPO被超额认购的原因。

推理行业动态部署/工程