AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「部署/工程」清除
5月12日周二
01:27Greg Brockman71OpenAI成立部署公司,助力企业AI落地应用
01:22Claude:Blog(网页)70精选Anthropic在AWS上正式推出Claude平台
01:02SemiAnalysis48台企厨房设备商现身英伟达服务器
00:35IT之家(RSS)57SpaceXAI 组建进行时,马斯克已提交商标注册申请
00:35阿绎 AYi63Anthropic在AWS推出直营平台,云锁定策略升级引关注
00:09The Decoder:AI News(RSS)66OpenAI子公司DeployCo采用Palantir策略,通过实验室无法模拟的工作流程构建护城河
00:04Claude62Claude平台在AWS全面上线
5月11日周一
23:35IT之家(RSS)69OpenAI 豪掷 40 亿美元成立新公司,要帮企业部署 AI
23:35IT之家(RSS)54MiniMax 启动"10x Team"合作计划,提供无限的 Token
22:54Runway:News(网页)68精选告别编写YAML:使用confingy配置机器学习系统
22:53Chubby♨️79OpenAI成立部署公司,深入企业AI应用层
22:34meng shao83OpenAI成立部署公司,携40亿美元助企业落地AI
22:31凡人小北82OpenAI 成立控股部署公司,联合投资机构与咨询公司构建生态
21:50向阳乔木64优化AI技能管理:统一目录与可视化工具推荐
21:38OpenAI69OpenAI成立部署公司,助力企业AI应用落地
21:11OpenAI:官网动态(RSS · 排除企业/客户案例)78精选OpenAI 推出 DeployCo 以协助企业围绕智能构建业务
20:48Berryxia.AI57一次将大模型的格式搞清楚!盘它!
20:34阿绎 AYi26用户自建Claude中转站ccode.dev,宣称彻底解决模型冒充与售后难题
18:53Chubby♨️56英特尔EMIB获SK海力士测试 或打破台积电封装垄断
18:39SenseTime72精选SenseNova U1图像生成模型登陆ComfyUI平台
17:53Chubby♨️60Cerebras凭借其推理芯片能效优势,瞄准今年全球最大规模IPO
16:34IT之家(RSS)60优必选与日立达成战略合作,Walker S2 机器人将进厂参与"造电梯"
16:34IT之家(RSS)57软银宣布已在日本正式启动电池业务,瞄准 AI 数据中心电力需求
13:49向阳乔木38企业级AI API管理需求催生专用网关市场
13:34IT之家(RSS)51英特尔 CEO 陈立武为英伟达黄仁勋授荣誉博士学位:两人开心牵手,合作开发新产品
13:34阿绎 AYi71中国移动上线AI模型中转平台MoMA,国家队入局AI基础设施竞争
10:34IT之家(RSS)61消息称英伟达 Vera Rubin 平台 7 月向主要 AI 客户出货,下半年大规模量产
08:23Hacker News 热门(buzzing.cc 中文翻译)61马里兰州居民被迫承担20亿美元的电网升级费用,只为服务州外的人工智能项目
07:45ginobefun50早报摘要:抗腐化结构、长时AI Agent与音频生成新路径
07:00Orange AI39未来团队核心是驾驭AI的"缰绳工程"
04:52Hacker News 热门(buzzing.cc 中文翻译)61本地人工智能应成为常态
03:43Hugging Face:Blog(RSS)74精选MachinaCheck:基于AMD MI300X构建多智能体CNC可制造性分析系统
03:00OpenRouter72NousResearch发布Hermes配置Pareto Code指南
01:34阿绎 AYi62邮件发送成本骤降,Cloudflare入局引发行业价格洗牌
01:29SemiAnalysis62速度即护城河:AMD ROCm软件栈性能在14天内提升超75倍
00:58elvis57智能体AI工作流的可扩展模式
5月10日周日
17:37The Decoder:AI News(RSS)56ByteDance计划投入超300亿美元扩张AI,大力押注国产芯片
16:37The Decoder:AI News(RSS)66GPT-5.5 成本较前代上涨 49% 至 92%,具体涨幅取决于输入长度
16:01宝玉64裁员潮将持续,直到我们学会发掘 AI 的商业价值【译】
15:32swyx 🌉66新加坡外长公开AI技术栈并将在AI工程师会议发表主题演讲
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月12日
01:27
Greg Brockman@gdb
71
OpenAI宣布成立一家由其控股的部署公司,旨在帮助企业成功部署和应用AI技术。该公司整合了19家领先的投资机构、咨询公司和系统集成商作为合作伙伴,并获得了40亿美元的初始投资。启动团队包括150名前沿部署工程师和部署专家,核心目标是协助各类组织将前沿AI技术投入生产环境,以产生实际的商业影响。

OpenAI: Today we're launching the OpenAI Deployment Company to help businesses build and deploy AI. It's majority-owned and cont...

OpenAI行业动态部署/工程
01:22
Claude:Blog(网页)
精选70
Anthropic在AWS上正式推出Claude平台

Anthropic公司正式在AWS上推出Claude平台,为AWS客户提供了通过其现有身份验证、账单及承诺消费抵扣使用完整Claude功能的新途径。该平台首次将全套Claude API功能引入AWS生态,新功能与原生API同日上线。平台包含Claude托管智能体、代码执行、文件API等多项核心功能,并支持最新模型。与Amazon Bedrock上的服务不同,此平台由Anthropic直接运营,数据在AWS边界外处理,适合需要完整平台体验的企业客户。服务将在多数AWS商业区域提供。

Anthropic产品更新部署/工程

推荐理由:Anthropic 第一次把完整 Claude 平台功能全量搬到 AWS 上,用 AWS 账号就能直接拿原生 API 最新特性,对于 AWS 生态里的开发者是个省心的一站式选择,不用再纠结该走 Bedrock 还是原生。
01:02
SemiAnalysis@SemiAnalysis_
48
众所周知,卫浴制造商Toto和鲜味发明者味之素正为AI提供动力,但你们听说过英伟达服务器里的台湾厨房设备供应商吗?(1/5) 🧵
行业动态部署/工程
00:35
IT之家(RSS)
57
SpaceXAI 组建进行时,马斯克已提交商标注册申请

马斯克已提交SpaceXAI商标申请,标志着其人工智能公司xAI正式并入SpaceX,成为其AI产品线。合并后实体估值达1.25万亿美元。SpaceXAI业务将聚焦太空算力,涵盖基于卫星的数据中心、轨道计算设施及AI服务。公司计划发射多达100万颗卫星构建轨道AI数据中心,并同步研发太空专用AI芯片。尽管愿景宏大,但该计划面临技术复杂性与商业可行性的双重挑战。

行业动态部署/工程
00:35
阿绎 AYi@AYi_AInotes
63
Anthropic在AWS推出直营平台,云锁定策略升级引关注

Anthropic在AWS正式推出Claude Platform,从通过Bedrock批发模型转变为直接运营。新平台使企业客户能使用与原生Claude完全同步的最新功能,包括测试版能力,并实现了与AWS的计费、身份认证和承诺消费额度无缝打通。此举提供了双轨选择:敏感数据项目可通过Bedrock留在AWS边界内,而追求创新的项目则可使用Platform获取最快最新的能力。这种深度集成大幅提高了企业更换AI模型的迁移成本,因为切换意味着要重构整个AWS的IAM、账单和权限体系,被视作强大的“云锁定”策略升级。

Claude: The Claude Platform on AWS is now generally available. AWS customers get the full set of Claude API features, with AWS a...

智能体Anthropic大佬观点部署/工程
00:09
The Decoder:AI News(RSS)
66
OpenAI子公司DeployCo采用Palantir策略,通过实验室无法模拟的工作流程构建护城河

OpenAI成立了一家名为DeployCo的控股子公司,专注于咨询和实施业务,旨在帮助企业将AI系统集成到核心运营中。这一举措借鉴了Palantir的策略,通过深入企业实际工作流程来构建竞争壁垒,这些复杂流程是实验室环境难以模拟的。DeployCo的成立标志着OpenAI正从单纯的技术提供者转向深度参与企业落地的服务方。

OpenAI行业动态部署/工程
00:04
Claude@claudeai
62
Claude平台现已在AWS全面上线。 AWS客户可获得全套Claude API功能,并享受AWS身份验证、计费及承诺金抵扣服务。
Anthropic产品更新部署/工程
5月11日
23:35
IT之家(RSS)
69
OpenAI 豪掷 40 亿美元成立新公司,要帮企业部署 AI

OpenAI宣布成立一家由其控股的新公司“OpenAI部署公司”,初始投资超40亿美元,旨在帮助企业搭建和落地AI系统。为快速壮大业务,OpenAI同时收购了AI咨询公司Tomoro,此举将引入约150名资深工程师与实施专员。Tomoro于2023年与OpenAI合作成立,客户包括美泰、红牛等企业。此举被视为OpenAI在竞争对手Anthropic企业级业务快速发展背景下,深化商业布局、推动技术大规模应用的关键举措。

OpenAI行业动态部署/工程
23:35
IT之家(RSS)
54
MiniMax 启动"10x Team"合作计划,提供无限的 Token

MiniMax宣布启动“10x Team”合作计划,旨在邀请各行业顶尖专业人士共同推动AI模型在特定领域的深度优化与十倍增长。该计划面向具备行业积累、能自主参与问题定义与工作流搭建的专业人士,提供无限Token、完整多模态模型能力及研发资源。合作采用全职入职或不少于四个月的Fellowship短期协作模式,办公地点覆盖上海、北京、香港、旧金山及伦敦。合作成果将开源并用于模型迭代,参与者可获得具国际竞争力的薪酬、股票激励及学术成果共享权益。此前,MiniMax已在工业软件、游戏引擎等多个领域与专家展开合作验证。

行业动态部署/工程
22:54
Runway:News(网页)
精选68
告别编写YAML:使用confingy配置机器学习系统

Runway开源了Python库confingy,旨在解决机器学习系统配置的长期痛点。该库允许开发者用纯Python代码(支持懒加载、类型检查和序列化)替代传统YAML配置文件,从而摆脱YAML作为图灵完备领域特定语言所带来的维护困境。confingy无需重构现有代码,即可满足跟踪构造函数参数、避免实例化昂贵对象(如大语言模型)等核心需求,有效改善了因复杂YAML配置导致的无法跳转定义、类型提示失效和重构困难等开发体验问题。

开源/仓库部署/工程

推荐理由:Runway把自家ML训练的YAML坑填平了,开源了confingy。如果你还在用YAML管实验参数,这可能是今年最该装的pip包。
22:53
Chubby♨️@kimmonismus
79
OpenAI成立部署公司,深入企业AI应用层

OpenAI正从单纯销售模型转向深入企业技术栈,其新成立的“部署公司”旨在通过“前沿部署工程师”帮助客户将AI深度集成到实际业务流程中。此举意在增强其企业市场竞争力,对标Palantir的深度集成服务模式。OpenAI收购Tomoro,将立即获得150名经验丰富的部署工程师与专家,以加速这一战略。其核心目标是成为AI经济的“部署层”,而不仅仅是模型提供商。

OpenAI: We've also agreed to acquire Tomoro, which will bring 150 experienced Forward Deployed Engineers and Deployment Speciali...

OpenAI行业动态部署/工程
22:34
meng shao@shao__meng
83
OpenAI成立部署公司,携40亿美元助企业落地AI

OpenAI宣布成立由其控股的独立子公司OpenAI Deployment Company,旨在帮助企业将前沿AI技术深度集成至核心业务流程。该公司通过收购英国咨询公司Tomoro获得了约150名部署专家,并联合了包括TPG、贝恩资本、高盛等在内的19家顶级投资机构和咨询集成商,形成覆盖数千家企业的服务网络。启动资金超过40亿美元,将用于扩大运营和持续收购。其核心工作模式是派遣“前置部署工程师”驻场,为客户量身定制并部署AI生产系统。

OpenAI: Today we're launching the OpenAI Deployment Company to help businesses build and deploy AI. It's majority-owned and cont...

OpenAI行业动态部署/工程
22:31
凡人小北@frxiaobei
82
OpenAI 成立控股部署公司,联合投资机构与咨询公司构建生态

OpenAI 成立由其控股的部署公司,引入麦肯锡、贝恩、凯捷等咨询公司及多家投资机构作为股东,旨在共同推动前沿AI在企业生产环境中的落地。其核心模式是私募机构提供资金与被投企业客户资源,咨询公司负责将AI深度集成至企业工作流,使OpenAI能快速承接庞大B端客户网络。几乎同时,Anthropic也与高盛等成立了类似合资公司。这标志着企业AI落地战役进入新阶段,单纯售卖API的模式面临瓶颈,深度驻场交付成为新竞争壁垒。预计国内厂商将跟进类似策略。

OpenAI: Today we're launching the OpenAI Deployment Company to help businesses build and deploy AI. It's majority-owned and cont...

OpenAI行业动态部署/工程
21:50
向阳乔木@vista8
64
优化AI技能管理:统一目录与可视化工具推荐

针对如何管理日益增长的AI技能(SKILL)以及同步Claude、Codex等不同AI工具的技能问题,建议将技能创建和管理目录统一设置在.agent/skills路径下。对于Claude、Codex等其他工具的目录,推荐使用软链接方式,以实现最大程度的兼容性。同时,推荐使用CC Switch的Skill管理工具,其可视化界面便于升级管理、点亮图标以及开启对不同工具的支持。

Yihui: 向大家讨教两个问题: 1. 你是如何管理日益增长的 SKILL 的? 2. 大家是如何同步 Claude Code 和 Codex 的 SKILL 的?有没有什么好的同步方案?

智能体教程/实践部署/工程
21:38
OpenAI@OpenAI
69
今天我们正式启动OpenAI Deployment Company,以帮助企业构建和部署人工智能。 该公司由OpenAI持有多数股权并控制。它汇聚了19家领先的投资公司、咨询机构和系统集成商,共同帮助各组织将前沿AI技术部署到生产环境中以实现商业影响。https://openai.com/index/openai-launches-the-deployment-company/
OpenAI产品更新部署/工程
21:11
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选78
OpenAI 推出 DeployCo 以协助企业围绕智能构建业务

OpenAI 正式推出全新企业部署公司 DeployCo,旨在帮助各类组织将前沿人工智能技术投入实际生产,并转化为可衡量的商业影响。该举措标志着 OpenAI 进一步深入企业服务领域,专注于解决 AI 模型从测试到规模化部署的落地挑战,助力企业通过定制化部署方案提升运营效率与业务成果。

OpenAI行业动态部署/工程

推荐理由:OpenAI 把部署单独拆成一家公司,说明企业落地不再是副业,而是和模型研发并列的支柱,做 toB 生意的同行可以重新想想自己的定位了。
20:48
Berryxia.AI@berryxia
57
一次将大模型的格式搞清楚!盘它!

本文梳理了本地大模型推理的主流格式。GGUF是llama.cpp推出的单文件格式,集成头文件、元数据和权重,加载快且支持灵活的K-quants量化(2-8bit),兼容llama.cpp等工具,适合CPU与低配设备跨平台使用。MLX是Apple为M系列芯片优化的框架,采用目录结构,在Mac上利用统一内存架构实现高效加载与处理,支持4bit量化,为Mac用户提供最佳体验。其他如PyTorch/Safetensors是训练分享标配,ONNX侧重跨框架部署。建议Mac用户优先MLX,跨平台或低配选GGUF,训练分享用Safetensors。

教程/实践端侧部署/工程
20:34
阿绎 AYi@AYi_AInotes
26
用户自建Claude中转站ccode.dev,宣称彻底解决模型冒充与售后难题

针对市场上Claude中转站普遍用Sonnet模型冒充Opus的问题,重度用户自建新站ccode.dev,宣称通过自研技术解决了信任痛点。该站经cctest.ai和hvoy.ai两个独立平台检测,显示为100%官方Claude Opus行为指纹,且延迟与速度表现优秀。其提供官方直连、AWS Bedrock和逆向渠道三种分层服务以确保稳定性,并推出1:1.5充值优惠及公测返额。此外,站点承诺假一赔三、支持开票与对公账户,旨在解决用户售后无门的普遍担忧。

产品更新部署/工程
18:53
Chubby♨️@kimmonismus
56
SK海力士正在测试英特尔的EMIB技术! 这家全球排名第一的HBM供应商(为英伟达及整个AI热潮提供动力)刚开始接收英特尔EMIB基板,并正在运行真实的2.5D封装测试,结合HBM与逻辑芯片。 这可能最终打破台积电CoWoS的垄断--让英特尔在AI封装竞赛中获得巨大推动(并解释其股价暴涨原因) 减少对台湾依赖。 增强美国实力? 英特尔正重返赛道?
行业动态部署/工程
18:39
SenseTime@SenseTime_AI
精选72
SenseNova U1图像生成模型登陆ComfyUI平台

SenseNova U1图像生成模型现已在ComfyUI上可运行,并获得包括REBEL AI在内的评测者高度认可。REBEL AI发布的实践教程展示了该模型的部署工作流,并对其图像生成能力进行了真实场景测试。模型支持8步快速推理,生成速度极快,应用场景涵盖人像、超现实艺术、文字标志和生物设计等。相关资源已在Hugging Face、GitHub和Discord平台开放。

GitHubHugging Face图像生成模型发布

推荐理由:商汤把新模型U1的ComfyUI部署流程完整放出,还有实测视频,想在自己机器上跑国产图像模型的开发者可以直接抄作业了。
17:53
Chubby♨️@kimmonismus
60
Cerebras凭借其推理芯片能效优势,瞄准今年全球最大规模IPO

AI芯片制造商Cerebras Systems因IPO订单超出发行股票20倍以上,计划提高IPO规模和价格。市场普遍认为其芯片仅推理速度更快,但其核心优势在于能效。传统GPU在推理时受内存带宽限制,每个token生成都需从内存读取整个模型,导致算力闲置。Cerebras的Wafer-Scale Engine采用单一大芯片设计,以片上SRAM替代片外HBM,每次内存访问能耗降低约100倍。减少数据移动既降低了延迟,也显著减少了每token的功耗,这解释了其IPO被超额认购的原因。

推理行业动态部署/工程
16:34
IT之家(RSS)
60
优必选与日立达成战略合作,Walker S2 机器人将进厂参与"造电梯"

优必选与日立(中国)有限公司签署战略合作协议,共同探索人形机器人在智能制造场景中的应用,以推动制造业智能化转型。合作涵盖电梯、楼宇系统、医疗健康、工业设备及半导体制造设备等领域,结合优必选的技术优势和日立的系统集成经验。目前合作已进入实质性验证阶段,日立在部分制造场景引入优必选的工业级人形机器人Walker S2,并围绕电梯智能制造现场开展深度二次开发,实现全流程柔性化智能流转与数据贯通。

具身智能行业动态部署/工程
16:34
IT之家(RSS)
57
软银宣布已在日本正式启动电池业务,瞄准 AI 数据中心电力需求

软银集团在日本大阪启动电池业务,以满足AI数据中心激增的电力需求。业务将研发生产电芯及储能系统,计划2028财年投产,并优先供应自有数据中心。软银与韩国企业合作,研发采用水系电解液、火灾风险更低的锌卤素电芯,以及高容量储能集装箱。该业务是软银AI基础设施投资的重要部分,目标到2030财年销售额突破1万亿日元。

行业动态部署/工程
13:49
向阳乔木@vista8
38
企业级AI API管理需求催生专用网关市场

随着企业广泛应用GPT、Claude等AI模型,如何安全、高效地管理和分配内部员工的AI API调用权限成为普遍痛点。出于数据安全考虑,企业通常不会直接使用普通中转服务。尽管Azure和亚马逊云提供相关解决方案,但不同公司的规模与定制化需求差异显著,这为专门的企业级API网关产品创造了市场空间。海外已有此类产品出现,国内市场也存在相应机会。

现象/趋势部署/工程
13:34
IT之家(RSS)
51
英特尔 CEO 陈立武为英伟达黄仁勋授荣誉博士学位:两人开心牵手,合作开发新产品

英伟达CEO黄仁勋在卡内基梅隆大学获科学与技术荣誉博士学位,由英特尔CEO陈立武授位。陈立武透露双方正基于此前英伟达的50亿美元投资,合作开发新产品。合作核心是通过NVLink技术整合英伟达AI加速计算与英特尔x86 CPU架构。具体包括:英特尔将制造集成英伟达RTX GPU的x86系统芯片用于PC,并为英伟达制造定制x86 CPU用于数据中心AI平台。双方目标直指深度集成NVLink的新一代至强处理器及AI主机节点,未来Serpent Lake处理器也将采用此联合方案。

行业动态部署/工程
13:34
阿绎 AYi@AYi_AInotes
71
中国移动上线AI模型中转平台MoMA,国家队入局AI基础设施竞争

中国移动推出的AI模型中转平台MoMA,标志着“国家队”正式进入AI基础设施领域。该平台已接入DeepSeek、通义千问等300多个主流模型,并通过央视新闻进行宣传。其核心逻辑在于,AI中转站被视为未来AGI时代的“智能电网”,是掌握行业定价权与未来的关键。用户可在移动云官网搜索“MoMA”获取体验包,建议先行测试实际效果。此举意味着AI行业竞争已上升至基础设施层面。

阿绎 AYi: 说个暴论,AI 行业的天,今天真的要变了, 前几天刚写了几篇推文分析过孙哥和特朗普家族为啥下场做AI 中转站,底层逻辑是中转站本质是AI水电煤的生意。 结果今天就看到央视新闻,中国移动上线了AI中转站! 各大社区里很多人都以为中国移动发的 ...

产品更新部署/工程
10:34
IT之家(RSS)
61
消息称英伟达 Vera Rubin 平台 7 月向主要 AI 客户出货,下半年大规模量产

据报道,英伟达已敲定Vera Rubin AI平台最终生产方案,将分阶段上市。试产将于下月启动,首批产品计划7月出货至北美大型AI数据中心及云服务商,微软、谷歌、亚马逊、Meta和甲骨文等预计成为首批客户。该平台芯片采用台积电3nm工艺制造,富士康、广达、纬创资通等合作伙伴将于下半年启动全面量产,并在第三季度大规模出货。据悉,单个Vera Rubin AI服务器机柜价值约1.8亿美元,并配备强大的软件生态系统。

产品更新数据/训练部署/工程
08:23
Hacker News 热门(buzzing.cc 中文翻译)
61
马里兰州居民被迫承担20亿美元的电网升级费用,只为服务州外的人工智能项目

马里兰州居民将承担高达20亿美元的电网升级费用,以支持主要为州外人工智能数据中心供电的项目。该州已向联邦能源监管机构投诉,认为这笔额外成本违反了保护本地用户的承诺。升级计划旨在满足数据中心急剧增长的电力需求,但费用转嫁至本州居民,引发了关于成本分摊公平性的争议。

政策/监管行业动态部署/工程
07:45
ginobefun@hongming731
50
早报摘要:抗腐化结构、长时AI Agent与音频生成新路径

Eric Ries提出用公益公司章程等“不锈钢螺栓”结构将使命嵌入组织,以对抗成功后的腐化。Eric Allam探讨长时AI Agent的持久化方案,通过分层实现毫秒级恢复。Samuel Humeau展示音频生成正复刻LLM技术路径,并以17毫秒首包延迟为当前标杆。

智能体现象/趋势语音部署/工程
07:00
Orange AI@oran_ge
39
推文指出,未来每个团队的核心工作将是"harness工程",即构建和管理能够有效驾驭、引导AI模型(如GPT、Claude、LLaMA)的框架与系统。这要求团队中的每个人都理解并掌握这套方法论。尽管其中存在一些非共识的观点,但被引用的文章被认为是对这一领域趋势的出色综述,为理解未来的工作范式提供了关键参考。

宝玉: http://x.com/i/article/2053591256110940160

现象/趋势部署/工程
04:52
Hacker News 热门(buzzing.cc 中文翻译)
61
本地人工智能应成为常态

文章主张本地人工智能应成为常态,而非依赖云端服务。当前AI工具大多基于云端,存在延迟、隐私、成本和网络依赖等问题。本地AI模型在个人设备上运行,能提供即时响应、更好保护隐私、降低长期成本并确保离线可用。随着硬件性能提升和模型优化,本地运行7B至13B参数级别的模型已具备可行性。这一转变将使用户真正掌控自己的AI助手,推动技术向更开放、可定制和以用户为中心的方向发展。

开源生态现象/趋势部署/工程
03:43
Hugging Face:Blog(RSS)
精选74
MachinaCheck:基于AMD MI300X构建多智能体CNC可制造性分析系统

MachinaCheck是一款基于多智能体AI的系统,旨在革新小型CNC机加工车间的报价分析流程。传统上,车间经理需花费30-60分钟手动分析图纸,而该系统在上传STEP文件及材料、公差等简单输入后,能在30秒内生成完整的可制造性报告,明确指出零件能否制造、所需工具及生产前需采取的行动。其核心在AMD MI300X加速卡上本地运行Qwen 2.5 7B模型,利用192GB HBM3显存确保客户设计数据无需离开本地,满足了制造业对数据隐私的严格要求。系统采用五组件流水线,结合精确的几何特征提取与LLM的制造知识推理,最终输出结构化报告。

智能体Hugging Face开源/仓库端侧

推荐理由:虽然是hackathon项目,但用多Agent做CNC可行性分析,把推理全压在本地AMD显卡上保护图纸隐私,还给了可跑的代码和Space,制造业AI落地就该这么直接。
03:00
OpenRouter@OpenRouter
72
@NousResearch 关于如何在 Hermes 中设置 Pareto Code 的文档:https://hermes-agent.nousresearch.com/docs/user-guide/configuration#openrouter-routing--pareto-code-for-auxiliary-tasks

OpenRouter: Introducing Pareto Code: a new, free, experimental coding router Set `min_coding_score` in your request and route to the...

产品更新编码部署/工程
01:34
阿绎 AYi@AYi_AInotes
62
邮件发送成本骤降,Cloudflare入局引发行业价格洗牌

Levelsio的推文揭示了电子邮件发送服务正快速商品化。价格对比显示,发送百万封邮件的月费差异巨大:Postmark为1206美元,Resend为650美元,SendGrid为600美元,而Cloudflare仅需354美元,Amazon SES甚至低至100美元。传统提供商在SDK和投递可靠性上的优势已消失,AI工具(如Cursor或Claude)能通过迁移提示在十分钟内完成系统切换,极大降低了技术门槛和集成成本。Cloudflare的定价已接近SES,同时提供更优的域名管理和生态体验,预计将推动独立开发者及中小型SaaS向低成本方案迁移。

@levelsio: ✉️ Trying @Cloudflare's new Email Sending feature today If you send 1,000,000 emails per month: - Postmark: $1,206/mo - ...

现象/趋势部署/工程
01:29
SemiAnalysis@SemiAnalysis_
62
速度即护城河:AMD ROCm软件栈性能在14天内提升超75倍

自DeepSeek-V4发布后14天内,AMD ROCm软件栈性能提升超过75倍。这一飞跃主要得益于融合mHC操作和RoPE哈达玛变换,有效降低了CPU开销并提高了HBM内存利用率。同时,团队使用TileLang和Triton快速开发了注意力索引器和KV缓存压缩器等核心组件。为追赶业界标杆,AMD仍需再提升5倍性能以匹配单节点聚合B200,并额外提升1.5倍以达到PD disaggregated B200水平,预计未来几周内有望实现这一目标。此快速进展离不开HaiShaw、Thomas、@roaner和@AnushElangovan等人的贡献。

产品更新开源生态部署/工程
00:58
elvis@omarsar0
57
智能体AI工作流的可扩展模式

智能体RAG流程的瓶颈通常不在大语言模型调用,而在于底层数据平面的序列化与分布式协调开销。新研究提出的AAFLOW是一个统一分布式运行时,将智能体工作流建模为基于Apache Arrow和Cylon的算子抽象,通过零拷贝数据平面直接连接预处理、嵌入和检索环节,并采用资源确定性调度与异步批处理降低协调成本。该方案实现了高达4.64倍的流水线加速,嵌入与更新阶段性能提升2.8倍,且所有收益均源于数据流优化,并未涉及大语言模型推理加速。

智能体arXiv论文/研究部署/工程
5月10日
17:37
The Decoder:AI News(RSS)
56
ByteDance计划投入超300亿美元扩张AI,大力押注国产芯片

字节跳动将2026年人工智能支出计划上调至超过2000亿元人民币(约合300亿美元),较原计划至少增长25%。公司正加速转向采用国产芯片。然而,这一投入规模与谷歌、亚马逊、微软和Meta四家公司合计规划的7250亿美元相比,仍显保守。

行业动态部署/工程
16:37
The Decoder:AI News(RSS)
66
GPT-5.5 成本较前代上涨 49% 至 92%,具体涨幅取决于输入长度

OpenAI 将 GPT-5.5 的官方定价较 GPT-5.4 提高了一倍,声称更短的响应能抵消成本上涨。但 OpenRouter 对实际使用数据的分析显示,真实成本涨幅在 49% 到 92% 之间,具体取决于输入长度。与此同时,Anthropic 也提高了其 Opus 4.7 模型的价格。由于两家公司都在考虑首次公开募股,这一涨价趋势可能将持续。

OpenAI行业动态部署/工程
16:01
宝玉@dotey
64
裁员潮将持续,直到我们学会发掘 AI 的商业价值【译】

企业AI使用量激增,代码生成量暴涨,但收入未同步增长。核心问题在于企业混淆了“投入”与“成果”:AI生成的大量代码只是成本投入,而非能带来收入的商业成果。AI按Token消耗定价,增加了企业成本,却未直接提升价值。过去开发资源有限迫使团队聚焦高价值想法,如今“代码免费”导致糟糕想法和团队协作问题激增,浪费资源。为抵消激增的AI支出并维持现金流,裁员成为直接的财务手段。只有当企业学会将AI增加的成本转化为相应收入增长时,裁员潮才可能停止。

现象/趋势部署/工程
15:32
swyx 🌉@swyx
66
新加坡外长公开AI技术栈并将在AI工程师会议发表主题演讲

新加坡外交部长维维安·巴拉克里希南将在@AIDOTENGINEER新加坡会议上发表主题演讲,分享他使用开源AI工具构建“第二大脑”工作流的经验。此前,他在GitHub上公开了个人AI技术栈的完整架构,涉及树莓派、Claude、本地嵌入和知识图谱等技术,这一举动受到全球AI社区关注,体现了政府高层对AI技术的直接、公开且务实的参与态度。继英国设立首席AI官后,新加坡内阁部长的深度参与标志着政府正积极拥抱AI。巴拉克里希南的实践表明,有意义的AI讨论应超越抽象层面,需通过实际技术参与来理解其参数,而新加坡正成为此类深度实践的发生地。

agrim singh: Where in the world can you find a senior government leader with a personal AI stack published on GitHub? How many would ...

开源生态行业动态部署/工程
‹ 上一页
1…3536373839…50
下一页 ›