AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「部署/工程」清除
6月6日周六
18:31Chubby♨️53xAI/SpaceX 出租 Colossus 算力,进军基础设施
17:17IT之家(RSS)69SpaceX IPO获约1500亿美元认购,两倍超额认购
17:10凡人小北60AI使用率成古德哈特定律新例证
16:17IT之家(RSS)52英伟达 Rubin 机架内存配置被误读,美光市值蒸发逾 1000 亿美元
12:06Simon Willison 博客67Simon Willison 发布 micropython-wasm:基于 WebAssembly 的 Python 沙箱执行方案
10:25小互69Google每月9.2亿美元向SpaceX购买算力
09:07Claude Code:GitHub Releases(RSS)64同事件精选Claude Code v2.1.166 发布同一事件,精选展示《Claude Code v2.1.163 发布》
09:03SemiAnalysis49Makora AI 顺序蒙特卡洛推测解码
08:16IT之家(RSS)60月付 9.2 亿美元:谷歌租赁马斯克 SpaceX 的 AI 算力,约 11 万英伟达 GPU、CPU 等
08:00HuggingFace Daily Papers(社区热门论文)59CHIAR-Former:明暗注意力--在黑暗中分配计算
06:57MarkTechPost(RSS)57Qualcomm AI Hub实战教程:使用MobileNet-V2和YOLOv7进行分类、目标检测与硬件感知部署
06:47Hugging Face:Blog(RSS)74精选用Qwen2.5-3B构建多智能体经济体:工程报告
05:29Rohan Paul78SpaceX获Anthropic与Google月付21.7亿美元GPU算力,Alphabet持股回报近百倍
04:59Rohan Paul77精选SpaceX与Google达成云计算新协议
04:23Emad73SpaceX AI云收入260亿美元年运行率逼近Azure
04:13Microsoft Research60微软Project Mosaic:micro-LED光学互连技术
02:30Chubby♨️71Gemma 4 QAT 模型发布:本地设备内存需求低至 1GB
01:40Replit ⠕34Replit 10分钟整合12 Drive建AI中心
01:12Google Developers Blog(RSS)75精选Google Colab CLI 发布
01:10Replit ⠕68同事件精选Replit Canvas:AI设计UI并快速转应用同一事件,精选展示《Replit Canvas:智能体设计工具发布》
00:50Epoch AI76精选AI热推高美国计算基建GDP占比翻倍
6月5日周五
23:15IT之家(RSS)73同事件精选苹果新版 Siri 不会被宣传为完成品,内部将其标记为"Beta"版同一事件,精选展示《受 DMA 影响,Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线》
22:30Cloudflare Blog71精选你的AI账单失控了。Cloudflare现在可以解决这个问题。
22:15IT之家(RSS)56华为云联合20余家模型厂商发布"百模千态,云聚共赢"生态合作计划
20:01Artificial Intelligence News(RSS)57C3 AI 智能体将帮助 Shell 实现预测性维护自动化
19:27MarkTechPost(RSS)61Microsoft Fara 教程:在 Google Colab 中使用模拟 OpenAI 兼容端点运行浏览器智能体
19:27MarkTechPost(RSS)62NVIDIA AI 发布 Dynamo Snapshot:基于 CRIU 的 Kubernetes AI 推理快速启动系统
19:22公众号:腾讯混元62精选腾讯混元提出Stem稀疏注意力算法,被ICML 2026收录
18:15IT之家(RSS)61消息称LG将引进1万块英伟达Blackwell GPU,为其迄今最大规模
18:15IT之家(RSS)58视觉内容社交平台 Pinterest 为 AI 服务导入亚马逊 AWS Trainium 芯片
17:48HuggingFace Daily Papers(社区热门论文)51SigmaScale:基于SVD低秩分解与学习缩放矩阵的LLM压缩方法
15:15IT之家(RSS)54Meta 借鉴特斯拉,在帐篷里建造数据中心
14:22Alibaba Cloud65阿里云发布SkillClaw与Nacos的Agent技能进化循环
14:22Alibaba Cloud29阿里云AI驱动QoderWork重塑团队协作
14:22Alibaba Cloud76精选PolarDB-X Zero 上线:30秒全分布式数据库
14:19AYi68开源AI内容创作系统:AI同事自动接力
13:07DogeDesigner79马斯克在JP摩根炉边谈话宣布SpaceX将因星链和轨道AI数据中心建设而上市
10:48Hacker News 热门(buzzing.cc 中文翻译)51Transformer 需要三个投影吗?--对 QKV 变体的系统研究
10:28SemiAnalysis59NVIDIA开源Rubin NVSwitch Tray含AMD CPU
10:21Alibaba Cloud56阿里云EventHouse破解Agent上下文瓶颈
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月6日
18:31
Chubby♨️@kimmonismus
53
xAI/SpaceX 正逐渐成为一家 AI 基础设施供应商,可能成为前沿 AI 计算最重要的"新超大规模商"之一。 Grok 不错,但它的用户群仍然相对较小。从这个意义上说,将 Colossus 重新用于出租算力是一个明智之举;该领域的利润率高达 30% 以上。
大佬观点部署/工程
17:17
IT之家(RSS)
69
SpaceX IPO获约1500亿美元认购,两倍超额认购

据知情人士消息,SpaceX IPO已吸引约1500亿美元认购需求,约为计划募资750亿美元的两倍。目前仍处路演早期,预计下周定价。路演材料强调其火箭发射业务的独特性——过去三年全球大部分轨道载荷由SpaceX完成,以及Starlink的增长实力。SpaceX还称AI业务对应市场机会可达23万亿美元,并自认是唯一能利用太空建设AI算力的公司,以弥补美国发电量和计算能力缺口。

行业动态部署/工程
17:10
凡人小北@frxiaobei
60
AI使用率是古德哈特定律的又一个经典例子。 评估任何一件事情都需要指标, 在没有一个更有衡量价值的指标的情况下,大家都选择了一个没那么坏的指标。

Gergely Orosz: "My company did layoffs a few weeks ago. The main metric for productivity is AI usage (% of PRs with AI assistance) and ...

现象/趋势部署/工程
16:17
IT之家(RSS)
52
英伟达 Rubin 机架内存配置被误读,美光市值蒸发逾 1000 亿美元

SemiAnalysis 简报预估英伟达 Rubin NVL72 的 SOCAMM 容量从 55TB 降至 28TB,每处理器配 768GB(96GB 模块),美光股价盘中跌超 10%,市值蒸发超 1000 亿美元。市场误读“初始配置下调”:主因是 2026 年 LPDDR5X 供应紧张,且 SOCAMM2 模块可拆卸升级(可换 192GB/256GB)。每颗 Rubin GPU 搭载 288GB HBM4(72 颗共 20.7TB)保持不变。

行业动态部署/工程
12:06
Simon Willison 博客
67
Simon Willison 发布 micropython-wasm:基于 WebAssembly 的 Python 沙箱执行方案

Simon Willison 发布 alpha 包 micropython-wasm,用于在 Python 应用中安全执行代码。该包将 MicroPython 编译为 WebAssembly,通过 wasmtime 库运行,实现内存和 CPU 限制、严格的文件与网络访问控制,并支持主机函数交互。它可作为 Datasette Agent 的沙箱插件 datasette-agent-micropython。

开源/仓库部署/工程
10:25
小互@xiaohu
69
Google每月9.2亿美元向SpaceX购买算力

SpaceX公布文件显示,Google与其签订协议,从2026年10月至2029年6月,每月支付9.2亿美元购买算力,具体包括约110,000个NVIDIA GPU、CPU、内存及其他组件。此前Anthropic也已向SpaceX每月支付12.5亿美元购买算力。两项协议合计每年带来约260亿美元收入。

Google行业动态部署/工程
09:07
Claude Code:GitHub Releases(RSS)
同事件精选64
Claude Code v2.1.166 发布

Claude Code v2.1.166 新增 fallbackModel 设置,最多配置三个后备模型在主模型过载或不可用时按序尝试;--fallback-model 现也适用于交互会话。deny rule 中工具名位置支持 glob 模式("*"拒绝所有工具),未知工具名启动时警告。跨会话消息中继不再携带用户权限,接收方拒绝被中继的权限请求。MAX_THINKING_TOKENS=0、--thinking disabled 及逐模型 thinking 开关可禁用默认开启思考的模型(仅 Claude API,第三方不变)。API 返回非预期不可重试错误时,在后备模型上重试一次。修复了图像处理失败、远程会话卡死、JetBrains IDE 终端闪烁、Kitty 键盘协议下 Shift+非 ASCII 字符丢失、PowerShell 命令验证挂起、macOS 后台进程孤儿化等问题。

智能体Anthropic产品更新部署/工程
同一事件,精选展示《Claude Code v2.1.163 发布》
推荐理由:Claude Code 重度用户该升级了,fallbackModel 让你设三个备用模型防止高峰期罢工,跨会话安全加固也让自动模式更敢放任跑了。
09:03
SemiAnalysis@SemiAnalysis_
49
@makora_ai 的顺序蒙特卡洛推测解码将多个草案 token 并行保持存活,而不是回退失败的匹配。
推理论文/研究部署/工程
08:16
IT之家(RSS)
60
月付 9.2 亿美元:谷歌租赁马斯克 SpaceX 的 AI 算力,约 11 万英伟达 GPU、CPU 等

谷歌与 SpaceX 达成云计算合作,自 2026 年 10 月起至 2029 年 6 月,每月向 SpaceX 支付 9.2 亿美元(约 62.46 亿元人民币),租用至少 11 万张英伟达 GPU 及 CPU 等芯片对应的计算能力,用于训练和推理 AI 等高密度场景。该合作既缓解谷歌算力供应紧张与扩容周期压力,也为 SpaceX 的人工智能业务新增重要收入来源,为其 IPO 提供叙事筹码。

Google行业动态部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
59
CHIAR-Former:明暗注意力--在黑暗中分配计算

CHIAR-Former 是一种 4 层混合 Transformer,根据每个 token 的谱熵将其路由至 DCT 谱混合或全自注意力(RBF 核混合在消融中被拒绝)。仅含 DCT+注意力的变体在 WikiText-103 上获得 Val PPL 36.54,相比全注意力基线(PPL 66.62)提升 45%,同时减少 62.5% 注意力 FLOPs。在 WikiText-2、IMDB 情感分类和 ListOps 上的评估表明,模型在大规模自然文本中因 token 多样性受益,而全注意力在小数据集和合成任务中仍占优势。

arXiv推理论文/研究部署/工程
06:57
MarkTechPost(RSS)
57
Qualcomm AI Hub实战教程:使用MobileNet-V2和YOLOv7进行分类、目标检测与硬件感知部署

该教程演示如何配置Qualcomm AI Hub Models,运行MobileNet-V2推理与YOLOv7目标检测,并在真实设备上完成模型编译。

教程/实践端侧部署/工程
06:47
Hugging Face:Blog(RSS)
精选74
用Qwen2.5-3B构建多智能体经济体:工程报告

开发者用Qwen2.5-3B构建了五人森林生物多智能体经济体,每个智能体独立运行,通过vLLM部署在Modal,以Gradio为交互窗口。3B模型在100%调用中输出有效JSON,但经济判断能力弱。通过设计稀缺性(食物品种限制、易腐坏、冬季燃料危机)和优化提示词(禁止买入自产物品、给出示例)提升决策质量。15轮模拟中,蜜价从10跌至3、柴价从4涨至7、财富基尼系数从0.14扩至0.38。项目展示了小模型可靠格式化与不可靠推理之间的工程填补。

智能体Hugging Face教程/实践部署/工程

推荐理由:我觉得这是近期最诚实的小模型工程复盘,把为什么不换大模型、怎么靠提示修正推理、怎样设计系统稀缺性讲透了,比看十篇论文有实操价值。
05:29
Rohan Paul@rohanpaul_ai
78
SpaceX获Anthropic与Google月付21.7亿美元GPU算力,Alphabet持股回报近百倍

Anthropic此前承诺每月向SpaceX支付12.5亿美元GPU算力。Google新披露的云服务协议每月再付9.2亿美元(年化约110亿美元),两家AI实验室合计月付21.7亿美元,年化营收达260亿美元。Alphabet于2015年以约9亿美元入股SpaceX约7%,当前SpaceX目标IPO估值1.75万亿美元,其6.11%股份对应约1070亿美元,投资回报约97-119倍。业务转向显示AI算力正成为战略商品。

Rohan Paul: SpaceX just disclosed a new Cloud Service Agreement with Google. Google to pay SpaceX $920 million a month (about $11B a...

AnthropicGoogle行业动态部署/工程
关联讨论 1 条Hacker News 热门(buzzing.cc 中文翻译)
04:59
Rohan Paul@rohanpaul_ai
精选77
SpaceX 刚刚披露了一份与 Google 的新云服务协议。 Google 将每月向 SpaceX 支付 9.2 亿美元(约合每年 110 亿美元),用于 xAI 数据中心的计算能力。 这再次表明,AI 算力正成为一种战略性商品,就像发射能力或能源一样,而那些能够为庞大的 GPU 集群提供资金、电力、冷却和运营的公司,可能会在其原有业务之外获得巨大的杠杆优势。
GooglexAI行业动态部署/工程
关联讨论 1 条Hacker News 热门(buzzing.cc 中文翻译)
推荐理由:谷歌每月斥资9.2亿美元租用xAI算力,这已经不只是一份商业合同,而是AI基础设施的定价锚点。算力正在变成战略资源,做云的和做芯片的都该重新估算自己的位置。
04:23
Emad@EMostaque
73
SpaceX作为最大neocloud,其AI云收入年运行率已达260亿美元,与Google Cloud和AWS相当,正逼近Azure(370亿美元)。据SpaceX修订的S-1文件披露,其与谷歌签署大额协议:2026年10月至2029年6月每月9.2亿美元,双方可提前90天通知终止。Emad Mostaque指出,这一交易规模相当于CoreWeave的整个收入。

Shaun Maguire: SpaceX just quietly amended its S-1 announcing another mega deal $920M/month from Google from October 2026 through June ...

Google大佬观点部署/工程
04:13
Microsoft Research@MSFTResearch
60
微软Project Mosaic:micro-LED光学互连技术

微软Azure CTO Mark Russinovich在Build 2026上介绍Project Mosaic,这是微软剑桥研究院的实验性光学互连技术,采用micro-LED实现低功耗、高速数据传输。高级研究员Kaoutar Benyahya现场演示单个LED调制形成字母,证明概念具备实时响应能力。

Microsoft论文/研究部署/工程
02:30
Chubby♨️@kimmonismus
71
Gemma 4 QAT 模型发布:本地设备内存需求低至 1GB

Google DeepMind 发布 Gemma 4 QAT 量化感知训练模型,专为本地 / 设备端优化。通过量化感知训练减少内存占用,同时相比标准训练后量化保留更多质量。支持 Q4_0 格式及新的移动专用量化格式。Gemma 4 E2B 版本可运行于约 1GB 内存,纯文本版本甚至低于 1GB,使手机、笔记本、边缘设备和消费级 GPU 上的本地 AI 更实用。

DeepMindGoogle模型发布端侧
01:40
Replit ⠕@Replit
34
Luca 构建了 Grid,将 12 个不同的 Google Drive 集中到一个中心。 借助 Replit,他只需 10 分钟就将一个提示词变成了 AI 驱动的员工中心。现在,团队成员可以询问从座位图到费用政策的任何问题。 Always Be Building.
产品更新部署/工程
01:12
Google Developers Blog(RSS)
精选75
Google Colab CLI 发布

Google 推出 Colab 命令行界面(CLI),允许开发者和 AI 智能体将本地终端连接到远程 Colab 运行时,实现无摩擦执行。该轻量级 CLI 支持请求高性能 GPU、远程运行本地 Python 脚本,并检索工件日志或模型(如微调后的 Gemma 3 适配器)。工具可直接集成到标准终端环境,可被 Antigravity、Claude Code 等 AI 智能体调用以管理复杂机器学习流水线。

GoogleMCP/工具产品更新部署/工程
关联讨论 1 条MarkTechPost(RSS)
推荐理由:对于习惯在 Colab 上薅免费 GPU 的开发者,这个 CLI 把本地开发、远程跑训练这套流程的摩擦降到了几乎为零,而且直接对接 AI agent,实验自动化往前迈了一大步。
01:10
Replit ⠕@Replit
同事件精选68
你试过新的 Replit Canvas 了吗? - 用 AI 创建美观的 UI 设计 - 使用 GPT-Image 2 & Seedance 生成素材 - 几分钟内将你的设计转化为可发布的应用
OpenAI产品更新图像生成部署/工程
同一事件,精选展示《Replit Canvas:智能体设计工具发布》
推荐理由:Replit Canvas 把 GPT-Image 2 和 Seedance 直接嵌进 UI 设计流程,让不会画图的开发者也能几分钟出一个看得过去的 App 原型,对非设计师的独立开发者是实打实的效率提升。
00:50
Epoch AI@EpochAIResearch
精选76
AI 热潮使计算基础设施占美国 GDP 比重翻倍。 2026 年第一季度,与 AI 相关的数据中心建设、计算硬件和网络设备投资约占美国 GDP 的 0.8%,推动整个计算基础设施占 GDP 比重达到约 1.5%。
行业动态部署/工程

推荐理由:Epoch AI 直接把 AI 算力投资算进了 GDP,占比从 0.4% 窜到 0.8%,翻倍速度超过多数实体产业,这已经不是技术新闻,是宏观分析师必须盯的指标了。
6月5日
23:15
IT之家(RSS)
同事件精选73
苹果新版 Siri 不会被宣传为完成品,内部将其标记为"Beta"版

苹果新版Siri被内部标记为“Beta”版,不会作为完成品宣传;可能设置等待清单供用户尝试。iOS 27细节:通知到达重新设计,通知中心手势移至左上角;“查找”应用视觉重设计;照片“清理”功能改进;大量底层安全改进。部分Siri查询将通过Google Cloud调用授权版Gemini,并使用谷歌的NVIDIA Blackwell B200集群处理。

Google行业动态语音部署/工程
同一事件,精选展示《受 DMA 影响,Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线》
推荐理由:古尔曼这料把苹果的策略摊开了,Siri不再死守自研,用谷歌Gemini加英伟达芯片,对追求隐私的苹果是转折点,但标Beta也说明离成熟还远。
22:30
Cloudflare Blog
精选71
你的AI账单失控了。Cloudflare现在可以解决这个问题。

Cloudflare AI Gateway新增实时消费限制功能,防止跨多个AI提供商的token账单失控。通过与Cloudflare Access集成,企业可以使用基于身份的预算和策略管理AI使用成本。

产品更新部署/工程

推荐理由:Cloudflare AI Gateway 新加的实时花费限制,直接掐住 token 账单失控的命门,对重度依赖多模型的团队来说,这比任何新模型发布都更实在。
22:15
IT之家(RSS)
56
华为云联合20余家模型厂商发布"百模千态,云聚共赢"生态合作计划

华为云在INSPIRE创想者大会上联合智谱、DeepSeek、MiniMax、Kimi等20余家厂商发布“百模千态,云聚共赢”计划,共建系统化商业生态。同时推出Agentic Infra新范式及四大新品:AICS灵衢智算集群支持10万卡级规模、总算力200EFLOPS、Token生成时延低于10毫秒、千卡吞吐500万Tokens/秒、可用性99.95%;AMS记忆存储方案实现PB级记忆空间并支持KV Cache分层池化;CCE VolcanoNext通智一体化调度引擎提升资源利用率超30%;AgentSphere羽量级沙箱实现100毫秒级启动与每分钟十万级批创能力。

智能体产品更新部署/工程
20:01
Artificial Intelligence News(RSS)
57
C3 AI 智能体将帮助 Shell 实现预测性维护自动化

壳牌(Shell)将利用 C3 AI 的智能体(agents),从基础异常检测转向全自动预测性维护。目前壳牌已在上下游运营中使用 C3 AI Reliability Suite 监控超过 30,000 个关键设备,未来将借助 AI 智能体进一步自动化维护流程。

智能体行业动态部署/工程
19:27
MarkTechPost(RSS)
61
Microsoft Fara 教程:在 Google Colab 中使用模拟 OpenAI 兼容端点运行浏览器智能体

一篇实践指南,介绍如何在 Google Colab 中运行 Microsoft Fara,使用模拟的 OpenAI 兼容端点测试浏览器智能体循环。

智能体Microsoft教程/实践部署/工程
19:27
MarkTechPost(RSS)
62
NVIDIA AI 发布 Dynamo Snapshot:基于 CRIU 的 Kubernetes AI 推理快速启动系统

NVIDIA Dynamo Snapshot 使用 CRIU 和 cuda-checkpoint 工具,在 Kubernetes 上对 vLLM 推理工作节点进行检查点和恢复,实现快速启动。

开源/仓库推理部署/工程
19:22
公众号:腾讯混元
精选62
腾讯混元提出Stem稀疏注意力算法,被ICML 2026收录

Stem算法通过Token位置衰减(TPD)和输出感知度量(OAM)两项创新,仅用25%算力即逼近稠密注意力精度。配套HPC算子针对Hopper架构优化,支持FP8量化与vLLM的Paged KV Cache,在混元Hy3 preview上实现首字延迟降低3.6倍。HPC-BSA相比MIT-BSA稳定保持约3倍加速,在8K至256K序列长度上表现一致。

开源生态推理论文/研究部署/工程

推荐理由:把稀疏注意力从一刀切升级成按信息流分配预算,算子在Hopper上把理论加速几乎无损转化,3.6倍首字延迟下降不是灌水——做长上下文应用的值得照着开源代码试。
18:15
IT之家(RSS)
61
消息称LG将引进1万块英伟达Blackwell GPU,为其迄今最大规模

LG集团将引进1万块英伟达Blackwell架构GPU,用于其人工智能转型(AX)计划。这是该集团有史以来最大规模的单次英伟达GPU采购,整体投资预计达数万亿韩元。LG人工智能研究院正持续开发EXAONE系列大语言模型;LG电子推进人形机器人商业化;LG U+作为韩国三大电信运营商之一,也是重要AI云服务供应商。英伟达CEO黄仁勋今日会见了LG集团会长具光谟。

行业动态部署/工程
18:15
IT之家(RSS)
58
视觉内容社交平台 Pinterest 为 AI 服务导入亚马逊 AWS Trainium 芯片

Pinterest 宣布大幅扩展与 AWS 的合作,计划在 2031 年前投入 40 亿美元,扩大对 AWS 定制芯片(包括 CPU 和 AI ASIC)的使用。目前约 1/3 的计算基础设施已运行在 AWS Graviton 系列 Arm CPU 上,未来还将利用 AWS Trainium 托管和运行 LLM / VLM 模型,支持个性化视觉搜索和 AI 辅助发现。首席技术官 Matt Madrigal 表示,深化合作将加速 AI 创新,提升用户体验和广告主效果。

推理行业动态部署/工程
17:48
HuggingFace Daily Papers(社区热门论文)
51
SigmaScale:基于SVD低秩分解与学习缩放矩阵的LLM压缩方法

SigmaScale通过学习辅助缩放矩阵S改进基于截断SVD的大语言模型压缩。该方法在激活感知压缩损失下优化两组向量,定义对角行和列缩放变换。学习缩放降低了权重矩阵的有效内在秩(有效秩熵减少),且降低幅度与压缩损失强相关。在Llama 3.1 8B Instruct和Qwen3-8B上的实验表明,SigmaScale在困惑度和零样本基准上与当前最先进SVD压缩方法竞争力相当,在特定任务上表现出优势,成为降低LLM推理计算成本的有效选项。

推理论文/研究部署/工程
15:15
IT之家(RSS)
54
Meta 借鉴特斯拉,在帐篷里建造数据中心

Meta 在俄亥俄州新奥尔巴尼外搭建 6 座“快速部署结构”帐篷,每座约 11600 平方米,用于容纳数吉瓦级数据中心,建设周期缩短一半。此举借鉴特斯拉 Model 3 量产时的做法,供电则依赖附近 200 兆瓦模块化燃气轮机,思路来自 xAI。Meta 计划数据中心等资本支出最多达 1450 亿美元,股价今年下跌 5%。其最新 AI 模型 Muse Spark 已开发完成,但依赖的 API 多次延期。

Meta数据/训练行业动态部署/工程
14:22
Alibaba Cloud@alibaba_cloud
65
阿里云发布SkillClaw与Nacos的Agent技能进化循环

阿里云推出SkillClaw与Nacos结合,构建AI智能体技能进化流水线。关键特性:自动从真实对话中提取经验并封装为可复用技能(Skill);Nacos负责集中化版本管理、审核与审计;打破本地孤岛,实现团队安全共享与分发;形成完整的"生成-治理-分发"持续进化闭环。目标是将个人洞察转化为团队的AI资产。

智能体产品更新部署/工程
14:22
Alibaba Cloud@alibaba_cloud
29
🧑🏻💻Meta-Archit Software Technology Limited 正在重新定义团队的工作方式--由阿里云 AI 和 QoderWork 驱动。 从数据分析到精美演示文稿只需几分钟。从代码到测试和快速迭代。AI 真正融入你的工作流,而不是反过来。 🔗查看 QoderWork 能为你的团队带来什么 →https://alidocs.dingtalk.com/notable/share/form/v01MAeqxebaRpE8xO8j_5sVCvvv_2TCYzWh?source=link
行业动态部署/工程
14:22
Alibaba Cloud@alibaba_cloud
精选76
PolarDB-X Zero 上线了! 无需注册。无需配置。只需一次 API 调用。 30 秒内获得一个全分布式数据库。 原生 HNSW 向量索引--内置兼容 MySQL 的引擎。 关系型 + 语义搜索--一条 SQL 语句。 AI 智能体就绪--MCP 协议、AI IDE 兼容(Cursor、Claude、Qoder、Qodex 等) 立即尝试:https://zero.polardbx.com #AlibabaCloud #PolarDB #ApsaraDB
MCP/工具产品更新部署/工程

推荐理由:PolarDB-X Zero 把分布式数据库、向量索引和 MCP 协议打包成一行 API,30 秒就能跑一个 AI Agent 可用的混合搜索后端,做 agent 开发的可以试一下。
14:19
AYi@AYi_AInotes
68
开源AI内容创作系统:AI同事自动接力

作者开源了一套AI内容创作系统,在Helio平台搭建“选题侦察官”“资料研究员”“改写分发官”等AI同事组成的战队。AI通过@自动接力完成每日信源扫描、资料调研、多平台(X/小红书/公众号)改写分发等流程,作者仅需决定选题和终稿。每位AI配有完整的开源系统提示词,可直接抄搭。系统还具备活动流水记录和每日Dream自我修正能力,让AI记住用户纠正,不再需要重复喂背景。

智能体教程/实践部署/工程
13:07
DogeDesigner@cb_doge
79
马斯克在JP摩根炉边谈话宣布SpaceX将因星链和轨道AI数据中心建设而上市

马斯克在JP摩根炉边谈话中宣布,SpaceX因需部署超10万颗下一代星链卫星及建设轨道AI数据中心,将推进IPO。Starship全复用使发射成本降至仅燃料费,V3目标约100吨,V4超200吨,未来可达每小时一次发射。Starlink V3带宽提升约100倍,延迟减半,卫星如小巴大小,仅Starship可一次发射约50颗。轨道AI数据中心利用太空太阳能,通过激光连接星链。月球将率先建设基础设施,电磁炮可发射AI计算载荷,年功率超1000太瓦。SpaceX同时推进自有芯片(Terafab),轨道平台开放给NVIDIA、Google等芯片,并推出Starshield国家安全服务。

数据/训练行业动态部署/工程
关联讨论 1 条X:cb_doge (@cb_doge)
10:48
Hacker News 热门(buzzing.cc 中文翻译)
51
Transformer 需要三个投影吗?--对 QKV 变体的系统研究

一项系统研究探讨 Transformer 注意力机制中是否必须使用三个独立的投影(Query、Key、Value)。通过分析多种 QKV 变体结构,论文对「三投影」这一设计选择进行了系统性评估。

arXiv开源生态论文/研究部署/工程
10:28
SemiAnalysis@SemiAnalysis_
59
重磅消息:NVIDIA 刚刚开源了其 Rubin NVSwitch Tray 的物料清单和示意图,其中包含 AMD EYPC 3151 嵌入式 CPU。由于每个 VR200 机架有 9 个 NVSwitch Tray,因此每个 NVIDIA 机架中就有 9 个小型 AMD 嵌入式 CPU。 NVIDIA 已在其公共 GitHub 仓库 "NVIDIA/nvbmc-docs" 中开源了这一内容,该仓库采用 CC 4.0 开源许可证!
GitHub行业动态部署/工程
10:21
Alibaba Cloud@alibaba_cloud
56
为什么行业智能体举步维艰,而AI编程却蓬勃发展?瓶颈在于上下文。🚀 了解阿里云EventHouse如何通过简化多源实时上下文供给来弥合差距。从信息完整性到知识协调,学习如何将Agent从演示可靠地迁移到生产。 👉🏻https://int.alibabacloud.com/m/1000414048/ #EventHouse #EventBridge #AI #Agents
智能体产品更新部署/工程
‹ 上一页
1…1718192021…50
下一页 ›