AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 983 条
全部一手资讯X论文
标签「部署/工程」清除
Chubby♨️@kimmonismus · 6月11日56

Iran threatens Elon Musk’s companies in Middle East via Iranian state media. Data Center and Starlink factory aimed for. Donald Trump recently wrote on TruthSocial that "The United States will be hitting Iran (whose Navy, Air Force, radar, anti-aircraft capabilities, and all other forms of defense, together with most of its offensive capability, are GONE!), VERY HARD TONIGHT." In response, Iran sent a clear message to the US, targeting Elon Musk's companies. Musk's largest asset in the region is the xAI data center in Saudi Arabia: a 500 MW AI data center built in partnership with HUMAIN, the Saudi state's AI vehicle, with NVIDIA as its primary chip supplier. This would make it the largest xAI data center outside the US - for comparison, the Colossus-1 data center in Memphis delivers around 300 MW. We are in for a very difficult night.

译伊朗通过官方媒体威胁马斯克在中东的公司,目标指向xAI在沙特阿拉伯的500 MW AI数据中心与Starlink工厂。该数据中心与沙特国家AI机构HUMAIN合作建设,NVIDIA为主要芯片供应商,是目前xAI在美国以外最大的数据中心(对比孟菲斯Colossus-1约300 MW)。此举是回应特朗普在TruthSocial发文称“美国今晚将狠狠打击伊朗”。局势紧张。

ClaudeDevs@ClaudeDevs · 6月11日64

We've just added two new Claude Managed Agents features: 1. Scheduled deployments - run tasks on a schedule 2. Environment variables - expose vault credentials for CLIs as environment variables

译我们刚刚为 Claude Managed Agents 新增了两个功能: 1. 定时部署 - 按计划运行任务 2. 环境变量 - 将保险库凭据以环境变量的形式暴露给 CLI

Alibaba Cloud@alibaba_cloud · 6月11日65

Big news! 🚀 Qwen is now live on Eden AI, one of Europe’s leading AI gateways, trusted by more than 200,000 developers. Enterprises can now access Qwen’s powerful open-weight models for reasoning, coding, and AI applications through Eden AI’s unified API, making it easier to build multi-model workflows while avoiding vendor lock-in. To celebrate the launch, enjoy 35% OFF all Qwen models. If you are attending VivaTech Alibaba Cloud AInnovation Summit at Hall 7.3 Workshop A next week, stay tuned for a special meet-up with Eden AI CEO Taha Zemmouri and Eden AI CPTO Samy Melaine. 🔗 Start building today: https://app.edenai.run/playground #AlibabaCloud #Qwen #EdenAI #VivaTech2026 #GenerativeAI #Developers #CloudComputing

译阿里云宣布 Qwen 模型正式登陆欧洲领先 AI 网关 Eden AI,该平台拥有超过 20 万开发者。企业可通过 Eden AI 统一 API 调用 Qwen 开源权重模型,用于推理、编码和 AI 应用,支持多模型工作流并避免供应商锁定。为庆祝上线,所有 Qwen 模型享受 35% 折扣。下周 VivaTech 2026 大会上,Eden AI CEO 与 CPTO 将参与阿里云 AI 创新峰会活动。

Alibaba Cloud@alibaba_cloud · 6月11日63

👏#ApsaraDB has 10 papers accepted to SIGMOD 2026—DB×AI, cloud-native storage & intelligent tooling. From paper to product: Beluga's CXL memory pool is in engineering validation; CloudJump III now powers #PolarDB's tiered storage. #AlibabaCloud keeps pushing the database frontier.🚀

译👏#ApsaraDB 有10篇论文被SIGMOD 2026接收——DB×AI、云原生存储与智能工具。从论文到产品:Beluga的CXL内存池正处于工程验证阶段;CloudJump III现已为#PolarDB的分层存储提供动力。 #AlibabaCloud 持续推动数据库前沿。🚀

fofr@fofrAI · 6月11日60

Fascinating side effect of safety refusals

译恶意软件开发者通过在间谍软件中添加核武器和生物武器相关文本,主动触发大模型安全拒绝机制,使AI安全扫描器无法分析该恶意软件。这是安全对齐中过度依赖一阶规则导致二阶盲点的典型案例:当闭源与开源模型内置激进拒绝策略时,攻击者会注入这些触发词来逃避检测。SocketSecurity的帖子指出,设计恶意软件分析管道需考虑意图以防范提示词操纵。当前仅是攻击者利用这类特征的早期阶段,未来处理复杂网络安全的用户系统可能需要模型具备更少的安全顿感。

Greg Brockman@gdb · 6月11日61

Use your Oracle cloud commitment for OpenAI products: https://openai.com/index/openai-on-oracle-cloud/

译将你的Oracle云承诺用于OpenAI产品:https://openai.com/index/openai-on-oracle-cloud/

小互@xiaohu · 6月11日74

Google 开源其扩散架构模型:DiffusionGemma 区别于Transformers 模型像打字机一样逐词一个一个生成 DiffusionGemma 可一次性生成大段或者整篇内容,然后再逐步优化 大幅度提高生成的速度: 在H100 上可实现 1000+ tokens/s,RTX 5090 上 700+ tokens/s 26B,18GB 显存能跑 一次可同时生成 256 个 tokens 自己检查自己,写完还能改: 普通 AI 写完一个字就锁死了,不会回头改。就算第 10 个字写错了,到第 100 个字的时候它也改不了前面的。 DiffusionGemma 的生成过程本身就是多轮迭代,每一轮它会重新审视整块文本,发现哪里不对就改掉。就像写作文先打草稿,再通读一遍改错别字,再读一遍调语句,几轮下来质量就上去了。

译Google 开源 DiffusionGemma,基于扩散架构,一次性生成大段文本再逐步优化。H100 上达 1000+ tokens/s,RTX 5090 上 700+ tokens/s。26B 参数仅需 18GB 显存,一次生成 256 tokens。多轮迭代自我纠错,可修改已生成内容。

郭明錤|Ming-Chi Kuo@mingchikuo · 6月11日58

Key takeaways on TSMC's next-generation advanced packaging, CoPoS (publicly available technical details omitted): 1. CoPoS is currently expected to enter mass production in 2H28. It is designed to improve the economics of ultra-large packages above the 9.5x reticle-size class, with NVIDIA’s Feynman AI chip a potential first adopter. 2. According to industry checks, glass is used in two distinct places (dimensions in mm): → 310 x 310 temporary glass carriers → 250 x 250 (pilot) / 510 x 515 (mass production) glass panels, processed and later cut into individual glass core substrates 3. The glass core substrate is essentially a three-layer structure: a glass core sandwiched between ABF (ABF-GCP) build-up layers on both sides. The widely discussed glass processing challenges, such as TGV formation and copper filling / metallization, are tied to this part of the stack. 4. Common misconceptions about CoPoS: → ❌ Misconception 1: CoPoS uses a glass interposer. ⭕️ Correction: The glass is not an interposer. The interconnect role is instead handled by the chip-side RDL, plus the TGV/Cu interconnects and ABF build-up layers in the glass-core substrate stack. → ❌ Misconception 2: Glass replaces ABF. ⭕️ Correction: As the substrate architecture above shows, glass and ABF coexist. → ❌ Misconception 3: Chips sit directly on glass. ⭕️ Correction: Chips are attached to the ABF build-up surface of the glass core substrate. 5. CoPoS should extend and reinforce TSMC’s leadership in advanced packaging, potentially giving that advantage visibility through around 2032.

译郭明錤分析,台积电CoPoS预计2028下半年量产,面向9.5倍光罩尺寸以上超大封装,NVIDIA Feynman AI芯片或率先采用。玻璃用于两个位置:310×310mm临时载板,以及250×250mm(试产)/510×515mm(量产)玻璃面板加工成玻璃核心基板。该基板为三层结构——玻璃芯两侧叠加ABF增层,TGV成孔与铜填充等挑战集中于此处。澄清常见误解:玻璃非中介层,互连由RDL、TGV/Cu及ABF共同承担;玻璃与ABF共存而非替代;芯片贴装在ABF增层表面。CoPoS有望延续台积电先进封装领先优势至2032年左右。

Berryxia.AI@berryxia · 6月11日64

兄弟们,Google 这个新“模型”有点意思! DiffusionGemma一口气把文本生成干到4倍速,还彻底开源Apache 2.0,谁都能本地玩。 它不用传统自回归那种“吐一个词想下一个”的老办法。 而是直接用diffusion先扔一堆噪声,然后整块整块地同时起草、同时纠错、同时精炼,1000+ token/s的速度直接起飞。 18GB消费级显卡就能顺滑跑,代码、数学、复杂编辑这些最烦人的活儿。 它现在能实时补空、格式化、自我修复,速度快到你感觉AI终于开始“思考整段”而不是“一个字一个字憋”。 以前大家都默认更快就得牺牲质量,结果Google这次直接告诉你:并行diffusion才是文本生成的下一章,把整个生成范式从串行憋词翻篇成了并行炼句。 开源权重已经在Hugging Face放出,开发者现在就能把这玩意儿拖回家自己改、自己玩、自己加速日常workflow。 这波一出,AI生成速度的天花板可能要被彻底重写了。

译Google 发布实验性开源模型 DiffusionGemma(Apache 2.0),采用并行 diffusion 方式代替传统自回归“逐词预测”,可同时起草、纠错和精炼整块文本,生成速度达 4 倍提升(1000+ token/s)。模型在 18GB 消费级显卡即可本地运行,适用于代码、数学、复杂编辑等任务,已开源权重至 Hugging Face。

Chubby♨️@kimmonismus · 6月11日58

The biggest bottleneck will be energy- very soon. Gartner's 2026 forecast puts global data center electricity at 565 TWh, up 26% from last year. AI servers already account for 31% of that and pass conventional servers in 2027. What's worth noting is the constraint Gartner names: it's power, not chips. They project demand above 1,200 TWh by 2030 and warn the grid won't keep up. So the race quietly shifts from who has the best silicon to who can actually get the electricity to run it.

译最大的瓶颈将是能源——很快。 Gartner 2026年预测显示,全球数据中心电力消耗将达到565 TWh,较去年增长26%。AI服务器已占其中的31%,并将于2027年超越传统服务器。 值得注意的是,Gartner给出的制约因素是电力,而非芯片。他们预计到2030年需求将超过1,200 TWh,并警告电网将无法跟上。 因此,竞赛悄然从谁拥有最佳硅片转向谁能真正获得电力来驱动它。

Rohan Paul@rohanpaul_ai · 6月11日55

Nvidia released this video of its photonics co-packaged optics (CPO) switch with Lambda. The AI race is not only about stronger GPUs, but about wasting far less power while those GPUs talk to each other. With co-packaged optics (CPO), NVIDIA is putting the light-based communication parts much closer to the main networking chip, instead of placing them as separate plug-in modules at the edge of the switch. From NVIDIA's official blog on this "co-packaged optics (CPO) connects directly to the token economy. Network power is overhead: it keeps GPUs connected but doesn't generate tokens. Network failures are also overhead: they turn provisioned GPU capacity into idle capacity. CPO addresses both by reducing network power draw and removing a large class of pluggable optical components from the fabric. A 128,000-GPU data center using traditional pluggable transceivers requires roughly 655,000 discrete transceiver modules across the switching fabric. Each one is a potential failure point. CPO removes that component class entirely. Agentic workloads change the pressure on the network. A traditional inference request is relatively self-contained. An agentic request can involve planning, retrieval, tool use, multiple model calls, and follow-up reasoning. More data moving across the cluster. More points where network latency or failure affects the outcome. Multi-agentic inference needs elastic and resilient data movement, so GPUs are not waiting for data, while maintaining tokens per second and fast time to first token."

译NVIDIA 发布了与 Lambda 合作的共封装光学(CPO)交换机视频。CPO 将光通信部件移至主网络芯片附近,而非独立可插拔模块。官方博客指出,在 GB300 NVL72 规模下,CPO 通过降低网络功耗和消除大量可插拔光学组件来减少故障点,提升每瓦 token 数。一个 128,000 GPU 数据中心传统需约 655,000 个独立收发器,每个都是潜在故障点,CPO 完全移除该类组件。智能体工作负载需要弹性数据移动,CPO 可减少网络功耗和组件数量,避免 GPU 等待数据。

Fuli Luo@_LuoFuli · 6月11日74

A strong model evolution needs a solid harness system, and vice versa. 14 days, 5 people, one vibe-coding journey — and MiMo Code was born. It's open source: https://github.com/XiaomiMiMo/MiMo-Code

译强大的模型进化需要坚实的驾驭系统,反之亦然。14天,5人,一次vibe-coding旅程——MiMo Code就此诞生。它已开源:https://github.com/XiaomiMiMo/MiMo-Code

Ethan Mollick@emollick · 6月11日49

"Switch to a cheaper model to save money" is a problem because cheaper models are worse (maybe they are good enough for a particular purpose, but still worse). More often a better approach is hierarchies of models, with smart models are orchestrators and auditors of cheap ones.

译“换更便宜的模型来省钱”是个问题,因为更便宜的模型更差(也许对某个特定用途来说足够好,但依然较差)。 更常见的方法是模型层级结构,由智能模型作为廉价模型的协调者和审核者。

SemiAnalysis@SemiAnalysis_ · 6月11日63

DeepSeek is going heavy-asset. On June 9, the company posted an opening for IDC planning engineers, a role explicitly scoped to the design and delivery of MW-to-GW scale infrastructure. It follows April's hiring of data center O&M engineers in Ulanqab, Inner Mongolia. Taken together, this is the first time DeepSeek has fully shown its hand on owning compute infrastructure rather than just renting it.

译DeepSeek 正走向重资产模式。 6 月 9 日,该公司发布了 IDC 规划工程师的招聘信息,该职位明确涉及兆瓦级到吉瓦级基础设施的设计与交付。这紧随其 4 月在内蒙古乌兰察布招聘数据中心运维工程师。综合来看,这是 DeepSeek 首次完全展露其自持算力基础设施而非仅租赁的意图。

Replit ⠕@Replit · 6月11日65

Most people run a security scan for malicious packages before publishing a project But the risk starts the moment they're installed Today we're launching Package Firewall, built in partnership with Socket It blocks malware before it ever reaches your app

译大多数人在发布项目前会运行安全扫描以检测恶意包 但风险从安装的那一刻就已开始 今天,我们正式推出 Package Firewall,与 Socket 合作构建 它在恶意软件到达你的应用之前就将其拦截

Claude@claudeai · 6月11日72

New from Code with Claude Tokyo: scheduled deployments and environment variables in vaults are in public beta in Claude Managed Agents, and dynamic workflows in Claude Code are generally available. Agents now run on a schedule, use your tools securely, and take on bigger jobs.

译Code with Claude Tokyo 新功能:定时部署和保险库中的环境变量已在 Claude Managed Agents 中进入公测,Claude Code 的动态工作流已正式可用。 Agent 现在可以按计划运行,安全使用你的工具,并承担更大的任务。

Huawei Cloud@HuaweiCloud1 · 6月10日52

You can't scale agents without the right platform. At Huawei Cloud INSPIRE 2026, Peter Zhou, Director of the Board at Huawei and CEO of Huawei Cloud, introduced AgentArts, an enterprise-grade platform built to help businesses scale agents, faster. https://tinyurl.com/5cjcph9d #INSPIRE2026 #HuaweiCloud #AI

译没有合适的平台,你就无法扩展智能体。在华为云INSPIRE 2026上,华为董事、华为云CEO张平安介绍了AgentArts,一个企业级平台,旨在帮助企业更快地扩展智能体。 https://tinyurl.com/5cjcph9d #INSPIRE2026 #HuaweiCloud #AI

Huawei Cloud@HuaweiCloud1 · 6月10日29

You can't scale intelligence on weak foundations. So at Huawei Cloud INSPIRE 2026, we thickened the ground beneath it. Hardware-software synergy. Four Agentic Infra innovations. One new paradigm. Learn more: https://tinyurl.com/3yukj4wm #INSPIRE2026 #HuaweiCloud #AI

译你无法在不牢靠的根基上扩展智能。因此,在华为云INSPIRE 2026上,我们夯实了它脚下的大地。 硬件-软件协同。四项Agentic Infra创新。一种新范式。 了解更多:https://tinyurl.com/3yukj4wm #INSPIRE2026 #HuaweiCloud #AI

Berryxia.AI@berryxia · 6月10日46

学完Harness后,Loop Engineering 又来了。 还真是要了解这些背后的逻辑和底层的设计。 不仅对于Vibe Coding 帮助大,更多的还是对于产品的架构设计都是不少的启发。 这几天想些一篇文章和大家一起学习下,这下Smith 直接搞完了,可以看看不错!

译Berry Xia表示,学完Harness后接触Loop Engineering,认为理解其底层逻辑对Vibe Coding和产品架构设计帮助很大。他原计划写文章分享,但Smith(@smithandai)已发表相关文章,推荐阅读。

MiniMax (official)@MiniMax_AI · 6月10日46

MiniMax is live on @RespanAI Gateway Developers now have another easy way to access our models. as more teams ship AI products across text, speech, image, video, and music, we want our models right there when you need them. link in comments 👇 #MiniMax #Respan #AIGateway #MultimodalAI #AIModels #Developers #BuildWithAI

译MiniMax 在 @RespanAI Gateway 上线 开发者现在有了另一种便捷方式访问我们的模型。 随着更多团队在文本、语音、图像、视频和音乐领域推出 AI 产品,我们希望在你需要时,我们的模型就在那里。 链接在评论区 👇 #MiniMax #Respan #AIGateway #MultimodalAI #AIModels #Developers #BuildWithAI

MiniMax (official)@MiniMax_AI · 6月10日54

the modular kernel team moving fast on M3 🚀 open weights dropping in a few days — then it runs on @Modular right away. excited for this one.

译Modular 内核团队正在快速推进 M3 🚀 开源权重将在几天内发布——届时即可立即在 @Modular 上运行。 对此非常期待。

ClaudeDevs@ClaudeDevs · 6月10日60

If you’re having trouble accessing Claude Fable 5, try running /model claude-fable-5. In the Claude Code CLI, make sure to upgrade to 2.1.170. If you’re on the Claude Desktop app, update the latest version.

译如果你无法访问 Claude Fable 5,请尝试运行 /model claude-fable-5。 在 Claude Code CLI 中,请确保升级到 2.1.170。 如果你使用的是 Claude Desktop 应用,请更新到最新版本。

Replit ⠕@Replit · 6月10日44

I built a mobile app, promo video, and pitch deck for my travel app at the same time using Replit's parallel agents 👇

译我使用 Replit 的并行代理,同时为我的旅行应用构建了移动应用、宣传视频和推介 PPT 👇

OpenRouter@OpenRouter · 6月10日51

AI regulations are coming, and not just for EU users. A central theme is human gates for sensitive actions. The EU AI Act (Aug 2026), Colorado's ADMT law (Jan 2027), and NIST AI RMF all require reviewable gates. The OpenRouter Agent SDK makes this easy👇

译AI 法规即将到来,且不仅限于欧盟用户。一个核心主题是:敏感操作需要人工把关。 欧盟 AI 法案(2026 年 8 月)、科罗拉多州 ADMT 法(2027 年 1 月)和 NIST AI RMF 均要求可审查的关卡。 OpenRouter Agent SDK 让这一切变得简单👇

SemiAnalysis@SemiAnalysis_ · 6月9日65

DeepSeekV4 1.6T Day 0 to Day 43 Performance Over Time - Huawei, GB300 NVL72, MI355X, B200 Day 0 Inference Performance on InferenceX 100x performance improvement in 26 Days Cost per Million Tokens Huawei 950DT Inference Trace Analysis https://semianalysis.substack.com/p/deepseekv4-16t-day-0-to-day-43-performance

译DeepSeek V4 1.6T 第0天至第43天性能随时间变化 - 华为, GB300 NVL72, MI355X, B200 第0天在InferenceX上的推理性能 26天内100倍性能提升 每百万Token成本 华为950DT推理追踪分析 https://semianalysis.substack.com/p/deepseekv4-16t-day-0-to-day-43-performance

Tencent Hy@TencentHunyuan · 6月9日67

🚀Introducing UniRL, an RL infra for unified multimodal models. Together with two new RL algorithms: DRPO and Flow-DPPO. One RL loop across diffusion/flow matching models, LLMs/VLMs, and unified multimodal models👇 Code: http://github.com/Tencent-Hunyuan/UniRL (yes — U(you)-ni-(need) RL 😉) 1、Most RL stacks are built for one modality. UniRL applies a single post-training loop — generate → score → advantage → update → sync — across model families. Model and algorithm are two independent axes, so your coverage is the model × algorithm product, not a fixed recipe menu. 2、One loop, every modality: text→image, text/image→video, vision-language, text-only LLM and VLM, the LLM→diffusion prompt-enhancer, and unified autoregressive+diffusion generation (Hunyuan-Image 3 and Bagel) — a model class no single-purpose RL repo can even express. 3、Built to scale: pluggable rollout engines (train-side / SGLang / vLLM-Omni) behind one typed contract, FSDP2 sharding, and three deployment modes from a single config knob. 4、Two team-original algorithms headline the release: FlowDPPO: Policy optimization for flow/diffusion models with trust-region masks based on exact divergence (See our paper: Flow-DPPO: Divergence Proximal Policy Optimization for Flow Matching Models https://github.com/Tencent-Hunyuan/UniRL/blob/main/FlowDPPO/HY_FlowDPPO.pdf) DRPO: LLM RL with a smooth, advantage-weighted quadratic regularizer (See our paper: Rethinking the Divergence Regularization in LLM RL [https://arxiv.org/abs/2606.09821])

译腾讯混元推出UniRL,一个支持统一多模态模型的强化学习基础设施,并发布两个新算法DRPO和Flow-DPPO。UniRL通过单个后训练循环(生成→评分→优势→更新→同步)覆盖扩散/流匹配模型、LLM/VLM及统一多模态模型(如Hunyuan-Image 3和Bagel)。模型与算法作为独立轴,可实现模型×算法的组合覆盖。框架支持可插拔rollout引擎(训练侧/SGLang/vLLM-Omni)、FSDP2分片和三种部署模式。FlowDPPO针对流/扩散模型引入基于精确散度的信任域策略优化;DRPO为LLM RL提供平滑的优势加权二次正则化方法。代码已开源。

Rohan Paul@rohanpaul_ai · 6月9日64

Interesting, this paper shows that Transformers may not need separate key and value projections to work well. This paper's design cut the KV cache by 50% in language modeling with only 3.1% higher perplexity, meaning inference memory fell sharply while prediction quality stayed close. A normal attention layer makes Query to ask what each token needs, Key to label what each token offers, and Value to carry the information sent back. Here, the surprising result is that Key and Value can often share the same learned map, because the model can use one representation both as an address and as the content being retrieved. The best variant, Q-K=V, kept Query separate, so attention still had direction: one token can ask a different token for information instead of every relation becoming mirror-like. When stacked with GQA and MQA, the same idea reached 87.5% and 96.9% cache cuts, because it reduces projection storage while those methods reduce stored heads. The weak variant is Q=K-V, because tying Query and Key makes attention too symmetric for causal language, and it gives no KV-cache savings. ---- Link – arxiv. org/abs/2606.04032v2 Title: "Do Transformers Need Three Projections? Systematic Study of QKV Variants"

译一篇论文系统研究了Transformer注意力中QKV投影的必要性,发现Key和Value可共享同一投影(Q-K=V变体),仅增加3.1%的困惑度,便将KV cache削减50%,大幅降低推理内存。最佳变体保留Query独立,使注意力保持方向性。与GQA和MQA结合时,可分别实现87.5%和96.9%的cache缩减。弱变体Q=K-V因导致因果注意力过于对称且无cache节省而无效。

Alibaba Cloud@alibaba_cloud · 6月9日67

Alibaba Cloud has launched a new public cloud region in Johor, Malaysia, with two new data centres to meet the growing demand for cloud and AI services to Malaysia in the second half of this year, including AgentRun, STAROps, ACS Agent Sandbox, Agent Security Center, AI Security Guardrails 2.0, and Agentic SOC. https://int.alibabacloud.com/m/1000414242/

译阿里云在马来西亚柔佛州推出了一个新的公有云区域,包含两个新数据中心,以满足今年下半年马来西亚对云和AI服务日益增长的需求,包括AgentRun、STAROps、ACS Agent Sandbox、Agent Security Center、AI Security Guardrails 2.0和Agentic SOC。https://int.alibabacloud.com/m/1000414242/

Perplexity@perplexity_ai · 6月9日51

Yesterday at London Tech Week we announced the Billion Pound Build competition. Teams can enter to secure a share of £1M in Computer credits by using Perplexity Computer to build their company. The pitch phase is open now and closes on 6 July.

译昨天在伦敦科技周上,我们宣布了 Billion Pound Build 竞赛。 团队可以参赛,使用 Perplexity Computer 打造自己的公司,争夺 100 万英镑的 Compute credits 份额。 演示阶段现已开放,截止日期为 7 月 6 日。

Berryxia.AI@berryxia · 6月9日37

设计一个真正的系统其实里面的工程太多了,每一环不可或缺,比如提示词工程、上下文工程,记忆模块、包括后面的skills 等等其实都无一例无的都成一个系统,都是环环相扣的。 这个Loop Engineering 讲的很清晰了!

译设计真正的AI系统涉及大量工程细节,提示词工程、上下文工程、记忆模块、skills等环节缺一不可,彼此环环相扣形成了一个完整系统。Berry Xia引用了一篇关于Loop Engineering的清晰阐述,强调这些组件的系统性整合才是关键。

小互@xiaohu · 6月9日47

马斯克新的大饼来了 这个饼,格外的大😂 涉及到行星移民、太空算力中心、AI卫星、太空能源... 让人类文明往上跳一个能量等级 用Starlink 现成的太阳能阵列造 AI 卫星,150千瓦峰值功率 / 120千瓦持续算力, 完全展开时翼展70米🥲 在月球本地造光伏和散热板,用电磁炮把 AI 卫星直接打进深空🤪 Terafab 太空算力工厂将占地约 1 亿平方英尺,是特斯拉 Giga Texas 工厂的 10 倍大小。 • Terafab 算力供应大约为:1TW/年 • 而当前美国年消耗量:0.5TW 首颗AI卫星: • 150千瓦峰值功率 / 120千瓦持续计算功率 • 采用SpaceX自主研发的太阳能技术 • 专为高性能AI工作负载设计的集中式AI计算载荷 • 完全展开时翼展70米 • 110平方米可展开液体散热器,用于在太空中移除废热 • 配备冗余冷却回路,集成微流星体防护 • 设计用于星舰发射,实现大规模太空计算所需的大量轨道运载能力 • 使用激光链路,同时避免了Starlink卫星所需的大多数复杂通信系统 视频完整文字内容: 开场:又是典型的一年 大家好,欢迎。今天把埃隆和伊恩,还有我们 Starlink 团队的人请来聊聊近况。 对 SpaceX 来说,这又是典型的一年:发射了一台全新的飞行器,收购了 xAI(现在归到 SpaceX 搞 AI),还宣布要建一座太瓦级芯片厂(terafab)。所以是啊,从来没有一刻闲着——典型的一年。 今天想把这些点串起来,看看它们怎么一起推动「让生命成为跨行星物种」,怎么开始往卡尔达肖夫等级上爬,顺便秀一点很酷的 AI 卫星。 卡尔达肖夫等级是什么 你怎么判断一个文明发展到了什么程度?这是最客观的衡量标准——任何外星物种来拜访我们,都会用它来给我们这个文明打分。而最客观的方式之一,就是看这个文明能驾驭多少能量。 有位俄国物理学家叫卡尔达肖夫,就想过这件事,我觉得他这个刻画方式很好: 一型文明:你能驾驭一颗行星上可用的能量。 二型文明:你能驾驭一颗恒星的能量。 三型文明:你能驾驭整个星系的能量。 这些都是非常客观、可测量的数字。 而现在,我们在卡尔达肖夫一型这个尺度上都低得可怜。如果问「我们驾驭了地球能量的多大比例」,那是个极其极其小的数字。至于恒星的能量,我们几乎一点都没碰到。 太阳到底有多大 太阳真的是个庞然大物,大到很难用语言形容。给你一个尺度感:太阳占了整个太阳系全部质量的约 99.86%。它几乎就是一切。剩下的 0.14% 里,大部分还是木星一颗行星。我们这些还是轻量级——整个地球的质量都落在那个「其它杂项」的小类别里。跟太阳比,地球就是一粒微尘。 从一型跳到二型,是一个巨大的难度台阶。三型我们甚至还不知道怎么搞——不过会到那一步的,AI 会搞定。 那太阳的能量有多少?落在地球横截面上的太阳能,大约只是太阳总输出功率的二十亿分之一。而这里面绝大部分我们还用不上——因为地球 70% 是水。严格说,我们这颗星球该叫「水球」才对。外星文明来了大概会纳闷:明明大部分是水,他们为啥管它叫「地球」?我们就是太阳系里那个名不副实、其实并不绿的「格陵兰」。 剩下 30% 是陆地,可里面一大堆是南极、西伯利亚、加拿大极北那种地方,人本来就不爱住,而且两极拿不到多少太阳能。所以真正能用来发电的陆地面积相当小。 想往上爬,就必须去太空 要想沿着卡尔达肖夫等级往上爬,或者说要驾驭太阳能量里任何有意义的比例,你就必须去太空。 打个比方:哪怕只想拿到太阳输出功率的百万分之一,你也得把人类驾驭的能量提高远不止一百万倍——因为我们现在用的能量,还不到太阳输出的一万亿分之一(一万亿 = 一百万乘一百万)。所以在卡尔达肖夫二型尺度上,我们基本上等于不存在,根本「上不了榜」。 我们在拿「百万分之一太阳功率」开玩笑——管它叫「一个 Microsoft」。能达到「一个 Microsoft」,相对我们现在的位置都是史诗级的成就,是个值得追求的目标。 有意思的是,这个目标同时是「相对现状极其大胆」和「作为太阳能量的占比又一点都不大胆」——百万分之一而已。要是哪个文明真能拿到太阳能量的 1%,那已经是个牛逼到家的文明了,会比我们强大得多。 但真要往那走,我们也不会傻乎乎地往太空扔一堆太阳能板去硬接阳光。得有真实需求,你上去是要干点有意义的事。在人类历史上到现在,其实一直没有这个需求——那是什么变了,让我们觉得现在是时候去争取那一两个百分点了? 为什么是现在:把数据中心送上天 要在卡尔达肖夫等级上有所进展,我们需要发射卫星绕地球运行、捕获太阳能。这样就不用在地面建巨型电厂、还要处理散热——而散热这件事,在太空里其实比在地球上容易得多,你直接往真空辐射就行。 我们想做的,是把卡尔达肖夫等级爬到一个「拿得出手的文明」的水平。这样万一哪天外星人终于愿意跟我们说话,我们好歹用上了「还算体面」的一部分太阳能量,而不是现在这种「彻底寒酸」的样子。 要把数据中心送上太空,有几个传统上几乎让这件事不可能的限制因素。要规模化,你需要三样东西: 巨大的入轨运力——这正是 Starship 能给我们的。最终你得往轨道乃至更远处运送数百万吨。 与之匹配的能量——如果你想往太空送 100 吉瓦乃至最终一太瓦,你迟早需要一太瓦的太阳能,外加配套散热。 海量芯片——最终需要一太瓦的 AI 芯片。 所以三样东西:入轨运力、大量太阳能(当然还有散热板),以及大量芯片。下面一项一项过。 Starship 与「可复用」这个根本突破 入轨运力靠 Starship。我们刚完成 V3 的首飞,太震撼了——这一刻等了很久。 Starship 会真正给航天带来革命。它是第一款能做到「完全且快速可复用」的火箭设计。可复用性,是让生命成为跨行星物种、以及攀登卡尔达肖夫等级所必需的根本突破。没有可复用的飞行器,你根本爬不上卡尔达肖夫等级,也没法把生命延伸到月球、火星和太阳系其余地方——成本会高到无法承受。除非能反复飞,否则你造不出足够多的火箭。 就像其它任何交通方式一样:要是每次坐完飞机就得把飞机扔掉,飞行会贵到没人坐,大家只能改开车。汽车、飞机、轮船、自行车,显然都是可复用的,否则根本撑不起一套交通系统。 火箭要做到可复用难得多,因为地球有很深的重力井和厚厚的大气层,这让火箭复用「勉强才有可能」。此前有过很多次造完全可复用火箭的尝试,大多半途而废,因为他们觉得自己成不了。要做到完全复用,每个环节都得做到极致:发动机、结构、航电、推进剂的选择。你得为减重走极端——所以我们让发射塔去「夹住」火箭,而不是装又重又笨的着陆腿,火箭直接被塔接住。 我们还没实现完全复用,但预计能做到,希望今年晚些时候在 Starship 上实现。再往前一步,是做到「快速复用」:火箭落下、被塔接住、放回发射台,不用任何翻修或繁琐检查就能再飞一次,像飞机一样。这极其困难,而这是史上头一回有一款火箭能做到这件事——这正是 Starship 之所以意义深远的地方。 它同时还是有史以来最大的飞行物、最重的飞行物、任何种类里最强劲的移动物体。Starship V3 的推力是土星五号登月火箭的两倍多;到 V4,差不多会是土星五号的三倍。而且我们预计,将来 Starship 能做到一小时飞不止一次。 顺便说个有意思的事:第 12 次飞行,是 SpaceX 迄今运过的最重载荷——而这还只是 V3 能力的一小部分。 入轨运力会变成什么量级 一旦我们能又快又多地飞,量级会比今天大好几个数量级。就算只算 Falcon 9 和 Falcon Heavy,SpaceX 现在就已经承担了全地球送入轨道质量的将近 90%——大概在 85% 到 90% 之间。剩下的大部分由中国发射,世界其它地方(包括美国其余部分)加起来大概只有 5% 到 7%。 有了 Starship,我们要把入轨量从现在每年约 2500 吨,提到每年数百万吨,而且要在相当短的时间内做到。我们觉得大概三年左右就能做到每年一百万吨入轨。Starship 会把「入轨运力」这个限制因素解决掉。 AI 卫星:其实比 Starlink 卫星更简单 接下来是发电和「太空里的数据中心」。很多人一听「太空数据中心」会卡壳——我们当然不是给一栋楼装上发动机飞上天,它长得其实很不一样。 很多人根本不知道数据中心里面长什么样,以为是个「互联网在云里」的神秘地方。有人想象成一堆电线,有人想象成一堆盒子,但说到底就是一组芯片。真正要送上太空的东西,看下来其实相当小。更有挑战的是:怎么给它供电?这正是我们能把 Starlink 现成的太阳能阵列技术用上的地方——用这份经验造一颗卫星,把数据中心的关键部件本身送进太空。 我们喜欢把它还原成「真正的工程问题是什么」:本质上就是把电送进去、再把废热和能量抽出来,扔进太空的真空里。 其实 AI 卫星比 Starlink 卫星简单得多。Starlink 卫星有巨大的相控阵天线、抛物面天线、一大堆激光链路,复杂得多。AI 卫星本质上就是一大片太阳能电池、一块散热板,再加一些激光链路,但没有 Starlink 上那些超复杂的天线。两者比起来,AI 卫星反而更好设计——就是个头大一点。 这颗卫星长什么样 这是我们的 AI 卫星一号(AI one)的草稿版本。 第一步得先做出一个有说服力的东西。我们觉得合适的起点是在 150 千瓦峰值功率这个量级。结合我们在 xAI 上跑负载的经验,我们看到它还能支撑约 120 千瓦的平均算力——峰值和平均是有区别的。所以这是 SpaceX AI 卫星的第一版:150 千瓦峰值功率、120 千瓦持续功率。 给你点尺度感:太阳能阵列按每平方米 250 瓦算,散热板按每平方米约 1400 瓦算。散热板是双面的,两面都在散热,刀刃边朝向太阳。1400 瓦每平方米是个很容易达到的目标,随时间推移,我们觉得太阳能板和散热板大概都能分别做到 250 瓦和 1400 瓦每平方米以上。 这基本就是这颗卫星的样子:一大片太阳能板、散热板,其余一切相比之下都很小。而且这些都是我们已经在 Starlink 星座里实际发射过的东西的演进版。对我来说最酷的一点是:我们用的太阳能技术,本来就要用在 V3 的 Starlink 飞行器上,所以我特别兴奋——直接拿过来,把它做大就行。 我们想传达的一点是:AI 卫星并不需要什么「目前还不存在的魔法」。正如伊恩说的,这里很多技术我们为 Starlink V3 卫星就已经做出来了。跟我们已经在做的事比,这并不是个超难的问题。 卫星上还会有大约一太比特(terabit)量级的激光链路连接能力。150 千瓦峰值功率,大致相当于一台英伟达 GB300 机架的水平:一台 GB300 带 72 颗 GPU,峰值功率大概 140 千瓦,但几乎不可能让它一直跑在峰值;更现实的工作区间是 120 千瓦左右的平均功率,峰值能冲到 150。所以你可以把它想成「太空里的一个算力机架」。 然后你可以把这些算力机架通过激光链路彼此相连,或者直接连到 Starlink 星座。接上 Starlink 之后,Starlink 就能用飞行器上现成的 Ka、Ku 频段天线把数据发回地面,它本身也有连到地面的激光链路。 这个延迟其实并不高。卫星大概在地面以上 600 到 800 公里,而光每毫秒走 300 公里,所以差不多就三毫秒的距离,并不远。别太担心延迟——总有人觉得会有很高的延迟,我说不会,光跑得挺快的。 还有个挺酷的点:散热板本身的尺寸,和 V3 飞行器现成的太阳能阵列差不多大,大概 70 米翼展,相当大了。我们要造很多颗、放上天。你常说「名字里就带着 space(太空)」——上面空间多的是,哪怕你说的是几千颗甚至上百万颗卫星,上面也有大把地方可以挪。太空真的很大,不存在「太空会变拥挤」这回事。卫星相对地球极其微小,凑近看它显得大,可一放到跟地球比的尺度上,卫星小到根本看不见。 我们现在在轨大约有一万颗 Starlink,已经很懂怎么安全地运营这么大规模的星座了——我们是唯一一家有这种量级经验的运营方。正因为有这个底子,我们知道卫星可以排得多密、还能安全地飞,而安全是我们看待整个星座时的头号目标。 在 Bastrop 建厂 我们会造很多卫星,就在德州的巴斯特罗普(Bastrop)这儿造。我们现在就坐在那栋楼里。这栋楼已经很大了——你绕过转角,透过树丛看见它,会「哇」一声。但我们正要让这栋楼相形见绌。 事实上,太阳能制造厂已经在建了。接下来很快会建 AI 卫星生产楼。我们预计到明年底,AI 卫星生产、太阳能生产这些都能以一个合理的产量运转起来。所以谁想做 AI 卫星,这里基本会成为它的中心。 就在我们背后,机器正在轰鸣——我们仍在这里制造 Starlink 的所有用户终端,这条线不会挪走。事实上我们还在为新型号开新的生产线。这些就是新的 Starlink 终端,产量比现在的终端高得多。我们觉得最终全世界大概会有几亿个 Starlink 终端。再加上 Starlink 直连手机(direct-to-cell)星座,会直接连到人们的手机上,让你的手机和太空之间实现高带宽通信。 第三样:芯片,以及为什么需要 terafab 三个限制因素已经搞定两个:入轨运力、太阳能;第三个是芯片。 至少一开始,我们当然可以直接把已经在量产的芯片发上去。我们目前的参考设计用的是英伟达 Rubin 芯片,也可以是 GB300 或 Rubin;我们还会有一套基于 TPU 的参考设计——本质上你可以把任何现成芯片送上轨道。 但当前整个行业,看起来大概会做到每年 100 吉瓦量级的 AI 算力。这并没有回答「你怎么走到一太瓦」这个问题。这就是为什么你需要 terafab。要迈上下一个数量级,你需要一座巨大的芯片厂。给你个尺度感:我们预计 terafab 大约会有一亿平方英尺,是特斯拉得州超级工厂的十倍。 除了大,它还有什么独特、跟地球上任何其它芯片制造不一样的地方?随时间推移,terafab 上会有很多技术演进,但归根结底是「规模」。哪怕没有任何根本性的技术突破,你只要把现有的芯片制造技术——非常吃力地——放大到每年一太瓦的芯片产出。 从逻辑裸片(logic die)的角度看,这相当于每年十亿颗、每颗一千瓦(按整光罩当量算)的芯片:十亿颗整光罩当量芯片、每颗一千瓦,然后你还需要配上海量的内存。 时间线:别想小了 今天很多人还觉得轨道数据中心是「十年以后的事」。我们想给大家一个时间框架的概念——至少是我们瞄准的时间框架。大家可以对此打点折扣,因为这只是我们的最佳猜测,不是承诺,是我们打算去试、并且觉得大概能做到的事: 明年底:把空间 AI 算力做到「年化一吉瓦/年」的速率。 然后争取每年提升一个数量级:约两年半时摸到年化 10 吉瓦/年,三年半时也许 100 吉瓦。 再往后,看全球芯片制造和 terafab 的进展,进一步放大到每年一太瓦——也就是一千吉瓦。 一太瓦是美国当前用电量的两倍。我觉得会有这个需求,但走着瞧。那是非常多的卫星。 下一步:月球质量驱动器 走完地球上所有限制因素、把地球能做的都顶到天花板之后,下一步是什么,才能真正往「成为卡尔达肖夫二型文明」再争取几个百分点?为什么要停在这?为什么要想得那么小?因为一太瓦其实非常小。 要再上三个数量级、从「每年一太瓦」再乘一千,我们目前能看到的唯一办法,是在月球上用「质量驱动器」(mass driver)。 具体说,就是在月球上本地生产光伏板和散热板,芯片也许从地球带去,也可以设想直接在月球上造。但大部分质量必须在月球本地制造,这样你就不用从地球往月球运。然后,因为月球没有大气、引力只有地球的六分之一,你可以不用火箭就把 AI 卫星加速送进深空——基本上就是用一台电磁炮,类似电磁轨道炮,把它们「打」进太空。可以把它理解成一台直线电机。 我想我们可以放个视频…… 谢谢大家。

译马斯克近日宣布SpaceX/xAI太空计算蓝图:首颗AI卫星采用Starlink太阳能技术,峰值功率150千瓦、持续算力120千瓦,翼展70米,配110平方米液体散热器,通过星舰发射,使用激光链路通信。计划建设Terafab太空算力工厂,占地约1亿平方英尺(特斯拉Giga Texas的10倍),算力供应达1TW/年,相当于当前美国年消耗量(0.5TW)的两倍。目标将数据中心送入太空捕获太阳能,实现卡尔达肖夫等级跃迁。该项目依赖星舰完全可复用技术,预计三年内将年入轨量从约2500吨提升至百万吨级。

MiniMax (official)@MiniMax_AI · 6月9日32

Pick M3 as your base model on AgentBox to deploy with frontier coding, 1M-token context, and native multimodality all in one click.

译在AgentBox上选择M3作为你的基础模型,一键部署,即可获得前沿编码能力、百万token上下文窗口和原生多模态。

Rohan Paul@rohanpaul_ai · 6月9日83

For the very first time Elon Musk explains the "space data center plan" of @SpaceX in detail and its AI1 orbital AI data center satellite - and suddenly it looks so much closer than I thought. He says "There’s not some magic necessary that doesn’t exist for AI satellites. As Ian said this is a lot of this is technology we’ve already made for the… we basically don’t think this is a super hard problem compared to things that we already do." 📌 Power and compute capacity: - 150 kW peak power - ~120 kW sustained/average compute power - Roughly equivalent to one full NVIDIA GB300 (or upcoming Rubin) rack in a typical data-center operating envelope (~140 kW peak is possible but 120 kW average is more realistic for sustained workloads). 📌 Solar array: - Assumed efficiency: 250 W/m² (expected to improve beyond this). - Large, deployable solar panels (evolutions of the solar arrays already flying on Starlink V3 satellites). 📌 Radiators (thermal management): - Double-sided design, oriented “knife-edge” to the Sun to minimize solar heating. - Heat rejection: ~1,400 W/m² (expected to improve). - Radiator panels are roughly the same size/scale as the Starlink V3 solar arrays (~70 m wingspan class). 📌 Design philosophy: - Significantly simpler than a Starlink satellite — no massive phased-array antennas or complex communications hardware. - Core elements: solar panels + radiators + compute chips + laser links. - Larger overall than Starlink sats but described as “the easier one to design for.” 📌 Connectivity: - ~1 terabit/s via inter-satellite laser links. - Can mesh with the existing Starlink constellation or link directly to ground. - Low latency: satellites planned for ~600–800 km altitude → light-travel time yields only ~6–8 ms round-trip (light travels ~300 km per millisecond). 📌 Deployment and operations: - Launched by Starship (the only vehicle capable of the required millions-of-tons-to-orbit scale). - Part of a future large constellation (potentially up to ~1 million satellites). - Orbital data centers can be networked together or routed through Starlink for terrestrial users. 📌 Manufacturing and timeline: - Production in Bastrop, Texas. - Solar manufacturing facility already under construction. - Dedicated AI satellite production building to follow. - Reasonable-volume production targeted by end of next year (2027). - Initial chips will use existing NVIDIA GB300/Rubin designs with SpaceX reference hardware; future scaling via a new “Terra Fab” chip factory (~100 million sq ft, 10× the size of Tesla Giga Texas). 📌 Scalability notes: - Near-term goal: gigawatt-scale orbital AI compute. - Longer-term: terawatt-scale and beyond, eventually using lunar mass drivers (electromagnetic rail-gun style) to launch photovoltaics and radiators from the Moon (no atmosphere + 1/6 g makes this feasible). - Starship is expected to increase annual mass-to-orbit from today’s ~2,500 tons to millions of tons per year within a few years.

译Elon Musk 首次详细解释 SpaceX 的 AI1 轨道 AI 数据中心卫星:峰值功率 150 kW,持续计算功率约 120 kW,相当于一个 NVIDIA GB300 机架;太阳能板效率 250 W/m²;双面散热器排热 1,400 W/m²。通过激光链路实现约 1 Tbps 互联,低轨 600–800 km 高度往返延迟 6–8 ms。由 Starship 发射,计划部署多达百万颗卫星,2027 年底前实现量产。近地目标为吉瓦级轨道 AI 算力,长期向太瓦级推进。

meng shao@shao__meng · 6月9日75

Github 122K ⭐️ 的 Skills 仓库「Skills For Real Engineers」推出新 Skill「Teach」:把当前工作目录变成有状态的学习空间!!怒赞作者 @mattpocockuk 👍🏻 开源地址: https://github.com/mattpocock/skills/tree/main/skills/productivity/teach Teach Skill 设计理念:Knowledge → Skills → Wisdom · Knowledge:概念、事实、原理;来源于高质量可信资源(书籍、论文、专家文章) · Skills:能动手做的事;来源于交互式课程 + 即时反馈 · Wisdom:真实场景下的判断;来源于社区、同行、实践者交流 工作区架构:文件即学习状态 工作区根目录/ ├── MISSION.md # 为什么学(指南针) ├── RESOURCES.md # 可信资源库 ├── NOTES.md # 教学偏好与备忘 ├── lessons/0001-*.html # 课程(主交付物) ├── reference/*.html # 速查参考(长期回看) └── learning-records/ # 学习记录(决策依据) 状态机: · MISSION.md → 决定教什么、为什么教 · learning-records/ → 决定下一步教什么(最近发展区) · lessons/ → 单次学习单元 · reference/ → 压缩后的长期记忆 五个关键机制(为什么学 → 会什么 → 教什么 → 怎么教 → 留下来) 1. Mission:先定「为什么学」,一切教学服从真实目标;文件:MISSION.md 2. ZPD:每节课刚好够难——读记录、对使命、教一小步;文件:learning-records/ 3. Lesson:一节课一件事:知识 → 练习 → 即时反馈;文件:lessons/*.html 4. Learning Record:记「会了什么」,不记「讲过什么」;文件:learning-records/*.md 5. Reference:把学过的压成速查手册,长期回看;文件:reference/*.html + GLOSSARY.md

译GitHub 122K⭐的Skills仓库推出新技能Teach,可将当前工作目录变为有状态学习空间。设计理念从Knowledge(概念事实)→Skills(动手操作)→Wisdom(真实判断)。工作区以文件即学习状态:MISSION.md定目标、lessons/提供课程、learning-records/记录已会内容、reference/生成速查手册。五个关键机制:Mission定方向、ZPD根据记录调整难度、Lesson一课一事+即时反馈、Learning Record记“会了什么”而非“讲了什么”、Reference形成长期可回看手册。可通过npx skills add mattpocock/skills --skill teach安装,适用于从魔方到软件基础等学习场景。

eric zakariasson@ericzakariasson · 6月9日69

here are 3 loops you can run in cursor 1. Flaky-test exterminator /loop run my test suite 20 times, collect every intermittent failure, fix or quarantine the flaky ones, and don't stop until you get 5 consecutive fully-green runs.

译以下是在 Cursor 中运行的 3 个循环 1. 不稳定测试清除器 /loop 运行测试套件 20 次,收集所有间歇性失败,修复或隔离不稳定测试,直到连续 5 次完全通过才停止。

DogeDesigner@cb_doge · 6月9日53

Elon Musk just unveiled SpaceXAI's first AI satellite. • 150 kW peak power / 120 kW sustained compute power • 150 kW solar array using SpaceX-manufactured solar technology • Centralized AI compute payload designed for high-performance AI workloads • 70-meter wingspan when fully deployed • 110 m² deployable liquid radiators to remove waste heat in space • Redundant cooling loops with integrated micrometeoroid shielding • Designed to launch on Starship, enabling the mass-to-orbit needed for large-scale space computing • Uses laser links while avoiding many of the complex communications systems required by Starlink satellites • SpaceX believes future versions can scale far beyond this first design Elon Musk says the path to scaling AI in space requires 3 things: • Massive launch capability (Starship) • Enormous solar power generation • Large radiators to reject heat from AI chips He also suggested that truly large-scale orbital AI could eventually require hundreds of gigawatts to a terawatt of power, implying millions of tons of infrastructure in orbit.

译Musk 公布了 SpaceXAI 首颗 AI 卫星,峰值功率 150 kW、持续计算功率 120 kW,配备自产 150 kW 太阳能板,翼展 70 米。散热系统采用 110 m² 可展开液体散热器,带冗余冷却回路与微流星防护。卫星由 Starship 发射,用激光链路通信,避开 Starlink 复杂系统。SpaceX 认为未来版本可大幅扩展。Musk 指出太空 AI 规模化需三大条件:Starship 大运力、巨大太阳能发电、大型散热器,并暗示大规模轨道 AI 最终可能需数百 GW 到太瓦级功率及数百万吨基础设施。

karminski-牙医@karminski3 · 6月9日70

教你如何10秒钟训练一个小模型! 教大家如何从0训练一个(电)小(子)模(鹦)型(鹉)! (不包熟啊.....逃...) 只需要10秒钟! 而且完全不用搭建环境! 全程在网页训练! 首先你需要有个Mac, 我试了下N卡应该也行, 但是貌似有点问题适配的不好(我的3080Ti它适配失败了WarpSize不支持), 所以建议还是使用 Apple Silicon (M1-M5) 的 Mac 训练. 然后使用llmistanbul直接把你的纯文本文档拖进去就行, 尽量不要包含奇怪的格式, 比如markdown或者json啥的, 不然输出会很奇怪. 我这里直接把哈利波特1-7拖了进去 (注意, 你私下炼作为研究没人管, 但不要把别人的著作炼完了发出去, 请尊重原作者). 然后按照我这个图1:

译推文介绍了如何使用 llmistanbul 在网页上10秒内训练一个小模型(电子鹦鹉)。只需将纯文本文档(如哈利波特1-7)拖入即可,建议使用 Apple Silicon Mac(M1-M5),避免 markdown/json 等格式。N 卡(3080Ti)适配不佳。提醒尊重版权,勿公开发布他人作品。

OpenRouter@OpenRouter · 6月8日66

This month is, unsurprisingly, Cost Reduction Month. In our data from the last 3 yrs, we commonly see major cost crunches right after the latest breakthrough. We'll ship major features to help you cut inference costs at least once a week, starting with today. Running list 👇

译本月不出所料是成本削减月。 根据我们过去3年的数据,重大突破之后往往会出现成本压力。 我们将从今天开始,每周至少推出一次主要功能,帮助您降低推理成本。 持续更新列表 👇

Rohan Paul@rohanpaul_ai · 6月8日63

Coinbase CEO Brian Armstrong thinks AI demand is almost limitless, but he expects 80% of workloads to shift to models that are 99% cheaper within 12-18 months.

译Coinbase CEO Brian Armstrong 预测,对智能的需求近乎无限,但 80% 的工作负载将在 12-18 个月内迁移到便宜 99% 的模型,仅 20% 继续运行在追求最高 IQ 的最新模型上(如科学突破、高级编排型 AI 智能体)。他类比高端 MacBook/游戏 PC 的配置占比,但指出模型价格下降远超摩尔定律。Armstrong 认为未来瓶颈是能源和算力,而非更好的模型。Coinbase 正将用户提示词路由到更便宜的模型,部分情况下 token 用量指数增长,成本基本持平。

Xiaomi MiMo@XiaomiMiMo · 6月8日82

🚀 1,000+ TOKENS/S ON A 1T MODEL! 🚀 We are thrilled to release Xiaomi MiMo-V2.5-Pro-UltraSpeed in collaboration with @TileRT_AI , breaking the 1,000 tokens/s output speed on a 1 Trillion parameter model for the FIRST TIME! Not wafer-scale integration like Cerebras. Not pure on-chip SRAM chips like Groq. We achieve 1,000 tps on a 1T MoE model using just a SINGLE, STANDARD 8-GPGPU NODE. Read the full technical deep dive:https://mimo.xiaomi.com/blog/mimo-tilert-1000tps Want to experience the future of real-time AI? 👉 Apply for UltraSpeed now: https://platform.xiaomimimo.com/ultraspeed ⏳ Limited-Time Access: Application-based · Jun 8 – Jun 23 (PDT) 💬 Chat Experience: Completely FREE for a limited time — try the blazing-fast web chat now. ⚡ UltraSpeed API: Just 3x the price for a ~10x boost in output experience. 🤝 Enterprise & Large-Scale Needs: business-mimo@xiaomi.com

译小米 MiMo 联合 TileRT_AI 发布 MiMo-V2.5-Pro-UltraSpeed,首次在 1 万亿参数 MoE 模型上实现超过 1,000 tokens/s 输出速度,仅用单台标准 8-GPGPU 节点(非 Cerebras 或 Groq 方案)。提供限时免费聊天体验,UltraSpeed API 价格为 3 倍,输出体验提升约 10 倍。申请时间为 6 月 8 日至 23 日(PDT),企业可邮件联系 business-mimo@xiaomi.com。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月11日
23:49
Chubby♨️@kimmonismus
56
伊朗威胁马斯克中东资产:xAI数据中心与Starlink工厂

伊朗通过官方媒体威胁马斯克在中东的公司,目标指向xAI在沙特阿拉伯的500 MW AI数据中心与Starlink工厂。该数据中心与沙特国家AI机构HUMAIN合作建设,NVIDIA为主要芯片供应商,是目前xAI在美国以外最大的数据中心(对比孟菲斯Colossus-1约300 MW)。此举是回应特朗普在TruthSocial发文称“美国今晚将狠狠打击伊朗”。局势紧张。

xAI行业动态部署/工程
22:37
ClaudeDevs@ClaudeDevs
64
我们刚刚为 Claude Managed Agents 新增了两个功能: 1. 定时部署 - 按计划运行任务 2. 环境变量 - 将保险库凭据以环境变量的形式暴露给 CLI
Anthropic产品更新部署/工程
18:06
Alibaba Cloud@alibaba_cloud
65
Qwen 上线欧洲 AI 网关 Eden AI

阿里云宣布 Qwen 模型正式登陆欧洲领先 AI 网关 Eden AI,该平台拥有超过 20 万开发者。企业可通过 Eden AI 统一 API 调用 Qwen 开源权重模型,用于推理、编码和 AI 应用,支持多模型工作流并避免供应商锁定。为庆祝上线,所有 Qwen 模型享受 35% 折扣。下周 VivaTech 2026 大会上,Eden AI CEO 与 CPTO 将参与阿里云 AI 创新峰会活动。

产品更新开源/仓库部署/工程
17:06
Alibaba Cloud@alibaba_cloud
63
👏#ApsaraDB 有10篇论文被SIGMOD 2026接收--DB×AI、云原生存储与智能工具。从论文到产品:Beluga的CXL内存池正处于工程验证阶段;CloudJump III现已为#PolarDB的分层存储提供动力。 #AlibabaCloud 持续推动数据库前沿。🚀
数据/训练行业动态部署/工程
15:14
fofr@fofrAI
60
恶意软件开发者通过在间谍软件中添加核武器和生物武器相关文本,主动触发大模型安全拒绝机制,使AI安全扫描器无法分析该恶意软件。这是安全对齐中过度依赖一阶规则导致二阶盲点的典型案例:当闭源与开源模型内置激进拒绝策略时,攻击者会注入这些触发词来逃避检测。SocketSecurity的帖子指出,设计恶意软件分析管道需考虑意图以防范提示词操纵。当前仅是攻击者利用这类特征的早期阶段,未来处理复杂网络安全的用户系统可能需要模型具备更少的安全顿感。

John Scott-Railton: NEW: malware developers added nuclear & biological weapons text to to their spyware. Goal? To trigger LLM safety refusal...

安全/对齐部署/工程
11:06
Greg Brockman@gdb
61
将你的Oracle云承诺用于OpenAI产品:https://openai.com/index/openai-on-oracle-cloud/
OpenAI行业动态部署/工程
10:51
小互@xiaohu
74
Google 开源扩散架构模型 DiffusionGemma

Google 开源 DiffusionGemma,基于扩散架构,一次性生成大段文本再逐步优化。H100 上达 1000+ tokens/s,RTX 5090 上 700+ tokens/s。26B 参数仅需 18GB 显存,一次生成 256 tokens。多轮迭代自我纠错,可修改已生成内容。

Google开源/仓库推理模型发布
10:26
郭明錤|Ming-Chi Kuo@mingchikuo
58
台积电下一代先进封装CoPoS关键要点

郭明錤分析,台积电CoPoS预计2028下半年量产,面向9.5倍光罩尺寸以上超大封装,NVIDIA Feynman AI芯片或率先采用。玻璃用于两个位置:310×310mm临时载板,以及250×250mm(试产)/510×515mm(量产)玻璃面板加工成玻璃核心基板。该基板为三层结构——玻璃芯两侧叠加ABF增层,TGV成孔与铜填充等挑战集中于此处。澄清常见误解:玻璃非中介层,互连由RDL、TGV/Cu及ABF共同承担;玻璃与ABF共存而非替代;芯片贴装在ABF增层表面。CoPoS有望延续台积电先进封装领先优势至2032年左右。

行业动态部署/工程
07:09
Berryxia.AI@berryxia
64
Google DiffusionGemma:4倍速文本生成开源模型

Google 发布实验性开源模型 DiffusionGemma(Apache 2.0),采用并行 diffusion 方式代替传统自回归“逐词预测”,可同时起草、纠错和精炼整块文本,生成速度达 4 倍提升(1000+ token/s)。模型在 18GB 消费级显卡即可本地运行,适用于代码、数学、复杂编辑等任务,已开源权重至 Hugging Face。

Google: Meet DiffusionGemma ⚡ Our latest experimental open model (Apache 2.0) that generates text up to 4x faster. Instead of pr...

Google开源生态模型发布部署/工程
04:47
Chubby♨️@kimmonismus
58
最大的瓶颈将是能源--很快。 Gartner 2026年预测显示,全球数据中心电力消耗将达到565 TWh,较去年增长26%。AI服务器已占其中的31%,并将于2027年超越传统服务器。 值得注意的是,Gartner给出的制约因素是电力,而非芯片。他们预计到2030年需求将超过1,200 TWh,并警告电网将无法跟上。 因此,竞赛悄然从谁拥有最佳硅片转向谁能真正获得电力来驱动它。
数据/训练现象/趋势部署/工程
02:23
Rohan Paul@rohanpaul_ai
55
NVIDIA 展示共封装光学(CPO)交换机视频

NVIDIA 发布了与 Lambda 合作的共封装光学(CPO)交换机视频。CPO 将光通信部件移至主网络芯片附近,而非独立可插拔模块。官方博客指出,在 GB300 NVL72 规模下,CPO 通过降低网络功耗和消除大量可插拔光学组件来减少故障点,提升每瓦 token 数。一个 128,000 GPU 数据中心传统需约 655,000 个独立收发器,每个都是潜在故障点,CPO 完全移除该类组件。智能体工作负载需要弹性数据移动,CPO 可减少网络功耗和组件数量,避免 GPU 等待数据。

NVIDIA AI Infrastructure: 📣 Get a first look at the NVIDIA Photonics co-packaged optics switch with @LambdaAPI. At NVIDIA GB300 NVL72 scale, the ...

产品更新部署/工程
02:06
Fuli Luo@_LuoFuli
74
强大的模型进化需要坚实的驾驭系统,反之亦然。14天,5人,一次vibe-coding旅程--MiMo Code就此诞生。它已开源:https://github.com/XiaomiMiMo/MiMo-Code
开源/仓库数据/训练部署/工程
01:53
Ethan Mollick@emollick
49
"换更便宜的模型来省钱"是个问题,因为更便宜的模型更差(也许对某个特定用途来说足够好,但依然较差)。 更常见的方法是模型层级结构,由智能模型作为廉价模型的协调者和审核者。
大佬观点部署/工程
01:25
SemiAnalysis@SemiAnalysis_
63
DeepSeek 正走向重资产模式。 6 月 9 日,该公司发布了 IDC 规划工程师的招聘信息,该职位明确涉及兆瓦级到吉瓦级基础设施的设计与交付。这紧随其 4 月在内蒙古乌兰察布招聘数据中心运维工程师。综合来看,这是 DeepSeek 首次完全展露其自持算力基础设施而非仅租赁的意图。
DeepSeek现象/趋势部署/工程
01:09
Replit ⠕@Replit
精选65
大多数人在发布项目前会运行安全扫描以检测恶意包 但风险从安装的那一刻就已开始 今天,我们正式推出 Package Firewall,与 Socket 合作构建 它在恶意软件到达你的应用之前就将其拦截
产品更新部署/工程

推荐理由:Replit 跟 Socket 合作搞了个包防火墙,自动拦截恶意依赖,对经常在 Replit 上跑项目的开发者是个实用补丁,但算不上大版本更新,普通用户可能无感。
00:19
Claude@claudeai
72
Code with Claude Tokyo 新功能:定时部署和保险库中的环境变量已在 Claude Managed Agents 中进入公测,Claude Code 的动态工作流已正式可用。 Agent 现在可以按计划运行,安全使用你的工具,并承担更大的任务。
AnthropicMCP/工具产品更新部署/工程
关联讨论 1 条Claude:Blog(网页)
6月10日
15:42
Huawei Cloud@HuaweiCloud1
52
没有合适的平台,你就无法扩展智能体。在华为云INSPIRE 2026上,华为董事、华为云CEO张平安介绍了AgentArts,一个企业级平台,旨在帮助企业更快地扩展智能体。 https://tinyurl.com/5cjcph9d #INSPIRE2026 #HuaweiCloud #AI
智能体产品更新部署/工程
15:11
Huawei Cloud@HuaweiCloud1
29
你无法在不牢靠的根基上扩展智能。因此,在华为云INSPIRE 2026上,我们夯实了它脚下的大地。 硬件-软件协同。四项Agentic Infra创新。一种新范式。 了解更多:https://tinyurl.com/3yukj4wm #INSPIRE2026 #HuaweiCloud #AI
智能体行业动态部署/工程
13:07
Berryxia.AI@berryxia
46
Smith分享Loop Engineering学习心得

Berry Xia表示,学完Harness后接触Loop Engineering,认为理解其底层逻辑对Vibe Coding和产品架构设计帮助很大。他原计划写文章分享,但Smith(@smithandai)已发表相关文章,推荐阅读。

Smith铜匠・十点睡觉: http://x.com/i/article/2064229409247358976

智能体教程/实践部署/工程
03:34
MiniMax (official)@MiniMax_AI
46
MiniMax 在 @RespanAI Gateway 上线 开发者现在有了另一种便捷方式访问我们的模型。 随着更多团队在文本、语音、图像、视频和音乐领域推出 AI 产品,我们希望在你需要时,我们的模型就在那里。 链接在评论区 👇 #MiniMax #Respan #AIGateway #MultimodalAI #AIModels #Developers #BuildWithAI
多模态行业动态部署/工程
03:04
MiniMax (official)@MiniMax_AI
54
Modular 内核团队正在快速推进 M3 🚀 开源权重将在几天内发布--届时即可立即在 @Modular 上运行。 对此非常期待。

Modular: Our kernel team has been deep in MiniMax M3 all week. The 1M-token context and native multimodality make it a hard model...

开源生态模型发布部署/工程
02:29
ClaudeDevs@ClaudeDevs
60
如果你无法访问 Claude Fable 5,请尝试运行 /model claude-fable-5。 在 Claude Code CLI 中,请确保升级到 2.1.170。 如果你使用的是 Claude Desktop 应用,请更新到最新版本。
Anthropic教程/实践部署/工程
关联讨论 32 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:OpenRouter (@OpenRouter)X:Testing Catalog (@testingcatalog)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Claude Devs (@ClaudeDevs)X:Artificial Analysis (@ArtificialAnlys)X:宝玉 (@dotey)X:Andrej Karpathy (@karpathy)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨X:歸藏 (@op7418)The Verge:AI(RSS)X:Berry Xia (@berryxia)Anthropic:Newsroom(网页)X:Vista (@vista8)The Decoder:AI News(RSS)X:Claude (@claudeai)X:Boris Cherny (@bcherny)Simon Willison 博客X:Rohan Paul (@rohanpaul_ai)X:Dario Amodei (@DarioAmodei)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)公众号:数字生命卡兹克
02:04
Replit ⠕@Replit
44
我使用 Replit 的并行代理,同时为我的旅行应用构建了移动应用、宣传视频和推介 PPT 👇
智能体产品更新部署/工程
01:36
OpenRouter@OpenRouter
51
AI 法规即将到来,且不仅限于欧盟用户。一个核心主题是:敏感操作需要人工把关。 欧盟 AI 法案(2026 年 8 月)、科罗拉多州 ADMT 法(2027 年 1 月)和 NIST AI RMF 均要求可审查的关卡。 OpenRouter Agent SDK 让这一切变得简单👇
智能体产品更新部署/工程
6月9日
22:50
SemiAnalysis@SemiAnalysis_
65
DeepSeek V4 1.6T 第0天至第43天性能随时间变化 - 华为, GB300 NVL72, MI355X, B200 第0天在InferenceX上的推理性能 26天内100倍性能提升 每百万Token成本 华为950DT推理追踪分析 https://semianalysis.substack.com/p/deepseekv4-16t-day-0-to-day-43-performance
DeepSeek推理评测/基准部署/工程
19:51
Tencent Hy@TencentHunyuan
精选67
腾讯混元发布UniRL:统一多模态强化学习基础设施

腾讯混元推出UniRL,一个支持统一多模态模型的强化学习基础设施,并发布两个新算法DRPO和Flow-DPPO。UniRL通过单个后训练循环(生成→评分→优势→更新→同步)覆盖扩散/流匹配模型、LLM/VLM及统一多模态模型(如Hunyuan-Image 3和Bagel)。模型与算法作为独立轴,可实现模型×算法的组合覆盖。框架支持可插拔rollout引擎(训练侧/SGLang/vLLM-Omni)、FSDP2分片和三种部署模式。FlowDPPO针对流/扩散模型引入基于精确散度的信任域策略优化;DRPO为LLM RL提供平滑的优势加权二次正则化方法。代码已开源。

多模态开源/仓库论文/研究部署/工程
关联讨论 1 条X:腾讯混元 (@TencentHunyuan)
推荐理由:UniRL把扩散和LLM的强化学习塞进同一个训练循环,外加两个新算法,多模态对齐的研究者可以立刻fork代码试起来。
19:44
Rohan Paul@rohanpaul_ai
64
Transformer QKV投影必要性研究

一篇论文系统研究了Transformer注意力中QKV投影的必要性,发现Key和Value可共享同一投影(Q-K=V变体),仅增加3.1%的困惑度,便将KV cache削减50%,大幅降低推理内存。最佳变体保留Query独立,使注意力保持方向性。与GQA和MQA结合时,可分别实现87.5%和96.9%的cache缩减。弱变体Q=K-V因导致因果注意力过于对称且无cache节省而无效。

arXiv推理论文/研究部署/工程
18:18
Alibaba Cloud@alibaba_cloud
67
阿里云在马来西亚柔佛州推出了一个新的公有云区域,包含两个新数据中心,以满足今年下半年马来西亚对云和AI服务日益增长的需求,包括AgentRun、STAROps、ACS Agent Sandbox、Agent Security Center、AI Security Guardrails 2.0和Agentic SOC。https://int.alibabacloud.com/m/1000414242/
智能体行业动态部署/工程
15:33
Perplexity@perplexity_ai
51
昨天在伦敦科技周上,我们宣布了 Billion Pound Build 竞赛。 团队可以参赛,使用 Perplexity Computer 打造自己的公司,争夺 100 万英镑的 Compute credits 份额。 演示阶段现已开放,截止日期为 7 月 6 日。
行业动态部署/工程
14:05
Berryxia.AI@berryxia
37
Loop Engineering:AI系统各环节环环相扣

设计真正的AI系统涉及大量工程细节,提示词工程、上下文工程、记忆模块、skills等环节缺一不可,彼此环环相扣形成了一个完整系统。Berry Xia引用了一篇关于Loop Engineering的清晰阐述,强调这些组件的系统性整合才是关键。

Cell 细胞: http://x.com/i/article/2064143847765020672

大佬观点部署/工程
11:09
小互@xiaohu
47
马斯克公布太空计算蓝图:AI卫星与Terafab工厂

马斯克近日宣布SpaceX/xAI太空计算蓝图:首颗AI卫星采用Starlink太阳能技术,峰值功率150千瓦、持续算力120千瓦,翼展70米,配110平方米液体散热器,通过星舰发射,使用激光链路通信。计划建设Terafab太空算力工厂,占地约1亿平方英尺(特斯拉Giga Texas的10倍),算力供应达1TW/年,相当于当前美国年消耗量(0.5TW)的两倍。目标将数据中心送入太空捕获太阳能,实现卡尔达肖夫等级跃迁。该项目依赖星舰完全可复用技术,预计三年内将年入轨量从约2500吨提升至百万吨级。

大佬观点部署/工程
10:26
MiniMax (official)@MiniMax_AI
32
在AgentBox上选择M3作为你的基础模型,一键部署,即可获得前沿编码能力、百万token上下文窗口和原生多模态。

GMI Cloud: Today, we are launching GMI Agent Box. A complete infrastructure stack for production-ready AI agents: native Docker, fl...

智能体行业动态部署/工程
10:12
Rohan Paul@rohanpaul_ai
同事件精选83
Elon Musk 详解 SpaceX AI1 轨道 AI 数据中心卫星方案

Elon Musk 首次详细解释 SpaceX 的 AI1 轨道 AI 数据中心卫星:峰值功率 150 kW,持续计算功率约 120 kW,相当于一个 NVIDIA GB300 机架;太阳能板效率 250 W/m²;双面散热器排热 1,400 W/m²。通过激光链路实现约 1 Tbps 互联,低轨 600–800 km 高度往返延迟 6–8 ms。由 Starship 发射,计划部署多达百万颗卫星,2027 年底前实现量产。近地目标为吉瓦级轨道 AI 算力,长期向太瓦级推进。

SpaceX: Watch @ElonMusk provide a technical update on SpaceX's capability to manufacture, launch, and operate AI satellites at s...

行业动态部署/工程
同一事件,精选展示《SpaceX与Anthropic合作提供大规模AI算力服务》
推荐理由:马斯克首次详细勾勒太空 AI 数据中心的路线图,从单颗卫星的 120kW 算力到百万颗组网的 terawatt 规模,把算力痛点从土地和电力拽到轨道上,基础设施的想象力得跟着刷新了。
08:43
meng shao@shao__meng
精选75
GitHub 122K⭐的Skills推出新技能「Teach」:把工作目录变有状态学习空间

GitHub 122K⭐的Skills仓库推出新技能Teach,可将当前工作目录变为有状态学习空间。设计理念从Knowledge(概念事实)→Skills(动手操作)→Wisdom(真实判断)。工作区以文件即学习状态:MISSION.md定目标、lessons/提供课程、learning-records/记录已会内容、reference/生成速查手册。五个关键机制:Mission定方向、ZPD根据记录调整难度、Lesson一课一事+即时反馈、Learning Record记“会了什么”而非“讲了什么”、Reference形成长期可回看手册。可通过npx skills add mattpocock/skills --skill teach安装,适用于从魔方到软件基础等学习场景。

Matt Pocock: /teach is live Learn anything, from rubik's cube to vocal harmonies to software fundamentals. npx skills add mattpocock/...

GitHub开源/仓库部署/工程

推荐理由:mattpocock 这个 Teach Skill 把学东西从看文章变成写代码,用文件作为学习状态机,做开发者的可以立刻用起来,思想比同类教程工具高一个档次。
07:26
eric zakariasson@ericzakariasson
69
以下是在 Cursor 中运行的 3 个循环 1. 不稳定测试清除器 /loop 运行测试套件 20 次,收集所有间歇性失败,修复或隔离不稳定测试,直到连续 5 次完全通过才停止。
教程/实践编码部署/工程
06:59
DogeDesigner@cb_doge
53
Elon Musk 公布 SpaceXAI 首颗 AI 卫星细节

Musk 公布了 SpaceXAI 首颗 AI 卫星,峰值功率 150 kW、持续计算功率 120 kW,配备自产 150 kW 太阳能板,翼展 70 米。散热系统采用 110 m² 可展开液体散热器,带冗余冷却回路与微流星防护。卫星由 Starship 发射,用激光链路通信,避开 Starlink 复杂系统。SpaceX 认为未来版本可大幅扩展。Musk 指出太空 AI 规模化需三大条件:Starship 大运力、巨大太阳能发电、大型散热器,并暗示大规模轨道 AI 最终可能需数百 GW 到太瓦级功率及数百万吨基础设施。

产品更新其他部署/工程
05:17
karminski-牙医@karminski3
70
llmistanbul 10秒训练电子鹦鹉模型教程

推文介绍了如何使用 llmistanbul 在网页上10秒内训练一个小模型(电子鹦鹉)。只需将纯文本文档(如哈利波特1-7)拖入即可,建议使用 Apple Silicon Mac(M1-M5),避免 markdown/json 等格式。N 卡(3080Ti)适配不佳。提醒尊重版权,勿公开发布他人作品。

教程/实践端侧部署/工程
6月8日
23:54
OpenRouter@OpenRouter
66
本月不出所料是成本削减月。 根据我们过去3年的数据,重大突破之后往往会出现成本压力。 我们将从今天开始,每周至少推出一次主要功能,帮助您降低推理成本。 持续更新列表 👇

OpenRouter: New server tool: Advisor Let smaller models consult a higher-intelligence "advisor" model. Helps them escape doom loops,...

智能体产品更新部署/工程
关联讨论 2 条OpenRouter:Announcements(RSS)X:OpenRouter (@OpenRouter)
23:11
Rohan Paul@rohanpaul_ai
63
Coinbase CEO Brian Armstrong 预测,对智能的需求近乎无限,但 80% 的工作负载将在 12-18 个月内迁移到便宜 99% 的模型,仅 20% 继续运行在追求最高 IQ 的最新模型上(如科学突破、高级编排型 AI 智能体)。他类比高端 MacBook/游戏 PC 的配置占比,但指出模型价格下降远超摩尔定律。Armstrong 认为未来瓶颈是能源和算力,而非更好的模型。Coinbase 正将用户提示词路由到更便宜的模型,部分情况下 token 用量指数增长,成本基本持平。

Brian Armstrong: Good take My guess is - demand for intelligence is near infinite - but 80% of workloads will be running on 99% cheaper m...

大佬观点部署/工程
22:40
Xiaomi MiMo@XiaomiMiMo
同事件精选82
小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型

小米 MiMo 联合 TileRT_AI 发布 MiMo-V2.5-Pro-UltraSpeed,首次在 1 万亿参数 MoE 模型上实现超过 1,000 tokens/s 输出速度,仅用单台标准 8-GPGPU 节点(非 Cerebras 或 Groq 方案)。提供限时免费聊天体验,UltraSpeed API 价格为 3 倍,输出体验提升约 10 倍。申请时间为 6 月 8 日至 23 日(PDT),企业可邮件联系 business-mimo@xiaomi.com。

推理模型发布部署/工程
同一事件,精选展示《小米 MiMo 与 TileRT 联合发布 UltraSpeed 模式,1T 模型输出突破 1000 tokens/s》
推荐理由:小米用单节点8卡标准GPU在1T MoE模型上跑出1000+ tokens/s,没有走晶圆级或专用芯片的路子,直接把推理成本门槛拉低了一大截,做实时对话和Agent的可以申请免费聊天先上手感受一下。
‹ 上一页
1…56789…25
下一页 ›