AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 983 条
全部一手资讯X论文
标签「部署/工程」清除
DogeDesigner@cb_doge · 6月5日75

Elon Musk on taking SpaceX public: "I've been asked for many years about taking SpaceX public, so it's probably been almost 10 years that people have been suggesting to me that I should take SpaceX public. We've been positive cash flow for quite a long time, I think, since around 2014-2015 and we've been self-funding, in fact, in our sort of private equity rounds, we actually have not been fundraising rounds, they've been liquidity rounds for investors and employees, because we give everyone at the company stock, and SpaceX has actually bought back stock in most of our sort of funding events. What's different about now is that was it's a number of things, we are embarking on a significant growth phase, like capital growth phase, where we're are going to put in orbit, probably 100,000 satellites, probably over 100,000 satellites, just for communications. The appetite for bandwidth of AI and robots is going to be enormous, and then we're also doing the AI data centers in space, which is another massive capital endeavor, but I think it will be the primary means by which AI can be expanded."

译马斯克在JPMorgan活动上回应SpaceX上市问题:他已被建议上市近10年,自2014-2015年起SpaceX就已实现正现金流并自筹资金,之前的私募轮次实际是面向投资者和员工的流动性/回购轮次。当前不同之处在于SpaceX正进入显著资本增长阶段,计划发射约10万颗通信卫星(可能超10万颗),AI和机器人对带宽需求巨大,还将在太空中建设AI数据中心,马斯克认为这将成为AI扩张的主要手段。

Berryxia.AI@berryxia · 6月5日60

😂 LM Studio 手机版也发布了,这下你可以“烧”你的iPhone 在本地跑大模型了……😆

Sam Altman@sama · 6月5日80

build and publish web apps with chatgpt! i really wish i had this when i was a kid, but i do miss hypercard.

译用ChatGPT构建并发布网页应用! 我真希望我小时候就有这个,但我确实怀念HyperCard。

Replit ⠕@Replit · 6月5日19

Build Your Business Live https://x.com/i/broadcasts/1qGoNNngZkyKv

译实时构建你的业务 https://x.com/i/broadcasts/1qGoNNngZkyKv

SemiAnalysis@SemiAnalysis_ · 6月4日38

Vertical power delivery, flexible moving-pin interposers, and direct-impingement water cooling. Cerebras had to rewrite the mechanical engineering playbook just to keep a single wafer from cracking itself apart.

译垂直功率传输、柔性移动引脚中介层和直接冲击水冷。Cerebras 不得不重写机械工程手册,仅仅是为了防止单个晶圆自裂。

Chubby♨️@kimmonismus · 6月4日66

The backlash from communities against data centers is reaching immense proportions. Residents of Monterey Park, California, voted overwhelmingly (about 86% in favor) to permanently ban datacenters, making it the first US city to enact such a ban through a ballot initiative rather than a council-passed moratorium. The vote reflects broader national backlash against AI datacenters - a recent Gallup poll found 7 in 10 Americans oppose construction in their local areas -with at least a dozen states now weighing moratoriums. Two thoughts on this: 1) It explains why Satya Nadella spent a relatively large amount of time at Microsoft Build addressing the prejudices and concerns surrounding data centers. The backlash is truly becoming a major problem. 2) Besides the understandable concerns (electricity costs, water consumption, real estate prices) that can actually be addressed, I often read that it's recurring resentment, prejudice against AI. I can't fully assess what's behind it. Presumably, it's a mixture of fear (of what's to come, what isn't understood) as well as the fear of losing one's own dominance as a human being (hubris; In his 1917 essay "A Difficulty in Psychoanalysis," Sigmund Freud coined the term "three great 'affronts to humanity'." These describe scientific findings that profoundly shook the human self-image and knocked humanity from its pedestal of supposed uniqueness and absolute control. AI is presumably bringing us the fourth). These concerns will increase, and so will the backlash. I'm worried that it will reach dramatic proportions. Data centers are needed; they are essential. To quote Demis Hassabis, AI will bring us in the golden age of science. For this, the expansion of data centers is necessary. Source: The Guardian

译加州蒙特利公园市以约86%赞成票通过永久禁止数据中心的法案,成为首个通过投票禁令而非市议会临时叫停的美国城市。这反映全国性反AI数据中心浪潮:盖洛普民调显示70%美国人反对本地建设,至少十几个州正考虑暂停。微软纳德拉在Build大会花较大篇幅回应相关偏见与担忧。背后除了电力、水耗、房价等可解决忧虑,还混合了对AI的恐惧及人类优越感受损(弗洛伊德所谓“对人类自恋的第四次打击”)。作者担心抵制会愈演愈烈,但数据中心对AI带来的科学黄金时代不可或缺。

Berryxia.AI@berryxia · 6月4日70

我擦@! 我发现现在Apple的MLX框架和模型都可以Day0发布了? 这看来是同步进行操作的,MLX框架以及和模型厂商直接第一时间进行了对接啊! 强烈建议Mac的同学直接上MLX框架的模型,速度一般至少10-20%还是有的。

SemiAnalysis@SemiAnalysis_ · 6月4日57

With the introduction of the TPUv8t, their new training focused TPU, Google unveiled a new scale-out network architecture called Virgo. Virgo is able to interconnect up to 134,400 chips with up to 47 Pbps of non-blocking bi-sectional bandwidth. (1/4)🧵

译随着TPUv8t(其新型训练专用TPU)的推出,Google公布了一种名为Virgo的全新横向扩展网络架构。Virgo能够将多达134,400个芯片互联,提供高达47 Pbps的无阻塞双向带宽。(1/4)🧵

xAI@xai · 6月4日69

Try Grok models on @Cloudflare's AI Gateway!

译在 @Cloudflare 的 AI Gateway 上尝试 Grok 模型!

StepFun@StepFun_ai · 6月4日56

Deploy Step 3.7 Flash on @modal with SGLang 🚀 Modal is a serverless AI platform for deploying and scaling compute-intensive workloads without managing infrastructure. Their new guide shows how to serve our open-weight Step 3.7 Flash with SGLang on Modal, using 8×H100 GPUs, Modal Volumes, and an OpenAI-compatible chat completions endpoint. Excited to collaborate with Modal to make StepFun models more accessible to builders. https://modal.com/docs/examples/stepfun_inference

译在 @modal 上用 SGLang 部署 Step 3.7 Flash 🚀 Modal 是一个无服务器 AI 平台,用于部署和扩展计算密集型工作负载,无需管理基础设施。 他们的新指南展示了如何在 Modal 上使用 SGLang 服务我们的开源权重 Step 3.7 Flash,采用 8×H100 GPU、Modal Volumes 以及兼容 OpenAI 的聊天补全端点。 很高兴与 Modal 合作,让 StepFun 模型更易于构建者使用。 https://modal.com/docs/examples/stepfun_inference

Replit ⠕@Replit · 6月4日67

You shipped your app. Now what? Your app may look great, but if no one can find it, it stays invisible Publishing is only the beginning Meet SEO Agent. It runs a scan for you and suggests fixes to help your app get discovered in web & AI search

译你发布了你的应用。然后呢? 你的应用可能看起来很棒,但如果没人能找到它,它就依然不可见。 发布只是开始。 认识一下SEO Agent。它会为你运行一次扫描,并建议修复措施,帮助你的应用在网页搜索和AI搜索中被发现。

Microsoft Research@MSFTResearch · 6月4日62

A three‑month pilot in a Midwestern bottling plant shows what happens when AI moves beyond chat and into decision-making, where constraints shift, stakes are real, and answers must hold. https://msft.it/6015vjYUN

译一份在中西部装瓶厂进行的三个月试点显示,当AI超越聊天进入决策领域时会发生什么——约束条件变化、风险真实、答案必须可靠。 https://msft.it/6015vjYUN

eric zakariasson@ericzakariasson · 6月4日74

http://x.com/i/article/2061967596568875008 # Don't let your agent guess, give it runtime context If you've ever watched an agent try to fix a bug, you've watched it guess. It reads the code, comes up with a theory, makes an edit, and hopes. Sometimes it's right. A lot of the time you get a fix that looks confident and quietly hides the real bug. Debug Mode is what we built for that. Instead of sitting there reasoning about the code, the agent goes and gets evidence about what the code does when it runs. Here's the loop 1. Agent comes up with multiple hypotheses, and starts to work on the most plausible first 1. Then, logging is added to test one hypothesis (without touching implementation) 1. A little debug server collects the runtime output to .cursor/debug.log while your program runs. 1. You reproduce the bug, and agent can now read the logs and understand what happened instead of having to guess 1. Cursor finds the root cause in the logs, makes the fix, and pulls out the logging it added. Here it is on a real bug, sped up to about a minute: ## How the team uses it Some interesting things that we've solved internally with debug mode: - A race condition that hit 1 in 20 runs. It was corrupting git metadata in our best-of-N runs. Debug Mode pinned it down in under an hour - A memory leak, traced in one pass. It came down to a misuse of our frontend framework. The fix was a single line. - A native crash deep in C++. An Electron crash people would normally route around. The logs made it findable. - An SSR flicker that had been given up on. A rendering bug nobody wanted to touch, fixed once the agent could see what the page was doing at runtime. Try it with Shift+Tab (it's in the CLI too, via /debug). I'm sure people are using it in ways I haven't thought of, so let me know!

译Cursor 发布 Debug Mode,解决 AI 智能体靠猜测修 Bug 的问题。工作流程:Agent 先生成多个假设,为最可能的假设添加日志(不修改代码);调试服务器在程序运行时收集输出到 `.cursor/debug.log`;用户重现 Bug 后,Agent 读取日志而非猜测;最后 Cursor 从日志找到根因并修复,自动移除添加的日志。内部案例:追踪 1/20 概率出现的 git 元数据竞争条件(1 小时内定位);一次单趟追踪内存泄漏(修复仅一行);定位 Electron 中 C++ 原生崩溃;修复此前无人敢碰的 SSR 闪烁问题。用户可通过 Shift+Tab 或在 CLI 中使用 `/debug` 触发。

AYi@AYi_AInotes · 6月3日46

发现老黄简直就是个行走的拉盘神器, COMPUTEX 2026 台北国际电脑展, Nvidia 市值5万多亿的黄仁勋,逛展会逛累了,直接跑到技嘉展台,席地一坐,跟技嘉老总李宜泰喝起来了。 旁边围了一圈人,他完全不在意,地上坐了近 10 分钟。 技嘉股价当场就被拉了一下, 估计很多人都纳闷,:老黄和技嘉到底铁到什么程度?这么捧场? 上上届 COMPUTEX 他公开喊过 "GIGABYTE NO.1",这次直接坐人地盘上喝啤酒——是真把合作伙伴当兄弟。 而且有个规律很硬,COMPUTEX 期间老黄一出现,相关供应链股票经常大涨,技嘉最近参会已经五连涨超 20%,这个视频一出,盘中又被带了一波。 所以怎么看这个信号? 第一层是股价信号,他在哪里坐下,市场的钱就跟到哪里, 第二层更深,他没去敲钟的展台,而是去长期合作伙伴的地盘坐下来聊天 ,这说明 Nvidia 的供应链逻辑里,技嘉的位置在加深,而不只是贴个牌。 对看供应链的人来说,老黄的行程表比研报值钱。

译黄仁勋在COMPUTEX 2026上逛至技嘉展台,席地而坐与技嘉老总喝啤酒近10分钟,引来围观。技嘉股价当场被拉,期间已五连涨超20%。深层信号显示Nvidia供应链逻辑中技嘉地位加深。引用推文回顾:2009年Nvidia市值仅40亿美元(Intel 1000亿),黄仁勋押注CUDA和异构计算,17年后Nvidia市值5万亿,Intel约五千亿,25倍劣势变为近10倍反超,体现其远见与护城河。

X.PIN@thexpin · 6月3日40

As AI strains power grids, China is moving data centers into space! Industrial collabs are rapidly forming across major cities, while Beijing aims to launch its first experimental satellite by 2028 to build a space-ground computing network. This gives China a crucial head start.

译随着 AI 对电网造成压力,中国正将数据中心送入太空! 各大城市快速形成产业合作,北京计划在 2028 年前发射首颗试验卫星,以构建天地计算网络。这使中国占据了关键先机。

Alibaba Cloud@alibaba_cloud · 6月3日22

Ontology bridges the LLM "Semantic Gap" in AIOps! 🧠 Pain Points: • LLMs lack private topology context 🏗️ • Correlation ≠ Causality 🔗 • Unexplainable black-box decisions ❓ ✅ UModel Solution: • Object-oriented IT modeling 🧩 • Unified query for multi-source data 📊 • Deterministic, auditable root-cause analysis Build trustworthy Agents with explicit knowledge graphs. 🚀 https://int.alibabacloud.com/m/1000413984/ #AIOps #LLM #Ontology #DevOps #CloudNative

译本体(Ontology)弥合了 AIOps 中 LLM 的“语义鸿沟”!🧠 痛点: • LLM 缺乏私有拓扑上下文 🏗️ • 相关 ≠ 因果 🔗 • 无法解释的黑箱决策 ❓ ✅ UModel 解决方案: • 面向对象的 IT 建模 🧩 • 多源数据统一查询 📊 • 确定性、可审计的根因分析 用显式知识图谱构建可信智能体。 🚀 https://int.alibabacloud.com/m/1000413984/ #AIOps #LLM #本体 #DevOps #云原生

Rohan Paul@rohanpaul_ai · 6月3日58

Satya Nadella: Microsoft’s latest Wisconsin AI data center keeps yearly water consumption no higher than that of 1 local restaurant. "The cooling loop is filled once and the data centre can operate effectively with zero water consumption. Daily water usage across a year is roughly equivalent to what a single restaurant would use" The mechanism is mainly about replacing evaporative cooling with closed-loop direct-to-chip liquid cooling, so water moves like coolant inside a sealed machine rather than being boiled off into the air. Hot GB200-class AI racks produce too much heat for normal air cooling, so cold liquid is pushed through pipes into the servers and across metal cold plates touching the hottest chips. The liquid enters the rack cool, absorbs heat from the chips through cold plates, then exits the rack at a higher temperature and carries that heat through pipes to a huge cooling system outside the compute floor. Microsoft says Fairwater sends that hot water to cooling “fins” beside the datacenter, where 172 20-foot fans blow air across the fins and dump the heat into the outside air. The important detail is that the air cools the water through metal surfaces, so the water does not need to evaporate the way many older datacenters use cooling towers. The cooled liquid then returns to the servers, repeats the loop, and keeps absorbing heat from the chips. In older data centers, heat is often removed partly through cooling towers. Hot water meets moving air, some water evaporates, and that phase change carries heat away. Effective, but it consumes fresh water continuously. But Firwater is a closed loop because the same coolant keeps circulating through sealed pipes: it absorbs heat from the chips, releases that heat through radiator-like fins, then flows back to the chips again. For Wisconsin Fairwater, Microsoft says more than 90% of the facility uses closed-loop liquid cooling, while the remaining portion uses outside air and switches to water only on the hottest days. ---- From "Microsoft" YouTube channel, (link in comment)

译微软CEO萨提亚·纳德拉在Build 2026上介绍了威斯康星州Fairwater AI数据中心。该设施采用闭环直接芯片液体冷却,冷却液一次性注入后可零水耗运行,年日用水量约等于一家餐厅。超过90%设施使用闭环液冷,仅最热天切换部分外部空气冷却。数据中心采用垂直两层架构,三维密集部署GPU,保持低延迟与高带宽网络,集群如同一台巨型AI机器。

Alibaba Cloud@alibaba_cloud · 6月3日28

Data security just got a major AI upgrade! ️🤖 Meet Alibaba Cloud Data Security Center (DSC)—your all-in-one solution for intelligent data protection. 🧠Smart Classification: Uses LLMs to auto-identify sensitive data. 🖼Image Desensitization: Powered by Tongyi OCR to mask faces & IDs. 📝Native Audit: AI-driven threat detection with fewer false alarms. Secure your cloud-native & multi-cloud environments with unified control. Learn more🔗:https://int.alibabacloud.com/m/1000413974/ #AlibabaCloud #DataSecurity #AI #CloudComputing #CyberSecurity

译阿里云宣布数据安全中心(DSC)迎来重大AI升级,提供一站式智能数据保护。核心功能包括:基于LLM的智能分类,自动识别敏感数据;利用通义OCR进行图像脱敏,自动遮盖人脸及身份证信息;原生审计集成AI驱动威胁检测,减少误报。支持云原生及多云环境统一管控,提升数据安全防护效率。

🚨 AI News | TestingCatalog@testingcatalog · 6月3日44

Perplexity Computer will soon be able to dynamically split compute power between local models and cloud models! If that would drive Perplexity Computer costs down, it would be huge, since it is one of the top blockers for many at this moment. Soon 👀

译Perplexity Computer 很快将能够在本地模型和云端模型之间动态分配算力! 如果这能降低 Perplexity Computer 的成本,那将是巨大的进步,因为目前这是许多用户的主要障碍之一。 很快 👀

jason@jxnlco · 6月3日43

Love cloudflare

译喜欢 Cloudflare。

Alibaba Cloud@alibaba_cloud · 6月3日57

Junhua Wang, Vice President of Product & Engineering, Head of Computing Platform, Alibaba Cloud Alibaba Cloud introduces Agentic Cloud—built for and run by agents, delivering 6 core capabilities from runtime to memory to move from managing compute to managing intelligence at scale.

译王俊华,产品与工程副总裁,计算平台负责人,阿里云 阿里云推出Agentic Cloud——专为智能体构建并由智能体运行,提供从运行时到内存的6项核心能力,从管理计算转向大规模管理智能。

AYi@AYi_AInotes · 6月3日57

Damn,Codex真的要杀疯了😭 最近1-2年爆发的上千家初创公司都得完蛋了, 尤其是vibe coding、prompt-to-app工具和无代码内部工具平台这些

译天哪,Codex 真的要大杀四方了😭 最近1-2年爆发的上千家初创公司都得完蛋了, 尤其是 vibe coding、prompt-to-app 工具和无代码内部工具平台这些

数字生命卡兹克@Khazix0918 · 6月3日65

http://x.com/i/article/2062025288771584000 # 分享Claude Code团队内部的5条工作原则,我觉得每一条都值得学习。 今天看到了一个我觉得还挺有价值的东西。 就是凌晨的时候,AIHOT上推了Claude Code的一篇blog。 还是蛮少见的,很少见类似于Claude这种真正的AI公司,来分享一些组织上的一些想法和思考。 特别这次分享的作者,还是当红炸子鸡Claude Code团队的工程总监,Fiona Fung。 聊得主题就是他们团队作为AI原生组织,在工作方式和流程上的一些变化。 我全部看完了,顺带也把那个半个小时演讲的视频给看完了,还是有很多共鸣的,因为很多思路和想法我们团队也在这么做这么践行的。 尤其是她反复提到的一个习惯,就是他们团队里,每遇到一个问题,都会再追问一句: 能不能把这件事自动化。 这跟我自己一直在说的理念、跟很多朋友提到的一个习惯是一样的。 就是如果一件事你需要重复3遍以上,请想尽一切办法,用AI将其自动掉。 今天看到Claude Code团队居然在用几乎一模一样的逻辑来运转整个工程组织,还是挺兴奋的。 所以想把这篇分享里的一些有价值的东西拎出来聊聊,希望能对大家有用。 最最开始的时候,她其实有一个很有意思的判断。 就是她说过去这么多年,软件工程的所有流程,不管是瀑布还是敏捷,所有那些规范啊方法论啊,本质上都是围绕一个核心成本在转,就是写代码太贵了这个事。 工程师时间贵,所以你得花大量时间做规划、写需求文档、做各种各样的评审、开各种各样的会,全是在管理这个最贵的资源。 我相信过去在互联网行业里面待过的小伙伴都能感同身受。 但在AI时代,或者说,Agent时代。 这个前提变了。 在Claude Code团队,写代码已经很少是那个拖慢速度的环节了。 那问题就来了,如果写代码本身不再是瓶颈的话,那围绕它的所有上下游的流程,就全部都得重新想了。 Fiona Fung提到了一个非常核心的词,也是她整个分享的最重要的词: 转移。 瓶颈没有消失,只是转移了。 转移到了验证、代码评审、安全。 代码生成太快了,新问题变成了,这些代码对不对,怎么维护,人到底该如何跟得上review代码的节奏。 左边灰色的就是是旧瓶颈,写代码和发布代码的产能。右边黑色的就是新瓶颈,验证、评审、跨职能协作、安全。 这个关于转移的判断,其实如果用AI来介入组织结构里面越深,大家的感触可能就会越明显。 我们的组织结构、流程,其实都需要围绕着这个大的变化来去重新设计。 就像当年从马车到汽车,不只是把马换成发动机的事儿,我们的整个公路系统、交通规则、城市规划,全都得重新设计。 那具体哪些东西需要重新来呢,Fiona列了一张图。 列了五个旧流程正在悄悄失效的领域。 1. 规划方式,因为工程速度和产出量完全不同了。 2. 代码所有权,谁写的这段代码变成了一个很奇怪的问题。 3. 代码评审,新的规模、新的形态、新的工具。 4. 团队构成,角色在模糊化,到底什么技能组合才是你需要的。 5. 知识共享,文档不再是唯一的真相来源了。 然后她对应地讲了五个她们重建的新规范。 包括要让人类的判断力,聚焦在真正需要的地方;新人入职的成本大大降低,甚至一周就可以直接开始产出代码了;少做前期规划,多做原型;招聘更看重创造力和判断力,不看纯产出速度;组织架构更扁平,每个管理者也都先从一线干活开始做起。 这里面每一趴,她又都展开来做了一些分享。 一. 规划的变化 以前因为coding时间贵,你得花大量时间提前规划。 Fiona说她刚加入Claude Code团队的时候,他们写了一个挺漂亮的六个月路线图。 结果呢,因为Claude Code本身迭代太快,三个月左右这个路线图就过时了。。。 所以他们现在的做法叫JIT规划,Just-In-Time,像JIT编译一样,在对的时间做恰好足够的规划。 不再写长篇大论的设计文档了,直接在PR或者原型里面讨论,不再做冗长的产品评审了,先做原型,让内部用户去用,然后根据反馈快速迭代。 左边是她们砍掉的东西,就是那个写代码之前必须先写设计文档的仪式。Fiona说对大部分工作来说这就是theater,做戏。现在换成原型先行,文档如果需要存在,写完代码之后感觉可以的话,再补需求文档。 右边是她们加码的东西,验证。因为在AI原生的工作流里,东西出bug的方式跟以前不一样了,唯一能保证质量的方式就是不断把验证流程往前推。 她还讲了一个观点我觉得特别好。 在技术讨论中,代码赢才牛逼。 就是如果两个人对一个方案有分歧,最快的解决方式不是继续吵,是让Claude把两个方案都做成原型,看实际的东西来判断。 Building is cheap,做东西很便宜。 Arguing is expensive,争吵才昂贵。 想起了当年,互相争某个方案,然后各自PK可能要各写一份PPT,开两轮会来讨论,现在十分钟两个原型都出来了,看着实物聊比对着PPT吵高效一万倍。。。 我自己也是类似的路径。以前做AIHOT的时候还试过写比较详细的PRD,结果发现写PRD的时间比我直接用Claude Code把东西做出来还长。。。 后来就改了,有想法先做原型,能用了再说。 很多功能都是在用的过程中发现不对,当场就改,极速迭代。。。 坦率的讲,在AI时代,我觉得过度规划就是浪费。 二. 自动化的变化 Fiona说的,在Claude Code团队里,他们每遇到一个这样的问题,都会追问一句,能不能把这件事自动化。 她举了一个她自己的例子,她以前每天早上端着咖啡,手动去总结各个客户反馈渠道的内容,这是她的每天固定的工作。 后来她把这件事变成了一个后台自动运行的任务,咖啡还是那杯咖啡,但她不再需要边喝边刷了。 这个例子听起来很小对吧,就一个总结客户反馈的事儿,能有多大工作量。 但重点不在这一件事,重点在这个习惯。 Claude Code团队里每个人,每次遇到一个重复性工作,都会条件反射地问自己,能不能自动化,她说,已经快形成了一种肌肉记忆。 这就是我一直在说的东西。如果一件事你需要重复3遍以上,请想尽一切办法用AI将其自动掉。在公司里面我反复跟团队讲,这甚至不是建议,是要求。 但坦率的讲,要真正把这个变成团队的肌肉记忆,比说出来难太多了。 因为大多数人对自动化的理解还停留在一个很粗的层面,觉得自动化就是写个脚本嘛,搞个定时任务嘛,这我知道,但AI时代的自动化跟以前完全不是一个量级的东西。 现在你用Claude Code,很多自动化的事情十分钟就搞定了,甚至不用十分钟。 比如我为了同步家里电脑和公司,我就跟Claude说了一句“帮我写一个hook,每次打开我的XX项目之前都去github拉取最新的代码”,几分钟就能跑起来。 以前自动化成本高,所以只有高频、高重复度、高价值的事情才值得自动化,但现在自动化成本几乎为零,逻辑就反过来了,几乎所有重复超过3次的事情都应该自动化。 除了工作流之外,触发器hook是一个非常好用的东西,这个我感觉以后我可以单独给大家写一篇Agent+hook搞自动化的一些小玩法,还是挺有意思的。 一个一个小的自动化攒起来,你会发现,最后这些东西,会在你可能都没反应过来的时候,一起长成了一颗苍天大树。 所以如果你现在还在犹豫要不要开始,我的建议是别想太大。 别一上来就想着我要搭建一个完整的自动化体系这种东西,那太吓人了,也没必要。 就从今天开始,找一件你今天重复做了的事情,花十分钟让Claude Code或者Codex帮你自动化掉。 明天再找一件,后天再找一件,一个月以后你回头看,你的工作方式已经完全不一样了。 三. 代码评审的变化 代码评审这块,Fiona说她过去六个月跟其他工程leader聊天,被问到最多的一个问题就是,你们人怎么跟得上代码review的速度。 她的做法叫Trust but verify,信任但验证。 Claude Code团队大量使用Code Review功能。 Claude负责处理所有的风格检查、linting、PR反馈、bug捕捉和修复、补充测试,这些以前可能占了review工作量60-70%的部分,现在Claude全接了。 但人类review仍然不可替代,在那些真正需要专业判断的地方。 法律合规的东西,Fiona说她永远需要她的法务伙伴参与风险评估,信任边界和安全敏感代码,需要领域专家,产品方向和品味的判断,需要PM和设计师。 而且她特别强调了,这个trust和verify之间的平衡是动态的。今天需要人来做的事情,下一个模型可能就能做了,所以你必须得不断重新评估这条线。 这就跟打游戏一样嘛,每个版本的版本答案都不一样,你不能拿上个版本的攻略打新版本,那只会被人干死。 四. 团队角色的变化 Fiona说在Claude Code团队,角色界限已经变得很模糊了。 PM在大量写代码,工程师也在做内容和设计的事情,以前泾渭分明的边界正在消融。 比如以前一个工程师修了个bug,要等内容设计师排期来写用户端的文案,排期这个破事大家懂的都懂,结果要么等好几天,要么赶进度发一个凑合的文案出去。 现在的流程是工程师修完bug,Claude来起草文案初稿,人类来做最终判断,当天就能发。 跨职能的gap不再是瓶颈了,开始变成了协作者,人类还是做最终决策的那个人,只是不再是写初稿的那个人了。 然后她说了一个我非常认同的观点,她现在招人主要看两种特质。 一种是有产品sense的创意builder,能识别出该做什么,能快速做出原型。 她还特意在描述里强调了一句: Taste is scarce, typing is not. 品味是稀缺的,打字不是。 另一种是有深厚系统背景的工程师,负责那些「trust but verify」里最需要人的部分,因为subtly wrong is still wrong,微妙的错误仍然是错误。 她说我根本不在乎你一个小时能写多少行代码,我在乎的是你选择去做什么,以及你怎么知道它是对的。 当AI能把执行速度提升10倍的时候,决定性的因素变成了你知不知道应该做什么,以及什么样的结果叫真正的优秀。 这,就是品味。 五. 如何推动团队变化 Fiona她们团队有一些有意思的核心原则。 她把团队原则分成了两类。左边灰色是必须做的硬性要求,右边黑色就是大家自己摸索的空间。 其实本质上,就是给团队设计了一个harness,核心就是大的方向统一,具体怎么落地各团队自己定。 Fiona总结了三条她最看重的事情。 1. 保持团队尽可能扁平,管理者支持各个小组的工作,但保持灵活让人能流动到工作需要的地方。 2. 如果Claude能做的事情,就让Claude做,这能让我们腾出手来做更难的工作。 3. 人不会主动去删除流程,只会在旧流程上面继续叠新流程,所以你得主动站出来,指名道姓地说出哪些流程可以走了。 这三条说起来都没啥特别的,但难在执行,特别是第三条。 Fiona说,她之前在一个团队里,有一个每周的review会议,一大堆人坐在会议室里,但她发现所有人都在看电脑,只有轮到自己汇报的时候才抬头说两句status,说完又低头继续看电脑(我相信我们很多时候的会议也都是这样的)。 然后她问了一句,我们为什么还在开这个会。 这时候,所有人才意识到,好像,这个会根本不需要。 于是,从此,这个会就取消了。 这种事太常见了,国内的公司里其实到处都是。 无数的流程和会议,当初设立的时候都有道理,但环境变了、工具变了,它们早就失去了存在的意义,只是因为惯性还在那里被迫转着。 没有人觉得它有用。 但,好像很多时候,也没有人站出来说一句这破逼会太浪费时间了,能不能别开了。 AI在你的组织里介入的越深,你会发现,很多过去的步骤和流程,其实液晶可以自动化了,如果我们不主动去审视,那这些步骤就会一直在那里,最后,变成纯粹的形式主义。 最后,Fiona还放了三个她在思考的问题,她没有答案。 但是很有意思。 第一,你还需要单独的iOS和Android团队吗?因为现在工程师已经可以更灵活地跨平台工作了。 第二,全自动化的review到底能推到多远,在「够快了」和「我们漏掉了什么重要的东西」之间那条线在哪里? 第三,当角色越来越模糊的时候,怎么确保所有角色都对自己的产出有信心? 我觉得她把这三个问题放出来这个动作本身就很有价值。 因为你会发现,即使是Claude Code的亲爹团队,也没有把所有事情都想明白。他们也在摸索,很多时候,这就不是一个有标准答案的事情。 每一次的大型技术的到来,其实都不只是工具升级,整个组织的运作方式很多时候,都要推倒重来。 所谓的AI原生,AI Native,其实也并不是买几个Claude会员或者包个API Key啥的,给大家用就算AI转型了,我一直觉得真正的AI原生组织,从规划方式到知识管理到评审流程到人才结构,每一层都是重新设计过的。 我们也没有做到,但是还是在不断的朝这个方向努力,最近加入的一些新的小伙伴,他们的好奇心和自驱力,且没有被过去一些传统且饱受诟病的工作方式所污染,已经感觉让我看到了一些雏形了。 而贯穿所有这些变化的,我觉得其实就是开头说的那个最朴素的思维习惯。 遇到重复的事情,自动化掉。遇到没用的流程,干掉。遇到不需要人做的判断,交给AI。 一个一个来,不着急,但不能停。 最后,用Fiona的最后一段话作为结尾吧。 Pick your noisiest workflow. Ask if it still earns its place. 找到你最繁琐的那个工作流,问问它。 是不是还配占着这个位置。

译Claude Code团队工程总监Fiona Fung分享该团队作为AI原生组织的工作原则。其核心判断是,AI时代软件开发的瓶颈已从“写代码”转移到“验证、代码评审与安全”。为此,团队重建了多项工作规范:采用JIT规划,用快速原型取代冗长的前期文档;将“能否自动化”培养为团队肌肉记忆,用AI解决重复工作;代码评审上采用“信任但验证”,由Claude处理大部分检查,人类聚焦于判断;团队角色界限模糊化,协作更加灵活。这些变化旨在让人类判断力聚焦于真正关键之处,新成员甚至能在一周内开始产出代码。

歸藏(guizang.ai)@op7418 · 6月3日55

Codex 昨晚上线的这个 Site 插件非常厉害。 它本质上感觉类似于 Claude Design,帮你设计和生成网页,同时还帮你部署好了,可以直接给别人访问。 比较遗憾的是 Pro 用户不能用,只有那些 Business 和有组织的用户可以用。

译Codex平台近日上线了名为Site的新插件。该插件功能类似于Claude Design,能够帮助用户设计并生成网页,并自动完成部署,生成可直接访问的链接。目前此功能的使用权限受限,Pro用户无法使用,仅向Business及组织类用户开放。

SemiAnalysis@SemiAnalysis_ · 6月3日50

IMPORTANT: it is important to understand that the CoreWeave & Microsoft photos are still Engineering/Quality Samples, and there is still some time before the software stack bring-up finishes & first production tokens are generated. The VR200 & MI455 rack metric to watch out for is time to first at-scale production token TTF-(ASP)-T. You can clearly see in the CW rack photos that none of the scale-out 800G OSFP cages are even populated.

译重要提示:需理解CoreWeave与微软的机架照片仍为工程/质量样品,距离软件栈启动完成并产出首批生产token尚需时日。VR200与MI455机架的关键指标是达到规模化生产token的时间,即TTF-(ASP)-T。从CW机架照片中可清晰看到,所有横向扩展的800G OSFP笼位均未安装模块。

meng shao@shao__meng · 6月3日75

Agentic Engineering 实战窍门全录(2026年6月版) 来自 @mvanhorn 的分享 👏🏻,他三个月内从「高中后没发布过有价值软件」到 last30days(27K stars)、Printing Press、Agent Cookie,以及对 Python、Go 等主流项目的实质贡献(结尾列出作者推荐全部工具) 看看 Agentic Engineering 给软件开发带来了什么变化 · 80% 编码,20% 规划 -> 规划交给 agent,人做方向与品味 · 人在键盘前执行 -> 人做 signal(信号),agent 做 volume(产出量) · IDE 是中心 -> 终端 + plan.md + 语音是中心 方法论骨架:Research → Plan → Work /last30days(社区现况调研) ↓ /ce-plan(结构化 plan.md,含验收标准) ↓ /ce-work(机械执行,可跨 session 续跑) ↓ Human Signal(品味、取舍、纠偏) Compound Engineering 是使这套循环落地的插件(/ce-plan、/ce-work、/ce-brainstorm)。plan.md 的价值不在于给人读,而在于约束 agent 不偷懒——有研究、有方案、有 checkbox,执行才完整。 # 22 条 Hack 的精简归类 一、规划层(最重要) 1. 有想法立刻 /ce-plan,不先想、不先写代码;模糊时用 /ce-brainstorm 再 plan。 2. plan 给人看,但作者几乎不读——plan 是 agent 的作业;人只 skim 标题,有疑问 inline 问(TLDR / eli5 / why this approach)。 3. 非工程任务同样适用:「make a plan for the plan」——先规划如何产出 deliverable,再执行,避免 LLM 直接写成品时偷工减料。 4. plan.md 也是协作介质:Proof 把 plan 变成可评论文档,非终端用户也能 review。 二、执行与并行 5. cmux 多 tab(4–6 个):plan 一个、build 一个、测 bug 一个……research 和 build 并行,cycle 回来第一个已完。 6. 新 terminal tab 默认进 Claude/Codex,不是 shell——降低开 session 成本。 7. YOLO 权限:bypassPermissions + skipDangerousModePermissionPrompt;多 session 无法逐条点确认。配合 Stop hook 音效,知道哪个 session 结束。 8. Claude 规划 + Codex 构建:Claude xhigh 关 fast mode;Codex xhigh 开 fast mode。通过 IDE 扩展、/ce-work --codex、Printing Press 委托,不必切 CLI。 三、输入方式 9. 语音优先:Monologue / Wispr Flow(Mac)+ 鹅颈麦;手机用 Apple 听写即可——LLM 能补全转写错误。共享办公室仍是痛点。 10. Granola raw transcript 直接丢进 /ce-plan,不先摘要;配合 Printing Press Granola CLI 检索历史会议。 11. last30days 在 plan 前跑:Reddit/X/HN/YouTube 等并行搜,让 plan 基于「社区当下认知」而非训练数据 cutoff。 四、随处可达 12. Remote control 常开:桌面 session 手机续接。 13. 给 Claude 一个邮箱(AgentMail + agentmail-to-claude-code):邮件/附件触发新 session;Hermes 的 cc <task> 从手机派活。 14. Mac mini 远程:Mosh(低延迟 SSH)、tmux(断网续跑)、Hermes/OpenClaw 自治、Agent Cookie 同步 cookie/.env。 五、产出扩展 15. HyperFrames:视频 = HTML composition → MP4;与代码 loop 同构(script.md → render)。 16. 笔记即 RAG:Bear CLI、Obsidian、gbrain、supermemory——agent 可读写的个人知识库,plan 质量随历史 compound。 17. 自写 Skills:重复两次以上的 workflow 固化;抄 Compound Engineering skill 的结构让 agent 脚手架。 18. 开源贡献:同一 /ce-plan + /ce-work loop;Discord 建人脉,PR 是入场券。 六、Printing Press 与现实 errands 19. Agent-native CLI 舰队:Tesla 预热、Instacart、ESPN 盯赛、Alaska 订票——agent 跑生活琐事,不只是写代码。 20. Agent Cookie:把真实浏览器 session 交给 CLI,解决 auth 痛点。 七、硬件与诚实反思 21. M5 Max 64GB + 禁 sleep + Anker 充电宝——多 agent 并行极耗电。 22. AI Psychosis:构建 loop 像最好玩的游戏,容易沉迷、忽视用户与身边人;允许「只为自己 build」;要 audience 则走长期积累路径。 # 工具栈一览(可执行清单) · 规划执行:Compound Engineering, Proof · 终端:cmux, Ghostty(读同一 config) · 语音:Monologue / Wispr Flow · 调研:last30days (+ ScrapeCreators key) · 会议:Granola, Printing Press Granola CLI · 远程:Mosh, tmux, AgentMail, Hermes, OpenClaw, Agent Cookie · 视频:HyperFrames · 笔记:Bear CLI, gbrain, supermemory · 生活 CLI:Printing Press, Agent Cookie · 第二引擎:Codex (xhigh + fast)

译该内容源自@mvanhorn的分享,介绍了“智能体工程”如何重塑软件开发。其核心是从“人主导编码”转向“人主导方向、智能体执行”,中心从IDE变为终端与计划文件。方法论遵循Research → Plan → Work循环,核心是让plan.md约束智能体行为。分享者总结了22条实战技巧,涵盖规划、并行执行、输入方式、远程控制等方面,并列出了完整的工具栈。

小互@xiaohu · 6月3日64

收到Mac mini被开发者追捧的吸引 微软发布了一台类似Mac mini的 台式机: Surface RTX Spark Dev Box 它是一个小盒子,放在桌上就行 配置了英伟达最新的 RTX Spark 芯片,128GB 内存,算力达到 1 petaflop(1000 万亿次运算),能在本地跑 1200 亿参数的大模型,不用连云端 GPU。 外观看起来像一个"压扁的 Xbox Series X",顶部有类似的散热格栅,只是通风孔是方形的而不是圆形的。整个机身是阳极氧化铝 3D 打印的,顶部有 1000 个通风孔。 定位:给开发者在本地跑 AI 模型、Agent 工作流、模型微调用的,不用什么都往云上送,省钱也快 开箱即用:预装了开发者版 Windows 11 Pro,VS Code、GitHub Copilot、WSL、PowerShell 7 都配好了,开机就能写代码 散热:整个铝合金机身就是散热系统,100W 功耗,顶部有 1000 个通风孔,能扛长时间训练任务不降频 价格:官方还没公布,行业分析师估计在 3000 到 3500 美元之间,同类产品 AMD Ryzen AI Halo PC 和 NVIDIA DGX Spark 大约卖 3999 美元 今年晚些时候在美国上市...

译微软推出Surface RTX Spark Dev Box,一款专为本地AI开发的小型台式机。它搭载NVIDIA RTX Spark芯片、128GB内存,算力达1 petaflop,可在本地运行1200亿参数大模型。其阳极氧化铝机身集成了散热系统,功耗100W。设备预装了开发者版Windows 11 Pro及开发工具链,预计售价3000至3500美元,将于今年晚些时候在美国上市。

🚨 AI News | TestingCatalog@testingcatalog · 6月3日65

HERMES 🔥: A new Hermes Desktop app from Nous Research is now available on macOS, Windows, and Linux! Testing time 👀

译HERMES 🔥:Nous Research 推出的全新 Hermes 桌面应用现已登陆 macOS、Windows 和 Linux! 测试时间 👀

SemiAnalysis@SemiAnalysis_ · 6月3日53

Cerebras did what the industry calls impossible: turned an entire 46,225mm² wafer into one chip. Defects on silicon that big are inevitable, so they built in redundancy and custom per-batch masks that route around every bad core, landing near 100% usable wafers. The results: 900,000 cores and 44GB of SRAM on a single piece of silicon, no packaging, no off-chip hops. And they're not stopping there, now exploring hybrid bonding a DRAM wafer on top for even more fast memory. (1/4) 🧵

译Cerebras做到了业界认为不可能的事:将整个46,225mm²晶圆制成单芯片。如此大面积的硅片缺陷不可避免,因此他们内置了冗余,并采用定制的逐批次光罩来绕过每个不良核心,最终实现了接近100%的可用晶圆率。结果:单片硅片上集成了90万个核心和44GB SRAM,无需封装,无片外跳转。他们并未止步于此,目前正在探索将DRAM晶圆通过混合键合堆叠在上方,以获得更快的更多内存。(1/4) 🧵

MiniMax (official)@MiniMax_AI · 6月3日57

Amazing deep dive from the @togethercompute team on serving MiniMax M3 in production. M3 with its 1M context, native multimodality and MiniMax Sparse Attention requires real work across paged decode, index scoring, and multimodal preprocessing to get it efficient. This is what a partnership at the frontier looks like🤝.

译@togethercompute 团队对 MiniMax M3 生产部署的精彩深度解析。 M3 凭借其 1M 上下文、原生多模态和 MiniMax Sparse Attention,需要在分页解码、索引评分和多模态预处理方面进行大量工作才能实现高效运行。 这就是前沿合作的样子🤝。

Rohan Paul@rohanpaul_ai · 6月3日63

Satya Nadella on Microsoft’s Fairwater data center, an AI superfactory. at today's Microsoft Build 2026 keynote. its vertically designed, two-story AI data center architecture. Instead of spreading compute only across a flat floor, Microsoft can place racks in three dimensions, packing far more GPUs densely while preserving fast network access. This helps the cluster behave more like one massive AI machine, with low latency and high bandwidth between GPUs. The other major point is its cooling efficiency: its cooling loop is filled once and can operate with effectively zero ongoing water consumption, using roughly the annual daily-water equivalent of a single restaurant. ---- From "Microsoft" YouTube channel, (link in comment)

译在微软 Build 2026 主题演讲中,Satya Nadella 介绍了 Fairwater 数据中心,这是一个为 AI 设计的“超级工厂”。其核心是垂直设计的双层 AI 数据中心架构,允许在三维空间内密集部署机架,在保持 GPU 间低延迟、高带宽网络连接的前提下,实现更高的计算密度,使整个集群更像一台大型 AI 机器。另一大亮点是其极高的冷却效率:冷却系统只需填充一次,实际运行中水耗几乎为零,其年度总用水量约等于一家餐厅的日用水量。这是微软构建“前沿智能生态系统”硬件基础的一部分。

Replit ⠕@Replit · 6月3日70

Announcing our new collaboration with @Microsoft Organizations can now build internal tools, workflows, or data dashboards in Replit and publish directly to Microsoft Fabric with security, authentication, and governance built in

译宣布与 @Microsoft 的新合作 组织现在可以在 Replit 中构建内部工具、工作流或数据仪表板,并直接发布到 Microsoft Fabric,内置安全、身份验证和治理功能。

ClaudeDevs@ClaudeDevs · 6月3日77

We’ve added a CLI for Claude Platform to make every API endpoint runnable from your terminal. Call the Messages API, stand up Claude Managed Agents, pipe results straight into your shell. The ant CLI is well understood by coding agents (Claude Code) using the claude-api skill.

译我们为 Claude Platform 添加了一个 CLI,使每个 API 端点都可以从你的终端运行。 调用 Messages API,启动 Claude 托管智能体,并将结果直接管道传输到你的 shell。 ant CLI 被使用 claude-api 技能的编码智能体(Claude Code)很好地理解。

Tibo@thsottiaux · 6月3日67

Tons of goodies for use of codex for day to day work. If you are on a business plan you can now host and share websites, we launched vastly improved plugins and skills for broad roles and you can give feedback to your agent through visual annotations in docs, slides, sheets and more.

译Codex 日常工作使用中新增大量实用功能。 如果你使用商业计划,现在可以托管和分享网站,我们推出了大幅改进的插件和技能以适应广泛的角色,并且你可以在文档、幻灯片、表格等中通过视觉注释向你的智能体提供反馈。

Peter Steinberger 🦞@steipete · 6月3日67

Such a privilege to work with Microsoft to bring claws to enterprises!

译很荣幸与微软合作,将 OpenClaw 带入企业!

OpenClaw🦞@openclaw · 6月3日69

"You can run OpenClaw inside your company now." Annoucing our work with @Microsoft to bring OpenClaw to the Microsoft and Windows ecosystems. Claws now work securly in the enterprise.

译“你现在可以在公司内部运行 OpenClaw 了。” 宣布我们与 @Microsoft 的合作,将 OpenClaw 带入微软和 Windows 生态系统。Claws 现在可以在企业环境中安全运行。

SemiAnalysis@SemiAnalysis_ · 6月3日52

Major hyperscalers introduce a variety of GPU, XPU, and CPU chips, leading to more diverse server rack and board designs. To meet different customer needs, ODMs need larger design teams, along with more assembly and testing capacity. ODMs now have a good opportunity to reach new customers and expand their client base. As AI server designs become more customized, early engagement and customer trust will be key factors in securing long-term business. AI server assembly requires heavy upfront investment in capacity and equipment. Vendors with stable customers are better positioned to support expansion and capture long-term growth.

译超大规模云服务商引入多样化的GPU、XPU和CPU芯片,导致AI服务器机架和板卡设计更加多元化。为满足不同客户需求,ODM厂商需要扩大设计团队规模,并增加组装与测试产能。这为ODM提供了接触新客户、拓展客户群的良机。随着AI服务器设计日趋定制化,早期介入与客户信任将成为赢得长期业务的关键。

OpenAI@OpenAI · 6月3日70

Building apps has never been easier. With Sites, Codex can turn your work, ideas, and plans into an interactive website or app your team can explore, use, and share with a URL. Rolling out to Business and Enterprise plans, before expanding more broadly.

译构建应用从未如此简单。 通过 Sites,Codex 可以将你的工作、想法和计划转化为一个交互式网站或应用,你的团队可以通过一个 URL 进行探索、使用和分享。 该功能将首先向 Business 和 Enterprise 计划推出,之后会更广泛地扩展。

OpenRouter@OpenRouter · 6月3日68

⚡ New provider drop: AI-Native Cloud from @digitalocean is now live on OpenRouter. High performance inference across popular open-weight models. #1 on output speed and latency for DeepSeek V3.2 by @ArtificialAnlys. See their stats and try the models: https://openrouter.ai/provider/digitalocean

译⚡ 新增服务商:DigitalOcean 的 AI-Native Cloud 现已在 OpenRouter 上线。 提供高性能推理,覆盖热门开源权重模型。在 DeepSeek V3.2 的输出速度和延迟方面排名第一(数据来自 @ArtificialAnlys)。 查看其数据并试用模型:https://openrouter.ai/provider/digitalocean

Chubby♨️@kimmonismus · 6月3日47

Incredible. The best design work doesn’t happen in a chat box. The fact that you can generate motion assets inside the canvas skips your image-gen hops. Super cool that changes here get synced back to your codebase.

译Kombai 2.0 被定位为首个AI设计工程师,旨在融合设计与工程。该工具允许用户在画布内直接生成动画素材,跳过了传统图像生成的中间环节,并能将设计变更同步回代码库。其目标是打破设计和工程分属不同工作流的旧模式,服务于一个设计师能交付代码、工程师寻求无缝集成、所有人都想构建优秀用户体验的新世界。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月5日
08:05
DogeDesigner@cb_doge
精选75
马斯克谈SpaceX上市:正处大规模资本扩张期

马斯克在JPMorgan活动上回应SpaceX上市问题:他已被建议上市近10年,自2014-2015年起SpaceX就已实现正现金流并自筹资金,之前的私募轮次实际是面向投资者和员工的流动性/回购轮次。当前不同之处在于SpaceX正进入显著资本增长阶段,计划发射约10万颗通信卫星(可能超10万颗),AI和机器人对带宽需求巨大,还将在太空中建设AI数据中心,马斯克认为这将成为AI扩张的主要手段。

J.P. Morgan: Live from our global headquarters: Jamie Dimon and Elon Musk discuss SpaceX and more. https://x.com/i/broadcasts/1NGarrM...

大佬观点部署/工程
关联讨论 1 条X:cb_doge (@cb_doge)
推荐理由:Elon Musk在摩根大通对话中首提太空AI数据中心,用100,000颗卫星支撑AI扩张,这不仅是SpaceX的上市前奏,更是AI基础设施从地面延伸到轨道的信号。
06:54
Berryxia.AI@berryxia
60
😂 LM Studio 手机版也发布了,这下你可以"烧"你的iPhone 在本地跑大模型了……😆
产品更新端侧部署/工程
06:45
Sam Altman@sama
同事件精选80
用ChatGPT构建并发布网页应用! 我真希望我小时候就有这个,但我确实怀念HyperCard。

OpenAI: Building apps has never been easier. With Sites, Codex can turn your work, ideas, and plans into an interactive website ...

OpenAI产品更新编码部署/工程
同一事件,精选展示《Codex 赋能每一种角色、工具和工作流》
推荐理由:Sam Altman 说希望小时候有这玩意,但企业版首发普通人还得等。把聊天直接变成可发布的网页 app,这方向让非开发者也能造工具。
00:03
Replit ⠕@Replit
19
实时构建你的业务 https://x.com/i/broadcasts/1qGoNNngZkyKv
教程/实践部署/工程
6月4日
12:27
SemiAnalysis@SemiAnalysis_
38
垂直功率传输、柔性移动引脚中介层和直接冲击水冷。Cerebras 不得不重写机械工程手册,仅仅是为了防止单个晶圆自裂。
大佬观点部署/工程
10:51
Chubby♨️@kimmonismus
66
社区反数据中心情绪高涨:加州蒙特利公园市以86%赞成票永久禁止数据中心

加州蒙特利公园市以约86%赞成票通过永久禁止数据中心的法案,成为首个通过投票禁令而非市议会临时叫停的美国城市。这反映全国性反AI数据中心浪潮:盖洛普民调显示70%美国人反对本地建设,至少十几个州正考虑暂停。微软纳德拉在Build大会花较大篇幅回应相关偏见与担忧。背后除了电力、水耗、房价等可解决忧虑,还混合了对AI的恐惧及人类优越感受损(弗洛伊德所谓“对人类自恋的第四次打击”)。作者担心抵制会愈演愈烈,但数据中心对AI带来的科学黄金时代不可或缺。

政策/监管部署/工程
08:51
Berryxia.AI@berryxia
70
MLX 框架 Day0 同步支持 Gemma 4

我擦! 我发现现在Apple的MLX框架和模型都可以Day0发布了? 这看来是同步进行操作的,MLX框架以及和模型厂商直接第一时间进行了对接啊! 强烈建议Mac的同学直接上MLX框架的模型,速度一般至少10-20%还是有的。

Dmitry Lyalin: If you're waiting Gemma 4 12b through @ollama, its here: gemma4:12b gemma4:12b-it-q4_K_M gemma4:12b-it-q8_0 gemma4:12b-i...

Google模型发布端侧部署/工程
07:25
SemiAnalysis@SemiAnalysis_
57
随着TPUv8t(其新型训练专用TPU)的推出,Google公布了一种名为Virgo的全新横向扩展网络架构。Virgo能够将多达134,400个芯片互联,提供高达47 Pbps的无阻塞双向带宽。(1/4)🧵
Google产品更新部署/工程
06:09
xAI@xai
精选69
在 @Cloudflare 的 AI Gateway 上尝试 Grok 模型!

Cloudflare Developers: We're partnering with @xai to bring Grok to @Cloudflare AI Gateway. • Grok LLMs, audio, image, and video models are now ...

xAI产品更新部署/工程
关联讨论 1 条X:Elon Musk (@elonmusk, xAI)
推荐理由:xAI把Grok全模态模型塞进了Cloudflare AI Gateway,开发者不用再单独搞定API Key和计费,想试grok-imagine-video的可以直接开跑。
01:45
StepFun@StepFun_ai
56
在 @modal 上用 SGLang 部署 Step 3.7 Flash 🚀 Modal 是一个无服务器 AI 平台,用于部署和扩展计算密集型工作负载,无需管理基础设施。 他们的新指南展示了如何在 Modal 上使用 SGLang 服务我们的开源权重 Step 3.7 Flash,采用 8×H100 GPU、Modal Volumes 以及兼容 OpenAI 的聊天补全端点。 很高兴与 Modal 合作,让 StepFun 模型更易于构建者使用。 https://modal.com/docs/examples/stepfun_inference
教程/实践部署/工程
00:58
Replit ⠕@Replit
同事件精选67
你发布了你的应用。然后呢? 你的应用可能看起来很棒,但如果没人能找到它,它就依然不可见。 发布只是开始。 认识一下SEO Agent。它会为你运行一次扫描,并建议修复措施,帮助你的应用在网页搜索和AI搜索中被发现。
产品更新部署/工程
同一事件,精选展示《Replit Agent 联手 Shopify 快速建店》
推荐理由:Replit 把 SEO 优化做进了开发流程,对于靠内容获客的产品人,部署完直接跑一遍 SEO Agent 可能比手动改 meta 标签省心十倍。虽然不是什么底层突破,但解决的是真痛点。
00:33
Microsoft Research@MSFTResearch
62
一份在中西部装瓶厂进行的三个月试点显示,当AI超越聊天进入决策领域时会发生什么--约束条件变化、风险真实、答案必须可靠。 https://msft.it/6015vjYUN
Microsoft推理论文/研究部署/工程
00:01
eric zakariasson@ericzakariasson
74
Cursor 推出 Debug Mode:让 AI 智能体通过运行时日志修复 Bug

Cursor 发布 Debug Mode,解决 AI 智能体靠猜测修 Bug 的问题。工作流程:Agent 先生成多个假设,为最可能的假设添加日志(不修改代码);调试服务器在程序运行时收集输出到 .cursor/debug.log;用户重现 Bug 后,Agent 读取日志而非猜测;最后 Cursor 从日志找到根因并修复,自动移除添加的日志。内部案例:追踪 1/20 概率出现的 git 元数据竞争条件(1 小时内定位);一次单趟追踪内存泄漏(修复仅一行);定位 Electron 中 C++ 原生崩溃;修复此前无人敢碰的 SSR 闪烁问题。用户可通过 Shift+Tab 或在 CLI 中使用 /debug 触发。

智能体产品更新编码部署/工程
6月3日
21:16
AYi@AYi_AInotes
46
黄仁勋COMPUTEX 2026坐技嘉展台喝啤酒

黄仁勋在COMPUTEX 2026上逛至技嘉展台,席地而坐与技嘉老总喝啤酒近10分钟,引来围观。技嘉股价当场被拉,期间已五连涨超20%。深层信号显示Nvidia供应链逻辑中技嘉地位加深。引用推文回顾:2009年Nvidia市值仅40亿美元(Intel 1000亿),黄仁勋押注CUDA和异构计算,17年后Nvidia市值5万亿,Intel约五千亿,25倍劣势变为近10倍反超,体现其远见与护城河。

AYi: 同样站在 2009 年那个路口,有人只看见一块显卡, 有人看见了往后二十年整个计算的样子。 那年 Nvidia 市值 40 亿,是 Intel 的零头, 所有人都笑黄仁勋不过是个卖游戏配件的。 那时候 Nvidia 市值 40 亿,Inte...

大佬观点部署/工程
19:35
X.PIN@thexpin
40
随着 AI 对电网造成压力,中国正将数据中心送入太空! 各大城市快速形成产业合作,北京计划在 2028 年前发射首颗试验卫星,以构建天地计算网络。这使中国占据了关键先机。
行业动态部署/工程
18:40
Alibaba Cloud@alibaba_cloud
22
本体(Ontology)弥合了 AIOps 中 LLM 的"语义鸿沟"!🧠 痛点: • LLM 缺乏私有拓扑上下文 🏗️ • 相关 ≠ 因果 🔗 • 无法解释的黑箱决策 ❓ ✅ UModel 解决方案: • 面向对象的 IT 建模 🧩 • 多源数据统一查询 📊 • 确定性、可审计的根因分析 用显式知识图谱构建可信智能体。 🚀 https://int.alibabacloud.com/m/1000413984/ #AIOps #LLM #本体 #DevOps #云原生
其他部署/工程
17:48
Rohan Paul@rohanpaul_ai
58
微软萨提亚·纳德拉在Build 2026介绍Fairwater AI数据中心

微软CEO萨提亚·纳德拉在Build 2026上介绍了威斯康星州Fairwater AI数据中心。该设施采用闭环直接芯片液体冷却,冷却液一次性注入后可零水耗运行,年日用水量约等于一家餐厅。超过90%设施使用闭环液冷,仅最热天切换部分外部空气冷却。数据中心采用垂直两层架构,三维密集部署GPU,保持低延迟与高带宽网络,集群如同一台巨型AI机器。

Rohan Paul: Satya Nadella on Microsoft's Fairwater data center, an AI superfactory. at today's Microsoft Build 2026 keynote. its ver...

Microsoft行业动态部署/工程
17:09
Alibaba Cloud@alibaba_cloud
28
阿里云数据安全中心推出AI智能防护升级

阿里云宣布数据安全中心(DSC)迎来重大AI升级,提供一站式智能数据保护。核心功能包括:基于LLM的智能分类,自动识别敏感数据;利用通义OCR进行图像脱敏,自动遮盖人脸及身份证信息;原生审计集成AI驱动威胁检测,减少误报。支持云原生及多云环境统一管控,提升数据安全防护效率。

产品更新部署/工程
16:24
🚨 AI News | TestingCatalog@testingcatalog
44
Perplexity Computer 很快将能够在本地模型和云端模型之间动态分配算力! 如果这能降低 Perplexity Computer 的成本,那将是巨大的进步,因为目前这是许多用户的主要障碍之一。 很快 👀

Perplexity: Read more about hybrid agentic inference in Perplexity Computer: https://www.perplexity.ai/hub/blog/the-data-center-move...

产品更新端侧部署/工程
15:00
jason@jxnlco
43
喜欢 Cloudflare。

dominik kundel: Codex can now deploy and host websites for you using Sites! 🎉 This includes storage for data and files using D1 and R2 ...

OpenAI产品更新编码部署/工程
14:39
Alibaba Cloud@alibaba_cloud
57
王俊华,产品与工程副总裁,计算平台负责人,阿里云 阿里云推出Agentic Cloud--专为智能体构建并由智能体运行,提供从运行时到内存的6项核心能力,从管理计算转向大规模管理智能。
智能体产品更新部署/工程
13:12
AYi@AYi_AInotes
57
天哪,Codex 真的要大杀四方了😭 最近1-2年爆发的上千家初创公司都得完蛋了, 尤其是 vibe coding、prompt-to-app 工具和无代码内部工具平台这些

OpenAI: Building apps has never been easier. With Sites, Codex can turn your work, ideas, and plans into an interactive website ...

OpenAI产品更新编码部署/工程
12:23
数字生命卡兹克@Khazix0918
65
Claude Code团队分享AI原生组织工作原则

Claude Code团队工程总监Fiona Fung分享该团队作为AI原生组织的工作原则。其核心判断是,AI时代软件开发的瓶颈已从“写代码”转移到“验证、代码评审与安全”。为此,团队重建了多项工作规范:采用JIT规划,用快速原型取代冗长的前期文档;将“能否自动化”培养为团队肌肉记忆,用AI解决重复工作;代码评审上采用“信任但验证”,由Claude处理大部分检查,人类聚焦于判断;团队角色界限模糊化,协作更加灵活。这些变化旨在让人类判断力聚焦于真正关键之处,新成员甚至能在一周内开始产出代码。

智能体Anthropic大佬观点部署/工程
10:59
歸藏(guizang.ai)@op7418
55
Codex上线Site插件:设计生成网页并一键部署

Codex平台近日上线了名为Site的新插件。该插件功能类似于Claude Design,能够帮助用户设计并生成网页,并自动完成部署,生成可直接访问的链接。目前此功能的使用权限受限,Pro用户无法使用,仅向Business及组织类用户开放。

产品更新编码部署/工程
09:21
SemiAnalysis@SemiAnalysis_
50
重要提示:需理解CoreWeave与微软的机架照片仍为工程/质量样品,距离软件栈启动完成并产出首批生产token尚需时日。VR200与MI455机架的关键指标是达到规模化生产token的时间,即TTF-(ASP)-T。从CW机架照片中可清晰看到,所有横向扩展的800G OSFP笼位均未安装模块。
Microsoft行业动态部署/工程
09:13
meng shao@shao__meng
精选75
智能体工程实战窍门全录

该内容源自@mvanhorn的分享,介绍了“智能体工程”如何重塑软件开发。其核心是从“人主导编码”转向“人主导方向、智能体执行”,中心从IDE变为终端与计划文件。方法论遵循Research → Plan → Work循环,核心是让plan.md约束智能体行为。分享者总结了22条实战技巧,涵盖规划、并行执行、输入方式、远程控制等方面,并列出了完整的工具栈。

Matt Van Horn: http://x.com/i/article/2061440101411102721

智能体教程/实践编码部署/工程

推荐理由:mvanhorn 三个月从零到 27K stars 的实战手册,22 条 hack 把 agentic 开发从规划到执行到语音全打通,开发者能直接套用。
09:07
小互@xiaohu
64
微软发布类似Mac mini的小型台式机:Surface RTX Spark Dev Box

微软推出Surface RTX Spark Dev Box,一款专为本地AI开发的小型台式机。它搭载NVIDIA RTX Spark芯片、128GB内存,算力达1 petaflop,可在本地运行1200亿参数大模型。其阳极氧化铝机身集成了散热系统,功耗100W。设备预装了开发者版Windows 11 Pro及开发工具链,预计售价3000至3500美元,将于今年晚些时候在美国上市。

Microsoft产品更新端侧部署/工程
07:23
🚨 AI News | TestingCatalog@testingcatalog
65
HERMES 🔥:Nous Research 推出的全新 Hermes 桌面应用现已登陆 macOS、Windows 和 Linux! 测试时间 👀
产品更新端侧部署/工程
05:21
SemiAnalysis@SemiAnalysis_
53
Cerebras做到了业界认为不可能的事:将整个46,225mm2晶圆制成单芯片。如此大面积的硅片缺陷不可避免,因此他们内置了冗余,并采用定制的逐批次光罩来绕过每个不良核心,最终实现了接近100%的可用晶圆率。结果:单片硅片上集成了90万个核心和44GB SRAM,无需封装,无片外跳转。他们并未止步于此,目前正在探索将DRAM晶圆通过混合键合堆叠在上方,以获得更快的更多内存。(1/4) 🧵
产品更新部署/工程
04:55
MiniMax (official)@MiniMax_AI
57
@togethercompute 团队对 MiniMax M3 生产部署的精彩深度解析。 M3 凭借其 1M 上下文、原生多模态和 MiniMax Sparse Attention,需要在分页解码、索引评分和多模态预处理方面进行大量工作才能实现高效运行。 这就是前沿合作的样子🤝。

Together AI: http://x.com/i/article/2061891247762026496

行业动态部署/工程
04:46
Rohan Paul@rohanpaul_ai
63
Satya Nadella 谈微软 Fairwater 数据中心:一个 AI 超级工厂

在微软 Build 2026 主题演讲中,Satya Nadella 介绍了 Fairwater 数据中心,这是一个为 AI 设计的“超级工厂”。其核心是垂直设计的双层 AI 数据中心架构,允许在三维空间内密集部署机架,在保持 GPU 间低延迟、高带宽网络连接的前提下,实现更高的计算密度,使整个集群更像一台大型 AI 机器。另一大亮点是其极高的冷却效率:冷却系统只需填充一次,实际运行中水耗几乎为零,其年度总用水量约等于一家餐厅的日用水量。这是微软构建“前沿智能生态系统”硬件基础的一部分。

Satya Nadella: Great to be back at Microsoft Build today. For us, it is not about any one piece of technology or even the platform. It ...

Microsoft产品更新部署/工程
03:56
Replit ⠕@Replit
精选70
宣布与 @Microsoft 的新合作 组织现在可以在 Replit 中构建内部工具、工作流或数据仪表板,并直接发布到 Microsoft Fabric,内置安全、身份验证和治理功能。
Microsoft产品更新部署/工程

推荐理由:对同时用 Replit 和 Microsoft Fabric 的企业来说,这个集成省了一步繁琐的部署工作,把内部工具开发到上线的链路压短了一截,但如果你没用过 Fabric 就不会有感知。
02:54
ClaudeDevs@ClaudeDevs
精选77
我们为 Claude Platform 添加了一个 CLI,使每个 API 端点都可以从你的终端运行。 调用 Messages API,启动 Claude 托管智能体,并将结果直接管道传输到你的 shell。 ant CLI 被使用 claude-api 技能的编码智能体(Claude Code)很好地理解。
AnthropicMCP/工具产品更新部署/工程

推荐理由:Ant CLI 把 Claude Platform 的所有 API 端点都弄进了终端,配合 Claude Code 用很顺手,做 Agent 或脚本开发的可以直接上手玩。
02:34
Tibo@thsottiaux
67
Codex 日常工作使用中新增大量实用功能。 如果你使用商业计划,现在可以托管和分享网站,我们推出了大幅改进的插件和技能以适应广泛的角色,并且你可以在文档、幻灯片、表格等中通过视觉注释向你的智能体提供反馈。
OpenAI产品更新编码部署/工程
02:23
Peter Steinberger 🦞@steipete
67
很荣幸与微软合作,将 OpenClaw 带入企业!

OpenClaw🦞: "You can run OpenClaw inside your company now." Annoucing our work with @Microsoft to bring OpenClaw to the Microsoft an...

Microsoft产品更新部署/工程
02:04
OpenClaw🦞@openclaw
精选69
"你现在可以在公司内部运行 OpenClaw 了。" 宣布我们与 @Microsoft 的合作,将 OpenClaw 带入微软和 Windows 生态系统。Claws 现在可以在企业环境中安全运行。
智能体Microsoft产品更新部署/工程
关联讨论 1 条The Verge:AI(RSS)
推荐理由:OpenClaw 和微软的合作,让企业终于能在自家 Windows 环境里跑这个 AI Agent,对看重合规与安全的团队来说,这比功能更新更实在。
01:21
SemiAnalysis@SemiAnalysis_
52
AI服务器定制化浪潮下,ODM厂商迎来新机遇

超大规模云服务商引入多样化的GPU、XPU和CPU芯片,导致AI服务器机架和板卡设计更加多元化。为满足不同客户需求,ODM厂商需要扩大设计团队规模,并增加组装与测试产能。这为ODM提供了接触新客户、拓展客户群的良机。随着AI服务器设计日趋定制化,早期介入与客户信任将成为赢得长期业务的关键。

行业动态部署/工程
00:33
OpenAI@OpenAI
同事件精选70
构建应用从未如此简单。 通过 Sites,Codex 可以将你的工作、想法和计划转化为一个交互式网站或应用,你的团队可以通过一个 URL 进行探索、使用和分享。 该功能将首先向 Business 和 Enterprise 计划推出,之后会更广泛地扩展。
OpenAI产品更新部署/工程
同一事件,精选展示《Codex 赋能每一种角色、工具和工作流》
推荐理由:Codex Sites 让应用构建门槛降到「描述即生成」,对企业团队快速验证想法是实打实的效率提升,但只开放 Business/Enterprise 意味着个人开发者还得等等。
00:29
OpenRouter@OpenRouter
精选68
⚡ 新增服务商:DigitalOcean 的 AI-Native Cloud 现已在 OpenRouter 上线。 提供高性能推理,覆盖热门开源权重模型。在 DeepSeek V3.2 的输出速度和延迟方面排名第一(数据来自 @ArtificialAnlys)。 查看其数据并试用模型:https://openrouter.ai/provider/digitalocean
DeepSeek产品更新推理部署/工程

推荐理由:OpenRouter 新上线的 DigitalOcean 推理服务,把 DeepSeek V3.2 的延迟压到了全场最低,比官方还快,做实时应用的值得立刻切过去试一下。
00:16
Chubby♨️@kimmonismus
47
Kombai 2.0 被定位为首个AI设计工程师,旨在融合设计与工程。该工具允许用户在画布内直接生成动画素材,跳过了传统图像生成的中间环节,并能将设计变更同步回代码库。其目标是打破设计和工程分属不同工作流的旧模式,服务于一个设计师能交付代码、工程师寻求无缝集成、所有人都想构建优秀用户体验的新世界。

Dipanjan Dey: Introducing Kombai 2.0 - the first AI design engineer. We keep hearing that AGI is almost here. Still, we're stuck with ...

产品更新编码部署/工程
‹ 上一页
1…7891011…25
下一页 ›