推文介绍了如何使用 llmistanbul 在网页上10秒内训练一个小模型(电子鹦鹉)。只需将纯文本文档(如哈利波特1-7)拖入即可,建议使用 Apple Silicon Mac(M1-M5),避免 markdown/json 等格式。N 卡(3080Ti)适配不佳。提醒尊重版权,勿公开发布他人作品。
推文介绍了如何使用 llmistanbul 在网页上10秒内训练一个小模型(电子鹦鹉)。只需将纯文本文档(如哈利波特1-7)拖入即可,建议使用 Apple Silicon Mac(M1-M5),避免 markdown/json 等格式。N 卡(3080Ti)适配不佳。提醒尊重版权,勿公开发布他人作品。
Apple 为首次 App Store 下载量不足 200 万的开发者免除云 API 费用,以降低 AI 实验门槛。
xAI在资产结构和运营模式上被比作数据中心REIT,而非传统的前沿AI实验室,这一观点来自martinalderson.com的分析文章。
Google向Intel订购超过300万颗AI芯片,计划于2028年交付。Nvidia正在测试Intel的制造工艺,用于其即将推出的Feynman架构。两家公司的动作源于台积电(TSMC)无法满足AI芯片需求。Intel长期低迷的晶圆代工部门因此获得第二次机会。
小米MiMo团队与TileRT合作发布MiMo-V2.5-Pro-UltraSpeed服务模式,专为MiMo-V2.5-Pro模型设计。该方案在单个8-GPU消费级节点上,实现了1万亿参数模型超过1000 tokens/s的解码速度。
小米在 6 月 8 日发布 MiMo-v2.5-Pro-UltraSpeed 模型,拥有 1T 参数规模,推理速度达到每秒 1000 个 token。该模型来自小米旗下的 mimo.xiaomi.com 项目。
同一事件,精选展示《小米 MiMo 与 TileRT 联合发布 UltraSpeed 模式,1T 模型输出突破 1000 tokens/s》New server tool: Advisor Let smaller models consult a higher-intelligence "advisor" model. Helps them escape doom loops,...
关联讨论 2 条OpenRouter:Announcements(RSS)X:OpenRouter (@OpenRouter)Good take My guess is - demand for intelligence is near infinite - but 80% of workloads will be running on 99% cheaper m...
小米 MiMo 联合 TileRT_AI 发布 MiMo-V2.5-Pro-UltraSpeed,首次在 1 万亿参数 MoE 模型上实现超过 1,000 tokens/s 输出速度,仅用单台标准 8-GPGPU 节点(非 Cerebras 或 Groq 方案)。提供限时免费聊天体验,UltraSpeed API 价格为 3 倍,输出体验提升约 10 倍。申请时间为 6 月 8 日至 23 日(PDT),企业可邮件联系 business-mimo@xiaomi.com。
同一事件,精选展示《小米 MiMo 与 TileRT 联合发布 UltraSpeed 模式,1T 模型输出突破 1000 tokens/s》英国保险公司 Aviva 利用 AI 工具识别出创纪录的 2.3 亿英镑保险欺诈索赔,以应对欺诈者使用新一代工具带来的挑战。当前欺诈手段愈加复杂,AI 既被用于防御,也被攻击方利用。Aviva 通过 AI 技术提升检测能力,遏制日益严重的保险欺诈问题。
OpenRouter 的 Agent SDK 新增人类参与循环(HITL)工具,用于 AI 智能体的合规监督。该工具可帮助 AI 智能体满足欧盟 AI 法案、科罗拉多州自动化决策技术法(SB26-189)以及 NIST AI 风险框架(NIST AI RMF)的监管要求。
同一事件,精选展示《OpenRouter Agent SDK 发布 `create-agent-tui` 与 `create-headless-agent` 技能,可快速搭建个性化编码智能体》华为云在 INSPIRE 2026 上推出 Agentic Infra 新范式,作为统一承载通用与 AI 负载的基础设施。同时发布全新一代模型训练推理平台与企业智能体平台,并宣布在其 Industry AI Foundry 中设立四个专属专区:智慧医疗专区、具身 AI 专区、智能制造专区和科学计算专区。
Arm 联合 Microsoft 推出 AppReady for Windows 项目,旨在引导开发者获取学习资源,构建原生 Windows on Arm(WoA)应用。项目整合 AI 赋能工具、开发指导与专家支持,帮助开发者检查关键依赖项是否已有 WoA 原生版本、审视构建系统与编译器设置、识别架构相关代码及性能关键路径,并获取原生开发指导。AI 工具可扫描代码、识别可移植性问题并加速移植。
AI Agent成本飙升,Uber预算浪费暴露了“Tokenmaxxing”陷阱。阿里云STAROps推出UModel解决方案,采用结构优先方法,用知识图谱替代盲文本推理,通过即时解析依赖关系大幅减少Token消耗和工具调用,实现10倍效率提升,同时确保企业系统可审计与零信任准确性。
OWC 在今年 5 月宣布的 Stack AI 是一款雷电 5“AI 加速器”与外置存储解决方案,在 COMPUTEX 2026 上确认基于群联 aiDAPTIV 方案,为外置式 AI 内存 NAND 扩充方案。aiDAPTIV 将闪存纳入系统有效内存,把部分 AI 内存需求卸载到高耐久性 SSD 上,降低对 DRAM 依赖,使大型 AI 智能体可在本地运行。此前的 aiDAPTIV 多为内置型,Stack AI 为外置版本,部署更灵活。
TrendForce 预测,受卫星宽带、手机直连卫星及 AI 运算需求推动,SpaceX 未来 IPO 将带动全球卫星产业产值在 2027 年达 4470 亿美元,年增 14%。SpaceX 通过收购 EchoStar 频段加速新兴市场手机直连卫星部署,并布局 AI 太空运算,在卫星轨道端直接分析农业监测等影像数据,同时扩建自有 AI 运算芯片厂 Terafab,强化垂直整合能力。
英伟达与韩国斗山集团6月8日宣布扩展合作,覆盖四大板块:斗山机器人将整合英伟达Isaac Sim、Cosmos及Jetson Thor,升级“智能体机器人操作系统”,并探索双臂及人形机器人;斗山山猫将引入物理AI至建筑、农业及物料搬运设备;斗山重工拟以燃气轮机、小型模块化反应堆等为英伟达AI工厂供电;斗山电子材料以覆铜板支持英伟达MGX生态AI服务器及网络设备PCB。
SK电讯宣布基于NVIDIA AI工厂平台DSX构建AI数据中心,目标将AI云服务规模扩展至GW级别。首先采用Blackwell架构GPU用于训练与推理,后续逐步导入Vera Rubin平台。该AI工厂计划于2027年在韩国投运。SK电讯计划将AI基础设施扩展至全亚洲,成为NVIDIA亚洲AI基础设施关键合作伙伴。此外,双方还在机器人仿真和训练平台方面展开合作。
SK海力士与英伟达达成多年内存合作,将为英伟达下一代AI超级计算机Vera Rubin、Vera CPU、RTX Spark PC及Jetson Thor平台联合开发内存。合作强调内存设计需提前数年与GPU协同设计、制造规划及资本投入,不能再于GPU完成后才设计。双方还将把AI引入芯片制造,利用NVIDIA CUDA-X、PhysicsNeMo、Omniverse、OpenUSD、cuOpt加速芯片设计和半导体仿真,并计划建立工厂数字孪生,在软件中模拟机器人、晶圆和物流后再投入产线。该合作进一步巩固了SK海力士在AI硬件供应链中的关键地位。
FT报道MIT一项研究,跟踪软件团队从文件编辑到审查到发布的完整生产漏斗。使用AI后,开发者创建或编辑文件数量增加近300%,但在审查阶段增益降至150%,最终到软件发布仅提升约30%。这表明AI在加速局部编码任务上效果显著,但人类审查、协调、产品判断、测试和发布流程仍是决定产出价值的关键瓶颈,大量额外工作未能转化为最终产品。
文章盘点四大渠道:① OpenAI Codex for OSS,开源项目维护者可免费获6个月ChatGPT Pro(价值$1200)及API credits;② Anything AI,新用户通过促销链接注册可得2万credits,需重复点击触发bonus;③ Lenny's Product Pass,付费订阅其年度Newsletter($200-400)可兑换总价值$30000+的AI工具一年会员,先到先得且要求新用户;④ 三大云startup credits,微软Founders Hub最低$1K-$5K(无VC要求),谷歌AI-first创业最高$350K但要求严,AWS可叠加(自筹$1K+YC等)。每个口子均有门槛限制。
Anthropic 挖走 OpenAI 自研芯片团队第二位硬件员工 Clive Chan,他主导与 Broadcom 合作的芯片设计,2.4 年亲历项目从零到即将部署。Clive 称无法抵抗“从山脚爬一座新山”的冲动,本周加入 Anthropic。主推文分析挖角逻辑:并非靠薪资,而是让核心员工感到 OpenAI 窗口期关闭,Anthropic 在基础科学、长期押注和硬件人才密度上提供更大攀登空间。过去一年已陆续挖走基础研究、安全及 AI 硬件等核心人才。
Personal update: I've decided to leave OpenAI. I'm proud to have been part of the custom chip program and grateful to ev...
富士康在2026年台北电脑展期间展示了一款液冷版 RTX 6000 Blackwell GPU,面向服务器和数据中心场景。该卡采用单槽设计,全面覆盖液冷散热模块,拥有96GB GDDR7显存,可运行AI大模型、复杂仿真及专业图形任务。电源接口改用远离PCIe插槽的独立插槽,未使用标准12V-2x6接口。
日本北海道农民富安弘毅用 ChatGPT 和 Codex 解决农场实际问题,涵盖 8 个用法:拍照识别西兰花病害、卫星监测获取 NDVI 数据、用 ESP32 和 LINE 机器人远程控制温室卷帘、为农场群聊开发机器人管理温度与排期、从聊天记录追踪播种数量、学习 RTK-GPS 自动转向原理并评估自建成本、设计基于 Airtable 的农场管理数据库。他说 AI 让传统昂贵的自动化变得低成本可及,“如同身边有一位超级工程师”。
低代码与无代码AI平台正将提示词转化为可运行的应用、智能体或模型。该指南比较了21款工具,涵盖应用构建器、自动化、AI智能体和机器学习平台四类,每款均附带官方链接。
Anthropic's Opus 4.7 and 4.8 models are experiencing degraded performance, which is causing a higher rate of failures fo...
近日,三峡集团首个无人机智能巡检管理体系在内蒙古投入运行,首批覆盖12座新能源场站,总装机640万千瓦。体系配套21座无人机机巢、28架巡检无人机,实现光伏、风机、集电线路、升压站巡检全覆盖。相比人工巡检,每年节省工时超11万小时,效率提升13.2倍,隐患提前检出率63%。依托自主开发的智能巡检平台,通过AI甄别缺陷,并建立专项管控机制落实双审批、全报备、实时监控,确保飞行全程可追溯、可管控、可闭环。
Claude Code v2.1.168 版本发布,更新内容仅为错误修复和可靠性改进。因原文较短,无法达成 50-100 字。
谷歌与SpaceX达成协议,每月支付9.2亿美元,获得位于xAI数据中心的计算能力。该交易的具体金额和合作细节于本周披露,将极大扩充谷歌的算力资源。
同一事件,精选展示《SpaceX与Google达成云计算新协议》Google 发布 Colab CLI,允许开发者和 AI 智能体在终端中直接运行本地 Python 代码,并利用远程 Colab 的 GPU 与 TPU 运行时进行加速。通过这一命令行工具,用户无需打开浏览器即可无缝连接 Colab 计算资源,为自动化和脚本化 AI 工作流提供了更便捷的接口。
同一事件,精选展示《Google Colab CLI 发布》Rreuters: SpaceX's $75B IPO is already seeing about $150B in demand (2x oversubscribed) SpaceX has said its AI business ...
一名前日本公务员(不会种地)在北海道用AI管理100公顷农场。他借助ChatGPT和Codex自行编写代码,构建全自动农场系统:ESP32+LINE机器人远程控制温室通风/卷帘电机;温度监测+自动通风机器人;Airtable农场数据库(田地、任务、传感器、材料);卫星NDVI作物健康地图叠加在田地上;AI生成布线图。展示了普通人用AI解决实际问题的正确方式。
http://x.com/i/article/2063237792746831872
据路透报道,SpaceX 750亿美元IPO已获约1500亿美元需求(2倍超额认购)。SpaceX在路演中表示,其AI业务可瞄准23万亿美元市场,通过太空建设AI算力突破地球限制。公司称美国电力与算力增长落后于中国,计划用SpaceX发射将数据中心等送入太空弥补差距。此前SpaceX披露与Google的云服务协议,Google每月支付9.2亿美元(约110亿美元/年)用于xAI数据中心算力。
SpaceX just disclosed a new Cloud Service Agreement with Google. Google to pay SpaceX $920 million a month (about $11B a...
科技巨头谷歌与航天公司SpaceX达成协议,每月支付9.2亿美元,用于购买计算服务。该消息根据Hacker News 6月6日的信息曝光,显示这一高额交易已得到确认。谷歌将向SpaceX支付每月9.2亿美元的费用,以获得其计算能力的支持。
OpenCV 5 正式发布,采用基于图的 DNN 引擎,ONNX 算子覆盖率从 4.x 的不到 23% 提升至超 80%,原生支持 Transformer、视觉语言模型(VLM)和大语言模型(LLM)。其他更新包括:更好的 Python 集成与命名参数、更紧凑核心代码、清晰硬件加速层、原生 FP16/BF16、规范化 0D/1D 张量、扩展 3D 视觉及现代化文档。该库 GitHub 拥有超 86,000 stars,每日安装量超一百万次。
Anthropic 5 月发布白皮书,提出企业部署自主 AI Agent 时须将零信任原则延伸至 Agent 架构。报告指出双重加速:前沿模型将漏洞发现到利用周期压缩至数小时;Agent 能自主解释目标、选工具、执行多步操作,传统访问控制无法阻止“合法权限内作恶”。核心原则:永不信任始终验证、假设已遭入侵、最小权限;另附设计检验——控制是让攻击不可能,还是仅增加麻烦?报告分五部分:Agent 为何是新安全对象、威胁图谱、三层能力成熟度模型、八阶段实施工作流、防御运营适配自主威胁速度。