宝玉 (@dotey) 对比各模型 Deep Research 表现:ChatGPT 的 DeepResearch 最好,Gemini 搜索能力强、表现也不错,Claude 做得很差。引用推文补充:在写代码、工程工作及需联网搜索数据并分析得出结论的任务上,Claude 的“5.5”版本远超 Opus,Opus 搜索能力几乎不可用。
@dotey 但是写代码,工程工作,以及所有需要上网搜索数据计算得出分析结论的事项,5.5 比 opus 强很多,opus基本不可用,它的搜索能力几乎等于没发用
宝玉 (@dotey) 对比各模型 Deep Research 表现:ChatGPT 的 DeepResearch 最好,Gemini 搜索能力强、表现也不错,Claude 做得很差。引用推文补充:在写代码、工程工作及需联网搜索数据并分析得出结论的任务上,Claude 的“5.5”版本远超 Opus,Opus 搜索能力几乎不可用。
@dotey 但是写代码,工程工作,以及所有需要上网搜索数据计算得出分析结论的事项,5.5 比 opus 强很多,opus基本不可用,它的搜索能力几乎等于没发用
Tomorrow could be Apple's most important AI moment yet. WWDC 2026 is expected to be all about one thing: making Siri rel...
据传 WWDC 2026 苹果将彻底重构 Siri,底层集成 Google Gemini 模型(约 1.2 万亿参数)作为云端智能层,与自有 3B 参数设备端模型组成混合系统。Siri 担任编排层,控制 UI、隐私和应用权限。预期新 Siri 支持更自然对话、跨应用上下文、屏幕感知、应用内操作、专用 Siri app、语音/文件/多模态交互、动态岛增强,并可选接入 ChatGPT/Claude 等第三方 AI。同时可能推出 AI 修图、智能相机、写作工具、自然语言快捷指令等新 Apple Intelligence 功能。
安全公司 SafeBreach 披露谷歌 Gemini 存在“Fake Context Alignment”漏洞。黑客可通过 WhatsApp、短信等发送特殊构造通知,将恶意指令隐藏在非目标语言文字或“静音超链接”中,利用 Gemini 的“Delayed Tool Invocation”机制绕过用户授权。攻击方式包括多语言混淆和语音助手不朗读超链接内容,可能导致智能家居被操控、通讯录被篡改。SafeBreach 于去年 8 月报告,谷歌在 11 月中旬通过改进内容分类器缓解。
谷歌与SpaceX达成协议,每月支付9.2亿美元,获得位于xAI数据中心的计算能力。该交易的具体金额和合作细节于本周披露,将极大扩充谷歌的算力资源。
同一事件,精选展示《SpaceX与Google达成云计算新协议》Google 发布 Colab CLI,允许开发者和 AI 智能体在终端中直接运行本地 Python 代码,并利用远程 Colab 的 GPU 与 TPU 运行时进行加速。通过这一命令行工具,用户无需打开浏览器即可无缝连接 Colab 计算资源,为自动化和脚本化 AI 工作流提供了更便捷的接口。
同一事件,精选展示《Google Colab CLI 发布》据路透报道,SpaceX 750亿美元IPO已获约1500亿美元需求(2倍超额认购)。SpaceX在路演中表示,其AI业务可瞄准23万亿美元市场,通过太空建设AI算力突破地球限制。公司称美国电力与算力增长落后于中国,计划用SpaceX发射将数据中心等送入太空弥补差距。此前SpaceX披露与Google的云服务协议,Google每月支付9.2亿美元(约110亿美元/年)用于xAI数据中心算力。
SpaceX just disclosed a new Cloud Service Agreement with Google. Google to pay SpaceX $920 million a month (about $11B a...
用户实测推荐,目前多模态大模型性价比最高的是Qwen3-VL / Qwen3.5 VL系列,其输出价格比Gemini 3.5 Flash便宜22倍,读图能力相当。作者使用的具体模型是qwen/qwen3.5-flash,价格为$0.1/$0.4,支持多模态图片+视频,上下文窗口达1M。
http://x.com/i/article/2060717603987791878
科技巨头谷歌与航天公司SpaceX达成协议,每月支付9.2亿美元,用于购买计算服务。该消息根据Hacker News 6月6日的信息曝光,显示这一高额交易已得到确认。谷歌将向SpaceX支付每月9.2亿美元的费用,以获得其计算能力的支持。
Google 的 NotebookLM 即将支持从用户资料生成多种格式的文件,包括 pdf、txt、md、docx、csv、pptx、epub 以及大量音视频与图片格式(如 mp3、mp4、wav、jpg、png、heic 等)。此次更新很可能与 Gemini 3.5 Flash 模型升级一同发布。
科技媒体Android Authority 6月5日报道,谷歌否认将AI Mode设为Chrome默认搜索方式的说法。此前Chrome Canary频道新增"Fulfill Searchbox Queries in AI Mode"实验选项,启用后地址栏查询直接进入AI Mode,引发媒体猜测。谷歌搜索工程副总裁Rajan Patel回应称该发布属错误,目前无相关计划。媒体认为"错误"更指向该功能不应在本次Canary版本中出现,而非内部未测试。
近日 Google 裁掉整个工程教育团队,该团队曾负责 10 万+工程师的培训。标志性的“Testing on the Toilet”项目(自 2006 年起在厕所隔间张贴最佳实践纸片)随之消失。推文指出,此举释放信号:连最重视工程文化的 Google 也认为培养人不如 AI 划算,未来可能不再有公司花几年时间培养新人,“师傅带徒弟”式的成长或成历史。@GergelyOrosz 确认全员被裁。
Everyone on Google's Engineering Education team had been laid off very recently It suggests Google completely stops inve...
SpaceX公布文件显示,Google与其签订协议,从2026年10月至2029年6月,每月支付9.2亿美元购买算力,具体包括约110,000个NVIDIA GPU、CPU、内存及其他组件。此前Anthropic也已向SpaceX每月支付12.5亿美元购买算力。两项协议合计每年带来约260亿美元收入。
Google DeepMind 发布开源权重模型 Gemma 4 12B,支持语音转录,在 AA-WER 基准上得分为 8.8%(排名第 58),远低于专注转录的开源模型 Voxtral Mini Transcribe 2(4B 参数,WER 3.6%)和 Voxtral Small(12B 参数,WER 2.8%)。该模型是 Gemma 4 系列中支持转录的最大型号(另有 E4B、E2B),而 31B 和 26B A4B 仅支持文本、图片和视频输入。Google 同步推出本地听写应用 Eloquent(MacOS/iOS)。模型已在 Hugging Face、Ollama 和 LMStudio 上架。
谷歌与 SpaceX 达成云计算合作,自 2026 年 10 月起至 2029 年 6 月,每月向 SpaceX 支付 9.2 亿美元(约 62.46 亿元人民币),租用至少 11 万张英伟达 GPU 及 CPU 等芯片对应的计算能力,用于训练和推理 AI 等高密度场景。该合作既缓解谷歌算力供应紧张与扩容周期压力,也为 SpaceX 的人工智能业务新增重要收入来源,为其 IPO 提供叙事筹码。
Google 发布 Gemma 4 的 QAT(量化感知训练)检查点,将最小模型从 11.4GB 缩小至 1.1GB(纯文本版 0.84GB),便于手机和笔记本运行。常规 PTQ(训练后量化)因模型未学会应对舍入而损伤质量;QAT 在训练中模拟压缩,让模型在权重被挤压时学习,压缩版不易丢失推理能力。Google 还构建了移动端优化格式,包含静态激活、通道量化、定向 2-bit 量化及 KV 缓存优化,减少手机缩放计算并防止长对话过快消耗内存。
Anthropic 称其 80% 的新生产代码由 Claude 编写。Google 新论文显示,通用 LLM 通过规划证明与逐步验证,将形式数学求解性能从低于 10% 提升至 70%。Google 开源 Gemma 4 12B,可在消费级 16GB GPU 上本地运行,支持音频和视频分析。通义千问发布 Qwen3.7-Plus,支持文本、视频、图像输入,价格 $0.4/$1.6 每百万 token,闭源。Anthropic 新化学报告有惊人结果。
Anthropic此前承诺每月向SpaceX支付12.5亿美元GPU算力。Google新披露的云服务协议每月再付9.2亿美元(年化约110亿美元),两家AI实验室合计月付21.7亿美元,年化营收达260亿美元。Alphabet于2015年以约9亿美元入股SpaceX约7%,当前SpaceX目标IPO估值1.75万亿美元,其6.11%股份对应约1070亿美元,投资回报约97-119倍。业务转向显示AI算力正成为战略商品。
SpaceX just disclosed a new Cloud Service Agreement with Google. Google to pay SpaceX $920 million a month (about $11B a...
Google Research 与 Google Cloud 合作推出跨语料库检索(Cross-Corpus Retrieval)框架,作为 Gemini Enterprise Agent Platform 的 Agentic RAG。该多智能体工作流将复杂企业查询分解为子任务,通过规划、重写和路由,迭代搜索多个数据源直至获得充分上下文,再生成可靠回答。与标准 RAG 相比,在事实性数据集上准确率最高提升 34%;在多个领域特定内部数据集上也实现了更好的接地与推理准确性。
SpaceX just quietly amended its S-1 announcing another mega deal $920M/month from Google from October 2026 through June ...
Google DeepMind 推出 Gemma 4 量化感知训练(QAT)检查点,包含 Q4_0 格式和一种新的移动端格式,旨在降低设备端内存占用。对比 BF16、Q4_0 QAT 和移动版 QAT 三种边缘端格式,官方公布了各格式的内存数据与设计权衡。
Google 发布 Gemma 4 QAT 模型,该模型通过量化感知训练(QAT)技术优化压缩,旨在提升移动设备和笔记本电脑上的运行效率与能效。文章来源于 Google 官方博客,介绍了这一面向移动端和笔记本端的模型优化方案。
Google DeepMind 发布 Gemma 4 QAT 量化感知训练模型,专为本地 / 设备端优化。通过量化感知训练减少内存占用,同时相比标准训练后量化保留更多质量。支持 Q4_0 格式及新的移动专用量化格式。Gemma 4 E2B 版本可运行于约 1GB 内存,纯文本版本甚至低于 1GB,使手机、笔记本、边缘设备和消费级 GPU 上的本地 AI 更实用。
Google AI 本周发布多项更新:Nano Banana 2 及 Pro 正式 GA,可通过 Gemini Enterprise Agent Platform、Gemini API 和 Google AI Studio 获取;Co-Scientist 多智能体系统面向科研自动生成优化新假设;Google Labs 推出 dreambeans,根据用户 Google 应用数据每日生成个性化话题集;Gemma 4 12B 统一无编码器多模态模型可完全离线运行于笔记本;Gemma 4 系列及草稿模型引入 QAT 降低内存需求;Google Magenta RealTime 2 开源实时音乐模型,支持 MIDI 键盘、文本提示和手势演奏。
Google 推出 Colab 命令行界面(CLI),允许开发者和 AI 智能体将本地终端连接到远程 Colab 运行时,实现无摩擦执行。该轻量级 CLI 支持请求高性能 GPU、远程运行本地 Python 脚本,并检索工件日志或模型(如微调后的 Gemma 3 适配器)。工具可直接集成到标准终端环境,可被 Antigravity、Claude Code 等 AI 智能体调用以管理复杂机器学习流水线。
谷歌发布 Gemma 4 量化感知训练 (QAT) 检查点,支持在消费级 GPU 和移动设备上本地运行,质量损失极小。新检查点提供 GGUF(Q4_0)格式,覆盖所有尺寸及起草模型,实现最佳本地性能。自定义移动模式采用混合精度方案,将 Gemma 4 压缩至 1GB 以下,包含 2-bit 解码层、优化 KV 缓存和静态激活。通过在训练中模拟压缩(而非训练后量化),大幅降低内存占用并加速解码,同时保持推理质量。
同一事件,精选展示《通过 Gemma 4 将 AI 推向边缘和设备端》Fitbit Air 作为一款极简、可靠的健身追踪器表现出色,但 Google 的 AI Health Coach 功能反而成为负担。
苹果新版Siri被内部标记为“Beta”版,不会作为完成品宣传;可能设置等待清单供用户尝试。iOS 27细节:通知到达重新设计,通知中心手势移至左上角;“查找”应用视觉重设计;照片“清理”功能改进;大量底层安全改进。部分Siri查询将通过Google Cloud调用授权版Gemini,并使用谷歌的NVIDIA Blackwell B200集群处理。
同一事件,精选展示《受 DMA 影响,Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线》外媒报道,谷歌员工在内部平台发布大量反AI梗图,嘲讽自家AI编程工具Jetski不够可靠。今年4月,CEO皮查伊宣称公司75%新代码由AI生成,但员工反映工程师需反复检查粗糙代码,负担未减。I/O大会期间,一张梗图讽刺AI“制造垃圾内容”获100余赞。过去一年反AI梗图达数百至数千张。员工指出AI将压力转移至测试、审查等后续环节,最终耗时与不用AI相近。
fofrAI 使用 Gemini 3.5 Flash 和 Antigravity CLI 实验 AI 智能体的自主性和速度。结果:20 分钟内在 Linux CPU 上安装并运行原版 Stable Diffusion 1.5,完成推理生成图像;基于 Lora 和 SD 论文,用 10 张图片从零实现 Lora 微调器(约 1 小时 30 分,主要为 CPU 训练);通过 modal 约 20 分钟找到 GPU、获取 Ideogram v4 权重并运行推理。该推文展示了当前长周期智能体任务的基线案例。
Where's the baseline for impressive long horizon agent tasks today? What are you seeing this week that makes you go "woa...
Chrome Canary 中出现隐藏 flag“Fulfill Searchbox Queries in AI Mode”,启用后地址栏搜索直接进入 AI Mode,界面类似聊天机器人,跳过传统搜索结果页。该功能完成度已接近可发布状态,但谷歌尚未公开宣布。用户可通过 chrome://flags 开启,支持 Mac、Windows、Linux 和 ChromeOS,短期内不会上线。
We're launching Search profiles, a new way for publishers and creators to shape their presence on Search. Search profile...
谷歌前天宣布为Android Go系统引入Gemini,配备2GB以上内存的Android Go手机可使用精简版Gemini Go AI助手。Gemini Go将替换原有Google Assistant Go,通过Google搜索应用提供服务。用户可通过长按Home键或电源键启动,支持拨打电话、发短信、查地图、搜餐厅、设闹钟、创建日历、播放媒体,并可上传文档和照片获取更多上下文。该助手已开始分阶段推送,用户将在未来几天或数周内体验到。
谷歌 Magenta 团队昨日发布 Magenta RealTime 2(MRT2)模型,免费放出乐器应用 Jam 及 DAW 插件 MRT2。MRT2 提供两种规模:高质量模型 mrt2_base(24 亿参数)和高速模型 mrt2_small(2.3 亿参数),均针对苹果 Apple Silicon 优化,mrt2_small 可在 M1 及以上芯片 Mac 实时运行。相较前代延迟约 3 秒,MRT2 改为逐帧生成(每帧 40 毫秒),控制延迟约 200 毫秒,降低至 15 分之一。支持文本和音频风格提示、MIDI 音符与鼓开关控制及 Auto-Strum 模式。技术基于 Codec Language Model,采用 SpectroStream 编解码器处理 48kHz 立体声音频。
关联讨论 1 条X:Google AI for Developers (@googleaidevs)