北京大学研究人员发现,GPT 和 Gemini 等主流大语言模型在进行文档分析时,经常引用无法支持其答案的文本段落。即便答案本身正确,被引用的证据也常是错误的。研究人员将此现象称为“归因幻觉”,并指出这是法律和医疗等受监管领域的风险。为此,他们提出了首个系统性测试该问题的新基准 CiteVQA。
北京大学研究人员发现,GPT 和 Gemini 等主流大语言模型在进行文档分析时,经常引用无法支持其答案的文本段落。即便答案本身正确,被引用的证据也常是错误的。研究人员将此现象称为“归因幻觉”,并指出这是法律和医疗等受监管领域的风险。为此,他们提出了首个系统性测试该问题的新基准 CiteVQA。
Xreal创始人兼CEO Chi Xu表示,作为谷歌的智能眼镜合作伙伴,公司认为智能眼镜行业已迎来转折点,并成功掌握了这一复杂领域的发展。
苹果将优化AirPods软件功能,但暂无独立应用计划。iOS 27将大幅改动设置应用中的AirPods菜单界面,使其更实用、清晰、简洁。当手机连接AirPods后,其设置页面会自动置顶于设置首页。此次改版旨在优化长期叠加新功能后变得繁杂的界面信息层级。该更新将同步上线于iOS 27、iPadOS 27及macOS 27系统,新系统将于数周后的苹果全球开发者大会发布。
数学家Adam Kucharski的实验表明,当向Microsoft Copilot输入两组仅国家标签不同但数据完全相同的分析请求时,Copilot并未能识别其本质一致,反而虚构并输出了基于国家的刻板印象分析。这暴露了当前许多AI工具在默认配置下存在的系统性偏差风险。尽管具备推理能力的“思维模型”能识别此类数据陷阱,但用户需要主动知晓并选择启用它们。这一现象警示我们,在进行关键数据分析时,不能盲目依赖AI工具的默认模型,而应审慎选择并评估其分析结果。
Google发布了新款Gemini AI模型,其核心特点是能跨模态处理“万物到万物”的生成任务,例如直接从文本生成高质量视频。文章通过作者用该工具为孩子的毛绒玩具鹿生成“度假视频”的实验,展示了当前生成式AI技术的强大与易用性——仅需极低的操作门槛和专业知识,即可创建逼真内容。这一趋势标志着强大的AI创作工具正快速普及,同时也引发了对生成式AI应用边界、内容真实性及潜在影响的深入思考。
Google CEO Sundar Pichai 近期将链接和来源重新描述为搜索的“一部分”,而非其赖以生存的基础。这一措辞的转变具有策略性,反映出 Google 通过新功能将用户留在其生态系统内的趋势。Google 正从互联网流量分发者转变为 AI 内容发布者,而其内容源的选择正日益成为一种编辑权力问题。
谷歌在2026年I/O开发者大会上推出的AI Overview(AI概览)功能近日出现逻辑故障。用户在搜索“disregard”等特定词汇时,系统错误地将其识别为执行指令,导致AI概览区域显示空白并遮挡正常搜索结果。测试发现,“ignore”、“stop”、“remember”等多个具有指令含义的词汇均存在同类问题,移动端同样受到影响。
在2026年Google I/O开发者大会上,对话环节聚焦于未来科技趋势。行业领导者围绕人工智能、量子计算、机器人学以及创造力等核心议题展开了深入探讨,旨在勾勒这些前沿领域的技术演进路径与发展蓝图。
同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》Google搜索在近期推出AI功能更新后出现了一个新问题:当用户尝试搜索“disregard”一词时,搜索界面会完全失效无法正常使用。这个技术故障表明AI集成可能对原有搜索引擎的稳定性产生了未预期的干扰,具体原因和修复时间尚未公布。
谷歌AI搜索近期出现显著故障,当用户搜索“disregard”一词时,AI概览功能并未返回常规的AI生成摘要,而是弹出类似传统聊天机器人的无关回复,例如“Got it! Let me know if you need help with anything else.”,完全忽略了用户的实际搜索需求。该现象在社交平台被曝光后,进一步引发了公众对AI搜索功能可靠性的担忧。
Google展示了运行Android XR操作系统的原型智能眼镜,该设备能将Gemini AI驱动的翻译、导航及其他信息直接叠加并显示在用户视野中。这标志着可穿戴设备从“后置屏幕”向“前置视窗”交互模式的重要演进,其核心在于将实时AI处理能力与日常视觉场景深度融合。
谷歌在 I/O 开发者大会后调整了 Gemini 的计费规则,自5月17日起,原先按“每日提示词次数”计量的配额改为“按算力消耗”计算,并将请求复杂度、功能调用和聊天历史长度纳入计量范围。此举引发大量 Pro 和 Ultra 付费用户投诉,称在处理密集任务时更易触及配额限制。谷歌随后回应,已为付费用户重置本周配额,并宣布将永久上调配额至原来的3倍。该调整目前已开始分批生效。
一篇博客文章发布在zeroshot.bearblog.dev,题为“谷歌的‘IBM化’?”,探讨谷歌是否正经历类似IBM的官僚化转型。该文在黑客新闻平台以102点的热度引发讨论,聚焦于谷歌从高速创新向稳定企业结构的潜在转变,并分析数字指标显示科技巨头在规模扩张中可能面临的共性挑战,如创新瓶颈和战略调整。文章通过对比分析,预示了谷歌未来发展的不确定性和行业影响。
Google即将全面引入AI概览功能,这将显著改变其搜索结果呈现方式。这一变化可能引发部分用户不满,尤其针对过度依赖AI生成的摘要式回答。与此同时,多家搜索引擎如DuckDuckGo、Brave Search等凭借隐私保护、去广告化或传统列表式结果等差异化特性,正吸引寻求替代方案的用户。市场动态显示,搜索引擎竞争正从技术功能向用户体验维度拓展。
谷歌在其Lighthouse网站分析工具中新增了名为“代理浏览”的实验类别,用于评估网站处理AI代理的能力。该新功能会检查网站是否提供了llms.txt文件,这是一个旨在供大型语言模型使用的元数据标准文件,旨在帮助AI更高效地理解和访问网站内容。此举标志着搜索引擎开始正式评估和适配AI代理,可能对未来网站的搜索优化方向产生影响。
技术博客记录了一项本地处理实验:在配备50GB交换分区的2021款MacBook上,使用Gemma4-31B大语言模型成功完成了一整年视频的本地索引任务。该成果在技术社区Hacker News上获得102个积分,显示了消费级设备运行大模型进行长周期媒体处理的可行性。
Google发布了面向开发者的新工具包:Kotlin版ADK与Android版ADK 0.1.0。这两个工具包旨在帮助开发者构建AI Agent。其中,Kotlin版ADK将代理工作流引入后端项目开发;Android版ADK则专注于移动端应用,提供了构建AI代理所需的特定功能。此次发布为开发者提供了在Android生态及更广泛平台创建AI应用的官方工具基础。
同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》Google 通过推出全栈 Gemini AI 解决方案扩展其智能家居生态系统。该方案集成了先进的摄像头智能、自然语言查询功能和日常活动摘要能力。它为服务提供商和硬件制造商提供了现成的参考设计与API,使其无需大量研发投入即可构建主动式、品牌化的智能家居服务。该计划旨在超越基础设备控制,迈向能够理解情境并实时响应用户需求的AI原生智能家居。
美国网络司令部启动专项工作组,计划在五角大楼和国家安全局的最高机密网络上部署OpenAI、Google等外部AI模型。此举源于AI系统(如Anthropic的Claude Mythos)在发现安全漏洞方面已展现出超越顶尖人类黑客的能力。Anthropic预测,类似高性能AI工具可能在未来6至24个月内广泛普及,促使美军加速整合先进AI以提升网络防御能力。
谷歌被指“挂羊头卖狗肉”,其高调宣传的“反重力”相关技术或项目存在名不副实的情况。文章分析了该事件,指出谷歌在披露信息与实际情况之间可能存在偏差。该内容于2026年5月21日发布,并在技术社区获得130点关注度。
剪映国际版CapCut宣布与谷歌Gemini展开合作。CapCut的图像和视频编辑功能将集成到Gemini应用中,用户可直接在应用内调用相关工具进行创作。官方称,此举旨在实现更智能、无缝且对话化的未来创作体验。这是双方继去年测试Google Photos与CapCut互通功能后的再次合作。
AI 代理技术正大量涌现,Google 近期推出了其 AI 代理生态系统,旨在向消费者市场推广集成化的人工智能解决方案。然而,这一策略面临挑战,因为目标受众可能缺乏购买兴趣或需求。这反映了当前 AI 领域的快速扩张和市场竞争加剧,科技公司正加速布局以抢占份额,但商业化落地仍需突破用户接受度瓶颈。
编辑Sean Hollister分享了他使用Google AI Studio的震撼体验。在一个下午内,他仅通过输入文字就成功构建了三个安卓应用。其中一次,他向AI输入了148个单词描述后便离开,十分钟后,一个功能完整的应用就已安装到他的手机并可运行。Google的AI工具包揽了从生成代码到编译、部署的所有技术环节,用户只需进行简单的手机调试设置。这一过程生动展示了“vibe coding”如何降低软件开发门槛,预示着普通用户也能借助AI工具快速将创意变为现实,个人软件开发的革命正在到来。
机构预测,谷歌与三星合作的新款Android XR智能眼镜将于2026年推出,包含Warby Parker和Gentle Monster联名款,预计首年销量可达200万台。这一速度远超Meta,后者累计达到200万台销量花了数年时间。若预测成真,谷歌将跻身全球智能眼镜销量第二位。同期全球智能眼镜总出货量预计为1500万台,其中纯音频款眼镜占比达91%。
谷歌宣布其AI模式的搜索结果中将包含广告。这意味着用户在使用AI驱动的搜索功能时,可能会看到付费推广内容。此举是谷歌搜索广告业务的最新扩展,将广告整合进由人工智能生成的直接回答或交互界面中,标志着搜索引擎商业化模式的进一步演进。
谷歌正为AI搜索重塑广告形态。用户在谷歌搜索商品时,旗下Gemini人工智能模型将推送相关产品并生成专属选购解读,说明推荐理由。谷歌还推出内置聊天机器人的广告,用户可与Gemini对话咨询商品信息。在人工智能搜索模式中,谷歌测试多种新广告形式,例如依据用户具体问题推送对应赞助商品,或在好物推荐列表中醒目植入赞助内容。这些广告旨在自然融入对话场景,打通从提问到下单的链路,并帮助用户发现更多新品牌。
谷歌在2026年I/O开发者大会上升级3D视频会议平台Google Beam,新增面向群组会议的实验功能。该功能利用AI体积视频模型,从不同视角生成更有纵深感的画面,使参与者呈现接近真人大小的3D形态,并配对空间音频让声音从说话者位置传出。系统自动将2D视频流渲染成围坐一桌的视觉效果,增强“存在感”,而非Beam设备如MacBook或Windows笔记本仍以2D形式接入。
谷歌高级副总裁詹姆斯·曼尼卡近日表示,AI短期内不会摧毁就业市场,也不同意“大规模失业”的激进预测。他援引其2017年参与的麦肯锡报告指出,自动化将同时导致岗位减少、新岗位出现以及现有岗位被重新定义。他认为当前争议在于这三种情况的占比,而非是否发生。曼尼卡批评AI行业放大了公众焦虑,这种恐慌可能削弱技术价值。他强调,AI最大的影响是改变工作内容与方式,而非让职业消失。
关联讨论 1 条IT之家(RSS)前线部署工程师模式由Palantir开创,现正被OpenAI和Anthropic等AI巨头广泛采用。为解决标准SaaS方案无法满足企业AI落地中的复杂定制化需求,该角色要求工程师深入理解业务场景,并与AI技术紧密结合。对于早期职业的AI工程师而言,掌握跨领域协作与实地部署技能,是进入这一高需求新兴领域的关键。
谷歌近期采取了一系列举措,被外界形容为“向网络宣战”。该公司正大力推行基于AI的搜索结果呈现方式,导致传统网页链接的流量大幅下降,引发了出版商和网站所有者的强烈不满。此举被指责破坏了互联网原有的开放生态与流量分配机制,可能从根本上改变用户获取信息的方式以及网站的生存模式。
三大AI厂商定价策略出现显著分化:Google的AI价格年增两倍,但其旗舰模型Gemini 3.1 Pro(输入2美元、输出12美元)仍是市场最低价;OpenAI的GPT-5.5(5美元/30美元)经历短期补贴后再次涨价;Anthropic的Claude Opus 4.7(5美元/25美元)价格保持稳定,且对最强模型有所下调。这些变动标志着行业正从不惜成本的市场份额争夺,转向注重利润与现金流管理的商业理性,以应对持续高昂的资本支出压力。
Google Research的TurboQuant算法已通过Turbovec项目应用于向量搜索领域。该工具以Rust语言构建,提供Python绑定接口,可直接集成到RAG流水线中。Turbovec实现了16倍的向量压缩率,同时无需进行任何码本训练,显著降低了部署和使用门槛。
在Google I/O 2026大会尾声,Google DeepMind首席执行官Demis Hassabis宣布,公司计划利用其AI平台重新构想药物发现流程,目标是“有朝一日解决所有疾病”。这一表态将AlphaFold与AlphaGenome等前沿AI科学项目,与解决人类最重大健康挑战的雄心联系起来,但同时也引发了关于技术预期与现实复杂性的广泛讨论。
在 Google I/O 2026 开发者大会上,公司共发布了 100 项内容,重点介绍了 Gemini Omni、Google Antigravity 和 Universal Cart 等新产品的核心亮点。
同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》谷歌对某些网站或开发者的处理方式引发社区讨论。根据2026年5月20日发布的一篇技术社区帖子(获121 points),内容提及谷歌似乎调整了相关政策或算法,导致特定对象受到影响。这可能涉及搜索可见性、开发者工具访问或数据接口的变化,具体影响范围和后续发展有待进一步观察。
随着AI编码工具在2026年初迅速普及,“Vibe编程”概念正从开发环境向移动端迁移。此前App Store倡导的“总有应用能满足你”承诺虽未完全实现,但AI工具正在改变应用开发门槛。谷歌等平台已开始将Vibe编程能力集成到手机系统中,允许用户通过自然语言描述生成定制化应用,这标志着个人应用创建从传统编码转向AI辅助的简易模式。
谷歌在2026年I/O开发者大会上宣布,其搜索功能的AI进化将显著加速。公司计划引入一种“代理式AI”技术,从根本上重构搜索体验。这意味着搜索引擎将从被动回答问题转向能够主动理解意图、规划并执行复杂任务的智能代理。此举标志着谷歌搜索战略的重大转向,旨在应对AI驱动的新一轮技术竞争。
Google推出一项针对混合办公场景的新实验功能。该功能通过改进视觉与音频技术,在Google Beam平台上实现参会者真实尺寸与声音的还原,显著提升了远程协作的沉浸感与包容性,旨在解决混合会议中常见的疏离问题。