科技媒体Android Authority 6月5日报道,谷歌否认将AI Mode设为Chrome默认搜索方式的说法。此前Chrome Canary频道新增"Fulfill Searchbox Queries in AI Mode"实验选项,启用后地址栏查询直接进入AI Mode,引发媒体猜测。谷歌搜索工程副总裁Rajan Patel回应称该发布属错误,目前无相关计划。媒体认为"错误"更指向该功能不应在本次Canary版本中出现,而非内部未测试。
科技媒体Android Authority 6月5日报道,谷歌否认将AI Mode设为Chrome默认搜索方式的说法。此前Chrome Canary频道新增"Fulfill Searchbox Queries in AI Mode"实验选项,启用后地址栏查询直接进入AI Mode,引发媒体猜测。谷歌搜索工程副总裁Rajan Patel回应称该发布属错误,目前无相关计划。媒体认为"错误"更指向该功能不应在本次Canary版本中出现,而非内部未测试。
苹果在 2026 年全球开发者大会(WWDC)开幕前夕汇总 iPadOS 27 新功能,聚焦 AI 体验升级。Safari 新增 Organize Tabs 功能,自动按主题整理标签页。Spotlight 搜索深度整合 Siri,支持提问、找文件、启动应用、查询天气等,并接入新 AI 搜索系统。快捷指令支持自然语言创建。系统级语法检查覆盖全系统,以半透明菜单展示原文和修改建议,可单独或批量接受修改。
Chrome Canary 中出现隐藏 flag“Fulfill Searchbox Queries in AI Mode”,启用后地址栏搜索直接进入 AI Mode,界面类似聊天机器人,跳过传统搜索结果页。该功能完成度已接近可发布状态,但谷歌尚未公开宣布。用户可通过 chrome://flags 开启,支持 Mac、Windows、Linux 和 ChromeOS,短期内不会上线。
百度伐谋进入北京工业大学苗扬团队实验室,辅助解决PEM电解槽制氢故障诊断、空间站空气监测和液体表面波可视化等难题。在制氢安全中,模型准确率从92.26%提升至95.04%,探索周期从“周级”缩短至“小时级”;在空间站色谱柱优化中,72小时内生成方案,体积缩小40%、分离效率提升3倍、误差降低8.17%;海外运维场景预计节省70%–80%维修等待时间。伐谋不替科研人员“写答案”,而是围绕目标、变量和评价标准进行大规模搜索试错。
http://x.com/i/article/2062762354149146624
BestBlogs 发布第一期订阅源分享,整理并接入了 375 个仍在更新的微信公众号 RSS 源,覆盖人工智能(71 个)、投资财经(63 个)、商业科技(57 个)、软件编程(50 个)等方向。所有来源已整理成 OPML 文件,可在 GitHub 下载并导入 RSS 阅读器。后续还将分享 X/Twitter 高质量账号、播客与 YouTube 频道等。BestBlogs 的核心思路是让用户先选择长期关注的来源,再由 AI 帮助筛选和排序。
Harness-1 将大语言模型的记忆工作转移到外部辅助系统(harness),解决传统搜索智能体需在同一上下文窗口内处理语义决策与状态记录导致的效率低下问题。模型仅负责搜索、验证等关键语义选择,而可恢复状态(候选池、证据链接、去重记录、预算感知记忆等)由 harness 追踪。这一分离使一个 20B 参数模型实现了更好的搜索表现。在强化学习中,外部化状态避免了失败原因混淆,有助于策略学习。Harness-1 在未见 benchmark 上提升更大,表明模型学到了可复用的搜索策略而非记忆领域习惯。论文 arXiv:2606.02373。
现有深度研究智能体多基于证据累积模型线性聚合信息,缺乏处理跨模态矛盾信息的机制。为此提出的Struct-Searcher是一种基于信念修正理论的结构化智能体工作流,在推理过程中显式维护一个不断演化的多模态结构图,实现冲突感知的多模态深度信息检索。实验表明,Struct-Searcher即插即用、模型无关,在BrowseComp-VL上对五种骨干模型的平均相对准确率提升17.2%;同时在MM-BrowseComp、HLE-VL、BrowseComp-VL上分别比次优方法高3.7%、1.5%和0.7%。
DuMate-DeepResearch 基于千帆智能体工厂构建,将负责任务理解、规划与调度的 Agent Core 与可扩展工具生态解耦,使中间决策与工具调用可追溯。框架引入三种机制:基于图的动态规划策略实现研究路线图由粗到细扩展与持续修正;递归两层执行将复杂搜索子任务委托给内层 Search Agent,隔离噪声并稳定长程执行;基于准则的测试时优化动态生成质量标准,作为证据合成与自适应停止的推理支架。在 DeepResearch Bench 和 DeepResearch Bench II 上分别取得 58.03% 和 61.95% 的最高总分,并在信息召回与分析维度排名第一。
提出ECI_{sem},一种无需训练的语义残差变体,利用冻结目标编码器嵌入对密集检索候选负样本源排序。每个评分需查询、标注正例及显式候选负例。ECI_{sem}从目标一致性、语义局部性、词汇残差性和对数行列式多样性构建加权残差信息矩阵。在MS MARCO上,族内ECI_{sem}将LLM负样本(非混合)和Dense+LLM(混合源)排为最高,与DistilBERT、E5-base、Contriever在BEIR上的最强聚合迁移结果一致。消融实验表明对齐依赖目标编码器族,且在样本量、温度等扰动下稳定。
RISE 方法提出用 BM25 为智能体搜索构建一个有边界的交互空间,并在索引时处理文档以支持 shell 式导航。在 BrowseComp-Plus 上,RISE 搭配 gpt-5.4-mini 达到 78% 准确率,每查询成本约为纯 shell DCI 基线的四分之一。当语料库扩充至 100 万文档时,RISE-BM25 在 gpt-5.4-mini 上准确率提升至 81%,而 DCI 在 gpt-5.4-nano 上准确率降至 60%,且 33% 的查询因超时失败。
Firecrawl在两年内已抓取80亿+网页,拥有125万+开发者、15万+公司客户,GitHub星标125K+(全球前100仓库),npm和PyPI周下载量超250万。主推文指出,这一数据表明AI竞争正从模型参数转向“将互联网转化为可供AI直接消费的上下文”——Firecrawl通过API提供干净、结构化、可规模化的实时网页数据,填平了智能体获取最新内容的瓶颈,成为AI时代的基础设施层。
We've now fetched 8,000,000,000+ pages at Firecrawl 🔥 A few other milestones in 2 short years: - 1.25M+ developers - 15...
该教程展示了面向研究级数学问题的完整NLP流水线:利用ResearchMath-14k数据集,通过TF-IDF提取领域关键词、生成句子嵌入,使用UMAP进行问题景观可视化,并结合K-Means聚类。进一步构建语义搜索引擎,训练分类器预测每个问题的开放状态,并基于相似性发现近似重复问题。
Cloudflare CEO Matthew Prince 表示,互联网上机器人流量已超过人类流量,这一转折点比他此前预测的 2027 年底提前数年。他将流量激增归因于 AI 智能体,并得出结论:网络的未来将是“pay to crawl”(付费爬取)。
Cloudflare Radar 实时统计显示,过去一周(5月28日至6月4日)全球所有 HTML 网页请求流量中,57.5% 来自机器人(爬虫、AI 抓取、自动化脚本),仅42.5%来自真人浏览器,机器人流量首次超过人类。按所有 HTTP 流量返回内容分类,JSON(API 机器通信)占33.1%居首,HTML 仅12%。互联网流量主体已从人类浏览网页转向机器间通信和机器人抓取。
关联讨论 2 条X:SemiAnalysis (@SemiAnalysis_)IT之家(RSS)Google 必须修改 AI Overviews,因其声称用户不想要“大量来源”。同时,Google 被要求在 AI 搜索中展示更清晰的链接,并允许英国出版商选择退出。
Google 首次在 Search Console 中为网站运营者提供关闭 AI Overviews 和 AI Mode 等 AI 搜索功能的开关,这两项功能已覆盖超过 35 亿月活用户。新的表现报告将展示次数单独列出。此举由英国竞争与市场管理局(CMA)推动,该机构认为网站运营者在当前局面下处于严重劣势。
to be underestimated is to be free
亚马逊将利用视觉搜索与AI技术,在用户搜索时生成并展示匹配查询的AI产品图片。该零售商表示,此举旨在帮助引导用户找到对应商品。
英国监管机构要求谷歌提供一项工具,允许网站出版商选择退出生成式AI搜索功能。该选项将先在英国测试,随后在全球范围内推出。
谷歌母公司 Alphabet 公布投资者演示文稿显示,Gemini App 月活跃用户超 9 亿,一年内翻倍超过一倍。Gemini 已为谷歌 13 款超 10 亿用户产品提供支持,其中 5 款用户量超 30 亿(搜索、Gmail、Android、Chrome、YouTube)。谷歌搜索 AI Overviews 月活跃用户超 25 亿。自 Gemini 3 推出,核心 AI 响应成本降低 30% 以上。谷歌预计本月推出 Gemini 3.5 Pro 模型。
Google Search 和 Google Shopping 中的 AI 工具帮助用户在二手和复古购物中发现好物。
英国竞争与市场管理局(CMA)出台新行为规则,要求谷歌允许网站所有者将其内容排除在AI Overviews等AI搜索功能之外,并防止内容被用于“微调”谷歌的AI模型。CMA称这是全球首创,出版商将拥有有效工具阻止其内容用于驱动AI搜索功能,从而在谈判中占据更有利地位。
Codex now has more than 5M weekly active users. But the bigger story is what people are using it for: not just writing c...
谷歌正在测试一项新功能,允许网站所有者通过Search Console中的退出开关,管理其内容是否出现在谷歌的生成式AI搜索产品(如AI Overviews、AI Mode)中。谷歌称,AI Overviews月活跃用户已超25亿,AI Mode月用户超10亿。该功能不影响网站在常规搜索中的排名。据9To5Google报道,此设置不适用于Gemini应用。
开源项目 BigSet 允许用户用自然语言描述数据需求,从实时网络中构建并定期刷新结构化数据集。研发团队负责人邵猛在实际工作中使用它,自动生成了一份 B2B SaaS 产品清单,内容涵盖产品分类、免费方案说明及官方定价页面链接,省去了逐一查找官网的繁琐工作。该项目已在 GitHub 上开源。
What if you and your agent had all the data that always stays fresh? Structured, on demand, never stale. Introducing Big...
What if you and your agent had all the data that always stays fresh? Structured, on demand, never stale. Introducing Big...
微软推出 Microsoft Web IQ,一套专为 AI 智能体设计的搜索 API。它基于必应经验全新重构,能返回高度浓缩的信息页面,以减少 Token 消耗。该 API 在 Token 效率与响应速度上领先,95% 的请求可在 165 毫秒内响应,速度约为同类产品的 2.5 倍。目前该 API 已被 Copilot 和 OpenAI 的 ChatGPT 使用。
Harness-1是一个20B参数的检索子智能体,通过强化学习训练。其核心创新是将状态管理外部化至环境侧的框架中,该框架负责维护包括候选池、重要性标注的精选集、证据链与验证记录等工作记忆,使策略本身专注于搜索语义决策。在八个涵盖网页、金融、专利等领域的检索基准测试中,Harness-1取得了0.730的平均精选召回率,超越了次优的开源搜索子智能体11.4个点,并与规模更大的前沿模型保持竞争力。其代码已开源。
OpenAI为ChatGPT推出新的职业相关功能。该功能可展示来自Indeed、Upwork和Appcast的个性化职位列表,目前仅在美国推出。用户还可以直接在ChatGPT中创建简历,并针对特定职位进行定制。
K-BrowseComp 是一个针对韩语语境的网页浏览智能体基准,包含400个问题,其中300个为人工构建验证的子集。在此子集上,GPT-5.5、DeepSeek-V4-Pro 和 GLM-5.1 等前沿大语言模型仅达到30.00%–45.67%的准确率,而韩国本土大模型得分仅为0.00%–10.33%。此外构建的100题合成对抗测试集中,最强模型得分仅为26.00%。数据集与代码已公开。
该论文评估了商业AI聊天机器人作为新闻中介的能力。研究发现,当以多选题形式提问时,最佳系统对数小时前新闻的准确率已超过90%,这表明检索增强生成技术正从静态知识库迈向实时信息处理。然而,这种高准确性并不稳定。当要求系统自由生成回答、新闻为印地语,或用户提问包含错误预设时,其表现显著下降。超过70%的错误源于检索失败或来源偏差,即系统检索到了近似但不精确的信息,随后基于错误的来源、语言或时间戳生成了回答。论文标题为《Evaluating Commercial AI Chatbots as News Intermediaries》(arxiv.org/abs/2605.22785)。
哈尔滨工业大学研究人员发现,包括 GPT-5.4 和 Kimi K2.6 在内的领先 AI 搜索代理,在已有的基准测试上并未进行太多真正的网络研究。它们主要利用网络来确认其在训练阶段已学到的知识。研究团队使用名为 LiveBrowseComp 的新基准测试得出了该结论,此测试仅涉及过去 90 天内的事件。当模型无法依赖既有记忆时,其表现显著下降,现有的性能排名也随之改变。
本教程展示如何实现 SkillNet 用例,将其作为一个实用框架,用于发现、安装、检查、评估和组织可重用的 AI 技能,以构建技能增强型 AI 智能体。