AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「搜索」清除
6月6日周六
12:16IT之家(RSS)43谷歌否认将AI Mode设为Chrome浏览器默认搜索方式
09:16IT之家(RSS)47苹果 iPadOS 27 前瞻:自然语言创建快捷指令、Safari 自动标签分组
6月5日周五
21:15IT之家(RSS)67谷歌 Chrome 浏览器测试搜索直通 AI Mode 新特性
18:52公众号:百度智能云(文心)48百度伐谋走进北工大实验室:从制氢安全到空间站监测,加速科研探索
14:07ginobefun78精选375个公众号RSS源优化Agent输入
13:07ginobefun41BestBlogs 订阅源分享第一期:微信公众号篇
09:26Rohan Paul60Harness-1:通过状态外部化提升搜索智能体性能
08:00HuggingFace Daily Papers(社区热门论文)55Struct-Searcher:结构化智能体工作流推动多模态深度信息搜索
08:00HuggingFace Daily Papers(社区热门论文)54DuMate-DeepResearch:具有递归搜索与准则推理的多智能体可审计深度研究框架
08:00HuggingFace Daily Papers(社区热门论文)61ECI_{sem}:面向困难负样本评估的语义残差有效对比信息方法
08:00HuggingFace Daily Papers(社区热门论文)59RISE:面向智能体搜索的交互空间检索方法
07:54Berryxia.AI61Firecrawl两年抓取80亿+网页,成AI基础设施
06:54MarkTechPost(RSS)56基于ResearchMath-14k数据集构建语义搜索引擎与开放状态分类器
06:35DogeDesigner51Grok 登顶苹果 App Store"ai app"搜索
03:22The Decoder:AI News(RSS)57Cloudflare CEO 称机器人流量已超人类流量,网络未来将是"pay to crawl"
6月4日周四
11:10小互82精选Cloudflare Radar:机器人流量首次超过人类占比57.5%
04:52Ars Technica:AI(RSS)65Google 被要求修改 AI Overviews:用户不想要"大量来源"
03:47The Decoder:AI News(RSS)59Google让网站可选择退出AI搜索结果,但深知多数别无选择
03:26🚨 AI News | TestingCatalog40Google AI Studio负责人引用获OpenAI投资网站
00:15TechCrunch:AI(RSS)31亚马逊将在搜索结果中展示AI生成的产品图片
6月3日周三
23:15TechCrunch:AI(RSS)54英国新规要求谷歌提供工具,允许出版商选择退出 AI 搜索
23:10IT之家(RSS)86精选谷歌:Gemini App 月活超 9 亿同比翻倍,是其增长最快的产品之一
21:34Google Blog:AI(RSS)50Google Search 提升二手和复古购物体验的5种方式
17:16The Verge:AI(RSS)61英国监管机构要求谷歌允许出版商选择退出AI搜索功能
17:08向阳乔木52不管怎么说,小红书上线了AI对话功能,还是很实用的。 毕竟小红书还是国内真人语料最多的平台之一。 且图文并茂,很适合做旅游、美食搜索攻略。
16:25Greg Brockman73Codex 周活用户超500万,成知识工作生产力工具
16:09IT之家(RSS)57谷歌:将允许网站所有者自行决定,是否出现在生成式 AI 搜索中
08:12meng shao66BigSet:AI生成B2B SaaS清单的开源工具
04:32Perplexity58Perplexity 新增 Apple Health 数据接入与实验室功能
02:23🚨 AI News | TestingCatalog74TinyFish开源Bigset:自然语言生成实时更新数据集
02:09IT之家(RSS)61微软发布 Web IQ:AI 智能体专用搜索 API
00:40HuggingFace Daily Papers(社区热门论文)61Harness-1:面向搜索智能体的强化学习与状态外部化框架
6月2日周二
18:42The Decoder:AI News(RSS)53OpenAI将ChatGPT打造为职业平台:新增职位搜索与简历编辑功能
11:40HuggingFace Daily Papers(社区热门论文)69K-BrowseComp:基于韩语语境的网页浏览智能体基准测试
01:59Perplexity70精选Perplexity发布Search as Code搜索架构
6月1日周一
21:09AK58GrepSeek:训练搜索智能体直接交互语料库
10:04Rohan Paul62AI聊天机器人处理新闻:优势与脆弱性并存
5月31日周日
23:48TechCrunch:AI(RSS)53理解关于AI迷狂的争论
16:17The Decoder:AI News(RSS)60AI 搜索代理往往只是确认其已知信息,而非真正研究网络
09:49MarkTechPost(RSS)65使用 SkillNet 构建用于搜索、评估、图分析和任务规划的技能增强型 AI 智能体
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月6日
12:16
IT之家(RSS)
43
谷歌否认将AI Mode设为Chrome浏览器默认搜索方式

科技媒体Android Authority 6月5日报道,谷歌否认将AI Mode设为Chrome默认搜索方式的说法。此前Chrome Canary频道新增"Fulfill Searchbox Queries in AI Mode"实验选项,启用后地址栏查询直接进入AI Mode,引发媒体猜测。谷歌搜索工程副总裁Rajan Patel回应称该发布属错误,目前无相关计划。媒体认为"错误"更指向该功能不应在本次Canary版本中出现,而非内部未测试。

Google搜索行业动态
09:16
IT之家(RSS)
47
苹果 iPadOS 27 前瞻:自然语言创建快捷指令、Safari 自动标签分组

苹果在 2026 年全球开发者大会(WWDC)开幕前夕汇总 iPadOS 27 新功能,聚焦 AI 体验升级。Safari 新增 Organize Tabs 功能,自动按主题整理标签页。Spotlight 搜索深度整合 Siri,支持提问、找文件、启动应用、查询天气等,并接入新 AI 搜索系统。快捷指令支持自然语言创建。系统级语法检查覆盖全系统,以半透明菜单展示原文和修改建议,可单独或批量接受修改。

智能体产品更新搜索
6月5日
21:15
IT之家(RSS)
67
谷歌 Chrome 浏览器测试搜索直通 AI Mode 新特性

Chrome Canary 中出现隐藏 flag“Fulfill Searchbox Queries in AI Mode”,启用后地址栏搜索直接进入 AI Mode,界面类似聊天机器人,跳过传统搜索结果页。该功能完成度已接近可发布状态,但谷歌尚未公开宣布。用户可通过 chrome://flags 开启,支持 Mac、Windows、Linux 和 ChromeOS,短期内不会上线。

Google产品更新搜索
18:52
公众号:百度智能云(文心)
48
百度伐谋走进北工大实验室:从制氢安全到空间站监测,加速科研探索

百度伐谋进入北京工业大学苗扬团队实验室,辅助解决PEM电解槽制氢故障诊断、空间站空气监测和液体表面波可视化等难题。在制氢安全中,模型准确率从92.26%提升至95.04%,探索周期从“周级”缩短至“小时级”;在空间站色谱柱优化中,72小时内生成方案,体积缩小40%、分离效率提升3倍、误差降低8.17%;海外运维场景预计节省70%–80%维修等待时间。伐谋不替科研人员“写答案”,而是围绕目标、变量和评价标准进行大规模搜索试错。

推理搜索行业动态
14:07
ginobefun@hongming731
精选78
你的 Agent 还在全网垃圾里捞内容?不如先喂它 375 个高质量微信公众号 RSS 源。 🔽

ginobefun: http://x.com/i/article/2062762354149146624

智能体检索增强搜索教程/实践

推荐理由:这个整理直接命中了 Agent 在中文垃圾信息里捞内容的痛点,375 个高质量公众号 RSS 源,做中文信息追踪的可以直接导入,比全网乱爬靠谱太多。
13:07
ginobefun@hongming731
41
BestBlogs 订阅源分享第一期:微信公众号篇

BestBlogs 发布第一期订阅源分享,整理并接入了 375 个仍在更新的微信公众号 RSS 源,覆盖人工智能(71 个)、投资财经(63 个)、商业科技(57 个)、软件编程(50 个)等方向。所有来源已整理成 OPML 文件,可在 GitHub 下载并导入 RSS 阅读器。后续还将分享 X/Twitter 高质量账号、播客与 YouTube 频道等。BestBlogs 的核心思路是让用户先选择长期关注的来源,再由 AI 帮助筛选和排序。

搜索教程/实践
09:26
Rohan Paul@rohanpaul_ai
60
Harness-1:通过状态外部化提升搜索智能体性能

Harness-1 将大语言模型的记忆工作转移到外部辅助系统(harness),解决传统搜索智能体需在同一上下文窗口内处理语义决策与状态记录导致的效率低下问题。模型仅负责搜索、验证等关键语义选择,而可恢复状态(候选池、证据链接、去重记录、预算感知记忆等)由 harness 追踪。这一分离使一个 20B 参数模型实现了更好的搜索表现。在强化学习中,外部化状态避免了失败原因混淆,有助于策略学习。Harness-1 在未见 benchmark 上提升更大,表明模型学到了可复用的搜索策略而非记忆领域习惯。论文 arXiv:2606.02373。

智能体arXiv推理搜索
08:00
HuggingFace Daily Papers(社区热门论文)
55
Struct-Searcher:结构化智能体工作流推动多模态深度信息搜索

现有深度研究智能体多基于证据累积模型线性聚合信息,缺乏处理跨模态矛盾信息的机制。为此提出的Struct-Searcher是一种基于信念修正理论的结构化智能体工作流,在推理过程中显式维护一个不断演化的多模态结构图,实现冲突感知的多模态深度信息检索。实验表明,Struct-Searcher即插即用、模型无关,在BrowseComp-VL上对五种骨干模型的平均相对准确率提升17.2%;同时在MM-BrowseComp、HLE-VL、BrowseComp-VL上分别比次优方法高3.7%、1.5%和0.7%。

智能体多模态搜索论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
54
DuMate-DeepResearch:具有递归搜索与准则推理的多智能体可审计深度研究框架

DuMate-DeepResearch 基于千帆智能体工厂构建,将负责任务理解、规划与调度的 Agent Core 与可扩展工具生态解耦,使中间决策与工具调用可追溯。框架引入三种机制:基于图的动态规划策略实现研究路线图由粗到细扩展与持续修正;递归两层执行将复杂搜索子任务委托给内层 Search Agent,隔离噪声并稳定长程执行;基于准则的测试时优化动态生成质量标准,作为证据合成与自适应停止的推理支架。在 DeepResearch Bench 和 DeepResearch Bench II 上分别取得 58.03% 和 61.95% 的最高总分,并在信息召回与分析维度排名第一。

智能体推理搜索论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
61
ECI_{sem}:面向困难负样本评估的语义残差有效对比信息方法

提出ECI_{sem},一种无需训练的语义残差变体,利用冻结目标编码器嵌入对密集检索候选负样本源排序。每个评分需查询、标注正例及显式候选负例。ECI_{sem}从目标一致性、语义局部性、词汇残差性和对数行列式多样性构建加权残差信息矩阵。在MS MARCO上,族内ECI_{sem}将LLM负样本(非混合)和Dense+LLM(混合源)排为最高,与DistilBERT、E5-base、Contriever在BEIR上的最强聚合迁移结果一致。消融实验表明对齐依赖目标编码器族,且在样本量、温度等扰动下稳定。

检索增强搜索论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
59
RISE:面向智能体搜索的交互空间检索方法

RISE 方法提出用 BM25 为智能体搜索构建一个有边界的交互空间,并在索引时处理文档以支持 shell 式导航。在 BrowseComp-Plus 上,RISE 搭配 gpt-5.4-mini 达到 78% 准确率,每查询成本约为纯 shell DCI 基线的四分之一。当语料库扩充至 100 万文档时,RISE-BM25 在 gpt-5.4-mini 上准确率提升至 81%,而 DCI 在 gpt-5.4-nano 上准确率降至 60%,且 33% 的查询因超时失败。

智能体检索增强搜索论文/研究
07:54
Berryxia.AI@berryxia
61
Firecrawl两年抓取80亿+网页,成AI基础设施

Firecrawl在两年内已抓取80亿+网页,拥有125万+开发者、15万+公司客户,GitHub星标125K+(全球前100仓库),npm和PyPI周下载量超250万。主推文指出,这一数据表明AI竞争正从模型参数转向“将互联网转化为可供AI直接消费的上下文”——Firecrawl通过API提供干净、结构化、可规模化的实时网页数据,填平了智能体获取最新内容的瓶颈,成为AI时代的基础设施层。

Firecrawl: We've now fetched 8,000,000,000+ pages at Firecrawl 🔥 A few other milestones in 2 short years: - 1.25M+ developers - 15...

智能体开源生态搜索现象/趋势
06:54
MarkTechPost(RSS)
56
基于ResearchMath-14k数据集构建语义搜索引擎与开放状态分类器

该教程展示了面向研究级数学问题的完整NLP流水线:利用ResearchMath-14k数据集,通过TF-IDF提取领域关键词、生成句子嵌入,使用UMAP进行问题景观可视化,并结合K-Means聚类。进一步构建语义搜索引擎,训练分类器预测每个问题的开放状态,并基于相似性发现近似重复问题。

搜索教程/实践数据/训练
06:35
DogeDesigner@cb_doge
51
Grok 现在在苹果 App Store 上搜索"ai app"时排名第一!🇺🇸🥇 击败了 ChatGPT、Gemini、Claude 等。
搜索行业动态
03:22
The Decoder:AI News(RSS)
57
Cloudflare CEO 称机器人流量已超人类流量,网络未来将是"pay to crawl"

Cloudflare CEO Matthew Prince 表示,互联网上机器人流量已超过人类流量,这一转折点比他此前预测的 2027 年底提前数年。他将流量激增归因于 AI 智能体,并得出结论:网络的未来将是“pay to crawl”(付费爬取)。

智能体大佬观点搜索
6月4日
11:10
小互@xiaohu
精选82
Cloudflare Radar:机器人流量首次超过人类占比57.5%

Cloudflare Radar 实时统计显示,过去一周(5月28日至6月4日)全球所有 HTML 网页请求流量中,57.5% 来自机器人(爬虫、AI 抓取、自动化脚本),仅42.5%来自真人浏览器,机器人流量首次超过人类。按所有 HTTP 流量返回内容分类,JSON(API 机器通信)占33.1%居首,HTML 仅12%。互联网流量主体已从人类浏览网页转向机器间通信和机器人抓取。

搜索数据/训练现象/趋势
关联讨论 2 条X:SemiAnalysis (@SemiAnalysis_)IT之家(RSS)
推荐理由:互联网流量首次以机器人为主,这是AI时代的真正里程碑。数据来自Cloudflare实时统计,比任何预测都更直白地告诉内容产业,以后网页得同时伺候人和爬虫了。
04:52
Ars Technica:AI(RSS)
65
Google 被要求修改 AI Overviews:用户不想要"大量来源"

Google 必须修改 AI Overviews,因其声称用户不想要“大量来源”。同时,Google 被要求在 AI 搜索中展示更清晰的链接,并允许英国出版商选择退出。

Google搜索政策/监管
03:47
The Decoder:AI News(RSS)
59
Google让网站可选择退出AI搜索结果,但深知多数别无选择

Google 首次在 Search Console 中为网站运营者提供关闭 AI Overviews 和 AI Mode 等 AI 搜索功能的开关,这两项功能已覆盖超过 35 亿月活用户。新的表现报告将展示次数单独列出。此举由英国竞争与市场管理局(CMA)推动,该机构认为网站运营者在当前局面下处于严重劣势。

Google产品更新搜索
03:26
🚨 AI News | TestingCatalog@testingcatalog
40
👀 有意思……Google AI Studio 产品负责人引用了 http://op.al 网站,该网站刚刚宣布获得 @openai 的投资

Logan Kilpatrick: to be underestimated is to be free

OpenAI搜索行业动态
00:15
TechCrunch:AI(RSS)
31
亚马逊将在搜索结果中展示AI生成的产品图片

亚马逊将利用视觉搜索与AI技术,在用户搜索时生成并展示匹配查询的AI产品图片。该零售商表示,此举旨在帮助引导用户找到对应商品。

产品更新图像生成搜索
6月3日
23:15
TechCrunch:AI(RSS)
54
英国新规要求谷歌提供工具,允许出版商选择退出 AI 搜索

英国监管机构要求谷歌提供一项工具,允许网站出版商选择退出生成式AI搜索功能。该选项将先在英国测试,随后在全球范围内推出。

Google搜索政策/监管
23:10
IT之家(RSS)
精选86
谷歌:Gemini App 月活超 9 亿同比翻倍,是其增长最快的产品之一

谷歌母公司 Alphabet 公布投资者演示文稿显示,Gemini App 月活跃用户超 9 亿,一年内翻倍超过一倍。Gemini 已为谷歌 13 款超 10 亿用户产品提供支持,其中 5 款用户量超 30 亿(搜索、Gmail、Android、Chrome、YouTube)。谷歌搜索 AI Overviews 月活跃用户超 25 亿。自 Gemini 3 推出,核心 AI 响应成本降低 30% 以上。谷歌预计本月推出 Gemini 3.5 Pro 模型。

Google搜索行业动态

推荐理由:9亿月活且一年翻倍,AI Overviews月活25亿,这些数字比任何benchmark都更能说明问题。谷歌本月还要推Gemini 3.5 Pro,进度比预期快,做搜索和产品的需要盯紧。
21:34
Google Blog:AI(RSS)
50
Google Search 提升二手和复古购物体验的5种方式

Google Search 和 Google Shopping 中的 AI 工具帮助用户在二手和复古购物中发现好物。

Google多模态搜索教程/实践
17:16
The Verge:AI(RSS)
61
英国监管机构要求谷歌允许出版商选择退出AI搜索功能

英国竞争与市场管理局(CMA)出台新行为规则,要求谷歌允许网站所有者将其内容排除在AI Overviews等AI搜索功能之外,并防止内容被用于“微调”谷歌的AI模型。CMA称这是全球首创,出版商将拥有有效工具阻止其内容用于驱动AI搜索功能,从而在谈判中占据更有利地位。

Google搜索政策/监管
17:08
向阳乔木@vista8
52
不管怎么说,小红书上线了AI对话功能,还是很实用的。 毕竟小红书还是国内真人语料最多的平台之一。 且图文并茂,很适合做旅游、美食搜索攻略。
产品更新多模态搜索
16:25
Greg Brockman@gdb
73
Codex 的计算机工作应用增长非常快。

OpenAI Newsroom: Codex now has more than 5M weekly active users. But the bigger story is what people are using it for: not just writing c...

OpenAI产品更新搜索编码
16:09
IT之家(RSS)
57
谷歌:将允许网站所有者自行决定,是否出现在生成式 AI 搜索中

谷歌正在测试一项新功能,允许网站所有者通过Search Console中的退出开关,管理其内容是否出现在谷歌的生成式AI搜索产品(如AI Overviews、AI Mode)中。谷歌称,AI Overviews月活跃用户已超25亿,AI Mode月用户超10亿。该功能不影响网站在常规搜索中的排名。据9To5Google报道,此设置不适用于Gemini应用。

Google产品更新搜索
08:12
meng shao@shao__meng
66
BigSet:AI生成B2B SaaS清单的开源工具

开源项目 BigSet 允许用户用自然语言描述数据需求,从实时网络中构建并定期刷新结构化数据集。研发团队负责人邵猛在实际工作中使用它,自动生成了一份 B2B SaaS 产品清单,内容涵盖产品分类、免费方案说明及官方定价页面链接,省去了逐一查找官网的繁琐工作。该项目已在 GitHub 上开源。

TinyFish: What if you and your agent had all the data that always stays fresh? Structured, on demand, never stale. Introducing Big...

GitHub搜索教程/实践
04:32
Perplexity@perplexity_ai
58
两种新方式将你的健康数据带入 Perplexity。 Perplexity 现在可在 iPhone 上连接 Apple Health。在 Computer 中使用你的睡眠、活动和 HRV 数据。 该功能现已在 Perplexity Health 中可用。添加实验室数据,询问生物标志物、抽血或检测结果。
产品更新搜索数据/训练
02:23
🚨 AI News | TestingCatalog@testingcatalog
74
TinyFish发布了Bigset,一个开源的多智能体系统。用户只需用一句自然语言描述所需数据,系统的智能体便会从网络实时抓取、去重并整合信息,生成一个结构化的数据集。该数据集可导出为CSV或XLSX格式,并支持用户自定义的刷新频率以保持数据始终为最新状态。

TinyFish: What if you and your agent had all the data that always stays fresh? Structured, on demand, never stale. Introducing Big...

智能体开源/仓库搜索数据/训练
02:09
IT之家(RSS)
61
微软发布 Web IQ:AI 智能体专用搜索 API

微软推出 Microsoft Web IQ,一套专为 AI 智能体设计的搜索 API。它基于必应经验全新重构,能返回高度浓缩的信息页面,以减少 Token 消耗。该 API 在 Token 效率与响应速度上领先,95% 的请求可在 165 毫秒内响应,速度约为同类产品的 2.5 倍。目前该 API 已被 Copilot 和 OpenAI 的 ChatGPT 使用。

智能体Microsoft产品更新搜索
00:40
HuggingFace Daily Papers(社区热门论文)
61
Harness-1:面向搜索智能体的强化学习与状态外部化框架

Harness-1是一个20B参数的检索子智能体,通过强化学习训练。其核心创新是将状态管理外部化至环境侧的框架中,该框架负责维护包括候选池、重要性标注的精选集、证据链与验证记录等工作记忆,使策略本身专注于搜索语义决策。在八个涵盖网页、金融、专利等领域的检索基准测试中,Harness-1取得了0.730的平均精选召回率,超越了次优的开源搜索子智能体11.4个点,并与规模更大的前沿模型保持竞争力。其代码已开源。

智能体检索增强搜索论文/研究
6月2日
18:42
The Decoder:AI News(RSS)
53
OpenAI将ChatGPT打造为职业平台:新增职位搜索与简历编辑功能

OpenAI为ChatGPT推出新的职业相关功能。该功能可展示来自Indeed、Upwork和Appcast的个性化职位列表,目前仅在美国推出。用户还可以直接在ChatGPT中创建简历,并针对特定职位进行定制。

OpenAI产品更新搜索
11:40
HuggingFace Daily Papers(社区热门论文)
69
K-BrowseComp:基于韩语语境的网页浏览智能体基准测试

K-BrowseComp 是一个针对韩语语境的网页浏览智能体基准,包含400个问题,其中300个为人工构建验证的子集。在此子集上,GPT-5.5、DeepSeek-V4-Pro 和 GLM-5.1 等前沿大语言模型仅达到30.00%–45.67%的准确率,而韩国本土大模型得分仅为0.00%–10.33%。此外构建的100题合成对抗测试集中,最强模型得分仅为26.00%。数据集与代码已公开。

智能体arXiv搜索论文/研究
01:59
Perplexity@perplexity_ai
精选70
推出Search as Code,我们为AI智能体打造的全新搜索架构。 它直接编写Python代码调用我们的搜索栈,而非逐个循环函数调用。 现已在Perplexity Agent API中提供,并成为Computer的默认选项。 https://research.perplexity.ai/articles/rethinking-search-as-code-generation
智能体MCP/工具产品更新搜索

推荐理由:Perplexity这次更新把Agent搜索从函数调用链改成直接生成Python代码,思路简洁有效,API开发者应该能立刻感受到token和延迟的下降,可以在Computer里试一下默认效果。
6月1日
21:09
AK@_akhaliq
58
GrepSeek 训练搜索智能体以直接交互语料库
智能体检索增强搜索论文/研究
10:04
Rohan Paul@rohanpaul_ai
62
AI聊天机器人处理新闻:优势与脆弱性并存

该论文评估了商业AI聊天机器人作为新闻中介的能力。研究发现,当以多选题形式提问时,最佳系统对数小时前新闻的准确率已超过90%,这表明检索增强生成技术正从静态知识库迈向实时信息处理。然而,这种高准确性并不稳定。当要求系统自由生成回答、新闻为印地语,或用户提问包含错误预设时,其表现显著下降。超过70%的错误源于检索失败或来源偏差,即系统检索到了近似但不精确的信息,随后基于错误的来源、语言或时间戳生成了回答。论文标题为《Evaluating Commercial AI Chatbots as News Intermediaries》(arxiv.org/abs/2605.22785)。

检索增强搜索论文/研究
5月31日
23:48
TechCrunch:AI(RSS)
53
理解关于AI迷狂的争论

在最新一期的“Equity”播客中,节目对科技公司的CEO们是否“尤其容易陷入AI迷狂”这一话题进行了辩论。

搜索现象/趋势
16:17
The Decoder:AI News(RSS)
60
AI 搜索代理往往只是确认其已知信息,而非真正研究网络

哈尔滨工业大学研究人员发现,包括 GPT-5.4 和 Kimi K2.6 在内的领先 AI 搜索代理,在已有的基准测试上并未进行太多真正的网络研究。它们主要利用网络来确认其在训练阶段已学到的知识。研究团队使用名为 LiveBrowseComp 的新基准测试得出了该结论,此测试仅涉及过去 90 天内的事件。当模型无法依赖既有记忆时,其表现显著下降,现有的性能排名也随之改变。

搜索论文/研究评测/基准
09:49
MarkTechPost(RSS)
65
使用 SkillNet 构建用于搜索、评估、图分析和任务规划的技能增强型 AI 智能体

本教程展示如何实现 SkillNet 用例,将其作为一个实用框架,用于发现、安装、检查、评估和组织可重用的 AI 技能,以构建技能增强型 AI 智能体。

智能体MCP/工具搜索教程/实践
‹ 上一页
123456…10
下一页 ›