苹果机器学习研究团队提出摊销MIPS方法,训练神经网络直接预测最大内积搜索(MIPS)的解。核心思路是将MIPS值函数建模为键集的凸支撑函数,其梯度指向最优键。据此设计两种互补模型:SupportNet(输入凸神经网络拟合支撑函数,用作聚类路由)和KeyNet(向量值网络直接回归最优键,可替换原始查询输入索引流水线)。在BEIR基准文档嵌入实验中,两种模型在FLOPs、探测次数或时钟时间等计算开销指标下均显著提升IVF匹配率。代码已开源。
苹果机器学习研究团队提出摊销MIPS方法,训练神经网络直接预测最大内积搜索(MIPS)的解。核心思路是将MIPS值函数建模为键集的凸支撑函数,其梯度指向最优键。据此设计两种互补模型:SupportNet(输入凸神经网络拟合支撑函数,用作聚类路由)和KeyNet(向量值网络直接回归最优键,可替换原始查询输入索引流水线)。在BEIR基准文档嵌入实验中,两种模型在FLOPs、探测次数或时钟时间等计算开销指标下均显著提升IVF匹配率。代码已开源。
微软安全研究团队于 6 月 30 日通报,名为 Search for perplexity ai 的 Chrome 扩展冒用 Perplexity AI 品牌,监控用户搜索记录。该扩展已从 Chrome Web Store 移除,已安装用户需手动卸载。合法域名为 perplexity.ai,假冒扩展将搜索流量跳转到 perplexity-ai.online。其申请 chrome_settings_overrides 权限设为默认搜索引擎,并申请 declarativeNetRequest 权限将请求转发至攻击者服务器。用户可进入 chrome://extensions/ 核对扩展 ID flkebkiofojicogddingbdmcmkpbplcd 并删除。
现有视频检索方法常将检索视为预处理步骤,失败后无法优化查询,且智能体框架多假设已提供相关视频。VideoSearch-R1提出一种智能体框架,通过与视频搜索引擎多轮交互实现迭代检索与推理。其核心是软查询优化(SQR),在连续潜在空间中优化搜索查询token,而非在离散文本空间重写。SQR及推理过程使用组相对策略优化(GRPO)训练,由检索和下游任务的任务级奖励信号引导。该方法在三个视频语料库时刻检索(VCMR)数据集上达到最先进性能,且生成的token远少于显式文本级查询优化。
微软计划 2026 年 8 月为 Teams 推出 Facilitator 会议协调助手。该 AI 功能在会议中实时分析对话,识别提问、未解答问题或不确定表达,并在会议聊天中给出相关答案。默认禁用且不直接发言,管理员可控制显示范围,用户可自行启用。触发频率通常低于每场 1 次。仅支持标准 Teams 会议,不支持通话、网络研讨会或 Town Hall。系统会实时处理对话,必要时执行网络搜索。功能将于 8 月上旬向 Targeted Release 用户推送,8 月下旬全面上线。
Cloudflare宣布,自2026年9月15日起,其默认设置将屏蔽同时用于搜索、AI智能体及训练的“混合用途”爬虫访问托管广告的页面,除非站点所有者手动调整。此举旨在保护出版商内容不被无偿使用。同时将原有的“Pay Per Crawl”模式升级为“Pay Per Use”,允许出版商在内容创造价值时向AI公司收费,初期合作方为Ceramic.ai和You.com。Cloudflare数据显示,AI爬虫超过50%的抓取流量浪费在重复获取未变更页面上。新政策适用于新客户、现有客户的新站点及所有现有免费客户。
同一事件,精选展示《Cloudflare 推出全新AI流量管理选项:区分搜索、智能体与训练爬虫,保护广告页面》Lev8 被定位为营销领域的 Codex,专门解决找客户、写破冰信等脏活。Benchmark 显示:海外找客户场景有效结果量 Lev8 90 个(Exa 58.2,Codex 20),匹配精度 83.3%(Exa 76.5%,Codex 71.8%),单条成本 $0.052(Exa $0.061)。产品聚合 50+ 实时数据源(LinkedIn、X、YouTube 等),覆盖 10 亿+ 职场人脉,自动监控融资、招聘、网站改版等信号,生成定制破冰话术,通过邮件、LinkedIn、WhatsApp、Instagram、X 五个渠道批量发送并统一管理回复。适用于独立开发者、一人公司、猎头、中介等需要精准找人的场景。
真的有点兴奋,终于等来营销圈的 Codex 了,不管你是独立开发还是OPC一人公司,找客户扒联系方式写破冰信这些破事,直接给你干得明明白白! 甚至你用来做副业搞钱都是一个超级神器! 我们都知道,AI现在已经把写代码的门槛拉平了,Codex能...
Cloudflare 为所有网站所有者提供更精细的AI流量管控选项,取代一刀切的屏蔽方式。用户可轻松区分并管理搜索爬虫、AI智能体爬虫和训练爬虫,同时新增保护广告变现页面的能力。
Cloudflare 宣布推出两项新举措,以应对 AI 搜索重构网络生态带来的创作困境。在智能体时代,创作者既需要保持可发现性,又要确保作品获得合理报酬,这两项举措旨在帮助平衡二者的关系。具体细节尚未公布。
内容独立日宣布一年后,一个付费内容的动态市场已正式形成。自主AI智能体的兴起正在颠覆传统搜索推荐模式,构建可持续的网络经济需要一套全新基础设施来支撑。
Lev8聚合50+实时数据源(LinkedIn、X、YouTube、Instagram、GitHub),覆盖10亿+职场人脉,实时追踪融资、招聘、改版等信号,自动生成定制破冰开场白,并通过邮件、LinkedIn、WhatsApp、Instagram、X五渠道一键发送统一回复。在找海外客户场景中:有效结果量Lev8 90个,Exa 58.2个,Codex仅20个;匹配精度83.3% vs 76.5% vs 71.8%;单条匹配成本$0.052 vs $0.061。三项指标全面超越。
Introducing Claude Science, a new app designed with every stage of research in mind. Artifacts traced to their code, env...
X本周一推出托管MCP服务器,允许Claude、Cursor、Grok Build等MCP兼容AI助手通过用户自己的账户权限直接连接X API。MCP是开放标准,用于AI模型连接外部工具。此前开发者需自建托管MCP服务器,现在由X托管,简化集成。该服务器不新增API能力,仅使已有功能更易被AI调用。X借此定位为实时数据检索网络。X还更新了API v2以应对AI生成垃圾内容,并提高发帖价格至$0.015、发链接至$0.20。
谷歌前工程负责人休·威廉姆斯借助Anthropic的编程助手Claude Code,开发出可正常运行的搜索引擎Zettair,为150万个维基百科条目建立索引。该引擎支持搜索自动补全、关键词摘要片段、相关搜索推荐、热门话题榜单以及AI生成的内容摘要。威廉姆斯未手动编写一行代码,但底层检索框架源自其21世纪初参与研发的信息检索系统。他认为,Claude Code只有在深厚专业技术功底的配合下才能发挥最佳效果,经验丰富的工程师永远是最出色的“指导者”。
X 官方推出托管 MCP,使 Grok、Cursor、Claude 等 MCP 兼容 AI 工具无需部署即可直接调用 X API,获取搜索、时间线、书签、发文等实时数据,全程走用户权限。该服务并非免费,采用 X Developer App 按量计费模式,读帖和发帖各有单价,重度 Agent 使用容易导致账单失控;写操作限流比读操作更严格,易触发 429 错误。建议开发者先在后台设定消费上限,从小流量测试后再放量。
Announcing the hosted X MCP. Agents now have access to the best real-time information source in the world. Connect Grok,...
AI人物搜索工具CLODO上线,支持用自然语言描述目标人物,在12亿(1.2B)索引档案中实时搜索、匹配、丰富联系人信息并生成触达方式。与输出静态CSV的传统搜索不同,CLODO检索实时网络信号,判断匹配度并解释推荐原因。该工具已获得Mercor、US News、Corgi以及美国情报界等机构的信任,并获得Y Combinator、CRV等投资。
Introducing CLODO, trusted by @mercor_ai, @usnews, @UseCorgi, the U.S. Intelligence Community, and more. Describe exactl...
Introducing CLODO, trusted by @mercor_ai, @usnews, @UseCorgi, the U.S. Intelligence Community, and more. Describe exactl...
Introducing CLODO, trusted by @mercor_ai, @usnews, @UseCorgi, the U.S. Intelligence Community, and more. Describe exactl...
自然语言处理技术正重塑专业社交网络的沟通方式,提升个性化与关联性。核心功能包括消息意图检测、语气风格适配、长篇资料摘要及多语言支持。语义匹配取代关键词匹配,基于共同目标与项目推荐更精准的连接。但AI生成消息可能引发隐私担忧,模型幻觉和语言偏见威胁信任。未来方向包括设备端小型语言模型、隐私保护推理及更严格评估指标,以在透明安全前提下维护真实人际关系。
Hacker News 用户发帖呼吁科技新闻平台应提供排除 AI 内容的筛选功能或替代来源,认为 Techmeme 等站点已被 AI 新闻淹没。评论中有人支持这一需求,认为应保留非 AI 科技讨论空间;也有人指出 AI 技术本身具有颠覆性价值,应区分商业炒作与真正的工具创新,并观察到 AI 帮助无编程经验者开发出实用应用。另有资深程序员表示期待接手清理“vibe code”的咨询业务。
一篇新论文指出,当前Web假设人类浏览页面、观看广告、点击链接,但AI智能体可收集并总结内容而不回访原站,损害出版商利益并导致网站封锁。作者提议将AI智能体视为人类代理,在Web请求中添加“agent metadata”,标明身份、所代表的人类、目的、限制和支付规则。网站通过新策略文件agents.txt决定允许、限速、收费、继承用户订阅、提供代理友好内容或屏蔽。内容还需附带provenance标签,让智能体识别来源是人类、AI还是两者。缺乏新机制将导致Web更难访问、出版商更难盈利、AI内容循环降低可靠性。
这是今晚直播的相关资料、资源及系统,分享给大家 相关资料: 1、《GEO内容工程操作手册与评估标准》https://doc.laoyao.cn/9fl0bc 2、《GEO内容工程系统研究报告》https://doc.laoyao.cn/t7...
Naver 于 6 月 26 日正式上线 AI 对话搜索服务“AI Tab”,定位为 AI 智能体搜索,旨在引导用户完成购买与预约。该服务整合 Naver 自家电商、地图、Cafe 社区、博客和本地生活服务,挑战谷歌 AI Mode。AI Tab 在回答深度和推理能力上不及 ChatGPT/Gemini,但在韩国本地餐厅推荐、商品发现及信息整理方面体验优于传统搜索。Naver 计划后续推出个性化房地产推荐和健康智能体服务。
本周六晚8点,姚老师在WaytoAGI进行第二次GEO公开课,主题为“GEO内容工程”。直播资料包括三份核心文档(操作手册、研究报告、实操教程)、两本推荐图书(《系统之美》《人人都该懂的工程学》)及三篇GEO相关论文。相关资源有GEO改写提示词、改写Skill及单篇内容GEO特征标注演示。开源项目包括GEO Skills、GEOFlow、Meta skill的GitHub仓库及课程PPT。
本周六(明天)晚上8点, 姚老师 @yaojingang 和我会在WaytoAGI给大家分享第二次GEO公开课。 主题是:GEO内容工程 链接:https://vc.feishu.cn/j/108720872 明天直播前5分钟进入就行。
谷歌今年 5 月宣布将 Play 商店集成至 Gemini 助手,现已逐步推送。用户可在 Gemini 聊天窗口中直接搜索、安装应用或进行内购,无需离开 Gemini。例如,询问“帮我找一款可以规划每周吃什么的 App”,Gemini 会搜索并跳转至 Play 商店详情页。该功能需年满 18 周岁,仅支持个人账号,且 Android 设备需安装 Play 商店。
iOS 27 Beta 2 固件代码显示新增 SearchPartnerInferenceProvider 组件,其本地化字符串明确提及“Baidu Visual Search”。该组件为第三方视觉搜索及 AI 服务商的基础设施,目前唯一指名的合作方为百度,未来可能按地区提供不同合作伙伴。本次更新还新增 SystemVoiceAssistant 应用,将 Polaris 音频框架独立为守护进程 polarisd,并新增 bluetoothaudiod 进程。固件包含超 4200 个 dylibs 更新、732 个 Mach-O 可执行文件更新及近 300 个 Kernel Extension 更新。
微软于2026年5月13日宣布取消Edge浏览器中独立的Copilot模式,同时放弃一年前随Edge 138版本分阶段推送的AI历史记录搜索功能。该功能用自然语言、同义词或带拼写错误的短语搜索浏览历史,由本地AI模型驱动,数据不上传云端,IT管理员可通过策略控制。用户因隐私担忧及认为功能冗余而不买账。微软转而将AI能力整合进Edge本身,包括Copilot跨标签页分析、手机端Journeys按主题归类历史,以及Copilot Voice和Copilot Vision等功能。
上海市消保委发布2026年618网购体验报告,基于4308份有效问卷。AI辅助消费决策精准度仅16.06%,84.56%尝试过AI选购但负面反馈主导(38.79%认为不贴合低价需求,29.71%表示高低价混杂)。算法推荐方面,仅24.21%认为高度匹配,38.51%发现同款商品在不同账号优惠不同。超85%消费者期待AI一站式购物。消保委呼吁平台校准算法,强化需求导向。
AI 工具 Apodex 发布收费通知:免费内测将于 6 月 29 日结束,之后开始正式收费。所有在 6 月 28 日及以前注册的早期用户将额外获得 2 周免费试用。该工具此前被博主深度拆解推荐,适合需要深度研究场景的用户,建议趁免费期尽快体验。
http://x.com/i/article/2069024565901119488
谷歌升级 Gemini 3.5 Flash 模型,原生引入“Computer Use”工具,并搭配 Chrome 149 浏览器增强 AI 交互。Chrome 新增“Select from screen”功能,用户可框选屏幕上的图片或文字,直接送入 Gemini 提示词,获得针对性 AI 交互,例如在鞋类网站选中多双运动鞋询问适合的跑步风格。该功能类似 Google Lens,但由对话式 AI 处理。Computer Use 工具使 AI 智能体能在网页、桌面、移动端执行访问网站、填写表单、点击按钮等复杂任务。
6 月 24 日,科技媒体报道苹果在 iOS 27 Beta 2 更新中收紧 Siri AI 规则,禁止其对用户提供的 URL 链接进行总结、阅读或提取信息。Siri AI 系统提示词新增指令,明确无法跳转访问网页,且不提供后续建议或变通方案。该调整可能关联苹果网页生态策略,防止 AI 直接抓取内容冲击网站流量。不过,在 iOS 27 版 Safari 浏览器中打开网页后,仍可通过 Apple Intelligence 摘要页面内容。
现有网页智能体基准主要测深度搜索,缺乏广度枚举能力评估。Ko-WideSearch 是韩语广度搜索基准,通过自动化合成-验证流程构建。任务要求从集合父实体(如电视剧季、王朝)中完整列举成员并填充属性表,采用 Item-F1、Column-F1、Row-F1 评分。基准含 228 张表格,覆盖 190 个实体、16 个类别,设三个难度层级,通过表宽和二维复合键控制成员覆盖率。对 20 个智能体的测试显示,智能体能恢复集合但无法填充行(Item-F1 92.8,Row-F1 53.7),难度提升准确率下降,增加搜索或花费无法缩小差距;难点在找到正确值而非格式化,自由文本单元格失败率最高。
Codex新功能Record & Replay可将浏览器操作录制成可复用的Skill。实测解决两个痛点:定向信息搜索时自动打开X搜热点、统计高赞帖子、提取关键词重新查询,输出带互动指标的表格和短关键词库,满足60%-70%图文素材需求;视频剪辑上传能完成静音检测、加速、导出GIF等固定流程,但上传可能被网站安全策略拦截,建议先让Codex出Plan判断可行性。Codex能理解意图,例如自动在输入Grok前增加中文关键词组合。目前依赖Computer Use和图片理解,操作慢且偶有误判,但已能将人的操作转化为Agent下次可执行的上下文,替代传统RPA和Replay。
微信近日内测AI智能体“小微”,常驻左上角,支持语音或文本输入,调用WeLM-V4-80B(MoE激活3B)与DeepSeek模型。可向个人/群聊发消息、发起视频通话、发红包或转账,需用户逐项确认;可查询朋友圈(限最近2天)、公众号、视频号,支持创建提醒、笔记、小工具,并能操作奶茶咖啡、打车、电影票等小程序至最后一步后交给用户。小微具备记忆功能,可记录地址等。聊天记录上下文仅在特定入口可用且限最近2天。整体策略“只读不动”,禁止批量发送、定时、删除联系人等操作。微信以谨慎节奏接入AI,是国民级应用全面拥抱AI的重要信号。
同一事件,精选展示《微信Agent小微灰度内测:主入口发消息红包,子入口可读聊天记录》Mistral AI 今日发布 OCR 4,支持 170 种语言,可单容器自托管部署。新版本除提取文本外,还返回边界框、块类型(标题/表格/方程等)和逐字置信度分数。独立标注者在 600+ 文档、12+ 语言的测试中平均胜率 72%。价格 $4/千页,批量 $2/千页,Document AI 模式 $5/千页。企业客户可自托管。Rogo 报告等效精度下成本低约 8 倍、延迟低 17 倍;Anaqua 测得每页快约 4 倍。OCR 4 同时作为 Mistral Search Toolkit(公开预览)的接入组件。
同一事件,精选展示《Mistral OCR 4》TheoremGraph 是覆盖非形式化与形式化数学的语句级依赖图。非形式化侧从 arXiv 解析 1170 万定理环境,提取 1830 万条有向依赖;形式化侧 LeanGraph 从 25 个 Lean 项目提取 388,105 声明节点和 1130 万类型化边。通过嵌入自然语言 slogan 将两类图映射到同一语义空间,LLM judge 在余弦阈值 ≥0.8 时确认 47,952 个匹配,阈值 ≥0.9 时接受率升至 87%。形式化概念检索中,name-and-signature 加图扩展的 Recall@10 达 0.775,接近 LeanSearch v2 的 0.780(无需 LM 重排序)。相关数据集、提取器、HTTP API 及 MCP 接口已开源。
Mistral AI 发布 OCR 4,新增边界框、块分类(标题、表格、方程式、签名等)及逐页逐词置信度分数。支持 170 种语言、10 个语系,可单容器全自托管部署。在 OlmOCRBench 上得分 85.20,独立标注者偏好率平均 72%。定价每 1000 页 $4,Batch API 享 50% 折扣。可通过 API 或 Mistral Studio 的 Document AI 调用。
关联讨论 1 条Hacker News 热门(buzzing.cc 中文翻译)微信搜一搜今日上线“AI 志愿助手”,为考生和家长提供志愿填报参考。用户输入分数、大学名称或志愿相关问题,系统结合合作方“掌上高考”的全国高校多年录取分数、位次、计划等结构化数据,给出冲、稳、保三个梯度的建议。支持继续追问以优化推荐,还可直接语音提问并多轮对话。