在今日火山引擎FORCE原动力大会上,总裁谭待表示豆包将继续免费,并推出面向生产力场景的专业版办公任务模式,搭载豆包大模型2.1 Pro(Doubao-Seed-2.1-Pro),围绕Coding、Agent、VLM三大方向升级。同时五大模型集中亮相:豆包视频生成Seedance 2.5及2.0 4K版、图像创作Seedream 5.0 Pro、音频生成1.0等。豆包大模型2.1已在火山引擎开放API服务,火山方舟体验中心同步上线,并接入豆包、TRAE、扣子等产品。
在今日火山引擎FORCE原动力大会上,总裁谭待表示豆包将继续免费,并推出面向生产力场景的专业版办公任务模式,搭载豆包大模型2.1 Pro(Doubao-Seed-2.1-Pro),围绕Coding、Agent、VLM三大方向升级。同时五大模型集中亮相:豆包视频生成Seedance 2.5及2.0 4K版、图像创作Seedream 5.0 Pro、音频生成1.0等。豆包大模型2.1已在火山引擎开放API服务,火山方舟体验中心同步上线,并接入豆包、TRAE、扣子等产品。
多式联运旅行平台 Omio 与 OpenAI 合作,在 ChatGPT 上构建了最早一批对话式旅行体验,连接超 3,000 家交通提供商、覆盖 47 国。用户可通过自然语言查询实时票价和路线,获取可预订的行程。内部方面,Omio 为全员部署 ChatGPT 并将 Codex 嵌入研发全流程,产品开发工作量降至原来的约 20%,项目周期从多人一季缩短至一人一月。Omio 的目标是成为 AI 原生公司,由员工对结果负责,AI 加速执行但决策权在人。
KaLM-Reranker-V1 是一种快速但非延迟交互(FBNL)重排序器,采用编码器-解码器架构。编码器使用 Matryoshka 嵌入池化预编码段落,解码器建模系统指令、用户指令和查询意图,再通过交叉注意力捕获查询与段落间的相关性,实现解耦计算并保持高效。模型提供 Nano(0.27B)、Small(1B)和 Large(4B)三种激活参数尺寸。在 BEIR 上达到 SOTA,与 Qwen3-Reranker 系列持平;在 MIRACL 上未经大量多语言训练仍表现优异;在 LMEB 上,0.27B Nano 模型可与 7-12B 嵌入模型竞争。
亚马逊已开始在ChatGPT投放广告,成为入驻OpenAI广告业务最知名的零售企业之一。电商分析师卡济乌凯纳斯指出,此举具“象征意义”,因亚马逊此前不愿参与AI购物合作。亚马逊将ChatGPT当作引流渠道,引导用户跳转至自家店铺,同时持续限制OpenAI、Perplexity等AI爬虫抓取数据,包括去年停止向谷歌购物提供数据、更新代码封禁爬虫,今年通过法院禁令阻断Perplexity智能体。对OpenAI而言,这一合作意味着其广告业务有望高速增长。
提出检索增强搜索(RAS)方法,通过束搜索优化候选程序,每一步从慢-快程序对训练数据中检索上下文示例引导LLM。基于LLM生成的自然语言描述进行上下文检索效果优于基于源代码的检索。同时提出AEGIS方法,将训练示例分解为原子编辑以提高可解释性。在C++程序优化上,RAS比先前最先进黑盒适应策略性能提升2.06倍,AEGIS提升1.37倍且编辑量更小。对于Python程序,RAS使平均运行时间百分位提升10.27。
Getty Images与OpenAI签署多年授权协议,授权图片将出现在ChatGPT搜索和发现功能中。双方未披露财务条款,也未说明OpenAI是否会使用Getty内容训练未来模型。消息公布后,Getty股价盘前涨约200%,此前年内跌约55%。CEO Craig Peters称授权内容使AI驱动搜索更实用可信。Getty此前曾抵制AI图像生成,后自建生成器并起诉Stability AI,目前仍在等待以37亿美元收购Shutterstock的审批。
皮尤研究中心最新报告显示,仅16%美国成年人预期AI在未来20年帮助社会,40%预期伤害。24%每天使用聊天机器人,51%从未使用。聊天机器人首要用途是搜索信息(42%),38%上班族用于工作,10%用于情感支持,4%用于陪伴。ChatGPT使用率最高(44%),其次Gemini(24%)、Copilot(17%)、Meta AI(14%)、Grok(8%)、Claude(6%)、Character.ai(3%)。30%称聊天机器人提升生产力,28%认为帮助了解信息。60%成年人阅读AI搜索摘要,表明AI正影响信息摄入。
6月22日,Getty Images宣布与OpenAI达成展示合作协议,授权图库内容将在ChatGPT的搜索与发现体验中呈现。此前,Getty Images曾与英伟达合作推出“Generative AI by Getty Images”工具,允许用户利用其授权图片库训练并承诺法律保护。OpenAI此前已与图片平台Shutterstock延续六年合作,并于2024年与英国《金融时报》签署协议,利用其资料库训练模型并提供新闻摘要链接。
前OpenAI员工Thomas Dimson和Joey Flynn创建了In the Weights网站。该网站向Grok、Gemini、多个GPT版本(包括GPT-5.4 Mini)、Claude、Llama等模型提问“Who is [姓名]?”,聚类描述后生成强度分数,以衡量一个人被AI模型“记住”的程度。测试显示作者得分641(前6%),榜首Macaulay Culkin得分988。网站还会列出返回结果的模型并标注潜在幻觉,例如GPT-5.4 Mini对Anthony Ha的描述。该工具意在替代传统Google vanity search,因为流量正转向大语言模型。
路透研究所2026年数字新闻报告显示,全球每周用AI聊天机器人获取新闻的比例从7%升至10%,仅1%将其视为主要来源。44%活跃用户信任AI生成的新闻,但仅4%经常点击原始来源。用户主要用途为追问(42%)、获取当前新闻(35%)和摘要(34%)。18-24岁年龄段使用率达17%,自称“新闻爱好者”的用户达18%。报告指出,聊天机器人存在强化已有偏见和分裂公共话语的风险,但也能简化复杂话题、翻译内容并提供多源整合,拓宽用户视角。
Liquid AI 本周发布两款 350M 参数检索模型:稠密双编码器 LFM2.5-Embedding-350M 和后期交互模型 LFM2.5-ColBERT-350M。二者基于 LFM2.5-350M-Base,通过将因果注意力改为双向注意力实现双向编码,支持阿拉伯语、德语、英语等 11 种语言的单语与跨语言搜索。在 NanoBEIR 多语言检索上,ColBERT 版 NDCG@10 为 0.605,Embedding 版为 0.577,均优于 Qwen3-Embedding-0.6B。在 MKQA-11 问答 Recall@20 上分别为 0.694 和 0.691。上下文窗口 32,768 tokens,文档调优至 512 tokens。提供 GGUF 格式,MacBook Pro M4 Max 上查询延迟低于 10 ms。模型以 LFM Open License v1.0 发布在 Hugging Face。
Google宣布将对德国慕尼黑地区法院的一项裁决提出上诉。该法院于2026年5月底判决,AI Overviews属于独立内容而非单纯搜索结果,Google需对其直接承担责任。案中AI错误地将两家慕尼黑出版商与欺诈计划关联。柏林法院6月初在另一案中得出相反结论,认为AI Overviews只是另一种形式的搜索结果,Google仅承担间接责任。Google将在上诉中引用柏林裁决。
阿里开源内部向量数据库Zvec,pip install zvec免费使用,对标Pinecone每月70美元能力。支持十亿向量毫秒级检索,无需单独起服务,全平台兼容;v0.5.0新增原生全文混合搜索。UCSD黄碧薇教授(causal-learn作者)提出AI四代范式:相关性小模型→因果小模型→相关性大模型(LLM)→因果大模型,认为当前正站在第四代门口。其创立的Aether AI完成首轮融资,致力于从视频中自动抽取物理规律,探索下一代因果AI范式。
人类到今天都写不出一颗煎蛋的物理方程, 一颗鸡蛋打进热油锅,它怎么凝固、怎么摊开、边缘怎么变焦, 没有任何一个公式能描述清楚,这种例子在物理世界里多到数不过来。 而这恰恰是当下通用 AI 范式的天花板,视频生成、VLA 学的都是像素层面的统...
xAI 将 Grok 引入 Microsoft Word,推出免费 365 插件。用户可将笔记转为结构化文档、重写文本以提升清晰度与简洁性,也能通过插件搜索网页、X 平台或生成图表。插件支持连接 SharePoint 和 Google Drive 等外部来源,还可用于 PowerPoint 和 Excel。
关联讨论 3 条IT之家(RSS)X:cb_doge (@cb_doge)xAI:News(网页)With Brain, Computer starts each task with full context of your projects, decisions, and sources instead of from scratch...
Together with researchers at Boston Children's Hospital and Harvard, we published a study in NEJM AI showing how o3 Deep...
Apodex专为解决无现成答案的硬问题设计。可同时派出最多150个子Agent并行探索,总步数超15,000步。在BrowseComp上超越GPT-5.5-pro,在DeepSearchQA上超越Claude-Opus-4.8和Kimi-K2.6。工作流程分深度研究、自我校验、撰写三阶段。内置三层自我验证机制(冲突审查员、事实检查员、草稿审查员)及独立全局验证器。由AgentOS负责调度、路由、事件流、检查点、成本记账、权限管理等底层事务,添加新应用只需插件代码,无需修改内核。
英国竞争与市场管理局(CMA)依据2025年数字竞争框架,限期6个月要求谷歌全面整改搜索排名系统。所有自然搜索结果必须基于客观、非歧视的标准,AI概述功能也不得偏袒任何平台。CMA同时要求谷歌建立更透明的内部投诉处理流程,并允许用户将个人搜索数据安全迁移至第三方。谷歌需在3个月内完成数据可移植性架构。谷歌发言人回应称其排名系统已公平透明,但将配合监管。
美团业务研发平台/搜推ASX团队六篇论文被ACL/ICML/KDD 2026接收。CBS将样本选择建模为上下文多臂老虎机,提升数学推理性能效率;ResRL通过负样本投影残差强化学习,数学超NSR 9.4%、代码刷新CodeForces SOTA、ALFWorld超PPO 7.8%;CDRRM仅用3千样本让未微调模型超越全量微调基线;LocalSearchBench覆盖国内9城6品类超134万商户与900道多跳问答,最优DeepSeek-V3.2正确率仅35.60%;DiningBench含3021道菜品多视角图像,29个VLM模型细粒度识别与营养推理不足;Mem²Evolve双记忆自进化框架在6类任务8个基准上优于单一进化策略。
谷歌在 Canary 频道最新 Chrome 浏览器中引入实验性 Flag,启用后工具栏可嵌入 AI Mode 快捷方式。AI Mode 是谷歌搜索结果页的 AI 对话交互,支持自然语言提问、多轮对话及文件上传分析。用户启用“Contextual Tasks Pin Button In Toolbar”Flag 后,点击按钮将在当前页面右侧弹出侧边栏,可针对浏览内容提问并上传文件。谷歌正测试“Browse with AI”和“Google Search AI Mode”两个暂用名。
邵猛详解 Codex Automations 的双循环架构:内循环负责将上下文带入任务,通过“检索即写作”、可逆动作(只建草稿不自动发送)等原则快速产出可审草稿;外循环在人工审阅后启动,通过草稿与终稿的 diff 提取证据,区分修改类型(写作偏好、事实补漏、承诺删除等),将经批准的教训写入 Markdown 供内循环下次使用。双循环速度错开:内循环快(如每 2 小时),外循环慢(日末/满 N 条审阅/每周),平衡即时效率与模式改进。适用于任何“起草→人审→发送/修改”的流程。
http://x.com/i/article/2067086994455601152
Meet Apodex 1.0 🔭 - a heavy-duty agent team for deep research, which sets the SOTA! The team searches the web, reasons ...
皮尤研究中心最新民调显示,49%的美国人至少偶尔使用聊天机器人,但63%认为该技术发展太快。自2024年以来,AI聊天机器人使用率从33%增至49%,其中ChatGPT使用量自2023年翻倍,44%受访者使用过。仅16%认为AI对社会有积极影响。年轻群体使用率更高且更悲观:18-29岁中66%使用,48%认为有负面影响。30-49岁使用频率最高,34%每天使用一次以上。约四成美国人用AI处理工作,30%认为提升了生产力,28%认为帮助更了解信息。皮尤2024年研究中,66%担忧AI传播不准确信息。
Exa 正式发布 Exa Agent,一个将前沿模型与自研搜索工具链打包成单一接口的托管式 API,面向深度调研、名单构建和实体 enrichment。核心技术包括:任务分解 + 并行子 Agent(Map-Reduce 架构);按任务动态混用前沿模型与经济模型的 Model Fusion;Highlights 模型可将 token 用量最高削减 94%。在 WideSearch 基准上采用 Row-F1 评分,Exa Agent 成本不到 GPT 5.5 和 Opus 4.8 的一半,处于 Pareto 前沿。应用场景涵盖金融、GTM/Sales、公司研究及文献/代码 review。
Introducing Exa Agent: frontier web research at less than half the cost of GPT 5.5 and Opus. /agent orchestrates a mixtu...
Meta在Facebook应用中推出AI Mode搜索,利用公开帖子回答复杂查询。实测显示基础推荐尚可,但存在严重幻觉:推荐奥斯汀的咖啡店给明尼阿波利斯行程,并错误引用社区泳池周末闭馆(实际周末开放)。AI曾就“1月6日国会骚乱者是否为爱国者”给出可疑答复。作为规划工具,AI Mode能发现用户未注意的活动,但地理错误和引用不实让结果大打折扣。
本周三,Pinterest 发布实验性应用 Ask Pinterest,通过对话式界面实现个性化购物推荐。该应用基于其 Taste Graph 数据映射用户兴趣与审美,支持多步查询(如规划晚宴),并能利用用户保存的 Pin 和 Board 进行个性化回答。初期仅限有限访问。同时,Pinterest 还推出了面向美国广告商的 AI 助手(Ads Manager 内测版)、全球上线的 Performance+ 创意模型,以及 Pinterest MCP,让广告商通过标准化第三方智能体工具管理广告活动。
Mozilla发布路线图,核心是推动2026年最大视觉功能重塑Project Nova落地。最新Firefox 152稳定版新增安卓标签页分组功能(iOS年内推出),重新设计设置界面,并加入“已拦截追踪器”小部件。未来规划包括自定义键盘快捷键、PDF拆分合并编辑、Multi-Account Containers原生集成、免费内置VPN(移动端)、AI驱动的Quick Answers语音问答、Smart Window隐私AI浏览体验,以及省电模式。
iPadOS 27 为妙控键盘添加自动化触发条件,连接或移开键盘可自动执行分屏、关闭应用等操作。快捷指令支持自然语言描述,系统自动生成流程并展示底层步骤。Safari 可根据网页主题自动整理标签页。系统整体提升窗口切换、文件传输等桌面化体验。Siri AI 搜索在索引完成后,用户可用自然语言跨应用查找文件、信息、邮件等内容,并给出带来源的上下文结果。
柏林法院近日裁定,Google的AI Overviews仅是一种“新的搜索结果格式”,用于汇总第三方内容,而非搜索引擎自身的原创陈述。法院认为普通用户能清楚识别AI是整合其他来源信息,Google对回答内容没有“决定性影响”。该判决源于一家香水公司因商标问题提起的诉讼——AI摘要中出现了其受保护品牌名及平价仿品链接。此前慕尼黑法院在另一起虚假事实案中得出相反结论,认定AI摘要为独立内容,Google须为算法错误负责。两起案件涉及不同法律基础(商标与竞争法 vs. 虚假陈述),上诉结果可能重塑AI搜索的责任边界。
WordPress VIP基于2000名受访者的调查显示,60%美国消费者认为品牌消息中出现“AI”会令人反感,86%不完全信任AI并仍想查看原始来源。42%表示缺乏明确归属的AI生成答案比航空公司费用、隐私政策和医疗账单更不可信。近四分之三受访者认为互联网比十年前更不人性化。33%将点击查看原始来源视为首要信任信号,80%认为网络信息应保持开放可访问。企业方面,60%受访企业称来自AI搜索引擎和答案平台的流量在过去一年增加,74%企业决策者将AI可发现性和归属列为主要或重要优先级。
Perplexity CEO 斯里尼瓦斯分享创业经验:从英伟达 CEO 黄仁勋学到保持危机感——英伟达市值 5 万亿美元、两年内营收预计 5000 亿美元,但黄仁勋经营公司像 30 天后就会倒闭;从马斯克学到工作不能仅由金钱驱动——SpaceX 薪酬围绕火星殖民地目标设计。他不认同卖掉公司退休,认为创始人应永远工作。Perplexity 正寻求新一轮融资,投后估值 200 亿美元,投资方包括软银、英伟达和贝索斯。
东京 AI 公司 Sakana AI 发布首个商业产品 Sakana Marlin,定位为虚拟首席战略官(Virtual CSO)的 B2B 自主研究智能体。输入主题后,Marlin 自主运行最多约8小时,输出数十至100页详细报告(含正文、参考文献和附录)及 AI 生成的幻灯片。核心算法是自适应分支蒙特卡洛树搜索(AB-MCTS),可动态选择“扩宽”或“加深”。产品经2026年4月封闭测试(约300名专业人士)优化,已与三菱 UFJ 金融集团合作,获花旗集团战略投资。定价按次付费(每次100积分,每积分98日元)及 Pro(月费15万日元,含2000积分)、Team(月费40万日元,含6000积分)套餐,AB-MCTS 已以 Apache 2.0 许可证开源。
Meta 今日起在 Facebook 推送新的 AI Mode 搜索功能,与“用户”“Marketplace”等常规模式并列。搜索结果并非“仅链接”,而是基于 Meta 旗下各平台公开帖子生成 AI 回复,用户还可追问。同步上线的还有照片预设(可将运动衫换到粉丝身上)和拼贴模板建议等 AI 功能。
Meta 宣布在 Facebook 推出“AI Mode”搜索功能,利用 Meta AI 从公开帖子(含群组和 Reels)提取信息并合成答案,用户可用自然语言提问获得摘要。同时新增视频拼贴剪辑、过渡效果及 AI 照片预设(可更换服装、发型和配饰),体育迷可在 Stories 中点击“AI Edit”虚拟穿上队服。这些更新延续了此前动态头像、Marketplace 自动回复和创作者 AI 助手的部署节奏。此外,Meta 近期启动了 Facebook、Instagram 和 WhatsApp 的全球订阅计划(每月 3.99 美元起),更多 AI 订阅层级正在规划中。
看了下OpenAI的广告后台,非常简单 但感觉要做好这个投放,难度也不小 研究了下官方文档,几点感触: 1、ChatGPT Ads的本质不是"买关键词",广告很依赖丰富的上下文,其实质是在买用户任务场景和意图匹配 2、对于AI广告,越像说明...
http://x.com/i/article/2065096982310567936