AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 140 条
全部一手资讯X论文
标签「搜索」清除
Rohan Paul@rohanpaul_ai · 5月17日62

Better search may come less from smarter indexes than from giving agents a richer way to touch text. Shows that AI agents using basic terminal tools like grep, file reads, and shell commands to search raw data perform far better than conventional retrieval systems on multiple benchmarks. On BrowseComp-Plus, swapping semantic retrieval for terminal search raised accuracy from 69% to 80% while lowering cost. The deeper point is not that grep is magically smarter than embeddings. It is that retrieval is usually treated as a model problem, when it is also an interface problem. A conventional retriever turns the corpus into a narrow ritual: ask once, receive a ranked list, reason over whatever survived. That works when the question is close to a document’s semantic center, but it breaks when the answer depends on exact phrases, faint clues, document structure, or a chain of small discoveries. Direct Corpus Interaction changes the shape of the task. The agent can search an exact string, inspect nearby context, notice a new entity, constrain the search again, and keep testing its hypothesis against the raw files. Here’s the part most people miss: the gain was not mainly from finding more gold documents, but from extracting more usable evidence once a promising document was reached. That makes DCI less like a better search engine and more like giving the model fingers. The limitation is real: as the corpus grows, the cost of finding the first useful anchor rises quickly, and blunt terminal search will not replace indexes for every large, static collection. But the paper’s lesson still lands cleanly. For capable agents, the bottleneck may no longer be only what they know, or even how they reason, but how much of the world their tools allow them to touch. ---- Paper Link – arxiv. org/abs/2605.05242 Paper Title: "Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction"

译研究表明,AI代理使用grep、文件读取等基础终端工具直接搜索原始数据,在多项基准测试中表现远超传统语义检索系统。例如,在BrowseComp-Plus基准上,终端搜索将准确率从69%提升至80%,同时降低成本。核心观点在于,检索不仅是模型问题,更是交互界面问题。直接语料交互允许代理进行精确字符串搜索、检查上下文并持续验证假设,从而从已定位文档中提取更多有效证据,其增益主要来自更充分地利用已发现文档,而非找到更多相关文档。局限性在于,随着语料库规模扩大,定位初始锚点的成本迅速增加,因此终端搜索无法完全替代大型索引。但对于强大AI代理,性能瓶颈可能在于工具允许其“触及”数据的深度。

Berryxia.AI@berryxia · 5月17日55

喜大普奔啊,兄弟们! 不要浪费X得订阅了! 大家现在可以在 Hermes Agent 中使用 X Premium 订阅,并且 Hermes Agent 现在可以搜索 X 帖子。

译喜大普奔啊,兄弟们! 不要浪费X的订阅了! 大家现在可以在 Hermes Agent 中使用 X Premium 订阅,并且 Hermes Agent 现在可以搜索 X 帖子。 https://x.ai/news/grok-hermes

🚨 AI News | TestingCatalog@testingcatalog · 5月17日64

HERMES 🔥: X Premium+ accounts can now use their subscription with Grok in Hermes Agent! Besides that, they can also use X search tool, which puts Hermes into a quite unique position now. It is not just OpenClaw vs Hermes anymore. It is OpenAI vs xAI once again 👀

译HERMES 🔥: X Premium+ 用户现可在 Hermes Agent 中使用其订阅权益访问 Grok! 此外,他们还能使用 X 搜索工具,这使 Hermes 目前处于相当独特的位置。 现在已不仅是 OpenClaw 与 Hermes 的较量。 这再次成为 OpenAI 与 xAI 的对决 👀

xAI@xai · 5月17日65

You can now use X Premium subscriptions in Hermes Agent, and Hermes Agent can now search X posts. https://x.ai/news/grok-hermes

译你现在可以在 Hermes Agent 中使用 X Premium 订阅,并且 Hermes Agent 现在可以搜索 X 帖子。 https://x.ai/news/grok-hermes [引用 @xai]:You can now use your @grok subscription inside @NousResearch Hermes Agent. http://x.ai/news/grok-hermes

Chubby♨️@kimmonismus · 5月16日70

Most AI tools give you a chat window. Sai gives you a coworker with its own desktop. I told it: "Do deep research on the topic." Then I closed my laptop. While I was off doing other work, Sai was inside its own secure Workspace - opening tabs, clicking through apps, reading sources, cross-referencing, taking notes. Not a chatbot summarizing a Google search. An actual coworker digging like a human does. When I came back, the research was done. Sources cited. Approvals requested before it sent anything. Nothing risky executed without my green light. This is what an "always-on" computer-using agent actually looks like.

译AI工具Sai被设计为拥有独立桌面的“虚拟同事”,而非仅提供聊天窗口。用户可向其下达“深度研究某主题”等指令后离线,Sai会在安全的工作空间内自主操作:打开标签页、点击应用、阅读并交叉引用资料、做笔记,其工作方式类似人类研究员。任务完成后,它会整理好引用来源,并在执行任何潜在风险操作前请求用户批准。这展示了“始终在线”的计算机使用代理的实际形态。

Rohan Paul@rohanpaul_ai · 5月16日70

X has released the latest "For You" feed algorithm to GitHub. Moving the feed closer to a Grok-style AI ranking system than a rule-heavy social media sorter. The system first gathers posts from accounts you follow through Thunder, then adds outside posts through Phoenix, which searches for content that looks relevant even if you do not follow the author. Ranking now behaves less like a checklist of likes, reposts, and keywords, and more like a transformer model that reads the user, the post, and past behavior as one prediction problem. Instead of asking “is this post good,” the model predicts multiple possible actions, such as whether you might reply, like, repost, watch, or skip. Thunder is the fast “people you follow” system. It keeps a live memory-store of recent posts, replies, reposts, and videos from users, then quickly pulls posts from accounts you follow when your For You feed is built. It is basically the in-network candidate source. Phoenix is the AI recommendation system. It has 2 jobs: first, Phoenix Retrieval finds outside posts from the global X corpus using similarity search, and then Phoenix Ranking scores both followed-account posts and outside posts using a Grok-based transformer model.

译X平台(原推特)已将其最新的“For You”信息流推荐算法在GitHub上开源。新算法从依赖点赞、转发等硬性规则排序,转向更接近Grok风格的AI智能排名系统。该系统通过Thunder实时获取用户关注账号的帖子,再通过Phoenix从全平台检索相关的外部内容进行补充。其核心排名模型不再单一判断帖子质量,而是像Transformer模型一样,将用户、帖子和历史行为作为一个整体进行预测,评估用户可能进行回复、点赞、转发、观看或跳过等多种互动可能性,从而实现更个性化的内容推荐。

AYi@AYi_AInotes · 5月16日72

马斯克开源了最新的X 算法(2026.5.15), 我花了1个多小时逐字学习理解, 结合我的X增长实践总结如下, damn!实在是太他么细了啊, 值得每个创作者花 5 分钟看完。 先一句话定调:这是第一次把 For You 的流量公式写成了源码,特别牛逼。 不废话,直接进重点: 一、新版算法的核心机制, 就一句话最终得分 = Σ(权重 × 多动作概率) 系统用 Grok Transformer 同时预测你这条帖会被读者做出哪些动作,每个动作一个概率,加权求和,分数最高的帖上 For You, 正向动作:P(点赞) / P(回复) / P(转发) / P(点击) / P(分享) / P(关注作者) 负向动作:P(不感兴趣) / P(拉黑) / P(举报)正向加分,负向重扣, 所有手工规则全砍了,100% Transformer 端到端。 二、Feed 流水线 6 步,每一步都可能让你的帖被截胡 1|Query Hydration(用户画像) 实时抓取读者的关注、点赞、转发、停留时长、profile 浏览次数——停留时长 + profile 浏览是隐性信号,权重比点赞还高 2|Candidate Sources(候选池)Thunder:你关注的人发的最新帖Phoenix Retrieval:全局双塔模型,从你不关注的人里捞内容塞进来 3|Hydration(补全元数据) 作者信息、媒体类型、品牌安全信号 4|Filtering(硬过滤) 去重、屏蔽、拉黑、静音词、Grox 反垃圾——账号信用差的人在这一层就被筛掉了 5|Scoring(打分) Phoenix Scorer 出概率,Weighted Scorer 算总分,Author Diversity Scorer 专门惩罚同一作者重复出现 6|Selection(Top-K 输出) 最后才轮到广告混排 三、对创作者真正有用的 4 个落地结论 ① 必带媒体 图/视频/poll 直接拉高 P(点击) 和停留时长,文字纯帖在新算法下天然劣势 ② 设计高互动钩子 开放问题、争议但不极端、@ 相关账号——目标是同时拉高 P(回复) 和 P(转发),这俩权重最高 ③ 同一主题别连发 Author Diversity Scorer 会主动扣你分,同主题隔 1-2 天发或换角度发,绕开惩罚 ④ 警惕负向信号 情绪化内容容易高互动,但也容易触发 P(不感兴趣) 和 P(举报), 这俩是重扣项,算了总分可能反而是负贡献 四、最反直觉的一点 X 这次开源了流水线代码、开源了 mini 模型、开源了广告混排逻辑, 但模型权重、训练数据、生产环境调优参数全部没开源, 也就是说你能看到流量怎么算,看不到具体每个权重的数值, 还是老马厉害哈哈哈, 最高级的透明就是让你看见规则但拿不到答案, 规则摊在桌上了,剩下的就是谁愿意按规则把内容做到极致了。 #X算法 #ForYou

译马斯克将X平台“For You”推荐算法开源。其核心是使用Grok Transformer端到端预测用户对帖子各项互动动作的概率,并通过加权求和得出最终得分以决定推荐。推荐流水线包含用户画像、候选池检索、元数据补全、硬过滤、打分及最终选择六个步骤。对创作者的启示包括:必带媒体内容提升点击与停留时长、设计高互动钩子、避免同一主题连发以防被惩罚、警惕引发负向互动信号。值得注意的是,本次开源了流程代码与架构,但未公开具体的模型权重、训练数据及生产环境参数。

DogeDesigner@cb_doge · 5月15日46

Elon Musk shares his goal for the new Grok powered 𝕏 algorithm. "It should be possible for somebody to post content as a new user with no followers and if that content is intrinsically excellent, it can be seen by a lot of people. That's our goal."

译埃隆·马斯克分享了他对由Grok驱动的新𝕏算法的目标。 "即使是一个零粉丝的新用户发布内容,只要内容本身足够优质,就应当能被大量用户看到。这是我们的目标。"

Perplexity@perplexity_ai · 5月14日68

Computer now connects to Snowflake. Run end-to-end work against live warehouse data and get answers with SQL, source tables, filters, and metrics. It’s like a personal data science team, on call with accurate answers from live company data.

译计算机现已连接至Snowflake。 可基于实时仓库数据开展端到端工作,通过SQL、源表、筛选器和指标获取答案。 这就像一支随时待命的个人数据科学团队,从公司实时数据中提供精准答案。

ginobefun@hongming731 · 5月14日66

BestBlogs 2.3.0 发布了。 这次做了几个比较重要的改动: 新用户完成三步引导,免费体验 7 天 Pro; 文章、播客、视频、推文详情页对所有人开放,不登录也能读全文; Pro 中心重新设计,本周阅读、AI 用量、关注源、最近 7 期早报一屏看齐。 另外也开放了老用户 14 天 Pro 福利,以及 Pro 用户邀请朋友体验的入口。 我希望 BestBlogs 能从一个「高质量内容聚合站」,慢慢变成一个更个人化的阅读工作流:每天帮你从海量内容里筛出真正值得看的部分,也让阅读这件事变得没那么焦虑。 欢迎体验: https://www.bestblogs.dev/pro

译BestBlogs 2.3.0 推出,主要更新包括新用户完成引导可免费体验7天Pro服务;文章、播客等详情页向所有人开放,无需登录;Pro中心重新设计,整合本周阅读、AI用量等功能于一屏。同时开放老用户14天Pro福利和邀请体验入口。该版本旨在从内容聚合站转向个人化阅读工作流,帮助用户筛选有价值信息,减轻阅读焦虑。

Berryxia.AI@berryxia · 5月14日66

ExaAILabs刚测完一个关键实验。 他们在强化学习阶段训练LLM搜索能力,一组喂Google数据,一组用他们的Exa搜索API。 结果用Exa的那组,模型性能更高,训练算力却省下了70%。 整整70%。 这个发现有点出乎意料 很多人还坚信想让AI搜索做得更好就只能靠堆更多算力。 但真实情况可能是搜索工具本身的质量和效率决定性远大于算力数量。 这对所有搞AI Agent、做RAG、训练带搜索能力大模型的团队来说是个重大信号。 我看完blog后感觉未来LLM训练的效率战可能要从选对工具开始打起。 如果你在做相关方向强烈建议去读他们的完整blog。

译ExaAILabs的一项关键实验表明,在强化学习阶段训练大语言模型的搜索能力时,使用其Exa搜索API替代Google数据,不仅能使模型达到更高性能,还可节省高达70%的训练算力。这一结果直接挑战了“提升AI搜索能力主要依赖增加算力”的普遍观点,揭示了搜索工具本身的质量与效率可能更具决定性影响。该发现为从事AI Agent、RAG以及训练具备搜索能力大模型的团队提供了重要启示,意味着未来LLM训练的效率竞争可能始于对底层工具的选择。

Rohan Paul@rohanpaul_ai · 5月13日60

The first fully AI-run radio station on X is now broadcasting AI news 24/7 for builders and founders. It tracks live signals from GitHub, HuggingFace, OpenRouter, X, HN, and YouTube, then turns those scattered updates into a 24/7 AI radio feed that tells builders what is actually moving in AI. Its AI hosts are not just voice wrappers over headlines, because they carry memory, editorial judgment, and distinct viewpoints. That makes the hard part signal ranking, not speech generation, since the system has to decide which GitHub repo, OpenRouter move, HuggingFace release, founder post, or HN debate actually deserves attention.

译X平台推出了首个完全由AI运营的电台,全天候为AI构建者和创始人播报新闻。该电台实时追踪GitHub、HuggingFace等多个平台的动态,将分散信息整合成连续音频流。其核心挑战在于信息排序而非语音生成,系统需判断哪些代码更新、模型发布或社区讨论值得关注。电台拥有五位具备编辑判断力、记忆和个性的AI主播,他们不仅能播报信息,还会识别模式、发现矛盾并论证观点。内容涵盖突发新闻、工具趋势、融资动态及社区观点,旨在帮助用户高效把握AI领域重要动向。

DogeDesigner@cb_doge · 5月13日71

You can now connect your Gmail with @Grok Connect Gmail and ask things like: • “Find my flight tickets for next month” • “Summarize all emails from my bank this week” • “Show me unpaid invoices from my inbox” • “Find the latest email from my lawyer/accountant” • “Summarize this long email thread in simple words” • “Find the attachment from the email I received yesterday” • “What meetings or deadlines were mentioned in my emails?” • “Find my hotel booking confirmation” • “Find the refund confirmation email” • “Summarize all unread emails from today” • “Find the last conversation I had with this person” • “Pull out important dates from my emails” • “Find the invoice PDF from last month” • “Tell me what I need to reply to” Your inbox just became searchable, smarter, and way more useful.

译Grok现已支持连接Gmail,用户可通过自然语言指令对收件箱进行智能查询与管理。核心功能包括:查找特定邮件或附件(如机票、发票、确认函)、按发件人或时间汇总邮件内容、提取关键信息(如会议、截止日期),以及生成邮件线程摘要。该集成旨在将传统收件箱转化为可智能交互的信息库,提升邮件处理效率与实用性。

Google Gemini@GeminiApp · 5月12日63

Personal Intelligence can help you build a travel itinerary that’s fully custom to you. It saves time by connecting dots across your @Gmail, @GooglePhotos, @Google Search, and @YouTube history. Choose which apps to connect and manage your personalization settings at any time 🧵

译Personal Intelligence 可帮助您打造完全个性化的旅行行程。 它通过关联您 @Gmail、@GooglePhotos、@Google 搜索和 @YouTube 历史记录中的信息点来节省时间。 您可随时选择要连接的应用程序并管理个性化设置 🧵

Peter Steinberger 🦞@steipete · 5月11日50

Birdclaw has my complete twitter archive, so I can ask Codex for any old weird tweet I ever favorited or bookmarked. https://birdclaw.sh

译Birdclaw保存了我完整的推特存档,因此我可以向Codex查询任何我曾点赞或收藏的旧推文。https://birdclaw.sh

Chubby♨️@kimmonismus · 5月9日64

Hold on, Chinas ERNIE 5.1 is almost SOTA but using only around 6% of the pre-training cost of comparable models?? ERNIE 5.0’s pre-training foundation: Baidu says ERNIE 5.1 achieves stronger search, reasoning, knowledge Q&A, creative writing, and agentic capabilities while using only around 6% of the pre-training cost of comparable models. It now ranks No. 4 on Arena’s Search Leaderboard with a score of 1,223, and ERNIE 5.1 Preview reached 1,476 on LMArena Text, ranking No. 13 globally. Caveat: dont see a technical paper. Need to verify their claims. But big if true.

译百度发布的ERNIE 5.1模型基于ERNIE 5.0预训练基础,宣称在搜索、推理、知识问答、创意写作和智能体能力方面获得提升,而其预训练成本仅为同类可比模型的约6%。该模型在Arena搜索排行榜以1223分位列第四,ERNIE 5.1 Preview在LMArena Text上取得1476分,全球排名第十三。推文作者指出目前未见技术论文,需验证其宣称的低成本高性能表现,但若属实将意义重大。

🚨 AI News | TestingCatalog@testingcatalog · 5月9日72

Baidu released Ernie 5.1 preview which lands at rank 4 on Search Arena. > Built on ERNIE 5.0's pre-training foundation, our latest foundation model upgrades search, reasoning, knowledge Q&A, creative writing, and agentic capabilities. Benchmarks 👀

译百度发布了基于ERNIE 5.0预训练基础的最新大模型ERNIE 5.1预览版。该模型在搜索、推理、知识问答、创意写作和智能体能力方面进行了升级。根据官方引用信息,ERNIE 5.1在Search Arena的全球搜索排行榜上位列第四,得分为1223分。这一排名反映了其更强的多源检索与信息综合能力,有助于在内容生成、AI助手、企业知识管理和智能体应用中提供更一致、可靠的答案。

Baidu Inc.@Baidu_Inc · 5月9日73

ERNIE 5.1 just dropped. Built on ERNIE 5.0's pre-training foundation, our latest foundation model upgrades search, reasoning, knowledge Q&A, creative writing, and agentic capabilities, while using only around 6% of the pre-training cost of comparable models. More in the thread 🧵

译ERNIE 5.1 刚刚发布。 基于 ERNIE 5.0 的预训练基础,我们最新的基础模型升级了搜索、推理、知识问答、创意写作和智能体能力,而预训练成本仅需对标模型的约 6%。 更多内容详见主题帖 🧵

Google AI Developers@googleaidevs · 5月9日22

End-of-week call for community builds! Have a project or demo that showcases Gemma 4 Multi-Token Prediction (MTP) drafters, File Search tool updates, or Webhooks in the Gemini API? Share them in the comments to let them shine 🌟

译周末社区作品征集! 你有展示 Gemma 4 多令牌预测(MTP)草稿器、文件搜索工具更新或 Gemini API 中 Webhooks 的项目或演示吗? 在评论区分享出来,让它们发光 🌟

Google AI@GoogleAI · 5月9日49

Happy Friday! 🎉We’re officially 11 days away from I/O (but the launches keep rolling in). Here’s what happened this week: — The @googlehealth app, featuring a personalized health coach built with Gemini that uses your wearables, favorite health & fitness apps, and medical records to deliver proactive wellness guidance that fits your life — Multi-Token Prediction (MTP) drafters in @googlegemma 4, which can speed up your workflows by up to 3X — Automatic source organization and customizable Mind Maps in @NotebookLM — Gemini API File Search tool updates with multimodal support, custom metadata, and page citations — Webhooks (now available in the Gemini API) replace continuous polling with push-based notifications — Some of our most popular AI features, like Nano Banana, Veo, and @googlephotos Remix are now available on Google TVs

译距离谷歌I/O大会仅11天,公司本周推出了一系列AI产品更新。Google Health应用集成Gemini,利用穿戴设备、健康应用和医疗记录提供个性化健康指导。Gemma 4引入多令牌预测技术,可将工作流速度提升高达3倍。NotebookLM新增自动源文件整理和可定制思维导图功能。Gemini API的文件搜索工具升级,支持多模态、自定义元数据和页面引用,并加入Webhooks推送通知以替代轮询。此外,Nano Banana、Veo和Google Photos Remix等热门AI功能现已登陆Google TV平台。

Berryxia.AI@berryxia · 5月8日66

强强联合就算了! 还特么免费看! 这年纪受得了吗? 咸鱼立马出上架销售来……

译作者免费发布《GEO红皮书》,旨在整治GEO行业黑帽手段、割韭菜等乱象。基于前沿论文、生成式AI法规和实战经验,红皮书系统拆解55种GEO风险,提供自查清单和治理框架,帮助中小企业在AI时代规范营销,促进行业回归理性。

向阳乔木@vista8 · 5月8日32

2025年初,姚老师 @yaojingang 和我发布了21万字的《GEO白皮书》,至今每天仍有数百人访问。 但这一年,大家也亲眼见证了行业的变质: 黑帽GEO横行、垃圾服务商割韭菜、虚假承诺满天飞…… 被央视315点名批评,不意外。 GEO行业不该是这样的。 为了让行业回归理性,帮中小企业在AI时代真正做好营销,姚老师和我最近花了不少时间,基于: 1. 国内外前沿论文 2. 生成式AI法规 & 互联网广告法 3. 一年实战踩坑经验 整理出一份10万字《GEO红皮书》 1. 拆解常见黑帽GEO手段,让你一眼识破 2. 教你甄别GEO服务商水平,避免踩坑 3. 提供GEO风险自查清单,防患于未然 ... 免费领红皮书: https://yaojingang.feishu.cn/wiki/Otqtw0HFbiNeCMkjKalcFkoJnpf

译作者与姚老师继年初发布《GEO白皮书》后,观察到行业在2025年出现严重变质,黑帽GEO手段泛滥、服务商良莠不齐、虚假承诺盛行,甚至被央视315点名。为促使行业回归理性,帮助中小企业有效利用AI进行营销,他们结合前沿学术论文、相关法规及自身实战经验,整理发布了《GEO红皮书》。该书旨在揭露黑帽GEO手法、提供服务商甄别指南,并给出风险自查清单,以协助企业规避陷阱,目前可免费获取。

Berryxia.AI@berryxia · 5月8日68

这套设计财务/表格Agent 来说必须按头安利一下! Ramp Labs 把 Fast Ask 深度嵌入到了 Ramp Sheets 的 Spreadsheet Agent 里。 以前的 spreadsheet agent 检索信息时,要么读太少漏掉答案,要么读太多导致又慢又贵、还容易被无关 tab 分心。 现在他们专门造了一个叫 Fast Ask 的检索子代理,彻底把这个检索循环优化掉了。 真正的核心卖点是:主 Agent 再也不用自己瞎逛 workbook。 给它一个问题(比如“2025 年 3-5 月 South land 的累计净收入是多少?”),Fast Ask 就会自动导航表格、读取最相关的 range,最后只返回精炼后的答案给主 Agent 用,大幅减少上下文污染和 token 浪费。 他们和 Prime Intellect 合作,用 RL post-training 把开源 Qwen3.5-35B-A3B(激活参数约 30 亿)打造成这个专业模型。实际效果非常炸裂: •在生产环境里,主 Agent 之前有 17.8% 的 tool calls 都浪费在打开 tab、读无关 sheet 上,现在这个瓶颈被干掉; •Fast Ask 延迟接近 Claude Haiku 4.5,同时在 held-out eval 上比 Claude Opus 4.6 准确率还高 4 个百分点; •整体 agent 系统既更快、更准,还更省钱。 具体实现上也收获满满: •用了高度仿真业务的合成数据集,设计了 14 类任务(revenue rollup、invoice reconciliation、spend analysis 等),每类还生成多种自然语言变体,防止过拟合; •Adversarial workbook 故意塞 decoy sheet、partial helper summary、模糊 identifier,训练模型学会避坑; •工具接口极简(只有 get_workbook_metadata、read_ranges、run_python 三个),每 rollout 限 15 步,用 GRPO + 自定义 reward(1.0 correctness + 0.1 efficiency + 0.05 concise)让模型学会又准又快地输出可解析的 ANSWER; •整个训练在 Prime Intellect 的 RL 平台上跑了 100 step,off-policy 异步设计让 rollout 不卡训练。 完美展示了 RL post-training 在“窄而可验证”场景下的威力:把 retrieval 这种重复、延迟敏感、可精确打分的子任务交给小专精模型去做,让前沿大模型专心做判断和推理,而不是浪费算力在翻表格上。 对做 Agent、尤其是财务/表格类 Agent 的同学来说,这套环境设计、reward shaping 和 subagent 思路,值得直接拿来复用。

译Ramp Labs在Ramp Sheets的Spreadsheet Agent中深度集成了Fast Ask检索子代理,解决了传统表格Agent因读取范围不当导致的效率低下和成本高昂问题。该子代理能自动导航并读取最相关数据范围,仅返回精炼答案,减少上下文污染与token消耗。其基于开源Qwen3.5-35B-A3B模型,通过与Prime Intellect合作进行RL后训练优化。实际应用中,它消除了主代理17.8%的无效工具调用,延迟接近Claude Haiku 4.5,准确率比Claude Opus 4.6高4个百分点,实现了更快、更准、更经济的系统性能。

elvis@omarsar0 · 5月8日39

Hacker News → LLM Artifact I built the most personalized HN feed. It only tracks topics I do research around based on memory and LLM wiki. No point in storing bookmarks. With a few automations, rules, skills, and proactive agents, you can make the feed whatever you want.

译Hacker News → LLM Artifact 我构建了最个性化的HN订阅源。 它仅根据记忆和LLM知识库追踪我研究的相关主题。 存储书签已无意义。 通过一些自动化流程、规则、技能和主动代理,你可以将订阅源定制成任何你想要的样子。

凡人小北@frxiaobei · 5月8日81

好东西,我的龙虾已经用上了✌️

译作者宣布,将新书《AI营销:从SEO到GEO》中配套的25个AI营销与GEO相关提示词开源至GitHub。此次更新还补充了部分短视频和文案相关的提示词,所有资源已在指定仓库公开,供用户下载使用或重新拉取。

向阳乔木@vista8 · 5月7日74

开源,通通开源,哈哈哈。

译开源,通通开源,哈哈哈。 [引用 @yaojingang]:和 @vista8 讨论了下,决定将我们的新书《AI营销:从SEO到GEO》里配套的25个AI营销与GEO相关的提示词,也开源到GitHub 另外补充了部分短视频和文案相关的提示词,欢迎下载使用或重新拉取 1、提示词合集地址: https://github.com/yaojingang/yao-open-promptsGEO 2、GEO提示词合集: https://github.com/yaojingang/yao-open-prompts/blob/main/prompts/08-ai-marketing/README.md

Berryxia.AI@berryxia · 5月7日70

这个不错,直接可以TRACK!!! 免费看:https://aihot.virxact.com

译推文推荐免费网站aihot.virxact.com,可直接追踪AI信息。该平台由公众号顶流博主卡兹克(@Khazix0918)公开其日常使用的优质信息源,无需登录即可访问,采用时间线形式便于查找,并分类整合官方信源、优质博主和推友等内容,还包括公众号监测和AI日报。用户通过此平台可使自己的AI信息源与顶流博主保持一致。

Perplexity@perplexity_ai · 5月6日71

Finance Search is now available in the Perplexity Agent API. In one tool call, developers can now retrieve licensed financial datasets, real-time market data, and cited web sources for agents that need current, verifiable financial answers.

译Perplexity Agent API 现已提供金融搜索功能。 开发者只需一次工具调用,即可为需要当前可验证金融答案的智能体获取授权金融数据集、实时市场数据和附引用的网络资源。

Berryxia.AI@berryxia · 5月6日64

Google NotebookLM思维导图正在迎来只重大升级: 这些新功能今天开始推出: 🚗 自定义:通过特定用户提示词来引导你的MindMap 📂 组织:立即重命名并分享你的MindMap 🗺️ 导航:节点之间丝滑顺畅的过渡 告诉我们你的想法!

译Google NotebookLM的思维导图功能正进行重大升级,新功能从今天起推出。核心更新包括自定义功能,用户可通过特定提示词引导MindMap的生成方向;组织功能支持立即重命名和分享MindMap,提升管理效率;导航功能优化了节点之间的过渡,实现更丝滑的交互体验。此次升级旨在增强工具的灵活性和用户体验,并邀请用户反馈意见。

TestingCatalog News 🗞@testingcatalog · 5月6日52

Perplexity released Perplexity Computer for Professional Finance with bootstrapped workflows and new data providers. Additionally, all responses are traceable back to the source!

译Perplexity发布了Perplexity Computer for Professional Finance,具备引导式工作流程和新的数据提供商。 此外,所有回答均可追溯至来源!

TestingCatalog News 🗞@testingcatalog · 5月6日67

Perplexity got a new tab for artifacts! It appears to be a list of all previously generated artifacts across Perplexity and Perplexity Computer. Pinning is possible too 👀

译Perplexity 新增了一个 artifacts 标签页!这里似乎列出了 Perplexity 和 Perplexity Computer 中所有先前生成的 artifacts。 还可以进行固定操作 👀

Perplexity@perplexity_ai · 5月6日71

Perplexity and Computer now connect to premium health sources, starting with NEJM and BMJ Group, with 9 more medical journals and clinical databases on the way. Ask health questions and get answers cited from the same sources relied on by hospitals and research institutions.

译Perplexity和Computer现已接入优质健康资源,首批包括NEJM和BMJ集团,另有9种医学期刊和临床数据库即将上线。 提出健康问题,即可获得来自医院和研究机构所信赖的相同来源的引用答案。

AK@_akhaliq · 5月5日55

Web2BigTable A Bi-Level Multi-Agent LLM System for Internet-Scale Information Search and Extraction paper: https://huggingface.co/papers/2604.27221

译Web2BigTable 一个用于互联网规模信息搜索与提取的双层多智能体LLM系统 论文: https://huggingface.co/papers/2604.27221

TestingCatalog News 🗞@testingcatalog · 5月5日61

TinyFish has made web Search and Fetch features FREE for all developers and AI agents, with generous rate limits! > Search: Low-latency search responses for agentic use > Fetch: Real browser render, clean markdown, or JSON outputs > Works with Claude Code, OpenClaw, Cursor, Codex, n8n, Dify, and more

译TinyFish宣布其网页搜索与抓取功能即日起向所有开发者和AI智能体免费开放,并提供宽松的调用频率限制。搜索功能可为智能体提供低延迟响应,抓取功能支持真实浏览器渲染、纯净Markdown或JSON格式输出。该服务兼容Claude Code、OpenClaw、Cursor、Codex、n8n、Dify等多种开发环境和AI工具。用户无需绑定信用卡即可通过指定链接获取API密钥。

TestingCatalog News 🗞@testingcatalog · 5月5日45

Perplexity is working on a new Digest feature. It seems to be connected to the upcoming Context for Perplexity Computer and potentially will be able to pull recent context from connected sources into a personal aggregated summary.

译Perplexity 正在开发一项新的 Digest 功能。 该功能似乎与即将推出的 Perplexity Computer Context 相关联,并可能能够从已连接来源提取近期上下文,整合成个人聚合摘要。

Chubby♨️@kimmonismus · 5月4日31

Why is the search function in Windows so incredibly bad? I don't understand it. On the one hand, Windows wants to integrate CoPilot AI everywhere. And then the OS is so bad that you can't even find the simplest things.

译为什么Windows的搜索功能如此糟糕?我无法理解。一方面,Windows想把CoPilot AI集成到各处。然后操作系统的搜索功能却差到连最简单的东西都找不到。

阿绎 AYi@AYi_AInotes · 5月2日48

之前看到过一些X要凉的言论, 加上中推区为了赚创作者收益各种低质搬运内容,信息噪音很大, 说实话我也曾经觉得X可能很难发展起来, 直到今天看到Nikita Bier发的这张图。 4月App Store下载量,比历史最高纪录还高出40%, 对你没看错,40%! 并不是小幅波动,直接断层式的跳跃增长🚀 让龙虾爬了下相关数据,过去两年很多人都在唱衰X 说它混乱,说它bug多,说用户都跑去Bluesky和Threads了, 甚至说说Elon把一个好好的产品毁了, 但其实下载量是不会骗人的, 这是用户用脚投出来的最硬的票。 很多人都想知道到底发生了什么? 其实没啥惊天动地的大事, 就是Nikita团队过去18个月, 一件事一件事地改, Grok深度集成了,视频体验变好了,社区功能也慢慢完善了, 再加上4月的新闻周期,X又变回了那个有大事第一时间去刷的地方。 有意思的是很多回复里都在说,Bluesky玩了一圈又回来了, 也不是Bluesky不好, 而是当全世界所有人都在讨论同一件事的时候,你只能来X, 我觉得这个东西就是实时社交网络的护城河,别人真的很难抄走。 但转念一想,这才只是开始, 下载量是领先指标,留存才是生死线。 现在的X问题依然很多: bot泛滥到影响体验,创作者变现政策反复横跳,app切后台就重载,reach像过山车一样不稳定。 如果这些问题解决不了, 这次的爆发可能只是昙花一现。 但如果Nikita团队能在接下来半年把留存和变现同步拉上来,那X就真的进入了一个全新的增长周期。 我感觉这件事对整个行业的冲击其实挺大的, 一个是它证明了,"安全、可控、算法投喂"不是唯一的答案。 其次是"言论自由、实时、开放",这个被很多人说过时的组合,依然有极强的生命力。 Nikita说,我们才刚刚热身, 讲真这个我信。 但真正的考验其实并不是拉新, 关键是怎么把这些兴冲冲进来的新用户真正留下来。 所以接下来的6到12个月, 才是见真章的时候, X是我心里全球最好的实时社交网络平台,有着最好的社区氛围和创作者支持体系,希望越来越好,感谢@nikitabier 团队过去18个月的努力和付出,respect🫡🫡🫡

译尽管长期存在唱衰言论,X在4月的App Store下载量却创下历史新高,较此前峰值增长40%,呈现断层式跳跃。这反驳了用户流向Bluesky、Threads或产品被毁的论调,下载量被视为用户“用脚投票”的最硬指标。增长归因于团队过去18个月对Grok集成、视频体验、社区功能的持续改进,以及4月新闻周期让X重回“刷大事”的核心场景。许多用户从Bluesky回流,凸显了“实时、开放、全球共时讨论”的护城河效应。然而,下载量只是领先指标,bot泛滥、创作者变现政策不稳定、应用性能等问题若不能解决,增长可能昙花一现。未来6-12个月的关键在于提升留存与变现,若能实现,X将进入全新增长周期。此事冲击行业认知,证明“安全可控的算法投喂”并非唯一答案,“言论自由、实时、开放”的模式依然拥有强大生命力。

Orange AI@oran_ge · 5月1日19

AI 推荐我读这本书,我就买了 昨晚8点开始看,看到9点就困了 然后一觉睡到早晨6点,睡了整整9小时 好书啊

ginobefun@hongming731 · 5月1日68

实用的 AI SEO 操作指南

译本文介绍了一套提升内容在主流AI(如ChatGPT、Claude)中可见性的实用方法,核心是主动提供结构化数据。关键步骤包括:在网站部署`llms.txt`文件概述站点;在`robots.txt`中允许AI搜索爬虫;向Google、Bing等提交Sitemap并利用其工具监测AI引用;参与Perplexity出版者计划;使用JSON-LD结构化数据标记内容;甚至可为AI创建专用知识端点,集中提供实时更新的结构化信息。这些做法旨在帮助AI更准确、高效地理解内容,而非制造垃圾信息。

Rohan Paul@rohanpaul_ai · 5月1日56

Time published a piece. Google’s AI position came from a long series of early bets by Sundar Pichai on DeepMind, TPUs, cloud infrastructure, and AI products, not from a last-minute reaction to ChatGPT. Google’s biggest strength in AI is its full-stack control of research, chips, cloud, products, and distribution across billions of users. "Critics once underestimated CEO Sundar Pichai. Now, critics wonder if he’s made Google too powerful" Google just secured absolute architectural control over the AI landscape by merging its custom physical silicon manufacturing directly with a single unified research laboratory. Competitors pay steep financial premiums for external chips while Google seamlessly executes complex neural calculations on its proprietary Tensor Processing Units. Building internal hardware allows engineers to aggressively scale pretraining, the critical phase where models ingest massive datasets, without facing crushing financial overhead. --- time .com/collection/time100-most-influential-companies/2026/saudi-aramco/

译《时代》杂志指出,谷歌在人工智能领域的领先地位,源于CEO桑达尔·皮查伊早期对DeepMind、TPU芯片、云基础设施及AI产品的一系列长期投资,而非对ChatGPT的仓促反应。其核心优势在于对研究、芯片、云服务、产品和覆盖数十亿用户的分发渠道实现全栈控制。通过将定制芯片制造与统一的研究实验室深度融合,谷歌获得了对AI架构的绝对控制权,能利用自研TPU高效执行复杂计算,同时让工程师得以低成本大规模扩展模型预训练,而无需像竞争对手那样承受高昂的外部芯片采购成本。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月17日
19:40
Rohan Paul@rohanpaul_ai
62
超越语义相似性:通过直接语料交互重新思考代理搜索的检索

研究表明,AI代理使用grep、文件读取等基础终端工具直接搜索原始数据,在多项基准测试中表现远超传统语义检索系统。例如,在BrowseComp-Plus基准上,终端搜索将准确率从69%提升至80%,同时降低成本。核心观点在于,检索不仅是模型问题,更是交互界面问题。直接语料交互允许代理进行精确字符串搜索、检查上下文并持续验证假设,从而从已定位文档中提取更多有效证据,其增益主要来自更充分地利用已发现文档,而非找到更多相关文档。局限性在于,随着语料库规模扩大,定位初始锚点的成本迅速增加,因此终端搜索无法完全替代大型索引。但对于强大AI代理,性能瓶颈可能在于工具允许其“触及”数据的深度。

智能体MCP/工具大佬观点搜索
07:54
Berryxia.AI@berryxia
55
喜大普奔啊,兄弟们! 不要浪费X的订阅了! 大家现在可以在 Hermes Agent 中使用 X Premium 订阅,并且 Hermes Agent 现在可以搜索 X 帖子。 https://x.ai/news/grok-hermes

xAI: You can now use X Premium subscriptions in Hermes Agent, and Hermes Agent can now search X posts. https://x.ai/news/grok...

智能体产品更新搜索
05:13
🚨 AI News | TestingCatalog@testingcatalog
64
HERMES 🔥: X Premium+ 用户现可在 Hermes Agent 中使用其订阅权益访问 Grok! 此外,他们还能使用 X 搜索工具,这使 Hermes 目前处于相当独特的位置。 现在已不仅是 OpenClaw 与 Hermes 的较量。 这再次成为 OpenAI 与 xAI 的对决 👀

Nous Research: xAI has expanded access to X Premium+ subscribers in Hermes Agent. Enjoy!

智能体xAI产品更新搜索
04:21
xAI@xai
精选65
你现在可以在 Hermes Agent 中使用 X Premium 订阅,并且 Hermes Agent 现在可以搜索 X 帖子。 https://x.ai/news/grok-hermes 【引用 @xai】:You can now use your @grok subscription inside @NousResearch Hermes Agent. http://x.ai/news/grok-hermes

xAI: You can now use your @grok subscription inside @NousResearch Hermes Agent. http://x.ai/news/grok-hermes

智能体xAI产品更新搜索

推荐理由:xAI 把 Grok 和 X 搜索带到 Hermes Agent,看着是功能更新,其实在把自家数据和模型能力向第三方 agent 开放,这一步比新模型更值得追踪,做 agent 的该看看。
5月16日
02:32
Chubby♨️@kimmonismus
70
AI助手Sai化身虚拟同事,自主完成深度研究

AI工具Sai被设计为拥有独立桌面的“虚拟同事”,而非仅提供聊天窗口。用户可向其下达“深度研究某主题”等指令后离线,Sai会在安全的工作空间内自主操作:打开标签页、点击应用、阅读并交叉引用资料、做笔记,其工作方式类似人类研究员。任务完成后,它会整理好引用来源,并在执行任何潜在风险操作前请求用户批准。这展示了“始终在线”的计算机使用代理的实际形态。

智能体搜索教程/实践
01:37
Rohan Paul@rohanpaul_ai
70
X平台开源最新"For You"信息流推荐算法

X平台(原推特)已将其最新的“For You”信息流推荐算法在GitHub上开源。新算法从依赖点赞、转发等硬性规则排序,转向更接近Grok风格的AI智能排名系统。该系统通过Thunder实时获取用户关注账号的帖子,再通过Phoenix从全平台检索相关的外部内容进行补充。其核心排名模型不再单一判断帖子质量,而是像Transformer模型一样,将用户、帖子和历史行为作为一个整体进行预测,评估用户可能进行回复、点赞、转发、观看或跳过等多种互动可能性,从而实现更个性化的内容推荐。

Elon Musk: The latest X algorithm has been published to GitHub https://github.com/xai-org/x-algorithm

GitHubxAI开源/仓库开源生态
00:42
AYi@AYi_AInotes
72
马斯克开源了最新的X 算法(2026.5.15)

马斯克将X平台“For You”推荐算法开源。其核心是使用Grok Transformer端到端预测用户对帖子各项互动动作的概率,并通过加权求和得出最终得分以决定推荐。推荐流水线包含用户画像、候选池检索、元数据补全、硬过滤、打分及最终选择六个步骤。对创作者的启示包括:必带媒体内容提升点击与停留时长、设计高互动钩子、避免同一主题连发以防被惩罚、警惕引发负向互动信号。值得注意的是,本次开源了流程代码与架构,但未公开具体的模型权重、训练数据及生产环境参数。

Elon Musk: The latest X algorithm has been published to GitHub https://github.com/xai-org/x-algorithm

xAI开源生态搜索教程/实践
5月15日
22:39
DogeDesigner@cb_doge
46
埃隆·马斯克分享了他对由Grok驱动的新X算法的目标。 "即使是一个零粉丝的新用户发布内容,只要内容本身足够优质,就应当能被大量用户看到。这是我们的目标。"
xAI大佬观点搜索
5月14日
23:15
Perplexity@perplexity_ai
精选68
计算机现已连接至Snowflake。 可基于实时仓库数据开展端到端工作,通过SQL、源表、筛选器和指标获取答案。 这就像一支随时待命的个人数据科学团队,从公司实时数据中提供精准答案。
产品更新搜索

推荐理由:Computer 接入 Snowflake,等于给公司内部数据分析配了个可对话的 SQL 助手,做报表的人可以试试,但暂时只是便利性提升,不算根本性的变化。
20:51
ginobefun@hongming731
66
BestBlogs 2.3.0 发布

BestBlogs 2.3.0 推出,主要更新包括新用户完成引导可免费体验7天Pro服务;文章、播客等详情页向所有人开放,无需登录;Pro中心重新设计,整合本周阅读、AI用量等功能于一屏。同时开放老用户14天Pro福利和邀请体验入口。该版本旨在从内容聚合站转向个人化阅读工作流,帮助用户筛选有价值信息,减轻阅读焦虑。

产品更新搜索
11:51
Berryxia.AI@berryxia
66
Exa实验揭示:提升LLM搜索能力,工具效率或比堆算力更重要

ExaAILabs的一项关键实验表明,在强化学习阶段训练大语言模型的搜索能力时,使用其Exa搜索API替代Google数据,不仅能使模型达到更高性能,还可节省高达70%的训练算力。这一结果直接挑战了“提升AI搜索能力主要依赖增加算力”的普遍观点,揭示了搜索工具本身的质量与效率可能更具决定性影响。该发现为从事AI Agent、RAG以及训练具备搜索能力大模型的团队提供了重要启示,意味着未来LLM训练的效率竞争可能始于对底层工具的选择。

Exa: How does Exa compare to Google for training LLMs to search? In this blog post, we find that LLMs using Exa during reinfo...

检索增强搜索数据/训练论文/研究
5月13日
22:34
Rohan Paul@rohanpaul_ai
60
X平台首开全AI运营电台,24小时播报AI动态

X平台推出了首个完全由AI运营的电台,全天候为AI构建者和创始人播报新闻。该电台实时追踪GitHub、HuggingFace等多个平台的动态,将分散信息整合成连续音频流。其核心挑战在于信息排序而非语音生成,系统需判断哪些代码更新、模型发布或社区讨论值得关注。电台拥有五位具备编辑判断力、记忆和个性的AI主播,他们不仅能播报信息,还会识别模式、发现矛盾并论证观点。内容涵盖突发新闻、工具趋势、融资动态及社区观点,旨在帮助用户高效把握AI领域重要动向。

thehype.: Meet the 1st radio on X fully run by AI. Covers AI news 24/7, always on. Designed for builders and founders. Live right ...

产品更新搜索语音
00:03
DogeDesigner@cb_doge
71
Grok接入Gmail,智能邮件助手革新收件箱管理

Grok现已支持连接Gmail,用户可通过自然语言指令对收件箱进行智能查询与管理。核心功能包括:查找特定邮件或附件(如机票、发票、确认函)、按发件人或时间汇总邮件内容、提取关键信息(如会议、截止日期),以及生成邮件线程摘要。该集成旨在将传统收件箱转化为可智能交互的信息库,提升邮件处理效率与实用性。

xAI产品更新搜索
5月12日
01:35
Google Gemini@GeminiApp
63
Personal Intelligence 可帮助您打造完全个性化的旅行行程。 它通过关联您 @Gmail、@GooglePhotos、@Google 搜索和 @YouTube 历史记录中的信息点来节省时间。 您可随时选择要连接的应用程序并管理个性化设置 🧵
Google产品更新搜索
5月11日
15:30
Peter Steinberger 🦞@steipete
50
Birdclaw保存了我完整的推特存档,因此我可以向Codex查询任何我曾点赞或收藏的旧推文。https://birdclaw.sh
智能体OpenAI搜索教程/实践
5月9日
20:51
Chubby♨️@kimmonismus
64
百度ERNIE 5.1以极低预训练成本逼近SOTA

百度发布的ERNIE 5.1模型基于ERNIE 5.0预训练基础,宣称在搜索、推理、知识问答、创意写作和智能体能力方面获得提升,而其预训练成本仅为同类可比模型的约6%。该模型在Arena搜索排行榜以1223分位列第四,ERNIE 5.1 Preview在LMArena Text上取得1476分,全球排名第十三。推文作者指出目前未见技术论文,需验证其宣称的低成本高性能表现,但若属实将意义重大。

Baidu Inc.: ERNIE 5.1 just dropped. Built on ERNIE 5.0's pre-training foundation, our latest foundation model upgrades search, reaso...

推理搜索模型发布
16:29
🚨 AI News | TestingCatalog@testingcatalog
72
百度发布了基于ERNIE 5.0预训练基础的最新大模型ERNIE 5.1预览版。该模型在搜索、推理、知识问答、创意写作和智能体能力方面进行了升级。根据官方引用信息,ERNIE 5.1在Search Arena的全球搜索排行榜上位列第四,得分为1223分。这一排名反映了其更强的多源检索与信息综合能力,有助于在内容生成、AI助手、企业知识管理和智能体应用中提供更一致、可靠的答案。

Baidu Inc.: ERNIE 5.1 ranked No. 4 globally on @arena's Search Leaderboard, with a score of 1,223. That ranking reflects stronger mu...

智能体搜索模型发布
15:19
Baidu Inc.@Baidu_Inc
73
ERNIE 5.1 刚刚发布。 基于 ERNIE 5.0 的预训练基础,我们最新的基础模型升级了搜索、推理、知识问答、创意写作和智能体能力,而预训练成本仅需对标模型的约 6%。 更多内容详见主题帖 🧵
智能体推理搜索模型发布
01:48
Google AI Developers@googleaidevs
22
周末社区作品征集! 你有展示 Gemma 4 多令牌预测(MTP)草稿器、文件搜索工具更新或 Gemini API 中 Webhooks 的项目或演示吗? 在评论区分享出来,让它们发光 🌟
Google其他搜索部署/工程
00:54
Google AI@GoogleAI
49
谷歌I/O大会前11天持续发布多项AI产品更新

距离谷歌I/O大会仅11天,公司本周推出了一系列AI产品更新。Google Health应用集成Gemini,利用穿戴设备、健康应用和医疗记录提供个性化健康指导。Gemma 4引入多令牌预测技术,可将工作流速度提升高达3倍。NotebookLM新增自动源文件整理和可定制思维导图功能。Gemini API的文件搜索工具升级,支持多模态、自定义元数据和页面引用,并加入Webhooks推送通知以替代轮询。此外,Nano Banana、Veo和Google Photos Remix等热门AI功能现已登陆Google TV平台。

Google产品更新搜索部署/工程
5月8日
23:35
Berryxia.AI@berryxia
66
作者免费发布《GEO红皮书》,旨在整治GEO行业黑帽手段、割韭菜等乱象。基于前沿论文、生成式AI法规和实战经验,红皮书系统拆解55种GEO风险,提供自查清单和治理框架,帮助中小企业在AI时代规范营销,促进行业回归理性。

姚金刚: 我们的第一份《GEO红皮书》发布了 去年,和 @vista8 向阳老师一起发布了GEO白皮书,收到不少朋友的正向反馈 大半年过去了,国内GEO行业发展得很快,但乱象也比较多,比如黑帽GEO横行、各种割韭菜、虚假承诺... 很多人,对GEO也...

搜索教程/实践
18:49
向阳乔木@vista8
32
GEO行业乱象丛生,《红皮书》助力企业理性营销

作者与姚老师继年初发布《GEO白皮书》后,观察到行业在2025年出现严重变质,黑帽GEO手段泛滥、服务商良莠不齐、虚假承诺盛行,甚至被央视315点名。为促使行业回归理性,帮助中小企业有效利用AI进行营销,他们结合前沿学术论文、相关法规及自身实战经验,整理发布了《GEO红皮书》。该书旨在揭露黑帽GEO手法、提供服务商甄别指南,并给出风险自查清单,以协助企业规避陷阱,目前可免费获取。

其他搜索现象/趋势
12:21
Berryxia.AI@berryxia
68
优化表格Agent检索效率:Ramp Labs集成Fast Ask子代理

Ramp Labs在Ramp Sheets的Spreadsheet Agent中深度集成了Fast Ask检索子代理,解决了传统表格Agent因读取范围不当导致的效率低下和成本高昂问题。该子代理能自动导航并读取最相关数据范围,仅返回精炼答案,减少上下文污染与token消耗。其基于开源Qwen3.5-35B-A3B模型,通过与Prime Intellect合作进行RL后训练优化。实际应用中,它消除了主代理17.8%的无效工具调用,延迟接近Claude Haiku 4.5,准确率比Claude Opus 4.6高4个百分点,实现了更快、更准、更经济的系统性能。

Ramp Labs: http://x.com/i/article/2052422965019439105

智能体搜索教程/实践部署/工程
00:36
elvis@omarsar0
39
Hacker News → LLM Artifact 我构建了最个性化的HN订阅源。 它仅根据记忆和LLM知识库追踪我研究的相关主题。 存储书签已无意义。 通过一些自动化流程、规则、技能和主动代理,你可以将订阅源定制成任何你想要的样子。
智能体大佬观点搜索
00:06
凡人小北@frxiaobei
精选81
作者宣布,将新书《AI营销:从SEO到GEO》中配套的25个AI营销与GEO相关提示词开源至GitHub。此次更新还补充了部分短视频和文案相关的提示词,所有资源已在指定仓库公开,供用户下载使用或重新拉取。

姚金刚: 和 @vista8 讨论了下,决定将我们的新书《AI营销:从SEO到GEO》里配套的25个AI营销与GEO相关的提示词,也开源到GitHub 另外补充了部分短视频和文案相关的提示词,欢迎下载使用或重新拉取 1、提示词合集地址: https:...

GitHub开源/仓库搜索

推荐理由:不是又一个提示词合集,而是把《AI营销》书里的实操技巧拆成了现成指令,短视频和GEO部分尤其解渴,做内容营销的建议直接fork。
5月7日
20:43
向阳乔木@vista8
74
开源,通通开源,哈哈哈。 【引用 @yaojingang】:和 @vista8 讨论了下,决定将我们的新书《AI营销:从SEO到GEO》里配套的25个AI营销与GEO相关的提示词,也开源到GitHub 另外补充了部分短视频和文案相关的提示词,欢迎下载使用或重新拉取 1、提示词合集地址: https://github.com/yaojingang/yao-open-promptsGEO 2、GEO提示词合集: https://github.com/yaojingang/yao-open-prompts/blob/main/prompts/08-ai-marketing/README.md

姚金刚: 和 @vista8 讨论了下,决定将我们的新书《AI营销:从SEO到GEO》里配套的25个AI营销与GEO相关的提示词,也开源到GitHub 另外补充了部分短视频和文案相关的提示词,欢迎下载使用或重新拉取 1、提示词合集地址: https:...

开源生态搜索教程/实践
12:20
Berryxia.AI@berryxia
70
推文推荐免费网站aihot.virxact.com,可直接追踪AI信息。该平台由公众号顶流博主卡兹克(@Khazix0918)公开其日常使用的优质信息源,无需登录即可访问,采用时间线形式便于查找,并分类整合官方信源、优质博主和推友等内容,还包括公众号监测和AI日报。用户通过此平台可使自己的AI信息源与顶流博主保持一致。

Jackywine: 公众号顶流千万粉丝博主 @Khazix0918 卡兹克把他每天看的优质信息源放出来了: - 无需登录,直接看 - 时间线形式,好查找 - 区分了官方信源、优质博主、推友 - 甚至还有公众号监测和 AI 日报 从此你的 AI 信息源和顶流博主...

搜索教程/实践
5月6日
22:37
Perplexity@perplexity_ai
精选71
Perplexity Agent API 现已提供金融搜索功能。 开发者只需一次工具调用,即可为需要当前可验证金融答案的智能体获取授权金融数据集、实时市场数据和附引用的网络资源。
产品更新搜索

推荐理由:Perplexity 把金融搜索拆成 API 端点,对于做金融 Agent 的开发者是实打实的生产力提升,属于‘一调即用’那种,可以跳过一堆数据集成工作。
08:17
Berryxia.AI@berryxia
64
Google NotebookLM思维导图新增自定义、组织与导航功能

Google NotebookLM的思维导图功能正进行重大升级,新功能从今天起推出。核心更新包括自定义功能,用户可通过特定提示词引导MindMap的生成方向;组织功能支持立即重命名和分享MindMap,提升管理效率;导航功能优化了节点之间的过渡,实现更丝滑的交互体验。此次升级旨在增强工具的灵活性和用户体验,并邀请用户反馈意见。

Google产品更新搜索
03:32
TestingCatalog News 🗞@testingcatalog
52
Perplexity发布了Perplexity Computer for Professional Finance,具备引导式工作流程和新的数据提供商。 此外,所有回答均可追溯至来源!

Perplexity: Every output is traceable. Computer shows where the data came from and links directly to the source behind key numbers. ...

产品更新搜索
03:32
TestingCatalog News 🗞@testingcatalog
67
Perplexity 新增了一个 artifacts 标签页!这里似乎列出了 Perplexity 和 Perplexity Computer 中所有先前生成的 artifacts。 还可以进行固定操作 👀
产品更新搜索
01:31
Perplexity@perplexity_ai
精选71
Perplexity和Computer现已接入优质健康资源,首批包括NEJM和BMJ集团,另有9种医学期刊和临床数据库即将上线。 提出健康问题,即可获得来自医院和研究机构所信赖的相同来源的引用答案。
产品更新搜索

推荐理由:医疗信息最怕不靠谱,Perplexity 直接接进 NEJM 和 BMJ 这种顶刊,等于把医生的参考资料装进 AI,查健康问题终于不用在营销文里盲人摸象了。
5月5日
05:49
AK@_akhaliq
55
Web2BigTable 一个用于互联网规模信息搜索与提取的双层多智能体LLM系统 论文: https://huggingface.co/papers/2604.27221
智能体搜索论文/研究
00:58
TestingCatalog News 🗞@testingcatalog
61
TinyFish宣布其网页搜索与抓取功能即日起向所有开发者和AI智能体免费开放,并提供宽松的调用频率限制。搜索功能可为智能体提供低延迟响应,抓取功能支持真实浏览器渲染、纯净Markdown或JSON格式输出。该服务兼容Claude Code、OpenClaw、Cursor、Codex、n8n、Dify等多种开发环境和AI工具。用户无需绑定信用卡即可通过指定链接获取API密钥。

TinyFish: Starting today, TinyFish Web Search and Fetch are free. For every dev and agent. Across the galaxy. No credit card. Gene...

智能体产品更新搜索
00:28
TestingCatalog News 🗞@testingcatalog
45
Perplexity 正在开发一项新的 Digest 功能。 该功能似乎与即将推出的 Perplexity Computer Context 相关联,并可能能够从已连接来源提取近期上下文,整合成个人聚合摘要。
产品更新搜索
5月4日
17:46
Chubby♨️@kimmonismus
31
为什么Windows的搜索功能如此糟糕?我无法理解。一方面,Windows想把CoPilot AI集成到各处。然后操作系统的搜索功能却差到连最简单的东西都找不到。
其他搜索
5月2日
01:11
阿绎 AYi@AYi_AInotes
48
X下载量创历史新高,实时社交网络护城河显现

尽管长期存在唱衰言论,X在4月的App Store下载量却创下历史新高,较此前峰值增长40%,呈现断层式跳跃。这反驳了用户流向Bluesky、Threads或产品被毁的论调,下载量被视为用户“用脚投票”的最硬指标。增长归因于团队过去18个月对Grok集成、视频体验、社区功能的持续改进,以及4月新闻周期让X重回“刷大事”的核心场景。许多用户从Bluesky回流,凸显了“实时、开放、全球共时讨论”的护城河效应。然而,下载量只是领先指标,bot泛滥、创作者变现政策不稳定、应用性能等问题若不能解决,增长可能昙花一现。未来6-12个月的关键在于提升留存与变现,若能实现,X将进入全新增长周期。此事冲击行业认知,证明“安全可控的算法投喂”并非唯一答案,“言论自由、实时、开放”的模式依然拥有强大生命力。

Elon Musk: X

搜索现象/趋势
5月1日
09:45
Orange AI@oran_ge
19
AI 推荐我读这本书,我就买了 昨晚8点开始看,看到9点就困了 然后一觉睡到早晨6点,睡了整整9小时 好书啊
其他搜索
06:10
ginobefun@hongming731
68
本文介绍了一套提升内容在主流AI(如ChatGPT、Claude)中可见性的实用方法,核心是主动提供结构化数据。关键步骤包括:在网站部署`llms.txt`文件概述站点;在`robots.txt`中允许AI搜索爬虫;向Google、Bing等提交Sitemap并利用其工具监测AI引用;参与Perplexity出版者计划;使用JSON-LD结构化数据标记内容;甚至可为AI创建专用知识端点,集中提供实时更新的结构化信息。这些做法旨在帮助AI更准确、高效地理解内容,而非制造垃圾信息。

Tw93: 这几天,有好几个小伙伴@我说,我的一些作品在他们问 AI 的时候主动被推荐了,很神奇,我想了想感觉啥也没有做,居然可以被收录,那要不要做点更体系化的事情来整一整让现在所有的主流 AI 能够更好的知晓我的内容、产品、想法,于是就开干了。 首先...

搜索教程/实践部署/工程
02:09
Rohan Paul@rohanpaul_ai
56
谷歌AI领先优势源于长期战略投资,非仓促应对ChatGPT

《时代》杂志指出,谷歌在人工智能领域的领先地位,源于CEO桑达尔·皮查伊早期对DeepMind、TPU芯片、云基础设施及AI产品的一系列长期投资,而非对ChatGPT的仓促反应。其核心优势在于对研究、芯片、云服务、产品和覆盖数十亿用户的分发渠道实现全栈控制。通过将定制芯片制造与统一的研究实验室深度融合,谷歌获得了对AI架构的绝对控制权,能利用自研TPU高效执行复杂计算,同时让工程师得以低成本大规模扩展模型预训练,而无需像竞争对手那样承受高昂的外部芯片采购成本。

DeepMindGoogle大佬观点搜索
‹ 上一页
1234
下一页 ›