AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「开源/仓库」清除
5月16日周六
20:42AYi60飞书 CLI 工具开源45天破万星,AI 透明操作获开发者认可
19:01Hacker News 热门(buzzing.cc 中文翻译)67Orthrus-Qwen3:在Qwen3上每步最多可处理7.8个令牌,输出分布与原版完全一致
16:42AYi66OpenAI向Zed编辑器共享ChatGPT订阅额度
06:31Hacker News 热门(buzzing.cc 中文翻译)64Image-blaster:仅凭一张图片即可生成3D场景、特效和网格
01:37Rohan Paul70X平台开源最新"For You"信息流推荐算法
5月15日周五
23:35Microsoft Research67精选微软研究院发布AI新工具与模型
22:57小互74开源项目OpenSquilla:智能路由降低AI成本近十倍,兼容多平台与模型
22:54Berryxia.AI65X算法开源发布,普通人创作者用途引思考
22:42IT之家(RSS)54高德推出"华为鸿蒙 HarmonyOS 首个生成式 UI 开源框架"AGenUI,利用通用协议适配多终端界面
22:04Greg Brockman69Codex技能:一键发掘本地潜在建站客户
20:49HuggingFace Daily Papers(社区热门论文)68Sat3DGen:从单张卫星图像生成全面的街景级3D场景
20:30Hacker News 热门(buzzing.cc 中文翻译)78精选Show HN: 根据基准测试排名,为您的硬件寻找最适合的本地 LLM
19:30Hacker News 热门(buzzing.cc 中文翻译)71精选克劳德(法律事务)
12:06Orange AI61开源一个月的时间,飞书 CLI 在 Github 破万星了。 相比同期的一些 CLI,飞书这个确实是群里口碑最好的。 为 Agent 做软件这件事,飞书践行得很好。
11:54歸藏(guizang.ai)55藏师傅PPT项目GitHub星数近万
11:02蚂蚁 inclusionAI:HuggingFace 新模型56精选蚂蚁集团提出 ARGenSeg-8B:基于自回归图像生成模型的图像分割框架
09:51Berryxia.AI75精选牛津大学博士后开源视频翻译工具Violin,支持多语言翻译与视频对话
08:51Berryxia.AI74Yetone发布Native Feel桌面应用开发Agent Skill
07:51Berryxia.AI32LM Studio 又更新了 Beta 版,在MLX框架下优化增强了之前的缓存问题。 目前需要打开dev模式然后加油更新到最新版体验。
06:01Simon Willison 博客28datasette-agent 0.1a1版本发布
05:06Peter Steinberger 🦞55OpenClaw 新版发布:性能与稳定性全面升级
00:56Simon Willison 博客58Datasette IP速率限制插件发布,应对恶意爬虫访问
00:51Berryxia.AI82精选Tom 兄弟开源 html-anything,赋能 AI Agent 输出高质量 HTML
5月14日周四
23:51Berryxia.AI65MLX CUDA后端测试全通过,跨平台本地AI时代来临
23:31蚂蚁 inclusionAI:HuggingFace 新模型59精选蚂蚁 inclusionAI 推出万亿参数推理模型 Ring-2.6-1T
22:51Berryxia.AI68腾讯AI团队开源Agent记忆系统,攻克长会话上下文丢失难题
19:58公众号:龙猫LongCat(美团)51美团 LongCat 开源 General 365:树立推理评测新标尺
19:15SenseTime77精选SenseNova U1技术报告发布,基于MoE架构开放模型权重
17:38🚨 AI News | TestingCatalog70OpenSquilla发布开源AI代理,主打高性价比长时任务
15:40IT之家(RSS)74精选"让 Token 消耗降低 61%":腾讯开源 Agent Memory
12:07宝玉80精选微信群聊总结Skill新增,依赖wx-cli配置
10:56向阳乔木72开源项目OpenSquilla:智能路由与本地检索,大幅降低LLM使用成本
08:00HuggingFace Daily Papers(社区热门论文)53EndPrompt:通过末端锚定高效扩展长上下文
07:35Orange AI58登科与我开发AI Agent坦克大战游戏
5月13日周三
23:39Emad71开源psql_bm25s,让PostgreSQL多智能体检索提速23倍
21:28Hacker News 热门(buzzing.cc 中文翻译)70Show HN: Statewright--让人工智能代理更可靠的可视化状态机
14:43SenseTime72精选SenseNova-U1 技术报告深度发布:前沿原生多模态模型构建全指南
14:04Peter Steinberger 🦞68微软助力OpenClaw企业级适配
13:39IT之家(RSS)60面壁智能 MiniCPM-V 4.6 发布开源:1.3B 参数仅需 6G 内存即可流畅运行
12:55向阳乔木60开源博客系统助博主快速建站,bug待后续更新
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月16日
20:42
AYi@AYi_AInotes
60
飞书官方 CLI 工具 lark-cli 开源45天后 GitHub star 数突破1万,成为国内首个破万星的办公套件开源项目。其核心在于允许 AI 通过命令行直接操作飞书,执行建群、建文档等任务,且每一步操作都可见、可预览、可审查,与 MCP 等云端不可见模式形成对比。更关键的生态指标是,飞书主干已合并了10位外部开发者的代码,而同类产品钉钉和企业微信则为零,体现了真实的开发者参与。这种透明可控的特性是开发者放心将任务交给 AI Agent 的重要前提。

AYi: 刚刚花三分钟装了飞书官方那个 CLI 工具, 跑了一句话,建群、建文档、发通知,一次性全做完了, 我盯着终端看了几秒钟, 才反应过来这玩意儿真的能让 AI 直接操作飞书。 装的过程没啥可说的, 一行 npx @larksuite/cli@l...

智能体MCP/工具OpenAI开源/仓库
19:01
Hacker News 热门(buzzing.cc 中文翻译)
67
Orthrus-Qwen3:在Qwen3上每步最多可处理7.8个令牌,输出分布与原版完全一致

Orthrus-Qwen3项目在Qwen3模型上实现了每次前向传播最高可处理7.8个令牌的性能,同时确保输出分布与原版模型完全一致。该项目已在GitHub开源,并在Hacker News社区获得102点热度。这一优化显著提升了模型推理效率,且保持了生成结果的准确性。

GitHub开源/仓库推理
16:42
AYi@AYi_AInotes
66
OpenAI向Zed编辑器共享ChatGPT订阅额度

在多数AI服务按token涨价之际,OpenAI采取了相反策略,将其ChatGPT的订阅额度共享给了代码编辑器Zed。用户无需额外付费,即可在Zed中直接使用该额度。关键细节在于,Zed中消耗的额度与ChatGPT网页版的订阅限额是共享且实时同步的。这意味着用户在Zed中用尽额度后,仍可返回ChatGPT网页版继续使用其服务。这一合作被形象地比作Codex(OpenAI的代码生成模型)与Zed编辑器的深度结合。

Tibo: Codex🫸🫷Zed

OpenAI产品更新开源/仓库编码
06:31
Hacker News 热门(buzzing.cc 中文翻译)
64
Image-blaster:仅凭一张图片即可生成3D场景、特效和网格

Image-blaster是一款开源工具,能够仅凭单张输入图片自动生成对应的3D场景、特效和网格模型。该项目已在GitHub平台发布,获得了开发者社区的关注,在Hacker News上收获了102个投票。这一技术简化了3D内容创作流程,有望降低相关领域的制作门槛。

图像生成多模态开源/仓库
01:37
Rohan Paul@rohanpaul_ai
70
X平台开源最新"For You"信息流推荐算法

X平台(原推特)已将其最新的“For You”信息流推荐算法在GitHub上开源。新算法从依赖点赞、转发等硬性规则排序,转向更接近Grok风格的AI智能排名系统。该系统通过Thunder实时获取用户关注账号的帖子,再通过Phoenix从全平台检索相关的外部内容进行补充。其核心排名模型不再单一判断帖子质量,而是像Transformer模型一样,将用户、帖子和历史行为作为一个整体进行预测,评估用户可能进行回复、点赞、转发、观看或跳过等多种互动可能性,从而实现更个性化的内容推荐。

Elon Musk: The latest X algorithm has been published to GitHub https://github.com/xai-org/x-algorithm

GitHubxAI开源/仓库开源生态
5月15日
23:35
Microsoft Research@MSFTResearch
精选67
微软研究院的新工具、模型、代码库和论文现已发布。 使用AI和智能体?值得关注: • MSR AI Frontiers的MagenticLite • 智能体化GitHub工作流 • 验证优先智能体 • 意义匹配微调 • AI转型与经济发展
智能体Microsoft开源/仓库行业动态

推荐理由:微软研究院这波把 agent 工具链摊开了,MagenticLite 轻量框架和 verification-first 思路值得跟,做智能体的可以去 GitHub 翻翻。
22:57
小互@xiaohu
74
开源项目OpenSquilla:智能路由降低AI成本近十倍,兼容多平台与模型

开源项目OpenSquilla通过智能路由架构,在保持与OpenClaw相近性能(0.9251分)的同时,将复杂AI任务处理成本从6美元大幅降至0.68美元。其核心是将简单任务分配给廉价模型,仅复杂任务调用Opus等顶级模型。系统具备四层记忆结构模拟人脑认知,支持按需加载16种工具,并设有三档代码沙箱安全防护。项目提供统一后端,支持网页、命令行及Slack、飞书等平台接入,兼容OpenAI、Claude、Gemini、DeepSeek等20余家主流模型。

智能体MCP/工具开源/仓库
22:54
Berryxia.AI@berryxia
65
X算法开源发布,普通人创作者用途引思考

兄弟们,老马将𝕏的最新算法公布了。 已经开源到Github上,对于我们普通人这东西有啥用呢? 🤔 创作者真的可以通过算法而“有利可图?” 创作迎合算法的内容还是.....? 地址:https://github.com/xai-org/x-algorithm 我已经让opus 4.7 拉满跑起来了

Elon Musk: The latest X algorithm has been published to GitHub https://github.com/xai-org/x-algorithm

GitHubxAI开源/仓库
22:42
IT之家(RSS)
54
高德推出"华为鸿蒙 HarmonyOS 首个生成式 UI 开源框架"AGenUI,利用通用协议适配多终端界面

高德发布鸿蒙系统首个生成式UI开源框架AGenUI。该框架基于谷歌A2UI协议,以C++为核心,能将AI大模型生成的界面意图直接转化为鸿蒙原生组件,实现手机、平板、车机等多终端无缝适配。它深度适配鸿蒙全场景架构,直连系统渲染与分布式能力,无中间层损耗。性能上,相比iOS和Android版本,其渲染性能提升20%,内存占用降低18%。AGenUI已全面开源,旨在推动生成式UI成为鸿蒙生态的系统级标准能力。

开源/仓库部署/工程
22:04
Greg Brockman@gdb
69
开发者发布了一款开源的Codex技能,旨在将本地搜索转化为潜在客户线索。该工具能自动搜索附近的各类本地商户,并分析其是否拥有独立网站或仅依赖社交媒体页面,以此判断其建站需求。核心功能包括潜在客户挖掘、网站与纯社交媒体状态检查、线索评分、提取联系方式,并支持聊天或CSV格式输出。用户可通过一条命令快速安装使用。

Kappaemme: CODEX SKILL THAT TURNS LOCAL SEARCH INTO CLIENT LEADS! I made a Codex skill that helps find local businesses that may ne...

智能体MCP/工具开源/仓库
20:49
HuggingFace Daily Papers(社区热门论文)
68
Sat3DGen:从单张卫星图像生成全面的街景级3D场景

Sat3DGen提出了一种从单张卫星图像生成街景级3D场景的新方法。针对现有方法在几何保真度与语义丰富性间的权衡难题,该方法采用“几何优先”策略,通过整合新颖的几何约束与视角训练策略,有效缓解了因视角差异大、监督稀疏导致的几何失真。在基于VIGOR-OOD测试集与新构建的高分辨率DSM基准上,该方法将几何RMSE从6.76米显著降至5.20米,同时大幅提升视觉真实感(FID从约40优化至19)。所生成的高质量3D资源可支持语义地图转3D合成、多相机视频生成等多种下游应用。代码已开源。

图像生成开源/仓库论文/研究
20:30
Hacker News 热门(buzzing.cc 中文翻译)
精选78
Show HN: 根据基准测试排名,为您的硬件寻找最适合的本地 LLM

一个名为“WhichLLM”的开源工具已在GitHub发布,可根据用户硬件配置推荐最适合的本地大语言模型。该工具通过基准测试对各类模型进行排名,帮助用户依据自身设备的性能指标选择最优模型。项目在Hacker News上获得116点热度,显示出社区对本地化AI部署效率工具的积极关注。

开源/仓库端侧部署/工程

推荐理由:选本地 LLM 不再靠猜,这个工具把基准测试和硬件匹配做得像查配置表,刚接触端侧的人也能立刻上手。
19:30
Hacker News 热门(buzzing.cc 中文翻译)
精选71
克劳德(法律事务)

Anthropic公司在GitHub上开源了专为法律领域优化的AI模型“Claude for Legal”。该模型能更准确地处理法律文本、合同及案例摘要,旨在提升法律从业者效率。此消息在Hacker News上获得105个投票点数,显示出技术社区对其在法律科技领域应用潜力的关注。

Anthropic开源/仓库推理

推荐理由:Anthropic 把 Claude 在法律场景的提示和工具打包成仓库,对法律人来说比 API 文档更直接可用,垂直落地信号明显。
12:06
Orange AI@oran_ge
61
开源一个月的时间,飞书 CLI 在 Github 破万星了。 相比同期的一些 CLI,飞书这个确实是群里口碑最好的。 为 Agent 做软件这件事,飞书践行得很好。
智能体开源/仓库部署/工程
11:54
歸藏(guizang.ai)@op7418
55
藏师傅的 PPT Skills,感觉 GitHub star 马上就要破万了呀! 没点 star 的朋友点点 star 吧,谢谢了。 顺便让 Codex 分析了一下安装的数据,还挺有意思的。

歸藏(guizang.ai): http://x.com/i/article/2053655813877870592

智能体开源/仓库
11:02
蚂蚁 inclusionAI:HuggingFace 新模型
精选56
蚂蚁集团提出 ARGenSeg-8B:基于自回归图像生成模型的图像分割框架

蚂蚁集团推出 ARGenSeg-8B,一种将多模态理解与像素级感知统一的自回归图像生成分割框架。它利用多模态大语言模型(MLLM)输出视觉 token,并通过通用 VQ-VAE 解码为分割掩码,使分割完全依赖 MLLM 的像素级理解。采用 next-scale-prediction 策略并行生成视觉 token,降低推理延迟。在多个分割数据集上超越此前最优方法,推理速度显著提升。论文已被 NeurIPS 2025 接收,模型已发布在 HuggingFace。

Hugging Face多模态开源/仓库模型发布

推荐理由:蚂蚁提出用自回归生成做分割,把理解和像素级感知统一到一个框架里,多个数据集SOTA且速度更快,做CV的值得看看。
09:51
Berryxia.AI@berryxia
精选75
牛津大学博士后开源视频翻译工具Violin,支持多语言翻译与视频对话

牛津大学博士后Kevin Lin开源视频翻译工具Violin,旨在打破高质量视频内容的语言壁垒。该工具将语音识别、大语言模型翻译与语音合成整合为自动化流水线,支持多语言互译与个性化翻译风格调整,例如将学术报告转化为儿童易懂版本。用户还能直接与视频内容进行对话并获取相关答案。Violin提供Web应用、命令行界面和Agent Skill三种使用方式,所有功能基于MIT协议开源,由Together Compute提供技术支持,适用于内容创作、教育及多模态智能体开发等领域。

Kevin Lin: 🌟Introducing🎻Violin - an Open-source Video Translation Skill. 📹Video is the dominant medium on the internet, yet most...

GitHub多模态开源/仓库语音

推荐理由:视频翻译过去得拼几个 API,Violin 一个开源 Skill 把 ASR、翻译、TTS 全通了,还加上视频对话和风格定制,做多语言内容传播的必须收藏。
08:51
Berryxia.AI@berryxia
74
开发者Yetone将一篇关于桌面应用开发"最佳实践"的文章转化为一个名为"native-feel-skill"的Agent Skill。该Skill旨在帮助开发者利用Coding Agent,轻松地重构或开发跨平台桌面应用,并使其获得极其接近Native原生应用的性能体验。项目代码已开源在GitHub上。

yetone: 由于这篇文章太伟大了,所以我把它变成了一个 Agent Skill。 大家可以使用自己的 Coding Agent 安装一下这个 Skill,这样就可以用「最佳实践」来轻松地重构或者开发一个既容易跨平台、又极其接近 Native 性能的桌面...

智能体GitHub开源/仓库编码
07:51
Berryxia.AI@berryxia
32
LM Studio 又更新了 Beta 版,在MLX框架下优化增强了之前的缓存问题。 目前需要打开dev模式然后加油更新到最新版体验。
产品更新开源/仓库推理
06:01
Simon Willison 博客
28
datasette-agent 0.1a1版本发布

datasette-agent发布了0.1a1测试版本。此次更新涉及权限控制逻辑,现在在向用户列出可查询的数据表前,会先检查是否拥有execute-sql权限。该变更对应项目的第8号议题,是权限模型的一项改进。datasette-agent是一个与Datasette生态相关的工具,其更新动态在相关技术标签下受到关注。

智能体开源/仓库
05:06
Peter Steinberger 🦞@steipete
55
OpenClaw 团队近期专注于提升性能、可靠性、安全性和稳定性,通过引入 crabbox 等全新自动化流程以及投入大量 CPU 资源于 CI 环节,实现了显著改进。新版本默认将 OpenAI 配置设为 Codex 登录,增强了运行时回退与停滞流恢复机制,确保 Telegram 轮询在停滞情况下仍可维持。此外,安装包更精简、启动路径更快速,整体运行更高效、稳定且不易卡顿。

OpenClaw🦞: OpenClaw 2026.5.12 🦞 🧠 OpenAI setup defaults to Codex login 🛟 Runtime fallbacks + stalled-stream recovery 📬 Telegram...

GitHub开源/仓库编码
00:56
Simon Willison 博客
58
Datasette IP速率限制插件发布,应对恶意爬虫访问

为解决datasette.io网站遭受恶意爬虫频繁访问的问题,作者借助Codex开发了一款可配置的IP速率限制插件。该插件能够监控并阻止在设定时间窗口内对特定路径发起过多请求的IP地址。文中给出了当前生产环境的配置示例:通过Fly-Client-IP请求头识别IP,设置最大跟踪键值数为10000,并豁免静态文件等路径;针对“/global-power-plants/*”和“/legislators/*”两类路径,规则限定60秒内最多允许60次请求,违规IP将被封锁20秒。

开源/仓库编码部署/工程
00:51
Berryxia.AI@berryxia
精选82
Tom 兄弟开源 html-anything,赋能 AI Agent 输出高质量 HTML

Tom 兄弟开源了“html-anything”项目,旨在让 AI Agent 能将多种数据格式直接转换为专业设计的 HTML。该工具支持 Markdown、CSV、JSON 等 11 种输入格式,并内置 75 套模板,可生成杂志、海报、推文卡片等多种形态。它能自动兼容 Claude Code、Cursor 等主流本地 code agent,实现一键切换、完全本地运行,无需 API 密钥,边际成本极低。这一能力显著提升了 Agent 的内容呈现效果,对日常使用 Agent 进行内容创作、报告和演示的用户具有实用价值。

Tom Huang: 正式开源 html-anything 🚀 1:1 让你感受全网爆火 Claude code 作者提的 HTML 效果! 你的 Agent 现在可以将任何数据转为世界级设计水准的 HTML 🔥 历时 3 天,1万五千行代码!支持 75 套...

智能体开源/仓库

推荐理由:这个工具填补了Agent输出只有干巴文本的尴尬,75套模板直接搞定报告、卡片、海报,做内容的人终于不用再手动排版了。
5月14日
23:51
Berryxia.AI@berryxia
65
MLX CUDA后端测试全通过,跨平台本地AI时代来临

MLX框架的CUDA后端已实现所有测试通过,标志着其从苹果芯片专属工具正式进军NVIDIA GPU领域。这意味着开发者能用同一套代码,在Mac和NVIDIA显卡上获得高性能运行体验,有望打破PyTorch等框架的兼容性壁垒。此举可能强力推动本地AI应用的跨平台发展进程。

Cheng: We have achieved a milestone in MLX that all tests are passing in CUDA backend now.

产品更新开源/仓库开源生态
23:31
蚂蚁 inclusionAI:HuggingFace 新模型
精选59
蚂蚁 inclusionAI 推出万亿参数推理模型 Ring-2.6-1T

蚂蚁 inclusionAI 发布旗舰推理模型 Ring-2.6-1T,参数规模达万亿,面向智能体工作流、工程开发、科研分析等复杂场景。模型从“能回答”升级至“能执行”,在多步任务与工具协作中表现更优;支持 high/xhigh 两档推理强度,可灵活平衡效果与成本;采用异步强化学习结合 IcePop 算法提升训练效率。基准测试中,high 模式 PinchBench 得 87.60、ClawEval 63.82、Tau2-Bench 电信场景 95.32;xhigh 模式 ARC-AGI-V2 得 66.18、AIME 26 达 95.83、GPQA Diamond 88.27。上下文长度支持 128K 扩展至 256K(YaRN),已通过 HuggingFace 和 ModelScope 开放下载。

智能体开源/仓库推理模型发布
关联讨论 4 条HuggingFace Daily Papers(社区热门论文)蚂蚁 inclusionAI:HuggingFace 新模型公众号:蚂蚁百灵(Ling)X:蚂蚁百灵 (@AntLingAGI)
推荐理由:蚂蚁放出的万亿参数推理模型,Agent执行能力在PinchBench上超GPT-5.4,异步RL训练和可调推理强度对工程落地有参考价值,开源可试。
22:51
Berryxia.AI@berryxia
68
腾讯AI团队开源Agent记忆系统,攻克长会话上下文丢失难题

腾讯AI团队耗时6个月,针对AI agent在长会话中频繁丢失上下文的问题,开发并开源了一套记忆系统。该系统通过三大核心操作提升性能:实时压缩过期上下文,将token消耗降低61%;利用mermaid语法生成结构化任务地图,使agent在30多步复杂工作流中不易迷失;建立专用Persona记忆,将人格一致性从48%提升至76%。方案基于实际踩坑经验,强调agent记忆的难点在于在正确时间以正确方式回忆正确信息,而非单纯堆叠token。项目已在GitHub开源,为AI agent发展提供实用解决方案。

Tencent AI: We spent 6 months on one problem: agents losing context in long sessions. Ended up building and open-sourcing an agent m...

智能体MCP/工具开源/仓库
19:58
公众号:龙猫LongCat(美团)
51
美团 LongCat 开源 General 365:树立推理评测新标尺
开源/仓库推理评测/基准
19:15
SenseTime@SenseTime_AI
精选77
由联合创始人兼首席科学家李沐博士领导的团队发布了SenseNova U1技术报告,详细阐述了其架构、训练方案与创新突破。此次开源同步发布了基于混合专家模型(MoE)的新权重,旨在推动AI领域的透明度、可复现性与进一步创新。团队希望通过开放共享促进整个社区的技术发展。

Dahua Lin: Proud to announce the release of the SenseNova U1 Tech Report - together with the a new set of model weights based on Mo...

开源/仓库开源生态数据/训练模型发布

推荐理由:商汤这次把SenseNova U1的MoE权重和完整技术报告一起开源,比常规PR多了些诚意,做模型选型和微调的值得翻翻。
17:38
🚨 AI News | TestingCatalog@testingcatalog
70
OpenSquilla近日推出了一款开源Python AI代理,专为执行成本效益高的长时任务而设计。其核心创新是内容感知模型路由技术,能自动将简单任务分配给廉价模型,复杂任务分配给高性能模型,基准测试显示相比单一模型方案可节省60%-80%的token成本。该代理还集成四层持久化记忆系统,支持本地嵌入以提升效率,并提供不依赖Docker的系统调用级沙箱隔离,确保运行安全。项目采用Apache-2.0许可证开源,强调本地优先和Python基础。为验证成本节省效果,OpenSquilla启动了"1000万Token账单挑战",邀请用户对比账单,设立奖项包括忠实复现、最佳节省案例和质量错误报告三类,共30名获奖者各获得1000万OpenRouter积分,旨在推动高效AI代理的实践应用。

OpenSquilla: Long-running agents shouldn't pay frontier-model prices for every turn. We've been quietly building our agent with conte...

智能体MCP/工具开源/仓库
15:40
IT之家(RSS)
精选74
"让 Token 消耗降低 61%":腾讯开源 Agent Memory

腾讯云开源了TencentDB Agent Memory,旨在解决Agent长任务中上下文窗口易满、Token成本高的问题。该方案采用“上下文卸载”与“Mermaid任务画布”两项核心技术,将完整信息卸载至外部存储,同时用结构化任务图保留关键状态与执行路径。实验显示,该方案在多任务连续会话中最高可降低61%的Token消耗,并提升任务成功率。项目已适配OpenClaw等主流框架,支持一键集成与本地SQLite存储。

智能体MCP/工具开源/仓库

推荐理由:腾讯开源的这个 Agent Memory,用 Mermaid 画布加上下文卸载,把长任务 Token 省了 61%,而且所有中间信息都可追溯,做复杂 Agent 的开发者可以直接抄作业了。
12:07
宝玉@dotey
精选80
baoyu-skills 新加了一个 Skill: 微信群聊总结 Skill:https://github.com/JimLiu/baoyu-skills/tree/main/skills/baoyu-wechat-summary 依赖于 wx-cli:https://github.com/jackwener/wx-cli 如何配置使用 wx-cli 请看项目文档,无法提供帮助。另外目前只是借助其读取数据,其他没任何关系。 Claude Code + Claude Opus 4.6 效果最佳
Anthropic开源/仓库教程/实践

推荐理由:微信群聊的AI总结一直缺现成方案,宝玉这个skill直接调wx-cli读取聊天记录再丢给Claude总结,社群运营同学可以马上试试。
10:56
向阳乔木@vista8
72
开源项目OpenSquilla:智能路由与本地检索,大幅降低LLM使用成本

开源项目OpenSquilla针对大语言模型应用Token消耗过高的问题,提出了智能模型路由与本地向量检索相结合的解决方案。系统能自动判断任务复杂度,将简单问题路由至廉价模型,复杂任务则分配给更强模型,且路由决策在本地完成,不消耗Token。通过增量发送与缓存命中机制,实际传输Token减少了90%以上。其记忆系统能在上下文将满时自动筛选并压缩关键信息,支持混合检索。项目还具备成本统计、安全沙箱、支持OpenClaw一键迁移及定时任务等功能,显著提升了使用效率与经济性。

智能体开源/仓库
08:00
HuggingFace Daily Papers(社区热门论文)
53
EndPrompt:通过末端锚定高效扩展长上下文

传统扩展大语言模型上下文窗口的方法需要在目标长度的序列上训练,计算成本高昂。EndPrompt方法仅通过短序列训练即可有效扩展上下文,其核心是将原始短上下文作为第一段,附加一个简短的末端提示作为第二段,并为其分配接近目标上下文长度的位置索引。这种两段式构造在短序列内引入局部和长程相对距离,同时保持文本语义连续性。理论分析基于旋转位置嵌入和伯恩斯坦不等式,表明位置插值能约束注意力函数。在LLaMA模型上将上下文从8K扩展到64K时,EndPrompt在LongBench上平均得分最高(76.03),超越LCEG、LongLoRA等方法,且计算量更少,证明长上下文泛化可从稀疏位置监督诱导,挑战了密集训练的必要假设。

arXiv开源/仓库推理数据/训练
07:35
Orange AI@oran_ge
58
作者与登科共同开发了一款名为"Agent坦克大战"的游戏,旨在呼吁人们不要仅将AI用于提升效率的"内卷",而应将其应用于娱乐放松领域。该游戏的核心是让玩家体验AI驱动的坦克对战,通过具体的游戏项目展示了AI技术在休闲娱乐场景下的创新应用潜力。

Orange AI: http://x.com/i/article/2054702609756508160

智能体开源/仓库
5月13日
23:39
Emad@EMostaque
71
在构建多智能体生产级系统时,PostgreSQL虽可靠但检索速度不足。团队为此开发并开源了psql_bm25s,这是一个原生PostgreSQL访问方法,实现了精确的BM25检索。其在标准基准测试中比pg_search快约23倍,使得检索不再成为性能瓶颈和成本负担,智能体得以高效查询数据,为大规模自主智能体应用铺平道路。

Intelligent Internet: so we built psql_bm25s. exact BM25 retrieval. native Postgres access method. ~23x faster than pg_search on the standard ...

智能体开源/仓库
21:28
Hacker News 热门(buzzing.cc 中文翻译)
70
Show HN: Statewright--让人工智能代理更可靠的可视化状态机

Statewright发布了一个开源的可视化状态机工具,旨在通过图形化界面提升人工智能代理的可靠性。该工具允许开发者直观地设计和监控AI代理的状态转换,简化开发流程,减少错误并增强系统稳定性。在Hacker News上,该项目获得101个点赞,显示出技术社区对其创新性的关注。开发者可通过GitHub访问代码,将其集成到AI项目中以提高可维护性和性能。

智能体GitHub开源/仓库开源生态
14:43
SenseTime@SenseTime_AI
精选72
SenseNova-U1 技术报告深度发布:前沿原生多模态模型构建全指南

SenseNova-U1 技术报告详尽披露了构建前沿原生多模态模型的方法,核心包括原生多模态统一建模、无损视觉接口、联合自回归与像素空间流匹配训练、以及原生混合专家骨干网络。报告提供了六阶段训练方案、强化学习后训练与蒸馏的完整实践指南。其开源版本 SenseNova-U1-A3B-MoT 基于混合专家架构,仅激活30亿参数,实现了高效快速的性能。相关资源已全面开放,涵盖技术报告、模型权重、代码和演示平台。

多模态开源/仓库模型发布

推荐理由:商汤把原生多模态模型的训练细节全公开了,无视觉编码器、原生MoE架构,还开源了38B-A3B权重,做多模态模型的可以直接照着技术报告复现。
14:04
Peter Steinberger 🦞@steipete
68
感谢微软,他们正助力OpenClaw做好企业级准备。

Omar Shahine: New in @openclaw beta: one path scheme to rule them all. `openclaw path read|write|append` works the same across md, jso...

GitHubMCP/工具Microsoft开源/仓库
13:39
IT之家(RSS)
60
面壁智能 MiniCPM-V 4.6 发布开源:1.3B 参数仅需 6G 内存即可流畅运行

面壁智能联合清华大学及 OpenBMB 开源社区发布新一代端侧多模态大模型 MiniCPM-V 4.6。该模型参数为 1.3B,仅需约 6GB 内存即可在端侧设备运行。其在通用图文理解、STEM 推理等任务上超越同尺寸模型,Artificial Analysis 评测得 13 分。效率方面,Token 吞吐量为竞品的 1.5 倍,计算消耗仅为其 2.5%。模型采用 LLaVA-UHD v4 架构,图像编码计算量降低 55.8%,并支持高分辨率图像快速处理。目前已全面开源,提供完整工具链,适配主流微调与推理框架。

多模态开源/仓库模型发布端侧
12:55
向阳乔木@vista8
60
博主长期计划搭建个人博客,因工程量大而拖延。受@vista8乔木老师开源博客系统启发,他fork代码并部署到Cloudflare,大半天内实现上线。系统提供Notion式写作体验,AI自动生成摘要、标签和封面,内置微信公众号bridge支持一键发布,且零服务器成本。开源社区避免了从零造轮子,大幅提升效率。但系统初版可能存在bug,需等待后续版本更新。

AI 赋能坊: 自己的博客,想了大半年,终于上线了。 说来惭愧,"搭一个自己的写作阵地" 这件事在我 TODO 里躺了很久。 选框架、挑主题、搞部署、接公众号...... 每次一想就觉得工程量太大,然后就搁置了。 直到看到 @vista8 乔木老师开源了他...

开源/仓库开源生态部署/工程
‹ 上一页
1…1213141516…25
下一页 ›