AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 525 条
全部一手资讯X论文
标签「开源/仓库」清除
MiniMax (official)@MiniMax_AI · 6月13日47

We love what the community is building with M3 open weights ♥️ Excited for what’s next

译MiniMax M3 支持已添加到 mlx-vlm,包含 MSA 实现!🚀 在 M3 Ultra 512GB 上测试,运行速度 24 tps,峰值内存约 240GB。目前正在优化性能并添加大量测试 💪 模型:https://huggingface.co/mlx-community/MiniMax-M3-4bit PR:https://github.com/Blaizzy/mlx-vlm/pull/1374 我们喜爱社区用 M3 开放权重构建的一切 ♥️ 期待下一步

Berryxia.AI@berryxia · 6月13日73

直接有人开源一键开启国行的Mac Siri AI,逻辑就是修改地区伪装美区。 地址:https://github.com/SkyBlue997/enableMacosAI

译开发者 SkyBlue997 在 GitHub 开源 enableMacosAI 工具,通过修改系统地区伪装美区来开启国行 Mac 的 Siri AI。此前有用户发现 macOS 的 GenerativeModels.plist 文件中存在 EnhancedSiriWaitlist 开关,关闭 SIP、挂载系统卷、修改键值并重启即可解锁 WWDC 新发布的 Siri AI 增强版。社区已整理出详细步骤,证明该 AI 能力早已内置,仅被等候名单屏蔽。

MiniMax (official)@MiniMax_AI · 6月13日70

M3 open weight just dropped and it's live on @Modular cloud on day zero with up to a 1M-context and MSA architecture kernel-to-cloud optimization is exactly what M3 needs glad to have @Modular with us from the start

译MiniMax 发布 M3 模型开源权重,并宣布与 Modular 合作,在 Modular Cloud 上当天上线。M3 支持最高 1M-token 上下文长度,接受文本、图像、视频多模态输入,采用 MSA(Multi-Stream Attention)架构,专为长时间运行的智能体(Agent)与编码(Coding)工作负载优化。

🚨 AI News | TestingCatalog@testingcatalog · 6月13日51

NVIDIA ❤️ MiniMax MiniMax M3 weights are now available on @huggingface, and NVIDIA now offers a Free Endpoint on its platform for testing. Testing time 👀

译NVIDIA ❤️ MiniMax MiniMax M3 权重现已在 @huggingface 上发布,NVIDIA 在其平台上提供免费端点用于测试。 测试时间到 👀

SenseTime@SenseTime_AI · 6月12日61

🚀 Introducing SenseNova-U1-8B-MoT-Interleaved—our newly optimized model purpose-built for interleaved text-and-image generation! Key upgrades where it matters most: ✨ 𝗡𝗮𝗿𝗿𝗮𝘁𝗶𝘃𝗲 𝗰𝗼𝗻𝘁𝗶𝗻𝘂𝗶𝘁𝘆 strengthened — coherent storytelling sustained across multiple pages 👥 𝗖𝗵𝗮𝗿𝗮𝗰𝘁𝗲𝗿 𝗰𝗼𝗻𝘀𝗶𝘀𝘁𝗲𝗻𝗰𝘆 improved — character identities and art style remain stable throughout 📝 𝗩𝗶𝘀𝘂𝗮𝗹 𝗾𝘂𝗮𝗹𝗶𝘁𝘆 elevated — cleaner text rendering and more reliable layouts with fewer artifacts Try it now 👇 https://huggingface.co/sensenova/SenseNova-U1-8B-MoT-Interleaved Showcases: https://github.com/OpenSenseNova/SenseNova-U1 Discord: https://discord.com/invite/BuTXPHmQub @huggingface @github

译商汤推出SenseNova-U1-8B-MoT-Interleaved模型,专门用于交错文本与图像生成。核心升级包括:叙事连续性增强,支持多页连贯故事;角色一致性改进,人物身份与艺术风格保持稳定;视觉质量提升,文字渲染更清晰、布局更可靠、伪影减少。模型已在HuggingFace开放体验。

🚨 AI News | TestingCatalog@testingcatalog · 6月12日60

KIMI AI🔥: A new open-source “Kimi K2.6 Code” model has been released on APIs and Huggingface! > Improved coding & agent performance over K2.6 > Reasoning efficiency > Long-horizon coding Testing time 👀

译KIMI AI🔥:全新开源 “Kimi K2.6 Code” 模型已在 API 及 HuggingFace 发布! > 较 K2.6 改进编码与智能体性能 > 推理效率 > 长时编码 测试时间 👀

Chubby♨️@kimmonismus · 6月12日64

Shoutout to @maxpolaczuk for making a WoW clone with fable 5! :))

译感谢 @maxpolaczuk 用 Fable 5 做了一个《魔兽世界》克隆版!:))

Chubby♨️@kimmonismus · 6月12日70

Someone just casually vibe-coded a World of Warcraft-style multiplayer game that works online with friends. Fully open source. And apparently, Claude Fable found a visually matching set of open-source assets on its own. Ngl, that’s pretty insane.

译有人刚刚随意地vibe-coded了一个魔兽世界风格的多人在线游戏,可以和朋友们一起在线玩。完全开源。 显然,Claude Fable自己找到了一套视觉上匹配的开源素材。 说实话,这相当疯狂。

AYi@AYi_AInotes · 6月12日70

Claude Code、OpenClaw、Hermes、Codex,一个比一个能干, 但 2026 年了,这批最先进的 Agent 还集体卡在同一件小事上: 上不了网,查推特要付费 API,读小红书卡登录,上 Reddit 动不动被封 IP。 一个叫 Agent Reach 的开源项目,把这三堵墙一起拆了, 26.4k stars,基本零 API 费用。 它聪明在没造轮子: yt-dlp、gh CLI 这些本来就成熟的工具,它统一管起来, Claude Code / Cursor / OpenClaw 要用的时候自动调用, 本质上是给你的 Agent 装了一双能看全网的眼睛。 安装是真的只要一句话, 把 install 链接丢给你的 Agent, 它自己装依赖、自己注册 skill、自己告诉你哪些平台还差个 Cookie, 装完跑一遍 agent-reach doctor,哪通哪不通、怎么修,一目了然。 开箱即用的:YouTube、GitHub、网页、B站、V2EX,零配置。 要配 Cookie 的:Twitter、小红书、Reddit、雪球,流程统一,Agent 会带着你做。 三盆冷水也先泼了: 1️⃣Cookie 会过期,得手动重新导出,不存在装完就一劳永逸; 2️⃣拿 Cookie 抓数据有封号风险,社区共识是用小号,别赌主力号; 3️⃣ 纯聊天用户别凑热闹,它只对会让 Agent 跑命令的人有价值。 但有一点让我觉得这项目能活很久: 作者几乎每天都在更新,而且自己天天在用, 毕竟开源项目最硬的指标从来不是 star 数, 关键看作者还在不在用自己的东西。 链接放一楼了,让你的 Agent 自己装自己👇

译Agent Reach(26.4k stars)让Claude Code、Cursor等AI Agent低成本访问网页、社交媒体。它整合yt-dlp、gh CLI等成熟工具,零配置即可用YouTube、GitHub、B站、V2EX;Twitter、小红书等需手动配Cookie。安装一条命令,Agent自动装依赖并注册skill,运行`agent-reach doctor`检查连通性。注意:Cookie会过期需手动更新;抓数据有封号风险(建议用小号);仅对跑命令的Agent有价值。作者持续维护。

小互@xiaohu · 6月12日75

升级了下公众号排版技能 晚一点发布,还需要优化下 增加了一些主题和优化了预览和浏览页面的阅读体验

译小互(@xiaohu)升级了公众号排版技能组合,实现一句话完成排版、封面生成并一键发送到公众号草稿箱。该工具已开源,提供20种主题颜色可选,可自动分析内容进行排版,支持非Markdown文件。用户只需在Claude Code、Codex或OpenClaw中提供文章链接或文档位置,即可获得可视化预览界面进行选择,全程无需手动操作。

向阳乔木@vista8 · 6月12日76

Fable 5 开发在线Photoshop,就是用这个生成需求文档。 P0需求点的开发效果。

译Vista 编写了 AI 专用 PRD 文档生成 Prompt,先用它生成文档再交给 AI 开发,以提升功能完整度。Fable 5 项目开发在线 Photoshop 正是使用此方法。安装指令:`npx skills add joeseesun/qiaomu-ai-prd`,开源地址和 Prompt 见评论。

AYi@AYi_AInotes · 6月12日70

一群 AI 研究员把量化金融的知识处理框架开源了,叫 QuantMind(MIT 协议)。 它不是 Bloomberg Terminal 的替代品,但确实在干一件类似的事:把 arXiv 量化论文、SEC filings、研报、博客等非结构化内容,批量解析成可查询的语义知识图谱。 核心优势在于两阶段架构:先把文献一次性提取并结构化(支持表格、公式、图表的多模态解析), 之后你用自然语言提问就能进行多跳推理和交叉验证,提取的知识会长期留存,后续查询成本很低。 它真正能替代的其实是对冲基金花六位数薪水让初级分析师干的「大量读论文、整理观点、做文献综述」这类工作。 以前的信息差很大一部分来自「我还没来得及读那篇关键论文」,但是现在这个借口正在快速失效, 但咱们也别误会,真正的 alpha 依然来自你问的问题、验证的严谨程度,以及把洞见转化为行动的能力, 工具只是把「读文献」这个基础环节的成本大幅降低了。

译一群AI研究员开源了量化金融知识处理框架QuantMind(MIT协议)。它能将arXiv论文、SEC文件、研报等非结构化内容批量解析为可查询的语义知识图谱,支持多模态解析(表格、公式、图表)及自然语言多跳推理,可替代初级分析师读论文、整理观点等工作。但真正的alpha仍取决于提问质量与验证严谨度。

Ethan Mollick@emollick · 6月12日69

Has anyone clearly laid out an argument for continued availability of frontier open weights models that are (1) profitable for firms to distribute free as costs rise & (2) safe enough post-Mythos that governments will not intervene to stop their nations labs from distributing?

译有没有人清楚地阐述了一个论点,支持前沿开放权重模型持续可用,且满足 (1) 企业在成本上升时仍可免费分发且盈利,(2) 在Mythos之后足够安全,以至于政府不会干预阻止本国实验室分发?

MiniMax (official)@MiniMax_AI · 6月11日49

Weights on Friday 🫶

译我们高性能MSA内核库现已开源。M3权重预计本周五发布。感谢等待! Github: https://github.com/MiniMax-AI/MSA Paper:https://github.com/MiniMax-AI/MSA/blob/main/docs/MiniMaxSparseAttention.pdf 主推文:权重周五发布🫶

Berryxia.AI@berryxia · 6月11日76

对了 直接限时免费!! 所以大家可以用起来啊~ https://mimo.xiaomi.com/zh/mimocode

译小米开源MiMo-Code,为终端原生AI coding助手,fork自OpenCode。新增SQLite持久记忆实现跨会话永久记忆,配备build/plan/compose三类子代理、自动checkpoint、智能上下文预算,及/dream自我提炼知识与/distill打包技能进化机制。零配置支持任何OpenAI兼容模型,一键curl安装,MIT协议。此前MiMo 2.5模型已接入Bloome作为Agent使用,且MiMo-Code限时免费。

Alibaba Cloud@alibaba_cloud · 6月11日65

Big news! 🚀 Qwen is now live on Eden AI, one of Europe’s leading AI gateways, trusted by more than 200,000 developers. Enterprises can now access Qwen’s powerful open-weight models for reasoning, coding, and AI applications through Eden AI’s unified API, making it easier to build multi-model workflows while avoiding vendor lock-in. To celebrate the launch, enjoy 35% OFF all Qwen models. If you are attending VivaTech Alibaba Cloud AInnovation Summit at Hall 7.3 Workshop A next week, stay tuned for a special meet-up with Eden AI CEO Taha Zemmouri and Eden AI CPTO Samy Melaine. 🔗 Start building today: https://app.edenai.run/playground #AlibabaCloud #Qwen #EdenAI #VivaTech2026 #GenerativeAI #Developers #CloudComputing

译阿里云宣布 Qwen 模型正式登陆欧洲领先 AI 网关 Eden AI,该平台拥有超过 20 万开发者。企业可通过 Eden AI 统一 API 调用 Qwen 开源权重模型,用于推理、编码和 AI 应用,支持多模型工作流并避免供应商锁定。为庆祝上线,所有 Qwen 模型享受 35% 折扣。下周 VivaTech 2026 大会上,Eden AI CEO 与 CPTO 将参与阿里云 AI 创新峰会活动。

Peter Steinberger 🦞@steipete · 6月11日78

Here's a simple loop: Tell codex to maintain your repos, wake up every 5 minutes and direct work to threads. That makes it easy to parallelize+steer work as needed. I use a orchestrator skill combined with my triage+autoreview+computer use skills, so some work can land autonomously. https://github.com/steipete/agent-scripts/blob/main/skills/maintainer-orchestrator/SKILL.md https://github.com/steipete/agent-scripts/blob/main/skills/github-project-triage/SKILL.md

译一个简单的循环:告诉 Codex 维护你的仓库,每5分钟唤醒一次,将工作直接分配到线程。这样可以轻松按需并行化和导向工作。 我使用一个编排器技能,结合我的分类+自动审查+计算机使用技能,因此部分工作可以自主落地。

宝玉@dotey · 6月11日77

baoyu-design skill (让你本地运行 Claude Design 的 Skill)更新,现在支持导入 figma 本地文件(Figma可以保存成 xxx.fig 文件)。比如你有一个设计系统的 Figma 文件,可以根据 Figma 在本地重建一个设计系统,和 Claude Design 在线版一样的效果。 这个功能还挺复杂的,如果没有 Claude Fable 5 帮忙搞不定,就是 Token 不够用 😭 用法很简单,安装 Skill 后,把 Figma 路径发给它,让导入为 Design System,后续新建设计项目都可以用,也可以直接加到项目中。 Skill 地址:https://github.com/jimliu/baoyu-design

译baoyu-design skill 更新,现已支持导入 Figma 本地文件(.fig),可在本地重建设计系统,效果与 Claude Design 在线版一致。该功能依赖 Claude Fable 5 辅助(Token 不够用)。安装后提供 Figma 文件路径即可导入为 Design System,后续新建设计项目可复用。同时支持在新建项目时添加已导入的 Design System,保留了 Claude Design 原始的导入和编译方式,用户可通过提问选择设计系统。安装命令:`npx skills add JimLiu/baoyu-design`。项目地址:https://github.com/jimliu/baoyu-design。

小互@xiaohu · 6月11日74

Google 开源其扩散架构模型:DiffusionGemma 区别于Transformers 模型像打字机一样逐词一个一个生成 DiffusionGemma 可一次性生成大段或者整篇内容,然后再逐步优化 大幅度提高生成的速度: 在H100 上可实现 1000+ tokens/s,RTX 5090 上 700+ tokens/s 26B,18GB 显存能跑 一次可同时生成 256 个 tokens 自己检查自己,写完还能改: 普通 AI 写完一个字就锁死了,不会回头改。就算第 10 个字写错了,到第 100 个字的时候它也改不了前面的。 DiffusionGemma 的生成过程本身就是多轮迭代,每一轮它会重新审视整块文本,发现哪里不对就改掉。就像写作文先打草稿,再通读一遍改错别字,再读一遍调语句,几轮下来质量就上去了。

译Google 开源 DiffusionGemma,基于扩散架构,一次性生成大段文本再逐步优化。H100 上达 1000+ tokens/s,RTX 5090 上 700+ tokens/s。26B 参数仅需 18GB 显存,一次生成 256 tokens。多轮迭代自我纠错,可修改已生成内容。

Demis Hassabis@demishassabis · 6月11日77

Awesome to see this innovation in text diffusion. DiffusionGemma is lightning fast, 4x faster than other Gemma 4 models! Congrats to @bodonoghue85 and the team who worked so hard on this - excited to see what people build with it!

译Google Gemma 团队推出实验性开放文本扩散模型 DiffusionGemma,采用 Apache 2.0 许可。该模型突破传统逐 token 顺序生成方式,能同时生成整段文本。Demis Hassabis 称其速度是其他 Gemma 4 模型的 4 倍。

Fuli Luo@_LuoFuli · 6月11日74

A strong model evolution needs a solid harness system, and vice versa. 14 days, 5 people, one vibe-coding journey — and MiMo Code was born. It's open source: https://github.com/XiaomiMiMo/MiMo-Code

译强大的模型进化需要坚实的驾驭系统,反之亦然。14天,5人,一次vibe-coding旅程——MiMo Code就此诞生。它已开源:https://github.com/XiaomiMiMo/MiMo-Code

Sundar Pichai@sundarpichai · 6月11日75

DiffusionGemma is an open, experimental model that brings our text diffusion research to Gemma 4. It’s a racehorse 🏇achieving up to 4x faster inference by generating entire blocks of text simultaneously vs predicting token-by-token (word-by-word) output!

译DiffusionGemma 是一个开放的实验性模型,它将我们的文本扩散研究引入 Gemma 4。它是一匹赛马 🏇,通过同时生成整块文本(而非逐 token(逐词)预测输出)实现高达 4 倍更快的推理速度!

Google DeepMind@GoogleDeepMind · 6月11日72

DiffusionGemma is our new experimental open model with up to 4x faster output on dedicated GPUs. Instead of predicting word-by-word, it generates entire blocks of text simultaneously. This lets the model self-correct and format complex markdown in real time.

译DiffusionGemma 是我们新的实验性开放模型,在专用 GPU 上输出速度最高可提升 4 倍。 它不是逐词预测,而是同时生成整块文本。这让模型能够自我纠正,并实时格式化复杂 Markdown。

向阳乔木@vista8 · 6月10日74

演示视频中的书籍解读口播脚本 Skill 开源了 https://github.com/joeseesun/qiaomu-book-script 安装指令:npx skills add joeseesun/qiaomu-book-script 只需要说:解读《被讨厌的勇气》 Skill 会调用多个Subagent从不同角度写脚本,最后主LLM整理成终稿。

译Vista 开源的 qiaomu-book-script Skill 可通过 `npx skills add joeseesun/qiaomu-book-script` 安装。用户说“解读《被讨厌的勇气》”即可触发,多个 Subagent 分别撰写脚本,最后由主 LLM 整理成终稿。此前 Vista 已用该 Skill 生成口播脚本并完成录制。

向阳乔木@vista8 · 6月10日65

一个专门给产品经理准备的Skill,五天竟有13k Stars。 从名字看,确实涵盖了产品经理日常工作范围。 警惕大而全的Skill产品包,最好体验根据需求微调。 安装地址见评论

歸藏(guizang.ai)@op7418 · 6月10日62

CodePilot v0.56.0 发布 本次更新的部分修复由 Claude Fable 5 完成。 模型与渠道扩充版本 新增 Claude Fable 5、小米 MiMo UltraSpeed 模型与通用 OpenAI 兼容第三方渠道。 并修复用量统计、回复状态丢失、服务商列表刷新等一批问题。推荐所有用户升级。 https://github.com/op7418/CodePilot/releases/tag/v0.56.0

译CodePilot v0.56.0 发布,新增 Claude Fable 5、小米 MiMo UltraSpeed 模型及通用 OpenAI 兼容第三方渠道。修复用量统计、回复状态丢失、服务商列表刷新等问题,推荐所有用户升级。作者在其 26 万行代码的 CodePilot 代码库中测试 Claude Fable 5,观察其查找问题的能力。

向阳乔木@vista8 · 6月10日55

昨天通宵开发的口播提词器,Codex目标运行了五个小时。 目前感觉,比多数收费提词器好用一点。 还没加手机录制,主要配合大疆Pocket3录口播。 项目已免费开源,欢迎Star或Fork二改。 地址见评论区

译Vista 分享其通宵开发的免费开源口播提词器,项目基于 Codex 开发,运行约 5 小时。他评价该工具比多数收费提词器好用,目前配合大疆 Pocket3 录制口播,暂未加入手机录制功能。项目已开源,欢迎 Star 或 Fork 二改,地址见评论区。

meng shao@shao__meng · 6月10日73

Cohere 发布首个开源编程模型「North Mini Code」 小参数、高效率、专做 Agent 编程 参数:MoE 架构(30B, 3B),128专家,每 token 激活 8 个 上下文:256K 输入 / 64K 输出 最低硬件:1× H100(FP8) 官方发布 https://cohere.com/blog/north-mini-code HuggingFace https://huggingface.co/CohereLabs/North-Mini-Code-1.0 # 训练方法(三阶段后训练) 1. 两阶段级联 SFT · 一阶段(64K):代码约 70% 可训练 token(43% Agent 工具调用 + 27% 单轮竞赛/科学编程),混推理与指令跟随 · 二阶段(128K):约 4.5B token,61% 为代码,全为 Agent/推理样本,工具调用与完成结果均校验可执行 · 数据来自 7 万+ 可验证任务、约 5000 个仓库;与 SWE-Bench 源去重,防泄漏 · SFT 目标不是刷榜,而是为 RL 打底:优化 pass@K 与采样多样性 2. RLVR(可验证奖励强化学习) · 算法:CISPO(token 级重要性采样,长轨迹不被短样本稀释) · 异步采样:vLLM sidecar + 窗口 FIFO 队列,缓解 Agent rollout 长度差异 · 双环境联合训练:Terminal(ReAct + bash)+ SWE(SWE-Agent) · 奖励:单元测试二值奖励;无效工具调用/不可解析输出得 0 分 3. 跨 Harness 泛化 · 训练时暴露多种 Agent 脚手架(SWE-Agent、mini-SWE、OpenCode 等) · 二阶段 SFT 中约 6% 为其他 benchmark harness 数据 · OpenCode 评估约 +10%;mini-SWE-Agent 上 pass@1 达 61.0%,属「免费迁移」 SFT 结束时:SWE-Bench Verified pass@10 = 80.2%,Terminal-Bench v2 pass@10 = 55.1%。RL 后 Terminal pass@1 +7.9%,SWE pass@1 +3.0%;轨迹更短、无效工具调用更少。 # 基准表现 Agent 编程(核心卖点) · Artificial Analysis Coding Index:33.4 · 同量级开源中领先 Qwen3.5 35B-A3B、Gemma 4、Devstral Small 2 等 · 甚至超过 Nemotron 3 Super(120B)、Mistral Small 4(119B)等更大模型 · 仍略低于 Qwen3.6 35B-A3B(约 35.2) 评测集:SWE-Bench Verified/Pro、Terminal-Bench v2/Hard、SciCode、LiveCodeBench v6 Harness:SWE-Agent v1.1.0、ReAct+Tmux、Terminus-2 等;temperature=1.0,top_p=0.95,3 seed 平均 非编程 Agent 任务偏弱(第三方汇总):GDPval-AA ~14%,τ²-Bench Telecom ~37%,Agentic Index 综合约 21.7——专精编程,非通用 Agent。 推理速度(对比 Devstral Small 2,Cohere 内部测试) · 同并发下输出吞吐最高约 2.8× · 词间延迟约 -30% · TTFT 略逊于 Devstral Small 2 # Agent 能力设计 模型原生支持交错思考与工具调用,格式类似 Cohere Command 系列: <|START_THINKING|> ... <|END_THINKING|> <|START_ACTION|> [JSON tool calls] <|END_ACTION|> <|START_TOOL_RESULT|> ... <|END_TOOL_RESULT|> <|START_RESPONSE|> ... <|END_RESPONSE|> 使用要点: · 必须把 reasoning/thinking 一并写入对话历史,否则效果下降 · 工具描述建议用 JSON Schema · 推荐采样:temperature=1.0,top_p=0.95 · 需较新 Transformers 源码、vLLM main + cohere_melody>=0.9.0 面向场景:子 Agent 编排、系统架构理解、Code Review、终端操作、多步软件工程。

译Cohere 推出首个开源编程模型 North Mini Code(MoE 30B/3B,128 专家,每 token 激活 8 个),支持 256K 输入/64K 输出,最低 1×H100(FP8)。训练采用三阶段后训练:级联 SFT(含 Agent 工具调用与推理数据)→ RLVR(CISPO 算法,异步采样,Terminal+SWE 双环境联合训练)→ 跨脚手架泛化。Agent 编程方面,Artificial Analysis Coding Index 达 33.4,同量级开源中领先 Qwen3.5 35B-A3B、Gemma 4 等,超过 Nemotron 3 Super 120B,稍低于 Qwen3.6 35B-A3B(约 35.2)。推理速度对比 Devstral Small 2 最高约 2.8×,词间延迟约 -30%。非编程 Agent 任务偏弱。推荐 temperature=1.0、top_p=0.95。

meng shao@shao__meng · 6月10日77

Text-To-Lottie: 一套 「Agent Skill + 本地预览 Harness」 的组合,让 Agent 生成 Lottie,在浏览器里实时验收 开源作者 @konstipaulus ,开源地址: https://github.com/diffusionstudio/lottie 安装方式:npx skills add diffusionstudio/lottie Skill:教 Codex / Claude Code / Cursor 等 Agent 如何写出 Skottie 可渲染的 Lottie JSON Harness:基于 Skia CanvasKit(Skottie)的全屏播放器 + React 控制面板,Agent 写入 public/lottie.json 后 Vite 热重载,立刻可见 技术架构 · 输出物:标准 Bodymovin JSON(public/lottie.json) · 渲染引擎:Skottie(非 lottie-web)—— 与 AE 导出路径更接近,也更适合程序化生成 · 预览闭环:写文件 → 保存 → 页面自动刷新 → 肉眼验收 · 可编辑性:Skottie Slots + controls.json,实时调颜色、尺寸等参数 · Agent 验收:URL 参数 ?frame=60&paused=1 精确定位帧,截图比对,不靠拖进度条 作者给的五条 Prompt 指南 1. 给具体素材:SVG、真实数据、截图;抽象描述质量明显下降 2. 用动效术语:ease-in / ease-out / ease-in-out,对应 Lottie 关键帧贝塞尔手柄 3. 像摄影师思考:pan / zoom / hold—— 用父级 Group 的 transform 模拟镜头 4. 声明需要的控件:默认只有背景色;颜色、描边宽度等需显式要求 Slots 5. 锁定时间规格:如「150 帧、30 FPS」= 5 秒成片,避免 Agent 随意猜时长 适用 / 不适用 1. 适合: · 单场景、短时长 Motion Graphics · SVG → Lottie(Figma 导出路径) · 数据可视化动效(K 线、图表、指标) · 需要透明背景、矢量、可嵌入 UI 的动效 2. 不适合: · 多镜头剪辑、音视频合成 → 用 Remotion · 复杂角色绑定、粒子、3D → AE 手工或专用工具更合适 · 需要 lottie-web 全特性兼容时 → Skottie 子集有差异

译开源项目 Text-To-Lottie 提供一套 Agent Skill 和本地预览工具,让 Codex/Claude Code/Cursor 等 Agent 生成标准 Bodymovin JSON(public/lottie.json),通过 Skottie 渲染引擎在浏览器中实时验收。安装命令:`npx skills add diffusionstudio/lottie`。技术特点:输出标准 Lottie JSON,使用 Skottie 渲染(非 lottie-web);基于 Vite 热重载实现自动刷新闭环;支持通过 Skottie Slots + controls.json 调整颜色、尺寸;Agent 可用 URL 参数 `?frame=60&paused=1` 精确定位帧截图。Prompt 指南包括:给具体素材、使用动效术语、pan/zoom/hold 模拟镜头、显式声明 Slots、锁定时间规格。适合单场景短时长 Motion Graphics、SVG→Lottie、数据可视化、透明背景矢量动效;不适合多镜头剪辑、复杂角色绑定、粒子、3D 或需 lottie-web 全特性的场景。

AYi@AYi_AInotes · 6月10日74

分享一个开源免费的省token神器,17k star,本周增速最快的项目之一, 可以把AI API账单直接砍到原来的1/5,回答质量还不变, 这就是刚火起来的 headroom,专门干一件事: 把所有要喂给AI的东西(输出、日志、文件、RAG块)先压缩一遍, 砍掉 60%-95% 的 token,最终回答质量完全没变。 最爽的是不用改一行现有代码, 直接当库、代理或者 MCP 服务器插进去就行,无缝对接所有大模型。 以前为了省token绞尽脑汁凑提示词, 现在一行配置,直接砍九成账单, 这才是所有AI开发者真正的刚需啊😲

译开源免费的 token 压缩工具 headroom 本周增速最快,已获 17k star。它专为所有 AI API 调用(输出、日志、文件、RAG 块)设计,压缩 60%-95% 的 token,将账单直接砍到原来的 1/5,且回答质量不变。无需修改一行现有代码,可作为库、代理或 MCP 服务器无缝对接所有大模型。开发者无需再绞尽脑汁凑提示词,一行配置即可大幅降低 API 成本。

OpenCode@opencode · 6月10日65

North Mini Code is now free on OpenCode 256K Context · fully open source Cohere's first coding model

译North Mini Code 现已在 OpenCode 上免费提供 256K 上下文 · 完全开源 Cohere 的首个编程模型

Rohan Paul@rohanpaul_ai · 6月10日69

A new open-source agent engine is trying to make AI sessions continuous across days. 🧠 Kocoro is a Mac-native AI agent trying to fix one of the most annoying problems in daily AI work: every new session forgets what happened before. Kocoro reviews your workday locally every night, then trains a light memory model over the cloud (by using TensorLogic), downloads it back, and the next morning picks up exactly where you left off — no re-pasting, no re-explaining. It knows where your projects live, what you were changing yesterday, which tools you reach for. It can open the browser, operate desktop apps, organize files, update documents, and carry a task across several apps without you stitching the steps together by hand. And what's cool is that they have made Kocoro's kernel is open source with a Github repo. Because an AI that operates your computer has to be verifiable, auditable, and under your control. Something that drives your machine shouldn't get there on "trust us." You can run the kernel from the command line with Shannon, or you can install the desktop app and never touch a terminal. Either way, the process is meant to be open — visible enough to inspect, editable enough to bend, and easy enough to switch off. Real memory isn't keeping every word. It's knowing what matters, what will shape the next decision, and what changes over time. You don't remember every sentence your colleague said last quarter — you remember that they hate surprise meetings, that the Q3 launch slipped

译Kocoro是一款Mac原生AI智能体,旨在解决AI会话每天重启后遗忘上下文的痛点。它每晚在本地审查工作内容,通过TensorLogic在云端训练轻量记忆模型,次日自动恢复上次中断的会话状态,无需重复粘贴或解释。Kocoro能感知项目文件、追踪昨天的变更、打开浏览器、操作桌面应用、整理文件并跨多个应用执行任务。其内核已在GitHub开源,确保可审计和用户可控。用户可通过命令行(Shannon)或桌面应用运行。

向阳乔木@vista8 · 6月10日37

第一次录口播脚本,推荐本好书《被讨厌的勇气》。 工具:Pocket3 + 免费提词器teleprompter + 手机配件 脚本:用刚做的书籍口播解读 Skill 生成,改天开源。 剪辑:剪映加片头片尾,调色用LUT文件CELLULOID_01_FU_LOW.cube

译作者首次录制口播脚本推荐书籍《被讨厌的勇气》,使用Pocket3相机与免费提词器teleprompter,脚本由自制的书籍口播解读Skill生成(计划稍后开源),剪辑用剪映添加片头片尾,调色采用LUT文件CELLULOID_01_FU_LOW.cube。

Tencent Hy@TencentHunyuan · 6月9日74

🚀Introducing UniRL, an RL infra for unified multimodal models. Together with two new RL algorithms: DRPO and Flow-DPPO. One RL loop across diffusion/flow matching models, LLMs/VLMs, and unified multimodal models👇 Code: http://github.com/Tencent-Hunyuan/UniRL (yes — U(you)-ni-(need) RL 😉)

译🚀推出UniRL,一个用于统一多模态模型的RL基础设施。附带两种新RL算法:DRPO和Flow-DPPO。 一个覆盖扩散/流匹配模型、LLM/VLM以及统一多模态模型的RL循环👇 代码:http://github.com/Tencent-Hunyuan/UniRL (是的——U(you)-ni-(need) RL 😉)

Tencent Hy@TencentHunyuan · 6月9日67

🚀Introducing UniRL, an RL infra for unified multimodal models. Together with two new RL algorithms: DRPO and Flow-DPPO. One RL loop across diffusion/flow matching models, LLMs/VLMs, and unified multimodal models👇 Code: http://github.com/Tencent-Hunyuan/UniRL (yes — U(you)-ni-(need) RL 😉) 1、Most RL stacks are built for one modality. UniRL applies a single post-training loop — generate → score → advantage → update → sync — across model families. Model and algorithm are two independent axes, so your coverage is the model × algorithm product, not a fixed recipe menu. 2、One loop, every modality: text→image, text/image→video, vision-language, text-only LLM and VLM, the LLM→diffusion prompt-enhancer, and unified autoregressive+diffusion generation (Hunyuan-Image 3 and Bagel) — a model class no single-purpose RL repo can even express. 3、Built to scale: pluggable rollout engines (train-side / SGLang / vLLM-Omni) behind one typed contract, FSDP2 sharding, and three deployment modes from a single config knob. 4、Two team-original algorithms headline the release: FlowDPPO: Policy optimization for flow/diffusion models with trust-region masks based on exact divergence (See our paper: Flow-DPPO: Divergence Proximal Policy Optimization for Flow Matching Models https://github.com/Tencent-Hunyuan/UniRL/blob/main/FlowDPPO/HY_FlowDPPO.pdf) DRPO: LLM RL with a smooth, advantage-weighted quadratic regularizer (See our paper: Rethinking the Divergence Regularization in LLM RL [https://arxiv.org/abs/2606.09821])

译腾讯混元推出UniRL,一个支持统一多模态模型的强化学习基础设施,并发布两个新算法DRPO和Flow-DPPO。UniRL通过单个后训练循环(生成→评分→优势→更新→同步)覆盖扩散/流匹配模型、LLM/VLM及统一多模态模型(如Hunyuan-Image 3和Bagel)。模型与算法作为独立轴,可实现模型×算法的组合覆盖。框架支持可插拔rollout引擎(训练侧/SGLang/vLLM-Omni)、FSDP2分片和三种部署模式。FlowDPPO针对流/扩散模型引入基于精确散度的信任域策略优化;DRPO为LLM RL提供平滑的优势加权二次正则化方法。代码已开源。

宝玉@dotey · 6月9日78

baoyu-design skill 现在支持导入 Design System,以及在新建项目时添加导入的 Design System 比我想的要麻烦的多:https://github.com/JimLiu/baoyu-design/pull/5 好在效果不错,保留了 Claude Design 原始的导入设计系统和编译设计系统的方式,可以通过提问的访问让用户选择导入好的设计系统! npx skills add JimLiu/baoyu-design

译baoyu-design skill 现已支持导入 Design System,新建项目时可直接使用已导入的设计系统。功能保留了 Claude Design 原有的导入与编译方式,通过提问即可让用户选择已导入的 Design System。开发者表示实现过程比预期复杂,但效果不错。安装命令:`npx skills add JimLiu/baoyu-design`。另据 @dotey 介绍,该工具为本地运行的 Claude Design 风格工具,可描述屏幕生成 HTML,在预览中点击元素说出修改指令,最佳搭配 Opus 4.8。

AYi@AYi_AInotes · 6月9日68

分享一个计算机视觉开发者必藏神器,4 万星GitHub开源! 不用自己写几百行画框跟踪代码, 一行命令搞定所有可视化, Supervision,CV 界真正的瑞士军刀。 1️⃣ 它到底有多强? 自动画框加标签,支持编号、自定义样式, 视频对象永久跟踪,ID 不乱跳,轨迹自动生成, 一键转换 YOLO/COCO/Pascal VOC 所有数据集格式, 内置热力图、区域计数、越线检测、人体骨架、人脸网格 模型无关,YOLO/Transformers/ 任何检测模型都能接, 2️⃣安装只要一句话 运行:pip install supervision 从 NBA 球员实时跟踪、交通路口车流量统计, 到工业缺陷检测、无人机目标追踪,所有你能想到的 CV 可视化场景,它全搞定。 3️⃣已经被 6500 + 个开源 CV 项目在用 现在就装,早用早爽, 做 CV 原型和演示的终极工具,没有之一!

译一行命令 `pip install supervision` 即可安装的计算机视觉可视化工具,支持自动画框加标签、视频目标永久跟踪、数据集格式一键转换,内置热力图、区域计数、越线检测、人体骨架等功能,模型无关,已被6500+开源项目使用。

Berryxia.AI@berryxia · 6月9日75

兄弟们!地主家家没有余粮了都! 天天烧Token 心里没有点b数啊? AI coding工具天天帮你狂飙代码,结果你连自己到底烧了多少钱都蒙在鼓里? 今天给大家推荐Lank 的Tokei这个macOS菜单栏小工具给你直接轻松拿捏它! 对了!开源免费啊!记得给Star啊! 它只读本地日志,零网络调用,30秒自动刷新,实时盯死Claude Code、Grok CLI、Aider、OpenCode等8个主流AI coding agent的token用量、实时成本、性能数据,还带每日图表、周热力图和年度Wrapped。 更绝的是它支持私人Git多设备同步,价格表还能本地覆盖,闲置太久还会提醒你该休息了。 以前大家只顾着堆agent、堆prompt去卷生产力,结果真正在烧钱的那些细节全被忽略了,现在Tokei直接把AI coding workflow从“爽用”变成了“精算”。 这套本地监控一装上,你才发现原来真正掌控AI生产力的,从来不是模型大小,而是你对每一次token消费的清醒。 地址见评论区👇

译Berry Xia 推荐开源工具 Tokei,这是一个 macOS 菜单栏小工具,只读本地日志、零网络调用,30 秒自动刷新,实时监控 Claude Code、Grok CLI、Aider、OpenCode 等 8 个主流 AI coding agent 的 token 用量、实时成本与性能数据,并附每日图表、周热力图和年度 Wrapped。支持私人 Git 多设备同步、价格表本地覆盖,闲置过久会提醒休息。引用推文指出,token 消耗情况可作为深度使用 AI 的面试亮点,数据全程私有,零侵入,无需任何认证。

meng shao@shao__meng · 6月9日75

Github 122K ⭐️ 的 Skills 仓库「Skills For Real Engineers」推出新 Skill「Teach」:把当前工作目录变成有状态的学习空间!!怒赞作者 @mattpocockuk 👍🏻 开源地址: https://github.com/mattpocock/skills/tree/main/skills/productivity/teach Teach Skill 设计理念:Knowledge → Skills → Wisdom · Knowledge:概念、事实、原理;来源于高质量可信资源(书籍、论文、专家文章) · Skills:能动手做的事;来源于交互式课程 + 即时反馈 · Wisdom:真实场景下的判断;来源于社区、同行、实践者交流 工作区架构:文件即学习状态 工作区根目录/ ├── MISSION.md # 为什么学(指南针) ├── RESOURCES.md # 可信资源库 ├── NOTES.md # 教学偏好与备忘 ├── lessons/0001-*.html # 课程(主交付物) ├── reference/*.html # 速查参考(长期回看) └── learning-records/ # 学习记录(决策依据) 状态机: · MISSION.md → 决定教什么、为什么教 · learning-records/ → 决定下一步教什么(最近发展区) · lessons/ → 单次学习单元 · reference/ → 压缩后的长期记忆 五个关键机制(为什么学 → 会什么 → 教什么 → 怎么教 → 留下来) 1. Mission:先定「为什么学」,一切教学服从真实目标;文件:MISSION.md 2. ZPD:每节课刚好够难——读记录、对使命、教一小步;文件:learning-records/ 3. Lesson:一节课一件事:知识 → 练习 → 即时反馈;文件:lessons/*.html 4. Learning Record:记「会了什么」,不记「讲过什么」;文件:learning-records/*.md 5. Reference:把学过的压成速查手册,长期回看;文件:reference/*.html + GLOSSARY.md

译GitHub 122K⭐的Skills仓库推出新技能Teach,可将当前工作目录变为有状态学习空间。设计理念从Knowledge(概念事实)→Skills(动手操作)→Wisdom(真实判断)。工作区以文件即学习状态:MISSION.md定目标、lessons/提供课程、learning-records/记录已会内容、reference/生成速查手册。五个关键机制:Mission定方向、ZPD根据记录调整难度、Lesson一课一事+即时反馈、Learning Record记“会了什么”而非“讲了什么”、Reference形成长期可回看手册。可通过npx skills add mattpocock/skills --skill teach安装,适用于从魔方到软件基础等学习场景。

jason@jxnlco · 6月9日40

If you use poke check out my autmation to keep track of codex launch’s. Maybe you’ll see @interaction mentioned in one of these one day. http://poke.com/r/7ZaRDldAw3s

译如果你用 poke,可以看看我的自动化工具,用来跟踪 codex 的发布。 也许有一天你会在其中看到 @interaction 被提及。 http://poke.com/r/7ZaRDldAw3s

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月13日
17:47
MiniMax (official)@MiniMax_AI
47
MiniMax M3 支持已添加到 mlx-vlm,包含 MSA 实现!🚀 在 M3 Ultra 512GB 上测试,运行速度 24 tps,峰值内存约 240GB。目前正在优化性能并添加大量测试 💪 模型:https://huggingface.co/mlx-community/MiniMax-M3-4bit PR:https://github.com/Blaizzy/mlx-vlm/pull/1374 我们喜爱社区用 M3 开放权重构建的一切 ♥️ 期待下一步

Ivan Fioravanti ᯅ: MiniMax M3 support added to mlx-vlm with MSA implementation! 🚀 Tested on M3 Ultra 512GB running at 24 tps with peak mem...

开源/仓库开源生态端侧
09:14
Berryxia.AI@berryxia
73
开发者 SkyBlue997 在 GitHub 开源 enableMacosAI 工具,通过修改系统地区伪装美区来开启国行 Mac 的 Siri AI。此前有用户发现 macOS 的 GenerativeModels.plist 文件中存在 EnhancedSiriWaitlist 开关,关闭 SIP、挂载系统卷、修改键值并重启即可解锁 WWDC 新发布的 Siri AI 增强版。社区已整理出详细步骤,证明该 AI 能力早已内置,仅被等候名单屏蔽。

Berryxia.AI: 我尼玛!苹果现在安全性真的差! 世界果真就是草台班子、谁也不例外! 苹果新Siri AI的等候名单? 国外大神Mac用户直接一顿操作就把AI增强版给硬解锁了,名单这东西瞬间成了笑话。 WWDC刚秀完新Siri,大家还在排队等官方推送,结果有...

GitHub开源/仓库端侧语音
00:43
MiniMax (official)@MiniMax_AI
70
MiniMax 发布 M3 模型开源权重,并宣布与 Modular 合作,在 Modular Cloud 上当天上线。M3 支持最高 1M-token 上下文长度,接受文本、图像、视频多模态输入,采用 MSA(Multi-Stream Attention)架构,专为长时间运行的智能体(Agent)与编码(Coding)工作负载优化。

Modular: M3 open weights from @MiniMax_AI just dropped, and Modular is a Day Zero launch partner. 1M-token context. Text, image, ...

智能体多模态开源/仓库模型发布
00:42
🚨 AI News | TestingCatalog@testingcatalog
51
NVIDIA ❤️ MiniMax MiniMax M3 权重现已在 @huggingface 上发布,NVIDIA 在其平台上提供免费端点用于测试。 测试时间到 👀

NVIDIA AI: Congrats to the @MiniMax_AI team on the release of MiniMax M3, a long-context multimodal model for text, image, and vide...

Hugging Face多模态开源/仓库模型发布
6月12日
22:34
SenseTime@SenseTime_AI
61
商汤SenseNova-U1-8B-MoT-Interleaved发布

商汤推出SenseNova-U1-8B-MoT-Interleaved模型,专门用于交错文本与图像生成。核心升级包括:叙事连续性增强,支持多页连贯故事;角色一致性改进,人物身份与艺术风格保持稳定;视觉质量提升,文字渲染更清晰、布局更可靠、伪影减少。模型已在HuggingFace开放体验。

图像生成多模态开源/仓库模型发布
21:11
🚨 AI News | TestingCatalog@testingcatalog
60
KIMI AI🔥:全新开源 "Kimi K2.6 Code" 模型已在 API 及 HuggingFace 发布! > 较 K2.6 改进编码与智能体性能 > 推理效率 > 长时编码 测试时间 👀

Kimi.ai: 🔗 Weights & code: https://huggingface.co/moonshotai/Kimi-K2.7-Code

开源/仓库模型发布编码
17:50
Chubby♨️@kimmonismus
64
感谢 @maxpolaczuk 用 Fable 5 做了一个《魔兽世界》克隆版!:))

ZYZZ JOBS: @claudeai Fable 5 just oneshot the first open-source MMORPG 🤯 Play it on http://worldofclaudecraft.com Contribute via g...

Anthropic开源/仓库编码
16:50
Chubby♨️@kimmonismus
70
有人刚刚随意地vibe-coded了一个魔兽世界风格的多人在线游戏,可以和朋友们一起在线玩。完全开源。 显然,Claude Fable自己找到了一套视觉上匹配的开源素材。 说实话,这相当疯狂。
Anthropic开源/仓库开源生态编码
12:38
AYi@AYi_AInotes
70
Agent Reach:让AI Agent零API费用访问网页和社交媒体

Agent Reach(26.4k stars)让Claude Code、Cursor等AI Agent低成本访问网页、社交媒体。它整合yt-dlp、gh CLI等成熟工具,零配置即可用YouTube、GitHub、B站、V2EX;Twitter、小红书等需手动配Cookie。安装一条命令,Agent自动装依赖并注册skill,运行agent-reach doctor检查连通性。注意:Cookie会过期需手动更新;抓数据有封号风险(建议用小号);仅对跑命令的Agent有价值。作者持续维护。

AYi: http://x.com/i/article/2060717603987791878

智能体开源/仓库开源生态
11:54
小互@xiaohu
精选75
小互(@xiaohu)升级了公众号排版技能组合,实现一句话完成排版、封面生成并一键发送到公众号草稿箱。该工具已开源,提供20种主题颜色可选,可自动分析内容进行排版,支持非Markdown文件。用户只需在Claude Code、Codex或OpenClaw中提供文章链接或文档位置,即可获得可视化预览界面进行选择,全程无需手动操作。

小互: 一句话搞定公众号排版、封面生成、发布 我做了个技能组合,可以一句话搞定公众号排版、封面生成,和一键发送到公众号草稿箱,你只需点下发布即可。 已经开源了 有20种主题颜色可选 最重要的是它会自动分析你的内容,进行自动排版,不是Markdown...

Anthropic图像生成开源/仓库教程/实践

推荐理由:小互把公众号排版全流程做成一个开源技能,一句话就能从内容生成到草稿箱,做公众号的可以直接用,这种自动化程度很少见。
11:30
向阳乔木@vista8
76
Vista 编写了 AI 专用 PRD 文档生成 Prompt,先用它生成文档再交给 AI 开发,以提升功能完整度。Fable 5 项目开发在线 Photoshop 正是使用此方法。安装指令:`npx skills add joeseesun/qiaomu-ai-prd`,开源地址和 Prompt 见评论。

向阳乔木: 现在都是 AI Agent做开发,人喜欢的 PRD 和 AI 喜欢的是不一样的。 为了精准高效开发,写了个专门服务于 AI 的PRD文档生成Prompt。 先有这个文档,再给AI开发,功能完整度和丰富性会远远比自己想的全面、好用。 Skil...

智能体开源/仓库教程/实践编码
关联讨论 1 条X:Vista (@vista8)
01:37
AYi@AYi_AInotes
70
QuantMind:量化金融知识处理框架开源(MIT协议)

一群AI研究员开源了量化金融知识处理框架QuantMind(MIT协议)。它能将arXiv论文、SEC文件、研报等非结构化内容批量解析为可查询的语义知识图谱,支持多模态解析(表格、公式、图表)及自然语言多跳推理,可替代初级分析师读论文、整理观点等工作。但真正的alpha仍取决于提问质量与验证严谨度。

AYi: http://x.com/i/article/2064536412670562304

GitHub检索增强多模态开源/仓库
00:29
Ethan Mollick@emollick
69
有没有人清楚地阐述了一个论点,支持前沿开放权重模型持续可用,且满足 (1) 企业在成本上升时仍可免费分发且盈利,(2) 在Mythos之后足够安全,以至于政府不会干预阻止本国实验室分发?
大佬观点安全/对齐开源/仓库政策/监管
6月11日
21:08
MiniMax (official)@MiniMax_AI
49
我们高性能MSA内核库现已开源。M3权重预计本周五发布。感谢等待! Github: https://github.com/MiniMax-AI/MSA Paper:https://github.com/MiniMax-AI/MSA/blob/main/docs/MiniMaxSparseAttention.pdf 主推文:权重周五发布🫶

RyanLee: Hey everyone - our high-performance MSA kernel library is now open-source. The M3 weights are expected to drop this Frid...

开源/仓库模型发布
18:09
Berryxia.AI@berryxia
76
小米开源MiMo-Code,为终端原生AI coding助手,fork自OpenCode。新增SQLite持久记忆实现跨会话永久记忆,配备build/plan/compose三类子代理、自动checkpoint、智能上下文预算,及/dream自我提炼知识与/distill打包技能进化机制。零配置支持任何OpenAI兼容模型,一键curl安装,MIT协议。此前MiMo 2.5模型已接入Bloome作为Agent使用,且MiMo-Code限时免费。

Berryxia.AI: 最近把小米的MiMo 2.5 的模型接到Bloome 中当Agent 来使用! 发现把技能配置好,自主执行任务也是不错的!关键是真的便宜啊! 这不又来整活儿了? 他们把MiMo-Code直接开源,这终端原生AI coding助手带跨会话永久...

智能体开源/仓库编码
关联讨论 3 条公众号:小米 MiMoHacker News 热门(buzzing.cc 中文翻译)X:小米 MiMo (@XiaomiMiMo)
18:06
Alibaba Cloud@alibaba_cloud
65
Qwen 上线欧洲 AI 网关 Eden AI

阿里云宣布 Qwen 模型正式登陆欧洲领先 AI 网关 Eden AI,该平台拥有超过 20 万开发者。企业可通过 Eden AI 统一 API 调用 Qwen 开源权重模型,用于推理、编码和 AI 应用,支持多模型工作流并避免供应商锁定。为庆祝上线,所有 Qwen 模型享受 35% 折扣。下周 VivaTech 2026 大会上,Eden AI CEO 与 CPTO 将参与阿里云 AI 创新峰会活动。

产品更新开源/仓库部署/工程
17:34
Peter Steinberger 🦞@steipete
精选78
一个简单的循环:告诉 Codex 维护你的仓库,每5分钟唤醒一次,将工作直接分配到线程。这样可以轻松按需并行化和导向工作。 我使用一个编排器技能,结合我的分类+自动审查+计算机使用技能,因此部分工作可以自主落地。
智能体开源/仓库编码

推荐理由:Peter Steinberger 这个 orchestrator + triage 的技能组合,让 AI 代理能近乎自主地维护 repo,做开源项目的可以直接抄。
14:52
宝玉@dotey
同事件精选77
baoyu-design skill 更新:支持导入 Figma 本地文件重建设计系统

baoyu-design skill 更新,现已支持导入 Figma 本地文件(.fig),可在本地重建设计系统,效果与 Claude Design 在线版一致。该功能依赖 Claude Fable 5 辅助(Token 不够用)。安装后提供 Figma 文件路径即可导入为 Design System,后续新建设计项目可复用。同时支持在新建项目时添加已导入的 Design System,保留了 Claude Design 原始的导入和编译方式,用户可通过提问选择设计系统。安装命令:npx skills add JimLiu/baoyu-design。项目地址:https://github.com/jimliu/baoyu-design。

宝玉: baoyu-design skill 现在支持导入 Design System,以及在新建项目时添加导入的 Design System 比我想的要麻烦的多:https://github.com/JimLiu/baoyu-design/pul...

GitHub多模态开源/仓库
同一事件,精选展示《baoyu-design skill 支持导入 Design System 并在新建项目中使用》
推荐理由:宝玉把 baoyu-design 调教得越来越像 Claude Design 在线版,现在能直接吃 Figma 文件生成设计系统,前端和设计同学可以省掉大量重复劳动。
10:51
小互@xiaohu
74
Google 开源扩散架构模型 DiffusionGemma

Google 开源 DiffusionGemma,基于扩散架构,一次性生成大段文本再逐步优化。H100 上达 1000+ tokens/s,RTX 5090 上 700+ tokens/s。26B 参数仅需 18GB 显存,一次生成 256 tokens。多轮迭代自我纠错,可修改已生成内容。

Google开源/仓库推理模型发布
09:19
Demis Hassabis@demishassabis
77
Google Gemma 团队推出实验性开放文本扩散模型 DiffusionGemma,采用 Apache 2.0 许可。该模型突破传统逐 token 顺序生成方式,能同时生成整段文本。Demis Hassabis 称其速度是其他 Gemma 4 模型的 4 倍。

Google Gemma: Meet DiffusionGemma! An experimental open model that explores a fast approach to text generation, released under an Apac...

Google开源/仓库模型发布
关联讨论 5 条Google DeepMind:Blog(RSS)X:Testing Catalog (@testingcatalog)X:Google AI for Developers (@googleaidevs)MarkTechPost(RSS)Google Developers Blog(RSS)
02:06
Fuli Luo@_LuoFuli
74
强大的模型进化需要坚实的驾驭系统,反之亦然。14天,5人,一次vibe-coding旅程--MiMo Code就此诞生。它已开源:https://github.com/XiaomiMiMo/MiMo-Code
开源/仓库数据/训练部署/工程
00:20
Sundar Pichai@sundarpichai
75
DiffusionGemma 是一个开放的实验性模型,它将我们的文本扩散研究引入 Gemma 4。它是一匹赛马 🏇,通过同时生成整块文本(而非逐 token(逐词)预测输出)实现高达 4 倍更快的推理速度!
Google开源/仓库推理模型发布
00:12
Google DeepMind@GoogleDeepMind
72
DiffusionGemma 是我们新的实验性开放模型,在专用 GPU 上输出速度最高可提升 4 倍。 它不是逐词预测,而是同时生成整块文本。这让模型能够自我纠正,并实时格式化复杂 Markdown。
DeepMind开源/仓库模型发布
关联讨论 5 条Google DeepMind:Blog(RSS)X:Testing Catalog (@testingcatalog)X:Google AI for Developers (@googleaidevs)MarkTechPost(RSS)Google Developers Blog(RSS)
6月10日
22:17
向阳乔木@vista8
74
Vista 开源的 qiaomu-book-script Skill 可通过 `npx skills add joeseesun/qiaomu-book-script` 安装。用户说"解读《被讨厌的勇气》"即可触发,多个 Subagent 分别撰写脚本,最后由主 LLM 整理成终稿。此前 Vista 已用该 Skill 生成口播脚本并完成录制。

向阳乔木: 第一次录口播脚本,推荐本好书《被讨厌的勇气》。 工具:Pocket3 + 免费提词器teleprompter + 手机配件 脚本:用刚做的书籍口播解读 Skill 生成,改天开源。 剪辑:剪映加片头片尾,调色用LUT文件CELLULOID_...

智能体MCP/工具开源/仓库
15:44
向阳乔木@vista8
65
一个专门给产品经理准备的Skill,五天竟有13k Stars。 从名字看,确实涵盖了产品经理日常工作范围。 警惕大而全的Skill产品包,最好体验根据需求微调。 安装地址见评论
MCP/工具开源/仓库开源生态
13:23
歸藏(guizang.ai)@op7418
62
CodePilot v0.56.0 发布:新增Fable 5及小米模型

CodePilot v0.56.0 发布,新增 Claude Fable 5、小米 MiMo UltraSpeed 模型及通用 OpenAI 兼容第三方渠道。修复用量统计、回复状态丢失、服务商列表刷新等问题,推荐所有用户升级。作者在其 26 万行代码的 CodePilot 代码库中测试 Claude Fable 5,观察其查找问题的能力。

歸藏(guizang.ai): 在我 26 万行代码的 CodePilot 代码库中尝试 Fable 5,看一下它能找出多少问题

产品更新开源/仓库编码
10:43
向阳乔木@vista8
55
Vista 开源免费口播提词器,用 Codex 开发 5 小时

Vista 分享其通宵开发的免费开源口播提词器,项目基于 Codex 开发,运行约 5 小时。他评价该工具比多数收费提词器好用,目前配合大疆 Pocket3 录制口播,暂未加入手机录制功能。项目已开源,欢迎 Star 或 Fork 二改,地址见评论区。

开源/仓库开源生态视频
09:48
meng shao@shao__meng
73
Cohere 发布首个开源编程模型 North Mini Code

Cohere 推出首个开源编程模型 North Mini Code(MoE 30B/3B,128 专家,每 token 激活 8 个),支持 256K 输入/64K 输出,最低 1×H100(FP8)。训练采用三阶段后训练:级联 SFT(含 Agent 工具调用与推理数据)→ RLVR(CISPO 算法,异步采样,Terminal+SWE 双环境联合训练)→ 跨脚手架泛化。Agent 编程方面,Artificial Analysis Coding Index 达 33.4,同量级开源中领先 Qwen3.5 35B-A3B、Gemma 4 等,超过 Nemotron 3 Super 120B,稍低于 Qwen3.6 35B-A3B(约 35.2)。推理速度对比 Devstral Small 2 最高约 2.8×,词间延迟约 -30%。非编程 Agent 任务偏弱。推荐 temperature=1.0、top_p=0.95。

Cohere: Introducing Cohere's first open-source coding model: North Mini Code Small & efficient, designed for agentic performance...

智能体开源/仓库模型发布编码
08:47
meng shao@shao__meng
精选77
Text-To-Lottie:Agent Skill + 本地预览 Harness,让 Agent 生成 Lottie 动画并实时验收

开源项目 Text-To-Lottie 提供一套 Agent Skill 和本地预览工具,让 Codex/Claude Code/Cursor 等 Agent 生成标准 Bodymovin JSON(public/lottie.json),通过 Skottie 渲染引擎在浏览器中实时验收。安装命令:npx skills add diffusionstudio/lottie。技术特点:输出标准 Lottie JSON,使用 Skottie 渲染(非 lottie-web);基于 Vite 热重载实现自动刷新闭环;支持通过 Skottie Slots + controls.json 调整颜色、尺寸;Agent 可用 URL 参数 ?frame=60&paused=1 精确定位帧截图。Prompt 指南包括:给具体素材、使用动效术语、pan/zoom/hold 模拟镜头、显式声明 Slots、锁定时间规格。适合单场景短时长 Motion Graphics、SVG→Lottie、数据可视化、透明背景矢量动效;不适合多镜头剪辑、复杂角色绑定、粒子、3D 或需 lottie-web 全特性的场景。

konstantinpaulus: Introducing text-to-lottie: an open source skill and harness for generating production ready Lottie animations with code...

智能体MCP/工具开源/仓库

推荐理由:让 Agent 写出能直接渲染的 Lottie JSON,这套 Skill + Harness 把生成到验收的链路打得很完整,前端和做动效的都可以直接试。
01:32
AYi@AYi_AInotes
74
headroom:开源token压缩工具,可省60%-95% token

开源免费的 token 压缩工具 headroom 本周增速最快,已获 17k star。它专为所有 AI API 调用(输出、日志、文件、RAG 块)设计,压缩 60%-95% 的 token,将账单直接砍到原来的 1/5,且回答质量不变。无需修改一行现有代码,可作为库、代理或 MCP 服务器无缝对接所有大模型。开发者无需再绞尽脑汁凑提示词,一行配置即可大幅降低 API 成本。

GitHubMCP/工具检索增强开源/仓库
01:32
OpenCode@opencode
65
North Mini Code 现已在 OpenCode 上免费提供 256K 上下文 · 完全开源 Cohere 的首个编程模型
开源/仓库模型发布编码
01:16
Rohan Paul@rohanpaul_ai
69
Kocoro:开源AI智能体实现跨天会话记忆

Kocoro是一款Mac原生AI智能体,旨在解决AI会话每天重启后遗忘上下文的痛点。它每晚在本地审查工作内容,通过TensorLogic在云端训练轻量记忆模型,次日自动恢复上次中断的会话状态,无需重复粘贴或解释。Kocoro能感知项目文件、追踪昨天的变更、打开浏览器、操作桌面应用、整理文件并跨多个应用执行任务。其内核已在GitHub开源,确保可审计和用户可控。用户可通过命令行(Shannon)或桌面应用运行。

智能体GitHub开源/仓库开源生态
00:12
向阳乔木@vista8
37
推荐《被讨厌的勇气》并分享口播录制工具与技巧

作者首次录制口播脚本推荐书籍《被讨厌的勇气》,使用Pocket3相机与免费提词器teleprompter,脚本由自制的书籍口播解读Skill生成(计划稍后开源),剪辑用剪映添加片头片尾,调色采用LUT文件CELLULOID_01_FU_LOW.cube。

开源/仓库教程/实践
6月9日
20:21
Tencent Hy@TencentHunyuan
74
🚀推出UniRL,一个用于统一多模态模型的RL基础设施。附带两种新RL算法:DRPO和Flow-DPPO。 一个覆盖扩散/流匹配模型、LLM/VLM以及统一多模态模型的RL循环👇 代码:http://github.com/Tencent-Hunyuan/UniRL (是的--U(you)-ni-(need) RL 😉)
GitHub多模态开源/仓库推理
19:51
Tencent Hy@TencentHunyuan
精选67
腾讯混元发布UniRL:统一多模态强化学习基础设施

腾讯混元推出UniRL,一个支持统一多模态模型的强化学习基础设施,并发布两个新算法DRPO和Flow-DPPO。UniRL通过单个后训练循环(生成→评分→优势→更新→同步)覆盖扩散/流匹配模型、LLM/VLM及统一多模态模型(如Hunyuan-Image 3和Bagel)。模型与算法作为独立轴,可实现模型×算法的组合覆盖。框架支持可插拔rollout引擎(训练侧/SGLang/vLLM-Omni)、FSDP2分片和三种部署模式。FlowDPPO针对流/扩散模型引入基于精确散度的信任域策略优化;DRPO为LLM RL提供平滑的优势加权二次正则化方法。代码已开源。

多模态开源/仓库论文/研究部署/工程

推荐理由:UniRL把扩散和LLM的强化学习塞进同一个训练循环,外加两个新算法,多模态对齐的研究者可以立刻fork代码试起来。
11:09
宝玉@dotey
精选78
baoyu-design skill 支持导入 Design System 并在新建项目中使用

baoyu-design skill 现已支持导入 Design System,新建项目时可直接使用已导入的设计系统。功能保留了 Claude Design 原有的导入与编译方式,通过提问即可让用户选择已导入的 Design System。开发者表示实现过程比预期复杂,但效果不错。安装命令:npx skills add JimLiu/baoyu-design。另据 @dotey 介绍,该工具为本地运行的 Claude Design 风格工具,可描述屏幕生成 HTML,在预览中点击元素说出修改指令,最佳搭配 Opus 4.8。

宝玉: Cursor's new browser + element annotation turns it into a design studio. Meet Cursor Design 🎨 - Claude Design, running ...

开源/仓库开源生态编码

推荐理由:宝玉把baoyu-design skill加上了Design System导入,现在用Cursor做前端页面可以直接挂设计规范,不用自己手搓变量了。比预期复杂但效果可以,做前端工具的可以试试。
10:28
AYi@AYi_AInotes
68
Supervision:4万星开源CV可视化工具

一行命令 pip install supervision 即可安装的计算机视觉可视化工具,支持自动画框加标签、视频目标永久跟踪、数据集格式一键转换,内置热力图、区域计数、越线检测、人体骨架等功能,模型无关,已被6500+开源项目使用。

开源/仓库开源生态
10:03
Berryxia.AI@berryxia
精选75
开源工具 Tokei:在菜单栏实时监控 AI coding agent 的 token 用量与成本

Berry Xia 推荐开源工具 Tokei,这是一个 macOS 菜单栏小工具,只读本地日志、零网络调用,30 秒自动刷新,实时监控 Claude Code、Grok CLI、Aider、OpenCode 等 8 个主流 AI coding agent 的 token 用量、实时成本与性能数据,并附每日图表、周热力图和年度 Wrapped。支持私人 Git 多设备同步、价格表本地覆盖,闲置过久会提醒休息。引用推文指出,token 消耗情况可作为深度使用 AI 的面试亮点,数据全程私有,零侵入,无需任何认证。

岚叔: 快让我看看大家消耗了多少token🎉 我现在面试会问候选人的token 消耗情况,这个算是评判你深度使用AI的一个证明了 建议有刚需的朋友也保留一份,给自己简历也能增加一些亮点 当前发布的开源版本使用的是github 做的同步,全程数据都...

GitHubMCP/工具开源/仓库

推荐理由:Tokei把AI coding的成本黑洞撕开一个口子,本地零侵入,数据私有不联网,开源玩法实属良心。做开发者的,是时候正视自己烧了多少Token了。
08:43
meng shao@shao__meng
精选75
GitHub 122K⭐的Skills推出新技能「Teach」:把工作目录变有状态学习空间

GitHub 122K⭐的Skills仓库推出新技能Teach,可将当前工作目录变为有状态学习空间。设计理念从Knowledge(概念事实)→Skills(动手操作)→Wisdom(真实判断)。工作区以文件即学习状态:MISSION.md定目标、lessons/提供课程、learning-records/记录已会内容、reference/生成速查手册。五个关键机制:Mission定方向、ZPD根据记录调整难度、Lesson一课一事+即时反馈、Learning Record记“会了什么”而非“讲了什么”、Reference形成长期可回看手册。可通过npx skills add mattpocock/skills --skill teach安装,适用于从魔方到软件基础等学习场景。

Matt Pocock: /teach is live Learn anything, from rubik's cube to vocal harmonies to software fundamentals. npx skills add mattpocock/...

GitHub开源/仓库部署/工程

推荐理由:mattpocock 这个 Teach Skill 把学东西从看文章变成写代码,用文件作为学习状态机,做开发者的可以立刻用起来,思想比同类教程工具高一个档次。
02:21
jason@jxnlco
40
如果你用 poke,可以看看我的自动化工具,用来跟踪 codex 的发布。 也许有一天你会在其中看到 @interaction 被提及。 http://poke.com/r/7ZaRDldAw3s
OpenAI开源/仓库编码
‹ 上一页
123456…14
下一页 ›