6月2日

12:06

StepFun@StepFun_ai

阶跃星辰发布其推理优化型模型Step 3.7 Flash。该模型为196B MoE架构，从设计之初就专注于推理效率。其采用多矩阵分解注意力机制，使KV-cache成本仅为DeepSeek模型的约22%；同时通过注意力与FFN解耦技术，实现了硬件优化的高效服务。该模型已通过Fireworks AI提供，采用Apache 2.0许可，并可用于构建智能体应用。

Fireworks AI: Many research labs only consider inference efficiency after the fact. Step 3.7 Flash is a 196B MoE model, and built for ...

智能体开源/仓库推理模型发布

10:47

Berryxia.AI@berryxia

Memo软件与沉浸式翻译工具使用体验分享

推文分享作者日常使用的两个AI翻译工具及工作流。1. Memo软件（免费开源）：用于处理本地视频。流程为下载视频后，使用Whisper本地模型进行转录以节省成本，再接入DeepSeek-V4-Flash API进行翻译。该软件支持字幕烧录、编辑和导出，但在X平台上传速度慢。2. 沉浸式翻译：主要用于网页、YouTube视频及图书翻译，优点是格式保持较好。两者均支持接入用户自定义的API模型。

Berryxia.AI: 特么终于搞完了,太费劲了! 整整花了1晚上才把它翻译中文、剪辑、上传完毕。富人也有富人的烦恼,只是我们的烦恼不一样罢了! 这两天刷屏的Ivanka Trump (特朗普的长女千金)的长播客采访。整个播客中有些观点不能说多么锐利,但是也从...

DeepSeek 多模态开源/仓库教程/实践

09:58

公众号：数字生命卡兹克

精选71

基于 Codex 的开源 AI 技能"清理垃圾.skill"：自动扫描电脑生成 HTML 报告，一键清理垃圾

作者基于 Codex 创建并开源了“清理垃圾.skill”，可对 Mac 和 Windows 电脑进行只读扫描，自动生成可交互的 HTML 报告，将文件按优先级分为绿灯（可自动清理）、黄灯（建议手动）、红灯（跳过）。在作者的 MacBook Air 上扫出近 120 GB 垃圾，其中 96.7 GB 为 B 站离线缓存视频，而 CleanMyMac 仅检出 15.8 GB。用户可在网页上逐项或一键清理，全程需二次确认，项目已开源至 GitHub。

智能体 GitHub 开源/仓库

关联讨论 1 条

推荐理由：卡兹克这个开源skill直接用Agent清理电脑垃圾，比CleanMyMac更透明、可定制，而且马上就能用，是AI冲击工具软件的活案例。

09:18

SemiAnalysis@SemiAnalysis_

你的强化学习训练效率取决于沙盒基础设施。来看看 Modal 如何让你的 rollout 持续运行！

Modal: Reinforcement learning has exploded on Modal, and we've been cooking. Here's a review of lessons learned helping teams t...

开源/仓库部署/工程

08:47

凡人小北@frxiaobei

Codex 正在变成 Agent 的默认 Runtime。 codex 其实还同时有 typescript sdk。如果你要搭建一个 agent，技术栈可以是： typescript + codex + cc-switch

Vaibhav (VB) Srivastav: We just released the Codex Python SDK 🔥 You can now embed Codex directly into your Python apps and workflows! > Start t...

智能体 OpenAI 开源/仓库

08:00

HuggingFace Daily Papers（社区热门论文）

免训练多概念LoRA组合：提示词感知加权策略

LoRA可个性化文生图模型，但多概念组合时直接叠加会干扰概念，降低质量与保真度。本文提出免训练方法，通过W-Switch与W-Composite两种策略，根据目标提示词中触发token的语义重要性对每个LoRA模块输出加权组合，实现多概念自定义。同时提出基于真实参考图像与自动分割概念区域的图像相似度评估框架。在ComposLoRA测试集上，该方法在视觉质量、身份保持和组合性上一致超越现有方法。LLM评估与用户研究验证有效性。代码已开源。

图像生成多模态开源/仓库论文/研究

07:54

ginobefun@hongming731

MiniMax发布开源模型M3：集成编码、长上下文与多模态

MiniMax开源发布了国内首个集成前沿Coding能力、1M超长上下文和原生多模态的模型M3。该模型能在24小时内自主完成145次CUDA算子迭代。与此同时，xAI前负责人指出，视频模型的上限将由LLM决定，下一个类似Sora的产品应是视频Agent，而非单纯的视频生成模型。

多模态开源/仓库模型发布编码

07:19

MiniMax (official)@MiniMax_AI

同事件精选81

M3 on Cloudflare AI Gateway， day one ⚡ 前沿编码能力，1M 上下文，原生多模态，现在一次 fetch 即可调用。是时候构建些东西了。 🦞

Cloudflare Developers: M3 from @MiniMax_AI is now available on Cloudflare AI Gateway: - First open model to push SOTA coding frontier - 1M cont...

多模态开源/仓库模型发布编码

同一事件，精选展示《MiniMax M3：前沿编码、100万token上下文与原生多模态一体模型》

推荐理由：MiniMax的M3把开源编码模型拉到新高度，1M上下文加原生多模态是惊喜，上线首周5折，值得跑一下看是不是真能干翻闭源。