AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「开源生态」清除
6月19日周五
10:47HuggingFace Daily Papers(社区热门论文)49FreeStyle:基于社区LoRA挖掘的风格-内容双参考生成框架
08:15Simon Willison 博客69Datasette Apps:在 Datasette 内托管自定义 HTML 应用
08:02ginobefun40BestBlogs早报06-19精讲:OpenAI Codex Record & Replay / Claude Code Artifacts / A2A协议满周岁
08:00OpenRouter:Announcements(RSS)73精选DeepSeek V4 智能体 token 份额持续增长
08:00HuggingFace Daily Papers(社区热门论文)49分层语言模型(TLM):在同一权重中分离公共与私有能力
07:48Berryxia.AI66Browser Use 开源浏览器 agent 模板 B
06:48Berryxia.AI70Matthew Berman 推出 Loop Library
06:23elvis64youtube-notetaker:从视频生成笔记的开源技能
05:27Yuchen Jin39开源LLM收入或超Anthropic,Cursor已实现
04:55Hacker News 热门(buzzing.cc 中文翻译)86诺姆·沙齐尔加入OpenAI
04:52MiniMax (official)40MiniMax M3 测试火热,OpenCode 延三倍限
02:47Chubby♨️32zAI创始人:Mythos级模型2027年前发布
02:22Ethan Mollick44训练前沿开放权重模型有盈利模式吗?
02:20jason51Codex 本周开源资助超 76 万美元
01:51elvis40中国模型差距缩小年底或明年初
01:17AYi52GLM-5.2 登顶 Design Arena,开源权重压 Claude Fable 5
00:56Z.ai37GLM-5.2 限时免费:HuggingFace 推理提供商可用
00:17AYi74GLM-5.2 发布:开源模型压缩84%至238GB本地运行
6月18日周四
23:22宝玉18Mythos 级开源模型不会太久
23:20🚨 AI News | TestingCatalog67微软评估多款开源模型用于Copilot Cowork,考虑托管DeepSeek V4
21:50meng shao63Vercel DESIGN.md 发布,可复刻设计
21:24StepFun61Step 3.7 Flash 在 Cline 免费开放一个月
21:13OpenBMB51SOAR 2026 挑战赛落幕:单消费级 GPU 推理性能优化
19:14IT之家(RSS)32Canonical 推出本地语音转文字项目 Myna,为 Ubuntu 26.10 引入 AI 听写功能
17:54向阳乔木45EvoMap 推出 GitHub Star 换 API Token 活动</summary>
17:14IT之家(RSS)37OpenAI 成为 Rust 基金会白金会员,合计赞助 60 万美元
15:54向阳乔木79精选免费开源乔木画布:AI生图+抠图,一键部署Vercel
14:45Hacker News 热门(buzzing.cc 中文翻译)68本地版 Qwen 并不是比 Opus 差,它只是另一种工具
13:14IT之家(RSS)71阿里开源首个统一科学大模型 LOGOS,仅用 1/56 参数超越微软 NatureLM
12:00公众号:龙猫LongCat(美团)59美团智能创作团队海报生成技术体系:PosterCraft/PosterOmni/PosterReward
11:43HuggingFace Daily Papers(社区热门论文)74精选Sumi:从头训练的7B开源均匀扩散语言模型
11:14Hacker News 热门(buzzing.cc 中文翻译)70精选cuTile Rust:安全无数据竞争的 GPU 内核系统
10:40公众号:通义实验室(千问)75精选首个统一科学大模型 LOGOS 正式开源
10:26Alibaba Cloud31阿里云高管谈企业AI模型战略与成本
09:56Alibaba Cloud31阿里云战略:颠覆GenAI成本
09:19meng shao58Kimi K2.7 Code 和 Claude Fable 5 生成落地页的实验对比分析
09:14IT之家(RSS)50苹果游戏移植工具包 4 测试,《赛博朋克 2077》帧率提升 10%
08:13Simon Willison 博客75GLM-5.2:可能是最强大的纯文本开源权重大语言模型
08:01ginobefun54GLM-5.2 开源、AI 化学家、对话闫俊杰
08:01ginobefun47智谱开源GLM-5.2,OpenAI用GPT-5.4改进化学反应,MiniMax规划10T模型
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月19日
10:47
HuggingFace Daily Papers(社区热门论文)
49
FreeStyle:基于社区LoRA挖掘的风格-内容双参考生成框架

风格-内容双参考生成旨在合成图像,保留内容参考的结构语义并采用风格参考的样式。FreeStyle提出基于社区LoRA挖掘的可扩展双参考生成框架,将LoRA作为风格与内容的组合锚点,通过生成-过滤流程构建大规模三元组数据。针对内容泄漏,采用两阶段课程学习:注意力级增强约束抑制风格参考泄漏,频率感知RoPE调制策略应对双参考阶段的位置对应泄漏。引入覆盖风格参考与双参考生成的基准,包含风格不变内容对齐分数(CAS)和基于VLM的拒绝分数。实验表明模型在风格对齐、内容保留和泄漏抑制间取得强平衡。

Hugging Face图像生成开源生态论文/研究
08:15
Simon Willison 博客
69
Datasette Apps:在 Datasette 内托管自定义 HTML 应用

今日发布的 datasette-apps 插件允许用户在 Datasette 实例中运行自包含的 HTML+JavaScript 应用。这些应用运行在严格 iframe 沙盒内,配合 CSP 头阻止外发 HTTP 请求,无法访问 cookies 或 localStorage。应用可通过 JavaScript 对 Datasette 数据执行只读 SQL 查询,也可通过配置存储查询执行写入操作。通信采用 postMessage() 后迁移至更安全的 MessageChannel()。所有查询和 CSP 错误均可在父框架中记录。该功能源自作者对 Claude Artifacts 机制的探索,现已独立为 Datasette 核心特性。演示实例可通过 GitHub 登录 agent.datasette.io 体验。

产品更新安全/对齐开源生态数据/训练
08:02
ginobefun@hongming731
40
BestBlogs早报06-19精讲:OpenAI Codex Record & Replay / Claude Code Artifacts / A2A协议满周岁

OpenAI为Codex上线Record & Replay,演示一次完整操作即可复用浏览器工作流;Claude Code支持Artifacts渲染,会话实时生成可视化页面并自动更新,Beta面向Team/Enterprise组织;Google A2A协议满周岁,Python/Go SDK已达1.0 GA,以FoldRun为例展示智能体协作。其他动态:MosaicLeaks基准测试揭示深度研究智能体隐私泄露风险;SGLang-JAX在TPU v7x上优化Ling-2.6-1T MoE模型,延迟降低53%。

ginobefun: http://x.com/i/article/2067749290982936576

智能体其他开源生态
08:00
OpenRouter:Announcements(RSS)
精选73
DeepSeek V4 智能体 token 份额持续增长

DeepSeek 于4月24日发布新一代旗舰模型 V4 系列。OpenRouter 数据显示,V4 发布后其 token 份额从年初的9%增长至6月初的18%,自5月中旬起成为 OpenRouter 最受欢迎模型。V4 是首个足以胜任智能体工作负载的 DeepSeek 模型,到5月底 V4-Flash 已占 DeepSeek 智能体 token 流量的70%。V4-Flash 最便宜端点价格为每百万 token 输入 $0.09、输出 $0.18,远低于 GPT-5.5 的 $5/$30。中国模型整体 token 份额于6月初超过美国模型,DeepSeek 是主要驱动力。

智能体DeepSeek开源生态现象/趋势

推荐理由:OpenRouter 独家数据展示了代际转折:DeepSeek V4 靠性价比吃下代理负载,中国模型 token 份额首次超过美国,这个信号比任何 benchmark 排名都真实,做应用选型的人该重新算账了。
08:00
HuggingFace Daily Papers(社区热门论文)
49
分层语言模型(TLM):在同一权重中分离公共与私有能力

为调和开源权重与敏感能力控制,论文提出分层语言模型(TLM)。一套权重支持多个能力层级:默认公共配置行为与常规LLM一致;紧凑密钥通过指定少量参数的排列,在相同权重上诱导出包含私有能力的替代计算图。在180M和650M参数模型上预训练并微调密钥配置后,密钥配置可获取新语言、指令跟随和私有事实记忆能力,而公共配置完全不展现。该方法自然扩展至多层级,且因授权基于权重结构,可抵抗微调式提取和密钥部分泄露。

安全/对齐开源生态论文/研究
07:48
Berryxia.AI@berryxia
66
Browser Use 开源浏览器 agent 模板 B

Browser Use 开源了基于 Vercel Eve 构建的浏览器 agent 模板 B。该模板让任意 agent 接入真实云端浏览器(Browser Use Cloud),实现网页浏览、点击、填表等操作,并通过 browser-harness 实时可视化执行过程,支持调试。模板已发布在 GitHub,可直接 clone 使用,支持初始化 skills 和 MCPs。开源免费,降低了开发可观测、可干预的 browser agent 的门槛。

Browser Use: Introducing B, a browser agent template! Built on Eve by @vercel. Give any agent a real Browser Use Cloud browser. Watch...

智能体GitHubMCP/工具产品更新
06:48
Berryxia.AI@berryxia
70
Matthew Berman 推出 Loop Library

Matthew Berman推出Loop Library,一个专门收集可直接复用的agent循环流程的社区库。库中收录从简单任务自动化到复杂多步工作流的各种loop模板,开发者可直接搜索使用,也可提交自己的循环。该库由http://here.now合作托管,旨在解决agent开发中循环结构设计(退出、验证、失败处理)的重复劳动,推动agent开发从“每次重新发明轮子”转向“搭积木”模式。

Matthew Berman: Just launched Loop Library - a curated list of agent loops you can use right now. Find loops, submit your own, tokenmaxx...

智能体产品更新开源生态
06:23
elvis@omarsar0
64
很高兴分享我的新AI智能体技能。 /youtube-notetaker 可从YouTube视频生成Artifacts。 捕获幻灯片、笔记、转录以及你想要的任何内容。 开源,你可以按需自定义。
智能体开源生态教程/实践
05:27
Yuchen Jin@Yuchenj_UW
39
我其实有不同看法。 越来越多公司正从租用闭源大语言模型转向通过开源大语言模型和后训练"拥有模型权重"。 Cursor 已经做到了。 开源大语言模型的收入某个时候可能超过 Anthropic。
Anthropic大佬观点开源生态
04:55
Hacker News 热门(buzzing.cc 中文翻译)
86
诺姆·沙齐尔加入OpenAI

前Google研究员、Transformer架构共同作者诺姆·沙齐尔在X上宣布,他将加入OpenAI,并期待与那里的卓越团队合作。沙齐尔表示这是一个艰难的决定,同时对Google团队及其共同取得的成果感到无比自豪。

GoogleOpenAI开源生态行业动态
关联讨论 8 条IT之家(RSS)X:Kim (@kimmonismus)The Decoder:AI News(RSS)X:Jason Liu (@jxnlco)X:Yuchen Jin (@Yuchenj_UW)X:歸藏 (@op7418)X:Sam Altman (@sama)TechCrunch:AI(RSS)
04:52
MiniMax (official)@MiniMax_AI
40
非常感谢所有使用 @opencode 测试 M3、找出问题并告诉我们什么重要的人。 @opencode 现已将 3 倍限制延长,以便大家继续构建 🚀

OpenCode: MiniMax M3 has been getting a lot of love We are extending the 3x limits till the end of the month on OpenCode Go

开源生态行业动态
02:47
Chubby♨️@kimmonismus
32
zAI(发布GLM-5.2的公司)创始人表示,Mythos级模型将在2027年第一季度前发布。 换句话说:他相信开源不会落后前沿实验室七个月,而是会迎头赶上。 这将变得非常有趣!

jietang: @elonmusk @teortaxesTex won't take that long

大佬观点开源生态
02:22
Ethan Mollick@emollick
44
训练前沿开放权重模型是否存在盈利的商业模式? 其他人可以像你一样廉价地托管、微调、咨询等。没有辅助产品销售,而且与大多数开源工作相比,其制作成本极其高昂。
大佬观点开源生态
02:20
jason@jxnlco
51
codex for open source: 本周为开源投入超过 76 万美元 ~ 16 万美元直接资助维护者 ~ 60 万美元承诺用于 Rust 超过 3000 名维护者获批六个月的 ChatGPT Pro(含 Codex)!
OpenAI开源生态行业动态
01:51
elvis@omarsar0
40
我认为这会在今年年底或明年初发生。 这不是瞎猜。我已经看到了足够多的研究和结果,知道差距正在快速缩小。 而且我现在比以往更多地使用DeepSeek、GLM、Qwen、Kimi和MiniMax等模型。
开源生态现象/趋势
01:17
AYi@AYi_AInotes
52
GLM-5.2 登顶 Design Arena,开源权重压 Claude Fable 5

GLM-5.2 在 Design Arena 上取得第一,Elo 达 1360,超越已关服的 Claude Fable 5。模型为开源权重,排名上升 4 位,Elo 提升 27 分,创下代码类历史最高分。

Design Arena: BREAKING: GLM-5.2 is now 1st on Design Arena. With an Elo of 1360, GLM-5.2 has jumped ahead of the now unavailable Claud...

开源生态编码评测/基准
00:56
Z.ai@Zai_org
37
智谱推出 GLM-5.2 模型,在 Hugging Face Inference Providers 上限时免费使用,主推文称持续5小时(引用称6小时)。支持提供商包括 Zai、Together AI、Novita、Fireworks、DeepInfra。该模型可搭配 Pi、opencode、Codex、Claude Code 等编程智能体,体现开源模型已迎头赶上。

Victor M: Open source MUST win 🔥 GLM-5.2 is free when used with Hugging Face Inference Providers and for every available provider...

Hugging Face开源生态行业动态
00:17
AYi@AYi_AInotes
74
GLM-5.2 发布开源权重,MIT 许可。原 1.5TB 模型经 84% 压缩至 238GB,可在 256GB Mac 或同档硬件本地运行,保留 82% 性能。拥有 1M 上下文窗口,编码和智能体任务显著提升。提供两种推理力度:GLM-5.2 (max) 极限推理,GLM-5.2 (high) 平衡性能与 token 效率。API 定价与 GLM-5.1 相同。

Z.ai: Introducing GLM-5.2: Frontier Intelligence, Open Weights - Significant improvements in coding and agentic tasks - Strong...

Hugging Face开源生态推理模型发布
6月18日
23:22
宝玉@dotey
18
@jietang 回复 @elonmusk 和 @teortaxesTex:"不会花那么久。" 主推文期待早日看到 Mythos 级别的开源模型👍

jietang: @elonmusk @teortaxesTex won't take that long

大佬观点开源生态
23:20
🚨 AI News | TestingCatalog@testingcatalog
67
微软正评估GLM、MiniMax、Kimi等多款开源模型用于Copilot Cowork,旨在降低推理成本。据Axios报道,微软考虑托管DeepSeek V4作为更便宜选项,同时将Copilot Cowork从无限定价转为按使用量计费。微软称用户每周执行数百任务,成本可能很高。若采用DeepSeek,模型将是可选、经微调和安全防护,并完全托管在Azure上。微软推动模型"可互换"策略,未来部分任务可能移至本地执行。

Chubby♨️: Axios reports that Microsoft is considering a Microsoft-hosted version of DeepSeek V4 as a cheaper model option for Copi...

DeepSeekMicrosoft开源生态行业动态
21:50
meng shao@shao__meng
63
酷!Vercel 创始人把 Vercel DESIGN.md 发出来了 用咱们的 Brand to DESIGN.md Skill 就可以复刻 Vercel 的设计品味和设计元素了 https://github.com/shaom/brand-to-design-md-skill 咱们的 Brand to DESIGN.md Skill 是两步: 1. 先去访问网站,提取其中的 DESIGN.md 2. 利用 DESIGN.md 为指导生成网站 现在 @rauchg 发出了 DESIGN.md,那第 1 步就跳过了,直接走第二步。

Guillermo Rauch: http://vercel.com/design.md

开源生态教程/实践
21:24
StepFun@StepFun_ai
61
阶跃星辰宣布与 Cline 合作,Step 3.7 Flash 未来一个月在 Cline 免费使用。该模型在 SWE Bench 上击败 Gemini 和 DeepSeek flash 模型,性能接近前沿水平。支持开源权重、256k 上下文窗口,速度快且稳定。用户可通过 Cline 中 `/model` 命令选择 Step 3.7 Flash。

Cline: Step 3.7 Flash is free in Cline for the next month. It beats Gemini and DeepSeek flash models, and comes surprisingly cl...

开源生态编码行业动态
21:13
OpenBMB@OpenBMB
51
SOAR 2026 挑战赛落幕:单消费级 GPU 推理性能优化

由 OpenBMB、SGLang 和 NVIDIA 联合主办的 SOAR 2026 挑战赛结束,旨在单消费级 GPU 上最大化 MiniCPM-SALA(稀疏+线性混合注意力模型)推理性能。最终 326 支队伍注册,4300+ 次提交,69 队入围排行榜。冠军团队实现整体 6.33 倍加速,单请求推理峰值达 9.72 倍,方案结合 NVFP4 量化、FlashInfer plan-cache 优化、自定义 Triton 内核、EAGLE-3 推测解码及运行时感知调度。低比特量化、推测解码、稀疏注意力和阶段感知调度被视为下一代高效推理核心支柱。

开源生态推理行业动态
19:14
IT之家(RSS)
32
Canonical 推出本地语音转文字项目 Myna,为 Ubuntu 26.10 引入 AI 听写功能

Canonical 公布 Project Myna,为 Ubuntu 桌面打造的本地语音转文字工具,首个版本随 Ubuntu 26.10 发布。Myna 仅提供听写功能:用户按下键盘快捷键后说话,转录文字直接插入当前应用,屏幕显示视觉反馈。所有识别在本地运行,下载模型后无需联网;麦克风仅在激活时被访问,音频数据在内存中处理后丢弃。首版以 Wayland 上的 GNOME 为主要验证环境,架构采用模块化设计,源码和文档已以 GPLv3 协议托管于 GitHub。后续计划加强桌面集成并优化听写体验。

产品更新开源生态端侧语音
17:54
向阳乔木@vista8
45
EvoMap 推出 GitHub Star 换 API Token 活动</summary>

EvoMap 发起开源激励活动:拥有 GitHub 开源项目的用户可按 Star 数量领取基础 API Token(最低 1 个 Star 即可参与)。操作流程为提交仓库地址、验证通过后领取积分。此外,开发者可将工作流、Prompt 或实用工具封装为 Gene/Capsule 并提交,以获取额外 API Credits。活动地址已附教程视频。

开源生态教程/实践
17:14
IT之家(RSS)
37
OpenAI 成为 Rust 基金会白金会员,合计赞助 60 万美元

6月18日,Rust基金会宣布OpenAI以白金会员身份加入,并提供总计60万美元(约406.5万元人民币)的资金支持,涵盖入会费用、额外拨款及生态系统维护。该资金将用于Rust Project Goals、Rust Innovation Lab等计划,为开源项目维护者提供系统化支持。Rust基金会是由AWS、谷歌、微软等联合创立的独立非营利组织。

OpenAI开源生态行业动态
15:54
向阳乔木@vista8
精选79
免费开源乔木画布:AI生图+抠图,一键部署Vercel

乔木画布推出免费开源在线图像编辑器,可一键部署Vercel为网站,功能类似简化版PS。支持Seedream和GPT-image-2生图、图片模板存储分享、一键抠图、2万图标和常见Emoji,甚至能绘制PRD。随时创建3:4/16:9/21:9等不同尺寸画布。原计划高级功能收费,庆祝端午节现全免费开源。在线体验:https://ps.qiaomu.ai/,GitHub见评论区。

OpenAI图像生成开源/仓库开源生态

推荐理由:这个开源画布把AI生图和简易设计工具打包,一键部署Vercel,对偶尔做图的产品人和开发者很友好,全免费开源的诚意值得点开收藏。
14:45
Hacker News 热门(buzzing.cc 中文翻译)
68
本地版 Qwen 并不是比 Opus 差,它只是另一种工具

一位小型软件公司创始人基于自身业务和开源项目分享,本地 Qwen 27B/35-A3B 模型在特定场景下有实际价值,使用 RTX 6000 Pro 显卡运行,显卡成本已在头两三个月内收回。但本地模型量化后容易出现无限循环和模型幻觉,无法无人监督使用,作者认为不应过度吹捧替代云端 Opus,而是把它看作另一种工具。

开源生态推理现象/趋势部署/工程
13:14
IT之家(RSS)
71
阿里开源首个统一科学大模型 LOGOS,仅用 1/56 参数超越微软 NatureLM

6 月 18 日,阿里 ATH-Token Foundry 联合人大高瓴人工智能学院开源首个基于统一“科学语法”的多领域科学生成基础模型 LOGOS。LOGOS-1B 仅用 1B 参数量(1/56)在多个任务上超越微软 NatureLM(8×7B)。模型构建涵盖 7 类模态、共 44.87B tokens 的预训练语料,通过共享词表将蛋白质、小分子等异构对象编码为统一离散 token 序列,并发明“文字描述法”将 3D 空间接触模式语法化为离散 token。预训练与下游任务实现 form-objective alignment 消除 gap。模型权重、推理代码与技术报告已在 HuggingFace 和 GitHub 开源。

开源生态数据/训练模型发布
12:00
公众号:龙猫LongCat(美团)
59
美团智能创作团队海报生成技术体系:PosterCraft/PosterOmni/PosterReward

美团智能创作团队构建了覆盖“生成—编辑—评判”全链路的海报生成技术体系。PosterCraft(ICLR 2026)通过四阶段级联优化实现端到端高美感海报生成,文字渲染准确率接近顶级闭源商业系统;PosterOmni(CVPR 2026)以单一统一模型覆盖扩图、补全、比例调整、风格迁移等六类设计任务;PosterReward(CVPR 2026)是首个专门面向海报质量的奖励模型,在专项评测基准上达86%准确率。三者相互协同,已全部开源至MeiGen-AI仓库,并在美团外卖套餐图生成、品牌IP袋鼠团团等业务中落地。

图像生成开源生态教程/实践评测/基准
11:43
HuggingFace Daily Papers(社区热门论文)
精选74
Sumi:从头训练的7B开源均匀扩散语言模型

Sumi(日语“墨”)是一个完全开源的7B参数均匀扩散语言模型,从零开始在1.5T模型token上预训练。它在知识、推理和编程评测中与同等token预算的自回归模型表现相当,但在常识推理benchmark上略逊,教育密集型数据混合可能是原因之一。Sumi开放模型权重、检查点及完整训练配方(含公开语料数据混合说明),为社区提供首个大规模均匀扩散模型的基准参考。

arXivHugging Face开源生态数据/训练

推荐理由:Sumi 是第一个完全从零预训练的大规模均匀扩散语言模型,填补了社区在这方向的研究空白,做扩散语言模型的人终于有个可以摸的起点。
11:14
Hacker News 热门(buzzing.cc 中文翻译)
精选70
cuTile Rust:安全无数据竞争的 GPU 内核系统

cuTile Rust 是一个基于 tile 的 GPU 编程系统,允许用 Rust 编写内存安全、无数据竞争的内核。它通过 #[cutile::module] 宏将内核 AST 嵌入主机二进制,在运行时经 CUDA Tile IR JIT 编译为 GPU cubin。可变张量在启动前分割,不可变张量共享,启动器在 GPU 工作期间保持所有权。在 NVIDIA B200 上,逐元素操作达 7 TB/s(约 91% 峰值带宽),GEMM 达 2 PFlop/s(约 92% 密集 f16 峰值)。基于 cuTile Rust 构建的 Grout 推理引擎在 RTX 5090 上解码 Qwen3-4B 达 171 tokens/s,在 B200 上解码 Qwen3-32B 达 82 tokens/s。项目处于早期研究阶段。

arXivHugging Face开源/仓库开源生态

推荐理由:用Rust的所有权模型保证GPU内核无数据竞争,性能还能达到峰值的92%,这个方向可能是安全GPU编程的未来,系统编程和推理引擎开发者值得一试。
10:40
公众号:通义实验室(千问)
精选75
首个统一科学大模型 LOGOS 正式开源

LOGOS 由 ATH-Token Foundry 联合中国人民大学高瓴人工智能学院开源,是首个基于统一“科学语法”的多领域科学生成基础模型。LOGOS-1B(1B参数)在六大科学任务上匹配或超越领域专用方法:口袋条件配体生成纯序列范式首次超越3D扩散模型,超越NatureLM(8×7B);逆合成预测Top-1准确率74.8%;口袋位点识别仅靠序列达58.5% Top-n准确率;MOF材料生成NBB提升至17.78%。模型采用统一词汇表将蛋白质、小分子等编码为离散Token,通过空间交互离散化实现无需3D坐标的序列预测。预训练与下游任务形式与目标一致,跨领域知识迁移经实验验证有效。已完整开源模型权重、推理代码与技术报告。

开源生态数据/训练模型发布

推荐理由:LOGOS用一套统一科学语法把蛋白质、小分子、材料等塞进同一个LLM框架,纯序列建模就干过了专用扩散模型,参数量却只有NatureLM的1/56,做AI4S的得认真看一眼。
10:26
Alibaba Cloud@alibaba_cloud
31
颠覆GenAI成本:阿里云的策略。 日本CyberAgent董事高官Takahito Naito与阿里云日本韩国区域总经理Takeshi Kurita讨论企业AI模型的战略利用与未来。 👉 https://xtech.nikkei.com/atcl/nxt/special/18/00001/060300084/ #AlibabaCloud #CyberAgent #CloudComputing #GenerativeAI #Qwen #AgenticCloud
开源生态行业动态
09:56
Alibaba Cloud@alibaba_cloud
31
颠覆GenAI成本:阿里云的战略。 Takahito Naito(CyberAgent董事总经理)和Takeshi Kurita(阿里云日本韩国区域经理)讨论企业AI模型的战略利用与未来。 👉 https://xtech.nikkei.com/atcl/nxt/special/18/00001/060300084/ #AlibabaCloud #CyberAgent #CloudComputing #GenerativeAI #Qwen #AgenticCloud
智能体大佬观点开源生态
09:19
meng shao@shao__meng
58
Kimi K2.7 Code 和 Claude Fable 5 生成落地页的实验对比分析

@nutlope 让 Kimi K2.7 Code 和 Claude Fable 5 各生成 12 个落地页并排对比。初始两者均有“AI 生成感”;为 Kimi 设置自定义 Design Inspiration MCP Server(利用多模态能力)后质量显著提升。成本上,B2B SaaS 单页 Kimi 仅 4 美分,Claude Fable 1.09 美元(约 27 倍差);平均 Kimi 比 Fable 便宜约 16 倍、比 Opus 便宜约 8 倍,总成本降低 94%。质量由 GPT-5.5 评分(0-100),Claude Fable 略高但差距小,Kimi 性价比突出。实验表明,结合高质量视觉参考后,开源模型已足以支持实际落地页工作流,批量迭代优势显著。

Hassan: http://x.com/i/article/2067278912984436736

多模态开源生态编码评测/基准
09:14
IT之家(RSS)
50
苹果游戏移植工具包 4 测试,《赛博朋克 2077》帧率提升 10%

苹果 GPTK 4 引入 Agentic AI 能力,通过 GitHub 开源智能体技能自动应用 Metal 最佳实践。测试显示,在 M3 Max MacBook Pro(48GB 内存/40 核 GPU)上,《赛博朋克 2077》通过 DirectX 12 转 Metal 4 帧率比 Metal 3 提升 10%;《反恐精英 2》帧率高于上一版。MacBook Neo 低设置运行《荒野大镖客 2》,GPTK 4 平均 35fps,较 GPTK 3 的 28fps 提升 25%。《007 初露锋芒》在 GPTK 3 下崩溃,现可运行至 60–70fps(1080p/中画质/FSR 质量),但每次启动需等待 20 分钟着色器编译。

GitHub开源生态评测/基准
08:13
Simon Willison 博客
75
GLM-5.2:可能是最强大的纯文本开源权重大语言模型

智谱(Z.ai)于6月13日向编码计划订阅者发布GLM-5.2,6月16日以MIT许可证开源完整权重。该模型为753B参数、1.51TB的MoE架构,40个活跃参数,纯文本输入,上下文窗口提升至100万token。在Artificial Analysis Intelligence Index v4.1上以51分领先,超越MiniMax-M3(44)、DeepSeek V4 Pro(max,44)和Kimi K2.6(43)。但每任务输出token消耗达43k,高于同类模型。Code Arena WebDev排行榜位列第二,仅次于Claude Fable 5。通过OpenRouter可获取,多数提供商定价$1.40/百万输入token、$4.40/百万输出token。实测生成SVG动画优秀,但负鼠SVG质量不及GLM-5.1。

图像生成开源生态模型发布编码
关联讨论 9 条公众号:智谱(GLM)X:Testing Catalog (@testingcatalog)Hacker News 热门(buzzing.cc 中文翻译)X:硅基流动 SiliconFlow (@SiliconFlowAI)The Decoder:AI News(RSS)X:智谱 Z.ai (@Zai_org)Nathan Lambert:Interconnects(RSS)智谱:研究(网页内嵌数据)Hugging Face:Blog(RSS)
08:01
ginobefun@hongming731
54
GLM-5.2 开源、AI 化学家、对话闫俊杰

智谱开源 GLM-5.2,Code Arena 全球可用模型第一,Solid 1M 无损上下文,FrontierSWE 仅比 Claude Opus 4.8 低 1%。OpenAI 将 GPT-5.4 接入智能化学 AI Maria,近乎自主优化 Chan-Lam 偶联反应,平均产率从 16.6% 升至 25.2%。MiniMax 创始人闫俊杰称 M2.7 消耗量超预期 10 倍,M3 目标让用户无限使用 Sonnet/Opus 级别模型。

MCP/工具其他开源生态
08:01
ginobefun@hongming731
47
智谱开源GLM-5.2,OpenAI用GPT-5.4改进化学反应,MiniMax规划10T模型

智谱开源GLM-5.2,Code Arena盲测全球可用模型第一,专注Coding与长程任务,支持百万token无损上下文,单位token FLOPs降至2.9倍,MIT协议全开源。OpenAI将GPT-5.4接入Molecule.one自主改进Chan-Lam偶联反应,两轮10080次实验后平均产率从16.6%升至25.2%,14组底物中11组提升。MiniMax闫俊杰称M3目标无限制用Sonnet/Opus级别模型,计划攻克10T参数模型。

ginobefun: http://x.com/i/article/2067387524339929088

OpenAI开源生态模型发布行业动态
‹ 上一页
1…678910…36
下一页 ›