AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「开源生态」清除
5月21日周四
08:00HuggingFace Daily Papers(社区热门论文)51理解数据时间性对大语言模型预训练的影响
08:00HuggingFace Daily Papers(社区热门论文)39表征优于路由:克服多时间尺度PPO中的替代目标劫持
05:18OpenClaw🦞66精选OpenClaw 2026.5.19版本发布
02:24MarkTechPost(RSS)65如何使用 kg-gen、NetworkX 分析和交互式可视化工具从文本构建知识图谱生成管道
01:36Rohan Paul67Velobase开源AI SaaS商业基础设施框架
5月20日周三
23:00TechCrunch:AI(RSS)63Stability AI发布可生成6分钟音频的新模型
20:08Berryxia.AI70本地AI生图"意外"加速,Draw Things新发现
15:33Alibaba Cloud51Qwen 2026新加坡大会即将开幕
14:31向阳乔木76精选开源油猴脚本实现多平台截图上传与内容处理
14:01向阳乔木69开源实用油猴脚本,不上班却更忙更充实
12:05HuggingFace Daily Papers(社区热门论文)72精选GoLongRL:面向能力的长期上下文强化学习与多任务对齐
12:02Alibaba Cloud56Qwen 2026大会新加坡举办,全栈AI突破亮相
11:34Rohan Paul73SenseNova U1开源发布,革新原生多模态生成
08:10Simon Willison 博客45datasette-llm-accountant 0.1a4版发布
08:00HuggingFace Daily Papers(社区热门论文)55SciAtlas:面向自动化科学研究的大规模知识图谱
04:41xAI:News(网页)60精选在OpenClaw中使用Grok
02:55IT之家(RSS)60谷歌推出 AI 通用购物车,联合亚马逊、Meta、微软打造 AI 电商协议
01:02Berryxia.AI38推特科技圈宝藏AI架构师与社群推荐
00:42Nathan Lambert66学术失衡:AI研究转向闭源与全球知识扩散
5月19日周二
20:52AYi64Damn it!SAM3绝逼要封神了! 不但开源而且强的一批! 最牛逼的地方是追踪能力, 即使在篮球比赛这种 复杂到爆炸的场景里也稳得一逼!!
17:07歸藏(guizang.ai)58藏师傅PPT Skill 25天破万Star,质量制胜
16:51IT之家(RSS)74精选地平线开源 HoloMotion-1 4 亿参数机器人小脑大模型,可实现舞蹈、健身、搬箱子等动作
16:49Xiaomi MiMo36Apache提交者免费获MiMo百万Token额度
15:51IT之家(RSS)73精选Kimi最新融资获国资与央企加注,估值半年翻四倍
15:00swyx🛬 SFO20Vercel与Supabase收购竞猜进行中
11:04Tencent Hy72精选开源古代汉字视觉感知评估基准Chronicles-OCR
09:59Simon Willison 博客52五分钟概览大语言模型领域近六个月发展
09:45IT之家(RSS)45Qwen 3.7?阿里云峰会 5 月 20 日举行,千问官宣"重量级新朋友"即将亮相
08:00HuggingFace Daily Papers(社区热门论文)57在类别不平衡的CT身体成分分割中,解耦采样策略与训练预算
08:00HuggingFace Daily Papers(社区热门论文)63Toto 2.0:时间序列预测进入规模扩展时代
08:00HuggingFace Daily Papers(社区热门论文)69OScaR:面向LLM及其多模态扩展的极致KV缓存压缩框架
07:25karminski-牙医59字节跳动开源全模态模型Lance:轻量高效的"拼好模"
02:12Rohan Paul57HiDream开源8B参数统一架构图像模型,挑战传统扩散管线
01:04Hacker News 热门(buzzing.cc 中文翻译)63我们利用 Git 的 -author 参数,成功阻止了 GitHub 仓库中的 AI 机器人垃圾信息
5月18日周一
23:34Hacker News 热门(buzzing.cc 中文翻译)65Linux 安全邮件列表"几乎难以管理"
15:32向阳乔木64开源Agent IDE ORCA发布:支持移动端与多账号切换
11:45IT之家(RSS)59Linux 之父 Linus 发飙:别用 AI 提交大量重复 Bug 报告,直接提修复方案,OK?
08:00HuggingFace Daily Papers(社区热门论文)57SAGA:一种用于多时间概率预测的序列自适应生成架构与自适应时序保形预测
02:01Yann LeCun64若无西方开源AI领军者,中国开源模型或成2030年全球默认选择
01:00向阳乔木80精选开源微信读书数据可视化工具yao-weread-skill发布
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月21日
08:00
HuggingFace Daily Papers(社区热门论文)
51
理解数据时间性对大语言模型预训练的影响

研究比较了按时间顺序排列数据与传统打乱数据两种预训练方式,针对一个在6B参数模型上训练的实验。研究引入了包含超过7000个时间锚定问题的新基准。结果发现,时间有序预训练的模型在通用语言能力上与打乱预训练基线持平,但其知识更及时、时间定位更准确;打乱预训练则在旧数据上表现达到峰值。代码、模型检查点和数据集已开源。

arXivGitHub开源生态数据/训练
08:00
HuggingFace Daily Papers(社区热门论文)
39
表征优于路由:克服多时间尺度PPO中的替代目标劫持

在强化学习中,多时间尺度PPO虽旨在平衡短期与长期规划,但在复杂延迟奖励任务中盲目融合多时间信号会导致严重的算法问题。研究发现,将时间注意力路由机制暴露于策略梯度会导致替代目标劫持,而无梯度不确定性加权则会引发不可逆的短视退化。为此,研究提出Target Decoupling架构:Critic侧保留多时间尺度预测以辅助表征学习,Actor侧则严格隔离短期信号并仅基于长期优势更新策略。在LunarLander-v2环境中的实验证明,该架构无需超参数调整即可稳定超越解决阈值,消除策略崩溃并跳出局部最优。实验代码已开源:https://github.com/ben-dlwlrma/Representation-Over-Routing。

arXiv开源生态论文/研究
05:18
OpenClaw🦞@openclaw
精选66
OpenClaw 2026.5.19 🦞 📱 Android Talk Mode 实现实时化 🍎 Mac 设置界面更清爽 🔐 xAI 登录支持无头模式 🧵 Telegram 话题功能更稳定 大版本更新,简短公告。 https://github.com/openclaw/openclaw/releases/tag/v2026.5.19
产品更新开源生态语音

推荐理由:一堆小修小补但都很实用,尤其 Android 实时对话模式,开源 AI 客户端里难得把体验做到这个程度,值得更新。
02:24
MarkTechPost(RSS)
65
如何使用 kg-gen、NetworkX 分析和交互式可视化工具从文本构建知识图谱生成管道

该教程演示了如何利用 kg-gen 工具,结合 LLM 与 LiteLLM 配置,从纯文本、对话及多源文档中提取实体、谓词和关系,并生成知识图谱。内容涵盖了从简单文本处理到使用分块与聚类技术应对长文本的进阶步骤,随后通过 NetworkX 进行图谱分析,并最终实现交互式可视化,为构建端到端的知识图谱生成流程提供了实践指南。

开源生态教程/实践数据/训练
01:36
Rohan Paul@rohanpaul_ai
67
Velobase开源AI SaaS商业基础设施框架

Velobase宣布开源其AI SaaS框架Velobase Harness。该项目强调,在AI应用时代,产品本身并非真正的护城河,将用户转化为收入的基础设施才是关键。Velobase自身从应用无人问津发展到实现八位数ARR的经历,印证了这一观点。该框架旨在补全从可用应用到盈利业务之间的缺失环节,提供包括支付计费、用户归因、分析与A/B测试在内的全套后端服务。

Velobase: Everyone can build an app now. Almost no one makes a dollar from it. We went from the same problem to 8-figure ARR. The ...

开源/仓库开源生态部署/工程
5月20日
23:00
TechCrunch:AI(RSS)
63
Stability AI发布可生成6分钟音频的新模型

Stability AI正式推出Stability Audio 3.0 small模型,该模型可在用户设备本地运行,生成时长最高达两分钟的音乐音轨。与此前云端生成较长音频的方案不同,此次更新强调了模型的轻量化与端侧部署能力,降低了对云计算资源的依赖。

多模态开源生态模型发布
20:08
Berryxia.AI@berryxia
70
本地AI生图"意外"加速,Draw Things新发现

在开源生图软件Draw Things中,一项意外发现显著提升了本地AI生图速度。将原为Z-Image Base训练的Z-Image-Fun-Lora-Distill与Z Image Turbo搭配使用后,原本需要8-9步的生成过程可缩减至3-4步,大幅缩短了本地生成时间,同时保持了画质与细节的稳定。这一组合有效突破了此前本地生图速度较慢的限制。

Draw Things: 🔍 An interesting discovery! 🧩 Z-Image-Fun-Lora-Distill from alibaba-pai was originally trained for Z-Image Base, with ...

图像生成开源生态教程/实践
15:33
Alibaba Cloud@alibaba_cloud
51
Qwen Conference 2026即将举行! 5月26日,新加坡金沙会展中心。 主讲全栈AI突破,设3个平行论坛, 1000平方米展区展示7+模型与6+ Agent工具。 立即注册:https://click.qwencloud.com/m/20000000142/
智能体开源生态行业动态
14:31
向阳乔木@vista8
精选76
开源油猴脚本实现小红书、抖音、微信公众号的截图粘贴自动上传,并支持YouTube字幕复制、倍速调节及内容导出至NotebookLM、ChatGPT等工具。主推文作者表示,该工具增强了将X平台内容同步至国内平台的意愿,尽管部分平台体验欠佳。

向阳乔木: 完成了第一项工作,开源自己常用的油猴脚本。 1. 小红书、抖音、微信贴图,截图粘贴自动上传。 2. Youtube字幕复制,倍速调节,复制字幕给NotebookLM、ChatGPT处理。 3. 小宇宙网页版倍速调整 开源地址:https:/...

GitHub开源/仓库开源生态

推荐理由:向阳乔木开源了一套油猴脚本,让截图直接粘贴上传到小红书、抖音等平台,对多平台内容分发的人来说是一个小而实在的时间节省利器。
14:01
向阳乔木@vista8
69
开源实用油猴脚本,不上班却更忙更充实

作者开源了自己常用的油猴脚本,主要功能包括小红书、抖音等平台的截图自动上传,以及YouTube字幕复制与倍速调节,方便与NotebookLM、ChatGPT等工具配合使用,同时支持小宇宙网页版调速。这是其个人工作清单的一项,作者感叹不上班后的日程(如测试AI产品、体验谷歌新模型等)反而更满,但核心在于所有事务都是自主选择并乐在其中。

向阳乔木: 今天的 Todolist 清单: 1. 上架一个快捷提示词 Chrome 插件 2. 开源几个油猴脚本 3. 测朋友的 AI 产品,写个简单评测 4. 准备周六直播问题 5. 去海河钓鱼 6. 体验谷歌昨天的发布模型和工具 ... 不上班比...

开源/仓库开源生态
12:05
HuggingFace Daily Papers(社区热门论文)
精选72
GoLongRL:面向能力的长期上下文强化学习与多任务对齐

GoLongRL是一个全开源的长期上下文强化学习方案,聚焦于使用可验证奖励的强化学习。该工作提出了面向能力的数据构建方法,公开发布了包含23K样本的数据集、完整构建管线及训练代码。数据集依据长期上下文能力分类,涵盖9种任务类型,由真实文档生成的问答对构成;实验证明该数据集性能优于闭源的QwenLong-L1.5数据集。训练得到的Qwen3-30B-A3B模型在长期上下文任务上达到了与DeepSeek-R1-0528等先进模型可比的性能。此外,提出了TMN-Reweight多任务优化方法,通过任务级归一化和难度自适应加权,在提升平均性能的同时保持或增强了通用能力。

开源生态推理数据/训练论文/研究

推荐理由:开源长上下文RL的配方直接放出来了,数据集+代码全都有。更狠的是单靠数据多样性就干掉了闭源竞品,甚至摸到了DeepSeek-R1的水平,做长上下文的值得复现。
12:02
Alibaba Cloud@alibaba_cloud
56
Qwen Conference 2026即将到来! 5月26日,新加坡金沙会展中心,全栈AI突破、3场平行论坛、1000平方米展区,展示7+模型与6+ Agent工具。 立即注册:https://click.qwencloud.com/m/20000000142/
智能体开源生态行业动态
11:34
Rohan Paul@rohanpaul_ai
73
SenseNova U1开源发布,革新原生多模态生成

商汤科技SenseNova U1已开源发布。其核心创新在于原生多模态统一建模,将视觉、语言与图像生成视为一个统一问题,而非分立模块的链式处理,从而减少了信息损失。该模型采用MoT架构(38B-Active 3B MoE),在生成信息图、海报、漫画等结构复杂的密集图文内容时能保持高度一致性。详细的技术报告披露了其包括近无损视觉接口、联合训练策略在内的完整构建方案,为行业提供了前沿参考。

SenseTime: 🔥 New week, New SenseNova-U1 Drop - and this one goes Deep!🔥 📄 The full Technical Report is OUT - the most detailed d...

图像生成多模态开源生态模型发布
08:10
Simon Willison 博客
45
datasette-llm-accountant 0.1a4版发布

Datasette 生态下的 LLM 账户管理工具 datasette-llm-accountant 发布了 0.1a4 预览版。本次更新修复了一个关键问题,即追踪对话链(chains of responses)时存在的缺陷,相关修复可追溯至 datasette-llm#7 问题。该版本主要用于提升使用 Datasette 管理与分析大语言模型调用时的稳定性和准确性。

产品更新开源生态
08:00
HuggingFace Daily Papers(社区热门论文)
55
SciAtlas:面向自动化科学研究的大规模知识图谱

SciAtlas 是一个大规模、多学科、异构的学术资源知识图谱,旨在为自动化科学研究提供“认知地图”。它整合了26个学科的超过4300万篇论文,包含1.57亿实体和30亿三元组,构建了可打破学科壁垒的结构化拓扑认知底座。为克服现有检索工具缺乏拓扑推理能力的问题,其开发了具备三路协同召回和图重排序功能的神经符号检索算法,实现从语义匹配到确定性关联发现的过渡。应用方向包括文献综述、研究趋势综合、想法定位与学术轨迹探索,旨在以结构化方式赋能科研全流程并显著降低推理成本。相关接口已在GitHub开源。

智能体开源生态搜索论文/研究
04:41
xAI:News(网页)
精选60
在OpenClaw中使用Grok

5月22日,xAI宣布,其用户现可在开源个人助理OpenClaw中直接使用Grok模型。所有持有SuperGrok或X Premium订阅的用户均可使用该功能。OpenClaw是一个开源的、本地优先的智能助手,可在多种硬件上运行并保持跨会话记忆,同时能接入WhatsApp、Telegram等多款主流通讯平台。用户通过简单安装和登录,即可在自有设备上运行OpenClaw,并通过其界面或关联的聊天工具与Grok交互。此举进一步扩展了Grok的应用场景,未来还将推出更多开源代理与集成支持。

智能体产品更新开源生态

推荐理由:Grok 开始融入开源 agent 生态了,OpenClaw 的本地优先加多平台连接让这集成对开发者挺实用,有 Grok 订阅的可以直接试试。
02:55
IT之家(RSS)
60
谷歌推出 AI 通用购物车,联合亚马逊、Meta、微软打造 AI 电商协议

在2026年I/O开发者大会上,谷歌宣布推出AI电商通用购物车“Universal Cart”及相关协议。核心协议包括开源的通用购物车协议UCP(获亚马逊、Meta、微软等支持),旨在为智能体提供通用语言;以及智能体支付协议AP2,用于管理AI支付流程。该功能将于今年夏天在谷歌搜索、Gemini、YouTube、Gmail中上线,支持多场景添加商品、追踪优惠与历史价格,并具备智能推理能力,可检测兼容性并推荐替代品。

智能体Google产品更新开源生态
01:02
Berryxia.AI@berryxia
38
推特科技圈宝藏AI架构师与社群推荐

推文推荐了AI架构师“烟花老师”,其社群运营出色,汇聚了众多研发、产品与创业领域的高质量成员,交流氛围与深度俱佳。他在X(原Twitter)平台比在国内其他自媒体平台获得了更积极的反馈与传播。作为近40个垂直AI免费社群的联创,其开源项目fireworks-tech-graph在X平台传播下获得了近7k star的关注。整体展现了其作为优质信息源与社区构建者的价值。

烟花老师: 还有一百多就五千订阅了,不知道一觉醒来会不会有惊喜。我经常不按常理出牌,就提前写好庆祝5k订阅达成吧,哈哈🎆 我主业是一个AI架构师,也是一支烟花AI社区的联创,从23年至今大概积累了40个垂直的AI社群,大家都很纯粹 全都是免费的社群,...

开源生态行业动态
00:42
Nathan Lambert@natolambert
66
学术失衡:AI研究转向闭源与全球知识扩散

本文指出,AI研究正从学术界主导向工业界闭源化转变,打破了长期由中立学者传播前沿知识的社会平衡。科技公司通过制造不信任感掌控叙事,削弱了科学界服务公众的传统。同时,金融驱动的“错失恐惧症”迫使许多志在学术的人才流向工业界。作者认为,尽管短期内发展由闭源模型主导,但知识最终必然扩散,其长期轨迹仍与开放科学紧密相连。在这一趋势下,凭借更利于研究获取与传播的环境,中国有望在未来成为全球AI研究的新中心。

大佬观点开源生态现象/趋势
5月19日
20:52
AYi@AYi_AInotes
64
Damn it!SAM3绝逼要封神了! 不但开源而且强的一批! 最牛逼的地方是追踪能力, 即使在篮球比赛这种 复杂到爆炸的场景里也稳得一逼!!
Meta开源生态模型发布视频
17:07
歸藏(guizang.ai)@op7418
58
藏师傅PPT Skill 25天破万Star,质量制胜

藏师傅开发的PPT Skill项目在25天内突破1万Star,速度远超许多大厂知名项目,成为其vibe coding实践中首个达成此里程碑的项目。尽管市场存在众多PPT生成工具,但该项目通过注重质量和用户体验实现了快速增长,凸显了在激烈竞争中,高品质输出是核心决定因素。作者还感谢了用户和推广者的支持与反馈。

开源生态行业动态
16:51
IT之家(RSS)
精选74
地平线开源 HoloMotion-1 4 亿参数机器人小脑大模型,可实现舞蹈、健身、搬箱子等动作

地平线机器人实验室发布了其开源的人形机器人全身控制模型 HoloMotion-1。这是一个拥有 4 亿参数的“小脑”大模型,通过 MoE 稀疏激活与 KV-cache 推理机制,在端侧实现了约 300FPS 的实时推理能力。该模型利用互联网视频、光学动捕、VR 遥操作等多种来源的动作数据进行训练,并在真实机器人上成功展示了舞蹈、爬行、健身、搬箱子等复杂动作的零样本迁移能力。相关代码与技术报告已公开。

具身智能开源生态模型发布

推荐理由:地平线开源的这个4亿参数模型,把机器人“小脑”拉到一个小模型级别,300FPS实时跑在端侧,零样本跳舞搬箱子,搞具身智能的该跟进看看了。
16:49
Xiaomi MiMo@XiaomiMiMo
36
📢致所有Apache软件基金会提交者 小米MiMo将通过"100T Token Builder计划"向您免费提供我们的Max Token套餐。 使用您的http://apache.org邮箱注册 → 即刻激活。 立即注册:http://platform.xiaomimimo.com
产品更新开源生态
15:51
IT之家(RSS)
精选73
Kimi最新融资获国资与央企加注,估值半年翻四倍

月之暗面旗下AI助手Kimi正在进行20亿美元新融资,国智投、中国移动等国资机构及央企已加入股东名单,该轮融资已进入收尾阶段。今年1月和2月,Kimi已密集完成3轮融资,累计融资超39亿美元(约376亿元人民币),最新估值相比去年11月已翻4倍有余,成为大模型创业公司中融资最多的企业。产品层面,基于Kimi K2.5模型的Composer 2.5已集成至编程应用Cursor,公司近期也发布了开源模型Kimi K2.6。

开源生态行业动态

推荐理由:国资加码、估值一年翻 4 倍,Kimi 成了国内大模型创业里融钱最多的公司。不仅是钱的问题,C 轮之后国家队正式入场,未来政策倾斜和资源整合才是看点。
15:00
swyx🛬 SFO@swyx
20
正在为 Vercel 和 Supabase 下注

altra: Bun goes to Anthropic Stainless goes to Anthropic Astral goes to OpenAI Mintlify goes to OpenAI (???)

开源生态行业动态
11:04
Tencent Hy@TencentHunyuan
精选72
开源古代汉字视觉感知评估基准Chronicles-OCR

开源了评估视觉大语言模型(VLLM)对古代汉字视觉感知能力的基准测试Chronicles-OCR。该数据集覆盖了从甲骨文到草书的3000年演变历程,包含7种历史书体与2800张均衡图像。评估涵盖字形定位、细粒度识别、古代文本解析和字体分类四项核心任务,旨在探究视觉分布随时间的变化如何影响模型感知。相关论文与代码已开源。

多模态开源生态论文/研究

推荐理由:腾讯混元开源的视觉感知基准,专攻古汉字识别,覆盖从甲骨文到草书的三千年演变,做 OCR 和视觉模型的可以拿来测测自家模型在历史文本上的感知退化。
09:59
Simon Willison 博客
52
五分钟概览大语言模型领域近六个月发展

过去六个月,大语言模型领域发生了显著变化,尤其以2025年11月为关键转折点。在该月,被称为“最佳”的模型主导权在Anthropic、OpenAI和Google之间五次易手,先后经历了Claude Sonnet 4.5、GPT-5.1、Gemini 3等模型的快速迭代。同时,编码智能体技术取得突破,从“时常可用”跃升至“基本可用”,能够稳定执行实际开发任务,这标志着整个领域的应用成熟度得到显著提升。

AnthropicOpenAI大佬观点开源生态
09:45
IT之家(RSS)
45
Qwen 3.7?阿里云峰会 5 月 20 日举行,千问官宣"重量级新朋友"即将亮相

阿里云峰会将于5月20日举行。千问大模型官方发布预热海报,透露将有一位“重量级新朋友”亮相,其特点是“更全能、更强大、有深度、有广度”。结合海报中的吉祥物元素,预计本次将公布Qwen系列大模型的最新重要成果。此前,Qwen 3.7-Max-Preview和Qwen 3.7-Plus-Preview版本已率先在相关平台上线,有望在峰会上正式发布。

开源生态模型发布
08:00
HuggingFace Daily Papers(社区热门论文)
57
在类别不平衡的CT身体成分分割中,解耦采样策略与训练预算

针对医学图像分割中的类别不平衡问题,本研究将少样本学习中的情景采样引入全监督训练,以构建类别均衡的批次。研究在公开的SAROS数据集上,对比了情景采样、随机采样和加权采样在分割9种肌肉与脂肪组织时的表现。在低数据场景下,情景采样的平均Dice系数达到0.787,优于随机采样(0.758)和加权采样(0.762),主要原因是其训练迭代次数多出12倍。研究关键发现是,训练迭代预算本身是影响采样策略评估的重要混淆因素;情景采样能多训练约三倍的迭代次数才趋于稳定,表明类别均衡批次具有隐式正则化效应,为不平衡任务提供了一种低成本的通用策略。

arXiv开源生态数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
63
Toto 2.0:时间序列预测进入规模扩展时代

时间序列基础模型Toto 2.0正式发布,这是一组五个开源权重的预测模型。研究表明,在400万至25亿参数范围内,采用统一训练方案的模型预测质量能持续可靠提升。该模型家族在三大预测基准测试中创下新纪录,包括其可观测性基准BOOM、通用基准GIFT-Eval以及抗污染的TIME基准。所有五个基础模型检查点均基于Apache 2.0协议开放发布。

开源生态数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
69
OScaR:面向LLM及其多模态扩展的极致KV缓存压缩框架

针对长上下文与多模态大语言模型中KV缓存内存占用高的瓶颈,本文提出了OScaR压缩框架。研究发现,传统逐通道量化在极端压缩下受限于“令牌范数不平衡”问题。OScaR通过“渠道化旋转”与“全令牌缩放”两项轻量技术,有效缓解了该不平衡带来的量化误差,无需复杂流程。在多种大模型上的实验表明,OScaR在INT2量化下可实现近乎无损的性能,相比基准解码速度提升最高达3.0倍,内存占用减少5.3倍,吞吐量增加4.1倍,为极致KV缓存压缩提供了高效通用方案。

GitHub开源生态推理论文/研究
07:25
karminski-牙医@karminski3
59
字节跳动开源全模态模型Lance:轻量高效的"拼好模"

字节跳动开源了全模态模型Lance,其激活参数量仅为3B,却能同时处理文本、图片和视频的输入与输出,完成理解、生成与编辑等多种任务。该模型通过模块化拼接构建了Lance_3B与Lance_3B_Video两个版本,其创新在于采用共享交错序列统一语义空间,并引入专用专家模块协调理解与生成的互斥关系,使得小参数模型性能接近更大规模模型。训练仅需128张A100,对端侧部署和多模态Agent应用具有重要价值。

多模态开源生态模型发布
02:12
Rohan Paul@rohanpaul_ai
57
HiDream开源8B参数统一架构图像模型,挑战传统扩散管线

HiDream开源了8B参数的HiDream-O1-Image模型,其核心创新在于采用像素级统一变换器,用单一架构直接处理原始图像块、文本与任务条件,将文本生成图像、编辑、个性化等任务统一为上下文生成,无需传统的VAE和文本编码器管线。该模型内置推理提示代理,能原生支持最高2048×2048的高分辨率合成。在性能上,它在参数量仅为部分同类模型三分之一的情况下,达到了可比的水平,尤其在文本渲染任务上表现出色,结果接近更大规模的模型。

图像生成开源生态推理模型发布
01:04
Hacker News 热门(buzzing.cc 中文翻译)
63
我们利用 Git 的 -author 参数,成功阻止了 GitHub 仓库中的 AI 机器人垃圾信息

一个团队利用 Git 的 --author 参数,成功阻止了 GitHub 仓库中的 AI 机器人垃圾信息,并在博客中分享了这一方法的具体实现,展示了其在实践中有效遏制自动化垃圾提交的效果。

开源生态教程/实践
5月18日
23:34
Hacker News 热门(buzzing.cc 中文翻译)
65
Linux 安全邮件列表"几乎难以管理"

AI漏洞挖掘工具的广泛应用导致Linux安全邮件列表收到的自动提交漏洞报告数量激增,使其“几乎难以管理”。具体数据显示,该邮件列表每周收到约100封邮件,其中大部分为自动化生成的报告,真正需要核心维护者关注的漏洞仅占少数。这种变化反映了安全研究自动化对开源社区协作模式带来的新挑战。

安全/对齐开源生态行业动态
15:32
向阳乔木@vista8
64
开源Agent IDE ORCA发布:支持移动端与多账号切换

ORCA是一款新开源的Agent IDE,提供iOS及移动端客户端,支持多账号切换(例如多个ChatGPT订阅),并显示Token消耗与5小时重置信息。它能自动检测电脑中已安装的CLI工具,如Claude Code CLI、Codex CLI、Gemini CLI等,支持目录文件拖拽对话及内置Markdown预览。该工具优化了Tui工具的常见痛点,但安装包体积较大。开源地址及官网已公布。

智能体MCP/工具开源/仓库开源生态
11:45
IT之家(RSS)
59
Linux 之父 Linus 发飙:别用 AI 提交大量重复 Bug 报告,直接提修复方案,OK?

Linus Torvalds 发布 Linux 7.1 第四个候选版本,并批评 AI 工具导致大量重复 bug 报告,使安全列表难以管理。他强调开发者应直接提交修复方案,而非仅报告问题,以减少不必要工作。Linus 表示自己过去20年更多担任技术维护者,AI 只是工具,不会替代程序员。

大佬观点安全/对齐开源生态
08:00
HuggingFace Daily Papers(社区热门论文)
57
SAGA:一种用于多时间概率预测的序列自适应生成架构与自适应时序保形预测

SAGA是一种基于解码器专用Transformer的序列自适应生成模型,专为处理不规则表格面板数据的时序预测而设计。它结合分割保形校准方法,为个体提供具有有限样本覆盖率保证的预测区间。模型使用瑞典1990年至2022年的纵向登记数据训练,涵盖超214万个体与6100万人次年记录,可预测未来1至30年的年度劳动收入,并通过蒙特卡洛方法聚合为折现终身收入分布。相比传统参数化过程及基线模型,SAGA在十年期预测的连续排序概率评分降低31.9%,二十年期平均绝对误差降低37.7%。其保形区间覆盖率误差不超过0.4个百分点,重构的终身收入基尼系数为0.327,接近实际值0.341,优于GKOS估计的0.378。相关模型与数据已公开以供复现。

开源生态数据/训练论文/研究
02:01
Yann LeCun@ylecun
64
推文警告,若西方无法尽快出现可信的开源前沿AI参与者,后果将迅速扩散。这与早期互联网格局相反:过去西方科技巨头主导全球,而中国自建生态;AI时代可能逆转这一态势。若无西方开源力量,能够支撑整个经济体的开源模型将仅由中国提供。若美国以国家安全为由进一步限制获取中国开源模型,其国内市场将仅由两三个封闭系统服务,而全球约60亿人口可能选择免费、强大、可自托管且不受禁运的中国AI技术栈。到2030年,中国开源模型或成为全球默认选择,导致美国在技术上自我孤立于世界大多数AI用户。

Daniel Jeffries: I don't think people understand just how bad it will be if an American open source champion doesn't emerge soon and the ...

Meta大佬观点开源生态
01:00
向阳乔木@vista8
精选80
开发者姚老师开源了微信读书Skill--yao-weread-skill。该工具能将用户的微信读书数据生成本地可视化报告,核心功能包括分析近两年的阅读时长与节律、书架书籍构成、阅读分类与作者偏好,并对笔记和想法进行语义分析。报告最终通过词云、热力图、雷达图等26种图表形式呈现,所有代码已在GitHub公开。

姚金刚: 写了一个微信读书可视化报告skill:yao-weread-skill,已开源到GitHub 它可以把微信读书数据,生成一份本地可视化读书报告,包括: 1、近2年阅读时长与节律 2、书架书籍分析 3、阅读分类、作者、出版社偏好 4、笔记、划...

GitHubMCP/工具开源/仓库开源生态

推荐理由:姚老师这个开源的微信读书skill,能直接拉取你的阅读数据,生成热力图、词云等26张可视化图表,读完就能装,做个人报告的可以直接抄作业。
‹ 上一页
1…2021222324…37
下一页 ›