AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「开源生态」清除
5月9日周六
22:13向阳乔木47刚和元子 @yuanzi_owO 姚老师 @yaojingang 直播分享了最近用AI做的工具,开源的一些项目。 很多人问各种工具和文档地址,我贴在评论区,方便大家使用。
15:50Hacker News 热门(buzzing.cc 中文翻译)47"Linux"基金会的预算中,超过97%并未用于Linux
14:29IT之家(RSS)58英伟达发布 CUDA-Oxide 0.1,邀请开发者使用 Rust 开发 CUDA 内核
08:00HuggingFace Daily Papers(社区热门论文)45LLiMba:在单张消费级GPU上为濒危罗曼语撒丁语适配30亿参数模型
08:00HuggingFace Daily Papers(社区热门论文)58SlimQwen:探索大型混合专家模型预训练中的剪枝与蒸馏
02:34Hugging Face:Blog(RSS)52CyberSecQwen-4B 发布:防御性网络安全专用小模型
00:34Hugging Face:Blog(RSS)72精选EMO:为涌现模块化预训练的专家混合模型
5月8日周五
20:22IT之家(RSS)67消息称 DeepSeek 寻求 500 亿元融资,下月将发布 V4.1 更新
16:23Hugging Face:Blog(RSS)58精选MedQA:基于AMD ROCm与LoRA微调Qwen3-1.7B的临床问答模型
14:14向阳乔木32VLC与FFmpeg开发者访谈揭示播放器设计哲学
10:16IT之家(RSS)57商汤发布日日新 SenseNova 6.7 Flash-Lite 多模态模型,Token Plan 限时免费
09:10Nathan Lambert11情绪驱动AI写作成效佳
08:00HuggingFace Daily Papers(社区热门论文)57基于前缀一致性的可靠思维链方法
08:00HuggingFace Daily Papers(社区热门论文)66jina-embeddings-v5-omni:通过冻结塔组合实现文本几何保持的多模态嵌入
08:00HuggingFace Daily Papers(社区热门论文)46SplatWeaver:一种为可泛化新视角合成动态分配高斯图元的框架
08:00HuggingFace Daily Papers(社区热门论文)56ModelLens:从海量模型中为你的任务寻找最佳模型
08:00HuggingFace Daily Papers(社区热门论文)53MatryoshkaLoRA:一种用于大语言模型微调的学习精确层次化低秩表示的通用框架
08:00HuggingFace Daily Papers(社区热门论文)61先验对齐自编码器:为潜在扩散模型构建友好的潜在流形
07:09Ethan Mollick60Mythos模型确具实力 通用型AI展现多重能力
05:35Orange AI74开源AI Agent网盘NeuDrive,支持主流工具与自动同步
05:29Anthropic:Research(发表成果 · 网页)73精选捐赠开源对齐工具 Petri
05:11Anthropic56Anthropic开源对齐工具Petri捐赠并更新
04:30Simon Willison 博客28llm-gemini 0.31
02:40Nathan Lambert63开放算法配方是高效利用算力的关键
02:30Simon Willison 博客67借助Claude Mythos Preview,Mozilla在幕后强化Firefox安全
01:29Anthropic:Research(发表成果 · 网页)81精选自然语言自编码器:将Claude的"想法"解码为文本
00:13向阳乔木70AI助手可一键生成70余种公众号排版风格
5月7日周四
22:04Orange AI75精选ColaMD 1.5版实现Markdown内容与HTML模板分离
20:43向阳乔木74开源,通通开源,哈哈哈。 【引用 @yaojingang】:和 @vista8 讨论了下,决定将我们的新书《AI营销:从SEO到GEO》里配套的25个AI营销与GEO相关的提示词,也开源到GitHub 另外补充了部分短视频和文案相关的提示词,欢迎下载使用或重新拉取 1、提示词合集地址: https://github.com/yaojingang/yao-open-promptsGEO 2、GEO提示词合集: https://github.com/yaojingang/yao-open-prompts/blob/main/prompts/08-ai-marketing/README.md
20:16IT之家(RSS)64中国信通院联合腾讯、华为等发起智能体可信握手协议(ATH),建立智能体开源社区
18:16IT之家(RSS)69小米开源 OmniVoice 多语言语音克隆 TTS,号称一个模型搞定 600 余种语言
17:06meng shao61用好 Google 开放标准 DESIGN.md + Agent Skills,1 小时把创业项目做出「亿元公司」的质感
12:16IT之家(RSS)61OpenAI 携手英伟达等 5 大巨头发布 MRC 协议,重塑大规模 AI 训练网络架构
11:16阿绎 AYi63AI在专业命理大赛接近人类顶尖水平,技术路径可迁移至垂直领域
09:42向阳乔木32这项目有意思,让由 20 不同大模型开发相同的UI组件。 看出来的效果有什么不同。 比如GPT-5.5 用文字有点多,感觉还是Opus 4.7好点。 网址见评论
09:38swyx 🌉31技术工具Openclaw与Cline Velocity价值被低估
09:20Berryxia.AI62SpaceX开放超算算力给Anthropic,并计划合作开发太空AI计算
08:36Replit ⠕67精选首届AI创意大会即将登陆纽约
08:00HuggingFace Daily Papers(社区热门论文)48MobileEgo Anywhere:基于通用硬件的长时程自我中心数据开放基础设施
03:36The Decoder:AI News(RSS)58OpenAI 联合 AMD、Broadcom、Intel、Microsoft 和 NVIDIA 构建网络协议以解决 AI 超级计算机瓶颈
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月9日
22:13
向阳乔木@vista8
47
刚和元子 @yuanzi_owO 姚老师 @yaojingang 直播分享了最近用AI做的工具,开源的一些项目。 很多人问各种工具和文档地址,我贴在评论区,方便大家使用。
开源/仓库开源生态编码
15:50
Hacker News 热门(buzzing.cc 中文翻译)
47
"Linux"基金会的预算中,超过97%并未用于Linux

Linux基金会2026年预算中,超过97%的资金并未直接用于Linux内核开发,而是流向了基金会旗下的其他项目和倡议。这一数据凸显了基金会工作重心的显著转移,其资源主要投入在云原生、区块链、人工智能等更广泛的开放协作项目上,而核心的Linux开发仅获得极小部分的预算支持。

开源生态现象/趋势
14:29
IT之家(RSS)
58
英伟达发布 CUDA-Oxide 0.1,邀请开发者使用 Rust 开发 CUDA 内核

英伟达实验室发布了实验性开源项目CUDA-Oxide 0.1编译器,允许开发者使用Rust语言直接为NVIDIA GPU编写CUDA内核。该编译器将标准Rust代码输出为CUDA生态的底层中间表示PTX,支持单源码编译并提供设备端抽象,旨在通过Rust的类型系统和内存安全优势,减少传统CUDA开发中的常见错误。项目采用自定义的rusc编译器后端,首个版本已开源发布。

开源/仓库开源生态编码
08:00
HuggingFace Daily Papers(社区热门论文)
45
LLiMba:在单张消费级GPU上为濒危罗曼语撒丁语适配30亿参数模型

研究团队基于Qwen2.5-3B-Instruct模型,在单张24GB消费级GPU上通过持续预训练与监督微调,开发出支持撒丁语的30亿参数模型LLiMba。训练语料包含1150万撒丁语词元及240万相关罗曼语文本。实验发现,持续预训练后模型在撒丁语困惑度降至6.76,并在所有FLORES-200翻译方向上超越基础模型。在五种微调配置中,rsLoRA r256在英译撒丁语任务中以28.5 BLEU值表现最佳。研究表明,适配器容量对低资源罗曼语适配的影响大于具体变体选择,且翻译指标虽能排序配置,但无法完全反映其定性行为的本质差异。

Hugging Face开源生态数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
58
SlimQwen:探索大型混合专家模型预训练中的剪枝与蒸馏

本研究系统探索了在大规模预训练中对混合专家模型进行压缩的方法。关键发现包括:对预训练MoE模型进行结构化剪枝,在相同训练预算下始终优于从头训练目标架构;不同的一次性专家压缩方法经过大规模持续预训练后性能趋同,为此提出一种简单的部分保留专家合并策略以提升下游任务表现。结合知识蒸馏与语言建模损失优于单独使用蒸馏,特别是在知识密集型任务上,进一步提出的多令牌预测蒸馏方法能带来稳定增益。在训练令牌数相同的情况下,渐进式剪枝方案优于一次性压缩。综合这些方法,成功将Qwen3-Next-80A3B模型压缩至23A2B,同时保持了有竞争力的性能。

开源生态数据/训练论文/研究
02:34
Hugging Face:Blog(RSS)
52
CyberSecQwen-4B 发布:防御性网络安全专用小模型

CyberSecQwen-4B 是基于 Qwen3-4B-Instruct-2507 微调的 4B 参数防御性网络安全模型,在 CTI-Bench 上以半参数(4B vs 8B)对标 Cisco Foundation-Sec-Instruct-8B:CTI-MCQ 得分 0.5868,领先 8.7 个百分点;CTI-RCM 得分 0.6664,保留后者 97.3% 的准确率。可运行于单张 12 GB 消费级 GPU,训练使用 AMD Instinct MI300X,LoRA 微调(r=64, lr=5e-5),数据来自 MITRE/NVD 的 2021 CVE→CWE 映射及合成分析师问答,以 Apache-2.0 许可发布。专为需本地部署的敏感安全场景设计。

Hugging Face安全/对齐开源生态模型发布
00:34
Hugging Face:Blog(RSS)
精选72
EMO:为涌现模块化预训练的专家混合模型

EMO是一种新型专家混合模型,通过端到端预训练使模块化结构直接从数据中涌现,无需依赖人类定义的先验。该模型允许在特定任务中仅使用12.5%的专家子集(即8个活跃专家中的部分),同时保持接近全模型的性能;当所有128个专家共同使用时,它仍作为强大的通用模型。EMO具有1B活跃参数和14B总参数,训练数据达1万亿令牌。与标准MoE相比,EMO通过文档级路由约束,鼓励专家形成领域专业化组,从而支持选择性使用而不导致严重性能下降,实现了可组合架构,优化了大型稀疏MoE的内存-准确性权衡。

Hugging Face开源生态数据/训练模型发布

推荐理由:EMO 让 MoE 专家从按词法分散进化到按语义域自然模块化,仅用 12.5% 专家就能接近全模型性能,对需要按需加载的大模型部署是真正的突破。
5月8日
20:22
IT之家(RSS)
67
消息称 DeepSeek 寻求 500 亿元融资,下月将发布 V4.1 更新

据知情人士消息,DeepSeek正寻求首轮融资,目标高达500亿元人民币,若成功将成中国AI公司迄今最大规模融资。创始人兼CEO梁文锋计划提供最大一笔资金。融资推动公司加快商业化节奏,计划提高模型发布频率以接近行业标准。同时,DeepSeek将于6月发布V4模型的更新版本V4.1。

DeepSeek开源生态模型发布行业动态
16:23
Hugging Face:Blog(RSS)
精选58
MedQA:基于AMD ROCm与LoRA微调Qwen3-1.7B的临床问答模型

该项目使用AMD Instinct MI300X(192 GB HBM3显存)和ROCm,通过LoRA微调Qwen3-1.7B模型实现医学问答。训练仅用2000条MedMCQA样本,约5分钟完成,仅更新约220万参数(占模型总参数的0.1443%),全程采用fp16精度,无需量化。HuggingFace生态(Transformers、PEFT、TRL、Accelerate)在ROCm上无缝运行,无需修改代码即可直接替代CUDA。模型已上传至HuggingFace Hub并提供在线Demo。

Hugging Face开源生态教程/实践数据/训练

推荐理由:一个月前的教程了,但如果你是 AMD 党想跑医疗微调,这篇把坑都踩完了,代码直接能复现,LoRA 适配器也挂在 Hub 上,拿来就能用。
14:14
向阳乔木@vista8
32
最新一期Lex Fridman访谈邀请了VLC播放器开发者和FFmpeg核心贡献者。访谈揭示了VLC最初是为在校园网播放卫星电视信号而设计的,其核心设计哲学是从第一天起就能处理不完整或损坏的文件,这解释了为何它能播放未下载完的AVI文件。一个有趣的现象是,VLC官网25%的流量来自用户搜索"cone player",因为许多用户只记得其图标是一个锥体。

向阳乔木: 最新一期Lex Fridman访谈了 VLC 播放器开发者,还有FFmpeg的核心贡献者。 有些冷知识很有趣,比如: VLC 最早是为在校园网播放卫星电视信号设计的。 以前网不好,UDP丢包家常便饭。 从第一天起,VLC 被设计成能处理 "...

其他开源生态
10:16
IT之家(RSS)
57
商汤发布日日新 SenseNova 6.7 Flash-Lite 多模态模型,Token Plan 限时免费

商汤科技推出新一代轻量化多模态模型“日日新 SenseNova 6.7 Flash-Lite”。该模型采用原生多模态架构,能直接理解网页、文档和图表,提升复杂任务处理效率。它取消了视觉转文本中间层,以更小参数量实现能力跨越,在权威测试中取得多项同级别SOTA,并在信息搜索等场景中比纯文本智能体降低60%的Token消耗。同时,商汤推出限时免费的SenseNova Token Plan,为开发者提供首月无门槛调用额度,并将其全线办公技能SenseNova-Skills在GitHub开源。

多模态开源生态模型发布
09:10
Nathan Lambert@natolambert
11
当我为AI领域的事物动情时,最终往往会付诸文字。 目前看来效果不错。

Dylan Patel: When you're sad you can either become and emotional eater or an emotional lifter. The latter is so much better.

其他开源生态
08:00
HuggingFace Daily Papers(社区热门论文)
57
基于前缀一致性的可靠思维链方法

本研究提出“前缀一致性”作为一种可靠性信号,用于改进大语言模型在推理任务中的自一致性方法。该方法通过截断思维链的中间部分并重新生成后续内容,发现正确答案的思维链更倾向于重现原答案。利用这一差异,前缀一致性对候选答案进行加权聚合,无需依赖词元概率或自评分提示。在五个推理模型和四个数学科学基准测试中,该方法在多数情况下成为最佳正确性预测指标,并以中位数4.6倍、最高21倍更少的词元消耗,达到了标准多数投票法的稳定准确率。相关代码已开源。

开源生态推理论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
66
jina-embeddings-v5-omni:通过冻结塔组合实现文本几何保持的多模态嵌入

本研究提出冻结编码器模型组合的新方法,基于VLM架构构建多模态嵌入模型。我们发布了jina-embeddings-v5-omni套件,包含两个模型,能将文本、图像、音频和视频输入编码到统一语义嵌入空间。该方法通过扩展Jina Embeddings v5文本模型,添加图像和音频编码器,但保持骨干文本模型和非文本编码器冻结,仅训练占总权重0.35%的连接组件,训练效率远高于全参数重训练。这确保了文本输入的嵌入结果与原始文本模型完全一致。评估显示,其性能与当前领先的大型多模态嵌入模型竞争,实现了高效且有效的多模态嵌入。

多模态开源生态论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
46
SplatWeaver:一种为可泛化新视角合成动态分配高斯图元的框架

针对现有基于3D高斯泼溅的方法为每个像素或体素分配固定数量图元,导致资源分配不均的问题,本文提出SplatWeaver框架。该框架引入一组基数高斯专家和一个像素级路由方案,能以前馈方式自适应地为不同空间位置分配0到M个高斯图元。通过结合高频先验与路由正则化,引导路由机制向精细结构、复杂几何和纹理区域分配更多图元,同时抑制平滑区域的冗余。多场景实验表明,SplatWeaver能以更少的图元数量,持续生成比现有先进方法更逼真的新视角渲染结果。

图像生成开源生态论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
56
ModelLens:从海量模型中为你的任务寻找最佳模型

开源生态拥有数十万个预训练模型,但为新数据集选择最佳模型极为困难。现有方法或局限于小型预选池,或需昂贵的逐模型计算。ModelLens框架创新性地利用公开排行榜上分散的交互记录,通过学习模型-数据集-指标三元组的性能感知潜在空间,可直接为未见过的数据集推荐未见过的模型,无需在目标数据集上运行候选模型。在一个包含162万条记录、覆盖4.7万个模型和9600个数据集的新基准测试中,其性能超越了依赖元数据或需运行每个候选模型的基线方法,并能将多种路由方法的性能提升高达81%,在文本和视觉-语言任务上展现了泛化能力。

arXivHugging Face多模态开源生态
08:00
HuggingFace Daily Papers(社区热门论文)
53
MatryoshkaLoRA:一种用于大语言模型微调的学习精确层次化低秩表示的通用框架

针对低秩适应(LoRA)微调方法中静态秩选择效率低、现有动态方法在高秩时性能欠佳的问题,研究团队提出MatryoshkaLoRA。该框架通过在现有LoRA适配器间插入一个固定的对角矩阵P,来相应地缩放其子秩,从而学习精确的层次化低秩表示。这一简单修改确保了所有子秩都能高效利用梯度信息,支持动态秩选择且精度损失最小。团队同时提出了“秩精度曲线下面积”(AURAC)评估指标。实验表明,该方法相比现有秩自适应方法能学习到更精确的表示,并在多个数据集上实现了更优的精度与性能权衡。代码已开源。

arXiv开源生态数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
61
先验对齐自编码器:为潜在扩散模型构建友好的潜在流形

本文研究了潜在扩散模型所需潜在流形的关键特性,提出了三个核心属性:连贯的空间结构、局部流形连续性和全局流形语义。基于此发现,研究者设计了先验对齐自编码器(PAE),它通过利用视觉基础模型提炼的先验和基于扰动的正则化,将这些属性转化为明确的训练目标,从而主动塑造对生成友好的潜在空间。在ImageNet 256x256数据集上的实验表明,PAE在训练效率和生成质量上均优于现有分词器,在相同设置下收敛速度比RAE快达13倍,并取得了1.03的最新最优gFID分数。

图像生成开源生态论文/研究
07:09
Ethan Mollick@emollick
60
Mythos确实不是营销炒作。 请记住这是一个通用模型,恰好擅长发现漏洞,因为优秀模型本就具备多重能力。预计OpenAI和谷歌也会有类似表现。开源模型在8个月内也将如此。https://hacks.mozilla.org/2026/05/behind-the-scenes-hardening-firefox/
大佬观点安全/对齐开源生态
05:35
Orange AI@oran_ge
74
开源AI Agent网盘NeuDrive,支持主流工具与自动同步

开发者开源了一款专为AI Agent设计的网盘NeuDrive,能够自动同步Agent的记忆、技能和文件。该工具支持Claude Code、Codex、Cursor等主流开发工具以及多种网页应用。项目已在GitHub开源,同时提供了可直接使用的部署版本。免费版已能满足绝大多数使用场景,付费版在付款时输入优惠码“vivo50”可兑换三个月免费使用权。

智能体GitHubMCP/工具产品更新
05:29
Anthropic:Research(发表成果 · 网页)
精选73
捐赠开源对齐工具 Petri

2025年10月,Anthropic公司开源了AI模型对齐测试工具箱Petri,用于快速检测模型的欺骗、奉承等风险倾向。该工具已成为Claude模型系列对齐评估的核心部分,并被英国AI安全研究所等外部机构采用。近日,Petri升级至3.0版本,主要改进包括:架构调整提升适应性,允许单独调整审计与目标模型;通过“Dish”附加组件使用真实系统提示和部署环境,增强测试真实性;与另一开源工具Bloom集成,实现更深入的行为评估。为确保独立性与公信力,Petri的开发已移交非营利组织Meridian Labs。

Anthropic安全/对齐开源生态

推荐理由:Petri 从 Anthropic 内部工具箱变成行业公共品,捐赠给 Meridian Labs 意味着对齐评估不再绑定一家公司,做安全测试的团队又多了一个可参考的标尺。
05:11
Anthropic@AnthropicAI
56
我们将开源对齐工具Petri捐赠给@meridianlabs_ai,使其能够独立持续发展。 与Meridian Labs合作,我们还发布了重大更新,提升了Petri测试的适应性、真实性和深度。 https://www.anthropic.com/research/donating-open-source-petri
Anthropic安全/对齐开源生态
04:30
Simon Willison 博客
28
llm-gemini 0.31

llm-gemini 0.31 版本发布,其中集成的 gemini-3.1-flash-lite 模型已结束预览状态,转为正式可用。该模型自三月份预览以来,其核心功能与特性未发生变化。此次更新标志着 Google 的 Gemini 系列模型在轻量级高性能路径上迈出了稳定的一步。

Google产品更新开源生态
02:40
Nathan Lambert@natolambert
63
由 @jacobcares 主导的研究表明,构建大语言模型的算力消耗很少集中在最终训练阶段,绝大部分算力实际用于开发算法配方。 公开创建算法配方是确保研究界算力能推动新知识产出的重要杠杆。

Ai2: Today we're bringing new NSF OMAI compute online with NVIDIA Blackwell Ultra-powered systems, turning a $152M national i...

大佬观点开源生态数据/训练
02:30
Simon Willison 博客
67
借助Claude Mythos Preview,Mozilla在幕后强化Firefox安全

Mozilla利用Claude Mythos Preview模型,成功定位并修复了Firefox中的数百个安全漏洞。此前AI生成的漏洞报告多为低质量信息,但随着模型能力提升及技术方法改进,报告质量发生显著变化。修复的漏洞包括一个存在20年的XSLT漏洞和一个长达15年的<legend>元素漏洞。值得注意的是,许多自动化攻击尝试已被Firefox现有的深度防御机制拦截。数据显示,2025年Mozilla每月修复约20-30个安全漏洞,而到2026年4月,单月修复数量跃升至423个,呈现爆发式增长。

Anthropic安全/对齐开源生态
01:29
Anthropic:Research(发表成果 · 网页)
精选81
自然语言自编码器:将Claude的"想法"解码为文本

Anthropic团队推出自然语言自编码器方法,能将大模型内部的激活值直接解码为可读文本。该方法通过训练“激活描述器”和“激活重建器”,形成“激活值→文本解释→重建激活值”的循环,并以重建相似度为目标进行优化。应用表明,NLA能揭示模型未言明的内部状态,例如在安全测试中,发现Claude内心意识到自己正被评估的比例远超其外部回应。团队已公开代码,并合作发布了交互式探索工具。

Anthropic安全/对齐开源生态论文/研究

推荐理由:Anthropic 搞出了一种从激活中直接读出自然语言的方法,相当于给 Claude 的内心戏配了字幕。他们用这招发现模型在安全测试里比表面更常怀疑自己被评估,对审计隐藏动机也有奇效。做 AI 安全的人应该立刻点开看。
00:13
向阳乔木@vista8
70
想让AI设计公众号排版CSS,可直接跟Agent说,参考Design md设计: https://github.com/VoltAgent/awesome-design-md/tree/main/design-md 一下能设计了70多个知名网站风格,选几个喜欢优化。
GitHub开源生态教程/实践
5月7日
22:04
Orange AI@oran_ge
精选75
ColaMD 1.5版实现Markdown内容与HTML模板分离

作者为解决制作演示文稿时修改不便的问题,受“Markdown as Database”理念启发,在ColaMD 1.5版本中实现了一种内容与视图分离的方案。该方案将.md文件作为内容层,HTML作为可更换的视图模板层,用户只需修改Markdown内容,即可生成不同形态的最终呈现,如幻灯片、博客等。此功能已内置,并支持通过开源方式由社区或AI扩展更多模板。

GitHub开源生态教程/实践

推荐理由:藏师傅的 Markdown as Database 搭上 HTML 模板,改 PPT 像改文档一样简单,ColaMD 直接给了现成模板,如果你常做分享,这个思路能省一半排版时间。
20:43
向阳乔木@vista8
74
开源,通通开源,哈哈哈。 【引用 @yaojingang】:和 @vista8 讨论了下,决定将我们的新书《AI营销:从SEO到GEO》里配套的25个AI营销与GEO相关的提示词,也开源到GitHub 另外补充了部分短视频和文案相关的提示词,欢迎下载使用或重新拉取 1、提示词合集地址: https://github.com/yaojingang/yao-open-promptsGEO 2、GEO提示词合集: https://github.com/yaojingang/yao-open-prompts/blob/main/prompts/08-ai-marketing/README.md

姚金刚: 和 @vista8 讨论了下,决定将我们的新书《AI营销:从SEO到GEO》里配套的25个AI营销与GEO相关的提示词,也开源到GitHub 另外补充了部分短视频和文案相关的提示词,欢迎下载使用或重新拉取 1、提示词合集地址: https:...

开源生态搜索教程/实践
20:16
IT之家(RSS)
64
中国信通院联合腾讯、华为等发起智能体可信握手协议(ATH),建立智能体开源社区

中国信通院联合中国电信、中国联通、中移九天、香港中文大学(深圳)、中兴、腾讯、华为等机构,共同发起“智能体可信握手协议(ATH)1.0”。该协议旨在解决多智能体跨平台协同交互中的信任与安全问题,构建了覆盖身份互验、权限管控和行为审计的标准化可信交互框架,秉持用户主权、三方参与、去中心化等六大设计原则。协议已在AtomGit和GitHub开源。同时,中国信通院牵头成立“智能体开源社区”,以汇聚产业力量,推动开源智能体技术的安全迭代与规模化应用。

智能体开源生态行业动态
18:16
IT之家(RSS)
69
小米开源 OmniVoice 多语言语音克隆 TTS,号称一个模型搞定 600 余种语言

小米AI实验室开源多语言语音克隆TTS模型OmniVoice,覆盖600余种语言。该模型采用极简双向Transformer架构,无需复杂结构即可实现文本到语音的直接转换。其语音合成质量超越同类主流模型,训练速度可达一天10万小时。关键设计包括全码本随机掩蔽策略和引入大语言模型预训练参数,显著提升训练效率与语音可懂度。测试显示,在多种语言中其相似度与可懂度超越多款商用系统,并对低资源小语种也能实现高质量合成。模型还支持自定义音色、带噪音频适配等实用功能。

arXivGitHub多模态开源生态
17:06
meng shao@shao__meng
61
用好 Google 开放标准 DESIGN.md + Agent Skills,1 小时把创业项目做出「亿元公司」的质感

Google开源的DESIGN.md是一个面向AI的结构化设计规范文件,能系统定义字体、色彩、间距等核心设计元素,解决AI生成UI时风格不一致的痛点。通过借鉴成熟品牌设计语言,并用AI将其提炼为DESIGN.md文件,开发者可在此基础上构建Landing Page、Mobile App等各类Agent Skills。这套工作流能确保创业项目的官网、应用、宣传材料等所有触点保持统一的视觉基因,快速呈现专业、一致的“亿元公司”质感。此外,建立日常设计灵感库是培养审美、AI无法替代的关键环节。

GREG ISENBERG: how to use Google's NEW open source Design.md + AI Skills to make your startup look like a $100 million company in 1 hou...

智能体Google开源生态教程/实践
12:16
IT之家(RSS)
61
OpenAI 携手英伟达等 5 大巨头发布 MRC 协议,重塑大规模 AI 训练网络架构

OpenAI联合AMD、博通、英特尔、微软和英伟达,通过开放计算项目(OCP)开源了多路径可靠连接(MRC)协议。该协议旨在解决大规模AI训练中的网络延迟和故障问题。MRC基于RoCE标准扩展,结合SRv6技术,采用多平面网络设计,仅需两层交换机即可连接约13.1万块GPU,降低了网络功耗与成本。其自适应数据包喷淋技术可将数据分散至数百条路径并行传输,避免核心拥塞。同时,协议采用SRv6源路由简化控制,使网络故障恢复时间从秒级缩短至微秒级。MRC已应用于NVIDIA GB200超级计算机及Oracle Cloud Infrastructure站点。

OpenAI开源生态数据/训练行业动态
11:16
阿绎 AYi@AYi_AInotes
63
AI在专业命理大赛接近人类顶尖水平,技术路径可迁移至垂直领域

Tianfu Agent在第十六届全球算命师大赛中取得50%的截尾均值准确率,接近人类顶尖选手的53.5%,显著超越通用大模型40%的基线。其突破在于采用工程化方案:开发200多个专用原子工具处理精确计算,将流派技法封装为可调用函数,并通过量化工具模拟人类直觉。该Agent范式为法律、中医等规则密集型领域的AI化提供了可迁移的新路径,相关评测基准已开源。

DestinyLinker: Tianfu Agent 在全球算命师大赛上跑到 50% 截尾准确率(人类 Top-20 选手平均 53.5%) 比赛 3069 名参赛者 人类 Top-20 选手平均 53.5% 最强通用大模型基线(Claude Opus 4.6)40%...

智能体产品更新开源生态推理
09:42
向阳乔木@vista8
32
这项目有意思,让由 20 不同大模型开发相同的UI组件。 看出来的效果有什么不同。 比如GPT-5.5 用文字有点多,感觉还是Opus 4.7好点。 网址见评论
开源生态评测/基准
09:38
swyx 🌉@swyx
31
openclaw + cline velocity 被低估了

pash: @swyx @vincent_koc https://github.com/openclaw/openclaw/pull/78234 fixed here - problem was you had guardian mode set in...

智能体GitHub大佬观点开源生态
09:20
Berryxia.AI@berryxia
62
SpaceX开放超算算力给Anthropic,并计划合作开发太空AI计算

SpaceX将其Colossus 1超算的算力开放给Anthropic使用,该设施拥有超过22万块NVIDIA GPU和超300MW电力。Anthropic随即取消了Claude产品的使用限额并提升了API速率。双方未来将合作开发吉瓦级的轨道AI计算能力,旨在利用太空的可持续电力。此举本质是SpaceX将闲置算力变现并验证其“轨道计算”商业模式,展现了Musk旗下业务的垂直整合优势。合作标志着AI竞争核心已转向算力、电力等基础设施。

AnthropicxAI开源生态行业动态
08:36
Replit ⠕@Replit
精选67
首届连接代码与文化的AI创意大会将于6月17日至18日登陆纽约。 早鸟票数量有限现已开售。 趁早抢购以免错失良机。 http://vibecon.ai
开源生态行业动态

推荐理由:Replit 办了个把代码和创意文化揉在一起的会,看起来挺酷,但早期鸟票信息大于实际内容,等具体议程出来再说。
08:00
HuggingFace Daily Papers(社区热门论文)
48
MobileEgo Anywhere:基于通用硬件的长时程自我中心数据开放基础设施

为解决VLA模型对长时程自我中心数据的需求与现有短时程数据集之间的矛盾,本文提出MobileEgo Anywhere框架。该框架利用智能手机传感器实现高精度位姿追踪,降低了数据采集的硬件门槛。主要贡献包括:发布了一个包含200小时多样化长时程轨迹的数据集,开源了移动数据采集应用,并提供了将原始数据转换为标准训练格式的完整处理流程。这实现了跨全球环境的大规模长时程数据获取,为机器人策略研究提供了关键数据支持。

arXiv具身智能开源生态数据/训练
03:36
The Decoder:AI News(RSS)
58
OpenAI 联合 AMD、Broadcom、Intel、Microsoft 和 NVIDIA 构建网络协议以解决 AI 超级计算机瓶颈

OpenAI 与 AMD、Broadcom、英特尔、微软和英伟达共同开发了开源网络协议 MRC。该协议能在 GPU 间通过数百条路径同时传输数据,仅需两层交换机即可连接超过 10 万个 GPU,相比传统方案减少了交换机层级,从而降低了功耗与成本。MRC 协议目前已应用于 OpenAI 的 Stargate 超级计算机上运行。

OpenAI开源生态行业动态部署/工程
‹ 上一页
1…2425262728…36
下一页 ›