AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「开源生态」清除
4月25日周六
19:51阿绎 AYi62AI维护机器人Clawsweeper上线,50个智能体日清4000条issue引开源范式变革
16:14IT之家(RSS)63英伟达已适配 DeepSeek-V4 AI 模型,GB200 NVL72 开箱性能超 150 tokens / sec / user
09:09Berryxia.AI57Mac Studio 256G可运行DeepSeek4-Flash量化版
08:00HuggingFace Daily Papers(社区热门论文)40AnalogRetriever:用于模拟电路检索的跨模态表征学习框架
4月24日周五
21:08IT之家(RSS)49阿里云百炼上线 DeepSeek-V4 模型,API 价格与官网一致
20:37karminski-牙医50DeepSeek 训练延期因低质用户,团队坚持免费 1.6T 模型理想
19:08IT之家(RSS)50美团万亿级大模型 LongCat-2.0-Preview 开放测试,全程基于国产算力集群训练
18:08IT之家(RSS)39摩尔线程携手智源 FlagOS,为 MTT S5000 GPU 完成 DeepSeek-V4 模型 Day-0 适配
15:41Steve Yegge:Medium(RSS)62Gas City 正式发布
14:19Artificial Analysis63小米发布MiMo V2.5 Pro模型,智能与代理能力表现强劲
14:08IT之家(RSS)53寒武纪 Day 0 适配 DeepSeek-V4,发布当日即稳定运行
13:45Hacker News 热门(buzzing.cc 中文翻译)69TorchTPU:在谷歌级规模下原生运行 PyTorch 于 TPU 上
13:24Chubby♨️61Deepseek v4以三分之一价格实现顶尖智能
12:54Yuchen Jin39国产大模型以有限算力实现突破
11:54Ethan Mollick22期待DeepSeek升级改善评论质量
11:54Chubby♨️61Deepseek V4发布,性能超越GPT-5.4
11:24Chubby♨️66Deepseek v4性能超越GPT-5.4创Codeforces新纪录
11:17HuggingFace Daily Papers(社区热门论文)55WorldMark:面向交互式视频世界模型的统一基准套件
11:08IT之家(RSS)64开源网络工具 cURL 开发者示警"高质量混乱":AI 提速漏洞挖掘,开源维护者修不过来
10:18AK40Hugging Face平台AI应用超120万
09:00公众号:蚂蚁百灵(Ling)51Ling-2.6-1T 发布:万亿旗舰"快思考"模型,对标 GPT-5.4
08:08IT之家(RSS)60小米发布 MiMo-V2.5-TTS / ASR 语音大模型:通过自然语言调度声音表现
08:00HuggingFace Daily Papers(社区热门论文)52从技能到人才:将异构智能体组织为现实世界的公司
08:00Hugging Face:Blog(RSS)78精选DeepSeek-V4:智能体可实际使用的百万token上下文
4月23日周四
08:00Hugging Face:Blog(RSS)57精选如何在 Chrome 扩展中使用 Transformers.js
4月22日周三
22:46Chubby♨️阿里巴巴的发布速度快得离谱。 不过 Qwen3.6 27b dense 看起来挺强的。
08:00HuggingFace Daily Papers(社区热门论文)面向LLMs的混合策略蒸馏
04:45Rohan PaulROBOTIS 本周发布了 AI Sapiens:一款 34 公斤的人形机器人,即使在动态移动和快速抬腿时也能保持平衡。该开源系统旨在作为实体 AI 工作的共享平台,完整的硬件和软件均已公开发布。
00:10宝玉Hermes 模型命名揭秘:源自希腊神话赫尔墨斯
4月21日周二
12:07AK42Kimi K2.6版本于HuggingChat上线
03:06Nathan Lambert开放权重模型追赶闭源AI的现状与变数
01:06Nathan Lambert看着所有模型依托快速改进的后训练陆续发布,显然我们需要一个完全开放的实验室,展示现代后训练中应优先拉动哪些杠杆。 现有的完全开放方案如 olmo 3 正迅速落后。糟糕的均衡。
00:04AK56Kimi K2.6模型于Hugging Face发布
4月20日周一
22:06swyx 🏝️@AIEmiami很高兴看到座无虚席的会场(约75%是东海岸AI工程师)@gabegreenberg 开场 AIE Miami - 所有演讲现已在 YouTube 上免费直播!
19:07Hacker News 热门(buzzing.cc 中文翻译)GitHub 的虚假点赞经济
08:00HuggingFace Daily Papers(社区热门论文)52稀疏自编码器增强大语言模型对抗越狱攻击的鲁棒性研究
4月19日周日
16:06swyx 🐣AI工程大咖齐聚迈阿密,首届独立AIE大会即将开幕
08:07宝玉给关注此事的各位一个快速更新: 自3月9日起,我就一直在求助关于我的 ClawHub skill slugs 被恶意劫持的问题。明确地说,这不仅仅是名称抢注--有人正在 fork 我的开源代码并直接发布。 尽管多次承诺会解决,但完全没有进展。 我现在正认真考虑不再将我的 skills 发布到 ClawHub。
08:00HuggingFace Daily Papers(社区热门论文)UniMesh:统一三维网格理解与生成
03:04Nathan Lambert这里的一个大问题是,我们并没有清晰界定 mythos capabilities 到底是什么。 发布博客中的每个基准测试都有模型能达标,当然。 但要说有模型能直接替换到相同用例中且性能毫无下降?我对此表示怀疑。
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
4月25日
19:51
阿绎 AYi@AYi_AInotes
62
AI维护机器人Clawsweeper上线,50个智能体日清4000条issue引开源范式变革

OpenClaw之父steipete推出AI维护机器人Clawsweeper,旨在应对AI生成代码带来的管理洪流。该工具部署50个AI智能体全天候扫描仓库issue和PR,仅在证据确凿时按严格限定的五类理由建议关闭,单日可处理约4000条。其设计极简,无传统仪表盘,所有状态数据实时写入README。这标志着开源维护从“人盯仓库”转向“AI管AI”,核心瓶颈从模型能力变为平台速率限制,被视为对开源维护范式的根本性改变。

Peter Steinberger 🦞: Built clawsweeper, which runs 50 codex in parallel around the clock, scans issues/prs deep and closes what is already im...

智能体产品更新开源生态
16:14
IT之家(RSS)
63
英伟达已适配 DeepSeek-V4 AI 模型,GB200 NVL72 开箱性能超 150 tokens / sec / user

英伟达宣布其Blackwell平台已适配DeepSeek-V4-Pro与DeepSeek-V4-Flash两款模型。DeepSeek-V4-Pro拥有1.6T总参数量与49B激活参数,定位高级推理;DeepSeek-V4-Flash则为284B总参数量与13B激活参数,主打高效场景。两款模型均支持100万Token上下文窗口与最高38.4万Token输出长度。实测显示,DeepSeek-V4-Pro在NVIDIA GB200 NVL72上开箱性能超过150 tokens/sec/user。开发者可通过NVIDIA NIM微服务下载部署,或利用SGLang与vLLM框架进行定制化推理,vLLM支持扩展至100个以上GPU。

DeepSeek产品更新开源生态部署/工程
09:09
Berryxia.AI@berryxia
57
是时候让你的Mac Studio 256G 可以开始使用DeepSeek4-Flash-4bit 量化版版本了! 至于速度嘛… https://github.com/ml-explore/mlx-lm/pull/1192

Prince Canuma: You can now run DeepSeek4-Flash on 256GB Mac. Next up speed 🚀 PR: https://github.com/ml-explore/mlx-lm/pull/1192

DeepSeek开源生态教程/实践端侧
08:00
HuggingFace Daily Papers(社区热门论文)
40
AnalogRetriever:用于模拟电路检索的跨模态表征学习框架

针对模拟电路设计中跨SPICE网表、原理图和功能描述等异构表示检索的难题,本研究提出了统一的三模态检索框架AnalogRetriever。该工作基于Masala-CHAI构建高质量数据集,并通过两阶段修复流程将网表编译率提升至100%。框架采用视觉语言模型编码原理图和描述,使用端口感知关系图卷积网络编码网表,并通过课程对比学习将三者映射到共享嵌入空间。实验表明,其在所有六个跨模态检索方向上的平均Recall@1达到75.2%,显著优于基线。集成至AnalogCoder智能体框架后,能持续提升功能通过率并完成此前无法解决的任务。代码与数据集将开源。

开源生态论文/研究部署/工程
4月24日
21:08
IT之家(RSS)
49
阿里云百炼上线 DeepSeek-V4 模型,API 价格与官网一致

阿里云百炼平台宣布首发上线DeepSeek-V4-Pro与DeepSeek-V4-Flash两款模型,其API定价与DeepSeek官网完全一致。其中,Flash版本输入价格低至每百万Tokens 1元,输出价格为每百万Tokens 2元。两款模型均支持100万Tokens的超长上下文,V4-Pro专为复杂任务设计,V4-Flash侧重高效经济。此次接入进一步丰富了百炼平台作为“AI模型超市”的生态,为开发者提供了一站式调用各类顶尖模型的灵活选择。

产品更新开源生态部署/工程
20:37
karminski-牙医@karminski3
50
主推文询问 deepseek 是否使用全国产卡训练,引用推文透露内测消息属实。梁文锋的理想是让全世界免费使用 1.6T 模型以促进社会进步,但低质量用户抢占训练集群资源,成为模型延期发布的主要原因。尽管面临挑战和数月延迟,deepseek 团队成功训练出新模型,并为努力感到开心,表示无悔付出。

砍砍.ᐟ: 参与了内测很久 看到的每一条消息都是真的 给我憋坏了 😬 梁文锋是很有理想的 他要让全世界用上 1.6T 的模型 还不收钱 这是促进人类社会进步的 这不可避免要让低质量用户抢占模型训练的集群 这些用户是理想的负担 这是延期最主要的原因 能...

DeepSeek开源生态行业动态
19:08
IT之家(RSS)
50
美团万亿级大模型 LongCat-2.0-Preview 开放测试,全程基于国产算力集群训练

美团新一代基础大模型LongCat-2.0-Preview已开放邀请测试,其总参数规模突破万亿,采用混合专家架构,整体能力被认为对标GPT-4。关键突破在于该模型完全基于国产化算力集群训练完成,标志着美团在此领域取得领先。此前,美团创始人王兴已披露公司持续投入数十亿美元保障算力供应。去年9月,美团曾开源基于相同架构、拥有5600亿参数的首款自研大模型LongCat-Flash。

开源生态数据/训练模型发布
18:08
IT之家(RSS)
39
摩尔线程携手智源 FlagOS,为 MTT S5000 GPU 完成 DeepSeek-V4 模型 Day-0 适配

摩尔线程与智源FlagOS合作,成功为MTT S5000 GPU完成了DeepSeek-V4-Flash模型的Day-0适配。该模型采用混合专家架构,总参数量284B,并首次运用“FP4+FP8”混合精度策略。MTT S5000 GPU凭借原生FP8支持及内置硬件级FP8 Tensor Core,能将数据位宽减半,显著降低显存带宽压力并提升计算吞吐量。双方团队通过编译优化与自动调优,重点攻克了FP8算子与Sparse Attention算子,实现了高效适配。

产品更新开源生态部署/工程
15:41
Steve Yegge:Medium(RSS)
62
Gas City 正式发布

Gas City 是 Gas Town 的彻底重写版本,作为构建自定义智能体工厂的 SDK 于本周发布 v1.0.0。它将技术栈解构为可组合的、声明式的 “pack” 构建块,用于部署任意拓扑的协作智能体团队。系统默认包含一个完整的 “Gas Town” pack,可作为原版的直接替代品。Gas City 基于 MEOW 栈和 Dolt 构建,提供智能体身份、消息传递、上下文、状态等开箱即用的服务,并暴露 Factory Worker API,完全开源并采用 MIT 许可证。

智能体GitHub开源/仓库开源生态
14:19
Artificial Analysis@ArtificialAnlys
63
小米发布MiMo V2.5 Pro模型,智能与代理能力表现强劲

小米于2026年4月22日发布MiMo V2.5 Pro模型,其在Artificial Analysis智能指数得分54,表现强劲。该模型在代理能力上领先,Agentic Index得分67%,优于Kimi K2.6等开源模型,这主要得益于在τ²-Bench和TerminalBench Hard上的优异表现。此外,其在前沿推理和指令遵循方面也有提升。模型具有1M上下文窗口,1T总参数,API定价具有成本效益,运行同一智能指数仅需462美元。不过,其在事实准确性指数上得分4,存在准确率较低的问题。模型采用MIT许可证,权重暂未公开,目前可通过小米官方API使用。

智能体开源生态模型发布
14:08
IT之家(RSS)
53
寒武纪 Day 0 适配 DeepSeek-V4,发布当日即稳定运行

寒武纪宣布已完成对深度求索最新开源模型DeepSeek-V4的Day 0适配,模型发布当日即可稳定运行。适配针对其285B和1.6T两个版本,代码已开源。通过自研高性能算子库对模型新结构进行专项加速,并在vLLM推理框架中全面支持5D混合并行、低精度量化等技术,以优化词元吞吐和端到端推理效率。同时,深度挖掘硬件特性以最小化通信开销,提升分布式推理性能。DeepSeek-V4拥有百万字上下文,能力领先,现已开放体验和API调用。

DeepSeek开源生态行业动态部署/工程
13:45
Hacker News 热门(buzzing.cc 中文翻译)
69
TorchTPU:在谷歌级规模下原生运行 PyTorch 于 TPU 上

谷歌发布了 TorchTPU,使 PyTorch 能够原生在 TPU 上运行,并实现谷歌级规模的计算。这一变化让开发者无需大幅修改代码即可利用 TPU 的高性能硬件,显著提升了 PyTorch 在大型模型训练和推理任务中的效率与可扩展性。此举标志着 PyTorch 与谷歌定制硬件生态的深度集成,为人工智能研究与开发提供了新的强大基础设施。

Google产品更新开源生态部署/工程
13:24
Chubby♨️@kimmonismus
61
Deepseek v4 真正的护城河?以约前沿实验室1/3的价格实现顶尖智能

Chubby♨️: Deepseek v4 is a huge step upwards compared to DeepSeek 3, outperforms on SWE verified opus 4.6 and GPT-5.4 and sets a n...

DeepSeek开源生态模型发布编码
12:54
Yuchen Jin@Yuchenj_UW
39
我依然惊叹于 DeepSeek、Kimi 和 Qwen 能够用少得多且经常是降配的 NVIDIA GPU,甚至华为芯片,训练出非常强大的大语言模型。 DeepSeek V4 的报告显示,他们发明了新的注意力架构,使训练/推理更加高效。 创造力热爱约束。 我真心希望我们看到有强大的美国开源模型能够参与竞争。
大佬观点开源生态数据/训练
11:54
Ethan Mollick@emollick
22
我希望升级到DeepSeek v4能让这里的机器人评论变得更能忍受一些。
大佬观点开源生态
11:54
Chubby♨️@kimmonismus
61
Deepseek 真的等到 OpenAI 发布了 GPT-5.5 才来抢风头吗?

Chubby♨️: Deepseek v4 is a huge step upwards compared to DeepSeek 3, outperforms on SWE verified opus 4.6 and GPT-5.4 and sets a n...

DeepSeek开源生态模型发布编码
11:24
Chubby♨️@kimmonismus
66
Deepseek v4 相比 DeepSeek 3 是一次巨大的飞跃,在 SWE verified 上超越了 opus 4.6 和 GPT-5.4,并在 Codeforces 上创造了新纪录。 但仍需针对 opus 4.7 和 GPT-5.5 进行测试,并观察实际使用是否如其承诺般出色。 重大发布!顶尖的开源模型!

Chubby♨️: Deepseek v4 pro Evals. Roughly on par with GPT-5.4 xhigh and opus 4.6 max

DeepSeek开源生态模型发布编码
11:17
HuggingFace Daily Papers(社区热门论文)
55
WorldMark:面向交互式视频世界模型的统一基准套件

针对交互式视频生成模型缺乏公平比较基准的问题,本文提出了首个统一测试平台WorldMark。它包含三个核心部分:一个将共享WASD动作映射到各模型原生控制的统一接口,确保六大模型能在完全相同的场景与轨迹上对比;一个涵盖500个测试案例的分层测试集,覆盖不同视角、风格与难度等级;以及一个支持视觉质量、控制对齐和世界一致性评测的模块化工具包。所有数据与代码均已公开,同时上线的在线平台World Model Arena支持模型并排对比与实时排名。

具身智能开源生态论文/研究评测/基准
11:08
IT之家(RSS)
64
开源网络工具 cURL 开发者示警"高质量混乱":AI 提速漏洞挖掘,开源维护者修不过来

cURL开发者Daniel Stenberg警示,AI生成的漏洞报告已从“垃圾信息”演变为“高质量混乱”。2026年报告提交频率激增至2025年的2倍,平均间隔跌破25小时,导致维护者工作量指数级增长。尽管报告质量提升,真实漏洞确认比例反弹至约16%,但高频提交仍使维护者不堪重负。同时,AI工具也缩短了攻击者的漏洞挖掘时间,可能在修复前被利用,加剧了安全风险。

安全/对齐开源生态现象/趋势
10:18
AK@_akhaliq
40
Hugging Face 上有超过 120 万个 AI 应用 这可能是最大的 AI 应用商店
Hugging Face开源生态现象/趋势
09:00
公众号:蚂蚁百灵(Ling)
51
Ling-2.6-1T 发布:万亿旗舰"快思考"模型,对标 GPT-5.4

蚂蚁百灵发布万亿参数旗舰 Ling-2.6-1T,采用 MLA 与 Linear Attention Hybrid 架构,以“快思考”机制实现低 Token 开销高效推理。综合智能对标 GPT-5.4 (Non-Reasoning),在 AIME26 上显著领先其他非思考模型;在 SWE-bench Verified、TAU2-Bench、BFCL-V4 等 Agent 基准上达到开源 SOTA。支持 256K 超长上下文(MRCR 高分)并表现优异的 IFBench。现已通过 OpenRouter 和官方平台提供一周免费 API 调用,将于近期正式开源。

智能体开源生态推理模型发布
08:08
IT之家(RSS)
60
小米发布 MiMo-V2.5-TTS / ASR 语音大模型:通过自然语言调度声音表现

小米发布全链路语音大模型系列MiMo-V2.5,包含TTS(语音合成)与ASR(语音识别)两大核心。TTS系列包含三款模型:基础版内置多款音色并支持精细控制;VoiceDesign版可一句话生成新音色;VoiceClone版能通过少量样本高保真复刻音色。三者均支持通过自然语言指令和音频标签精细调度声音表现,已在小米MiMo开放平台限时免费。ASR模型已正式开源,在中英双语、方言、强噪音及多人对话等复杂场景下的识别性能达到业界领先水平。

开源生态模型发布语音
08:00
HuggingFace Daily Papers(社区热门论文)
52
从技能到人才:将异构智能体组织为现实世界的公司

针对多智能体系统受限于固定团队结构等问题,研究团队提出 OneManCompany 框架,将其提升至组织层面。该框架将技能、工具与配置封装为可移植的“人才”单元,通过类型化接口协调异构后端,并借助社区人才市场实现动态按需招募。组织决策采用“探索-执行-审查”树搜索,在统一分层循环中完成任务分解、执行与结果聚合,同时提供终止与无死锁的形式化保证。实验表明,OMC 在 PRDBench 上取得 84.67% 的成功率,较现有最佳方法提升 15.48 个百分点,跨领域案例验证了其通用性与适应性。

智能体开源生态论文/研究
08:00
Hugging Face:Blog(RSS)
精选78
DeepSeek-V4:智能体可实际使用的百万token上下文

DeepSeek发布新一代模型DeepSeek-V4,其核心突破在于实现了长达百万token的上下文窗口,并确保智能体能够有效利用这一扩展的上下文能力。该模型延续了通过开源与开放科学推动人工智能发展与普及的使命,标志着大模型在长上下文理解和实际应用方面迈出重要一步。

智能体DeepSeek开源生态模型发布
关联讨论 3 条Simon Willison 博客Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)
推荐理由:DeepSeek 把上下文窗口推到百万 token 不稀奇,关键是「agent 能实际用」这六个字。如果实测成立,RAG 的很多工程妥协可以扔掉了,做长文档和复杂 agent 的人该第一时间跑一遍。
4月23日
08:00
Hugging Face:Blog(RSS)
精选57
如何在 Chrome 扩展中使用 Transformers.js

本文介绍在 Chrome 扩展中集成 Transformers.js 库的具体方法,涵盖从环境配置、模型加载到前后端通信的关键步骤。通过示例代码演示了如何利用该库在扩展中实现本地机器学习推理,同时处理扩展权限限制与安全策略。文中还对比了 Web Worker 与 Service Worker 两种部署方案,并提供了性能优化建议,帮助开发者在浏览器扩展环境中高效运行 Transformer 模型。

开源生态教程/实践端侧

推荐理由:Hugging Face 官方出的 Transformers.js 浏览器插件教程,想在 Chrome 里跑端侧推理的前端开发者可以直接抄,省掉自己踩坑的时间。
4月22日
22:46
Chubby♨️@kimmonismus
阿里巴巴的发布速度快得离谱。 不过 Qwen3.6 27b dense 看起来挺强的。

Qwen: 🚀 Meet Qwen3.6-27B, our latest dense, open-source model, packing flagship-level coding power! Yes, 27B, and Qwen3.6-27B...

开源生态模型发布编码
08:00
HuggingFace Daily Papers(社区热门论文)
面向LLMs的混合策略蒸馏

研究团队提出混合策略蒸馏(HPD)方法,通过统一视角将知识蒸馏重新表述为token级重加权对数似然目标。该方法整合前向与反向KL散度的互补优势以平衡模式覆盖与模式寻求,并结合离线数据与轻量级近似在线采样策略。在数学推理、对话及代码任务的验证中,HPD展现出优于现有方法的优化稳定性、计算效率和最终性能,且适用于不同模型家族与规模。

arXiv开源生态数据/训练论文/研究
04:45
Rohan Paul@rohanpaul_ai
ROBOTIS 本周发布了 AI Sapiens:一款 34 公斤的人形机器人,即使在动态移动和快速抬腿时也能保持平衡。该开源系统旨在作为实体 AI 工作的共享平台,完整的硬件和软件均已公开发布。
具身智能开源/仓库开源生态
00:10
宝玉@dotey
Hermes 模型命名揭秘:源自希腊神话赫尔墨斯

Nous Research 解释其开源模型系列 Hermes 的命名由来:名称取自希腊神话中掌管通信、魔法与智慧的赫尔墨斯神,正确发音为 "Her Meeze"。该团队已使用此名约三年,陆续发布了 Hermes 1 至 Hermes 4 四代模型,Teknium 为该系列主要作者。中文社区则习惯将其戏称为"爱马仕"。

Teknium 🪽: Quick facts about Hermes; - It's pronounced Her Meeze - It's named after the Greek God of communication, magic, and inte...

智能体大佬观点开源生态
4月21日
12:07
AK@_akhaliq
42
Kimi K2.6 现已在 huggingchat 上可用
Hugging Face产品更新开源生态
03:06
Nathan Lambert@natolambert
开放权重模型追赶闭源AI的现状与变数

当前开放权重模型与闭源实验室的性能差距维持动态平衡。在训练范式改变前,开放模型能够持续 fast-follow 闭源模型,尚无证据表明前者会落后。这一均衡取决于基准测试演变、模型实际表现与排名关联度,以及训练制度调整等因素。若闭源模型通过整合用户训练数据形成数据壁垒,或经济力量驱动战略转变,现有格局才可能被打破。

Interconnects: Reading today's open-closed performance gap The complex factors that determine the single evaluation number so many focu...

大佬观点开源生态数据/训练
01:06
Nathan Lambert@natolambert
看着所有模型依托快速改进的后训练陆续发布,显然我们需要一个完全开放的实验室,展示现代后训练中应优先拉动哪些杠杆。 现有的完全开放方案如 olmo 3 正迅速落后。糟糕的均衡。
大佬观点开源生态数据/训练
00:04
AK@_akhaliq
56
Kimi K2.6 已在 Hugging Face 发布 https://huggingface.co/moonshotai/Kimi-K2.6
Hugging Face开源生态模型发布
4月20日
22:06
swyx 🏝️@AIEmiami@swyx
很高兴看到座无虚席的会场(约75%是东海岸AI工程师)@gabegreenberg 开场 AIE Miami - 所有演讲现已在 YouTube 上免费直播!

AI Engineer: Miami: We're in the final stretch for tickets! Get your ticket to AIE Miami before we sell out! https://www.ai.engineer/miami

开源生态行业动态
19:07
Hacker News 热门(buzzing.cc 中文翻译)
GitHub 的虚假点赞经济

技术博客awesomeagents.ai发布针对GitHub平台虚假star现象的深度调查,揭露开发者通过购买虚假点赞人为提升项目可信度与曝光度的灰色产业链。该报道在Hacker News技术社区获得106个点赞关注。调查涉及虚假star的交易机制、对开源生态的影响及平台检测难题,但具体交易规模与涉案账号数量等详细数据需查阅原文完整报告获取。

GitHub开源生态现象/趋势
08:00
HuggingFace Daily Papers(社区热门论文)
52
稀疏自编码器增强大语言模型对抗越狱攻击的鲁棒性研究

本研究探讨了稀疏自编码器(SAE)在增强大语言模型(LLMs)对抗越狱攻击鲁棒性中的作用。通过在推理时将预训练SAE集成到Transformer残差流中,不修改模型权重或阻断梯度。实验覆盖Gemma、LLaMA、Mistral和Qwen四个模型家族,针对GCG、BEAST等白盒攻击及三项黑盒基准测试,结果显示越狱成功率最高降低5倍,并减少了跨模型攻击的可迁移性。参数消融表明,L0稀疏度与攻击成功率呈单调剂量-反应关系,且中间层在防御效果和模型正常性能间达到最佳平衡。这些发现支持表征瓶颈假说,即稀疏投影重塑了越狱攻击所利用的优化几何结构。

安全/对齐开源生态论文/研究
4月19日
16:06
swyx 🐣@swyx
AI工程大咖齐聚迈阿密,首届独立AIE大会即将开幕

AI Engineering领域重量级人物本周将齐聚迈阿密,参加首届独立运营的AIE Miami大会。该活动由@gabegreenberg与@MichelleBakels团队策划,致力于在非科技中心城市建设开发者社区。目前门票即将售罄。作者表示将以非组织者身份出席,届时可与参会者及赞助商深度交流。

AI Engineer: Miami: We're in the final stretch for tickets! Get your ticket to AIE Miami before we sell out! https://www.ai.engineer/miami

开源生态行业动态
08:07
宝玉@dotey
给关注此事的各位一个快速更新: 自3月9日起,我就一直在求助关于我的 ClawHub skill slugs 被恶意劫持的问题。明确地说,这不仅仅是名称抢注--有人正在 fork 我的开源代码并直接发布。 尽管多次承诺会解决,但完全没有进展。 我现在正认真考虑不再将我的 skills 发布到 ClawHub。

宝玉: Hi @steipete and @4shadowed, following up on my previous message, just wanted to check if there's been any update on the...

智能体开源生态行业动态
08:00
HuggingFace Daily Papers(社区热门论文)
UniMesh:统一三维网格理解与生成

UniMesh是一个统一3D网格理解与生成的新型框架,通过单一架构联合学习两大任务。该框架引入Mesh Head连接扩散式图像生成与隐式形状解码器;提出Chain of Mesh (CoM)几何迭代推理机制,实现用户驱动的语义网格编辑闭环;并构建Actor-Evaluator-Self-reflection自反思机制,可诊断纠正3D字幕等高级任务错误。实验表明,UniMesh不仅性能优异,更实现了生成与理解的相互增强及迭代编辑能力。

多模态开源生态论文/研究
03:04
Nathan Lambert@natolambert
这里的一个大问题是,我们并没有清晰界定 mythos capabilities 到底是什么。 发布博客中的每个基准测试都有模型能达标,当然。 但要说有模型能直接替换到相同用例中且性能毫无下降?我对此表示怀疑。

rohit: Dario seems to think China and open source will hit Mythos capabilities in 6-12 months

Anthropic大佬观点开源生态推理
‹ 上一页
1…2930313233…36
下一页 ›