AIHOT

6月14日

00:00

EleutherAI：Blog

该方法提出自由形式最小二乘概念擦除技术，在推理阶段无需依赖神谕概念标签即可实现比 LEACE 更精细的模型编辑。通过自由形式优化框架，技术突破传统方法对标注数据的依赖，在保持模型原有能力的同时，精准定位和移除目标概念表征，显著提升概念编辑的灵活性与精确度，为无监督概念操控提供高效解决方案。

安全/对齐论文/研究

00:00

Runway：Changelog（网页）

语音验证

推出声纹身份验证功能，用户通过朗读随机数字或自然语音即可完成实名认证。系统采用端到端加密传输与抗录音攻击算法，误识率控制在 0.5% 以下。支持 16 种语言及方言识别，已集成至客服热线与金融 App，开发者可通过 API 在 10 分钟内完成接入。

产品更新语音

6月6日

11:59

Qwen：Research（API）

使用 Qwen-Agent 将 LLM 上下文从 8k 扩展到 1M

基于 Qwen2（8k 上下文）构建的 Qwen-Agent 可理解 1M token 长文档，性能超越 RAG 及原生长上下文模型。该 Agent 同时用于生成训练数据，以训练新的长上下文 Qwen 模型。

智能体检索增强数据/训练论文/研究

5月26日

00:00

xAI：News（网页）

精选

Grok-1.5 Vision 预览版

xAI 发布 Grok-1.5 Vision 预览版，新增视觉理解能力，可处理图像、图表及文档内容，支持跨模态推理与视觉问答，现面向早期测试者开放试用。

xAI多模态模型发布

推荐理由：xAI发布Grok-1.5 Vision预览版，具备多模态视觉理解能力

5月23日

01:00

EleutherAI：Blog

VINC-S：具备释义不变性的闭式可选监督知识提取方法

研究者正在整理2023年春季项目成果，核心成果为VINC-S方法。该技术实现了闭式解的可选监督知识提取，关键创新在于引入释义不变性机制，确保模型在面对语义等价的不同表述时保持稳定的知识抽取能力。方法支持灵活监督设置，采用闭式数学推导，但具体的实验数据、性能指标及架构细节尚未在现有文本中披露。

数据/训练论文/研究

5月21日

00:00

Anthropic：Transformer Circuits（可解释性研究）

精选83

Scaling Monosemanticity：从 Claude 3 Sonnet 中提取可解释特征

研究团队成功将稀疏自编码器方法扩展至 Claude 3 Sonnet 模型，从中提取出高质量、可解释的抽象特征。这些特征具有多语言、多模态特性，并能连接同一概念的抽象与具体实例，例如识别代码中的安全漏洞以及关于漏洞的抽象讨论。研究发现的特征涵盖名人、城市、代码类型签名等多个领域，其中部分特征与AI安全高度相关，涉及代码后门、偏见、欺骗、权力寻求及危险内容等潜在风险。研究通过缩放定律指导稀疏自编码器训练，证实了该方法在大规模生产模型上的可行性，为理解大模型内部表征提供了新工具。

Anthropic推理论文/研究

关联讨论 1 条

推荐理由：揭示大模型内部可解释特征，对AI安全研究和模型调试有重要参考价值。

5月20日

00:00

LMSYS：Blog（Chatbot Arena 团队）

Chatbot Arena新增Hard Prompts高难度评测类别

Chatbot Arena推出Hard Prompts新评测类别，基于特定性、领域知识、复杂度等7项标准对100万条提示词评分，筛选得分≥6的高难度提示（约占20%）构建榜单。新榜单显示，Llama-3-8B-Instruct排名较英语总榜显著下滑，Claude-3-Opus超越Llama-3-70B-Instruct，GPT-4o等模型表现提升。平台同步实施去重机制减少高频问候干扰。

推理数据/训练评测/基准

5月14日

01:39

Sam Altman：Blog（RSS）

精选

GPT-4o

OpenAI 将 GPT-4o 向所有 ChatGPT 用户免费开放，无广告。全新语音（及视频）模式响应速度接近人类，表现力极强，被 Sam Altman 称为「用过最好的计算机界面」，像电影里的 AI。未来还将支持个性化、代操作等功能。

OpenAI多模态模型发布语音

推荐理由：Sam Altman 解读 GPT-4o 发布，强调语音交互与免费策略

5月11日

18:10

Qwen：Research（API）

精选

Qwen-MAX-0428 笔记

通义千问发布 Qwen-MAX-0428，参数量超越此前开源的 Qwen1.5 系列（0.5B-110B），成为该系列当前最大规模模型。

推理模型发布

推荐理由：阿里Qwen发布更大规模模型Qwen-MAX-0428，参数规模超越此前110B版本

5月10日

00:00

Runway：News（网页）

探索电影制作的未来：Runway 与 Tribeca Festival 2024 的节目合作

Runway 联合 Tribeca Festival 2024 于 6 月 8 日免费展映 AI 制作短片及音乐视频，覆盖剧本、剪辑、视效到音效设计全流程，映后设导演 Q&A 环节，探讨 AI 工具如何重塑电影叙事。

行业动态视频

5月8日

00:00

LMSYS：Blog（Chatbot Arena 团队）

技术博客：Llama 3 表现如何？Arena 数据分析

Meta 于 4 月 18 日发布的开源模型 Llama 3-70B 在 Chatbot Arena 排行榜迅速登顶，参与超 5 万次对战。该模型在开放式写作和创意任务上表现突出，胜率达 60%，但在数学、编码等封闭式技术任务上逊于 GPT-4-Turbo 和 Claude 3 Opus。随着提示难度增加，其胜率从 50% 显著下降至 40%。分析显示，Llama 3 的输出风格更友好且具对话性，这成为其获得用户偏好的关键因素。

Meta开源生态推理评测/基准

5月2日

00:00

LMSYS：Blog（Chatbot Arena 团队）

LMSYS 与 Kaggle 联合举办人类偏好预测竞赛，奖金 10 万美元

LMSYS 与 Kaggle 联合发起一项人类偏好预测竞赛，总奖金池达 10 万美元。参赛者需构建预测模型，判断用户在大型语言模型（LLM）两两对决中更偏好哪个回答。竞赛基于 LMSYS Arena 的真实对战数据，旨在通过众包方式探索更准确的 LLM 评估方法，推动模型与人类偏好对齐。比赛面向全球开发者开放，获胜方案有望改进现有大模型排名机制。

数据/训练评测/基准

4月25日

13:33

Qwen：Research（API）

精选

Qwen1.5-110B：Qwen1.5 系列首个 100B+ 参数模型

Qwen1.5 系列发布首个 100B+ 模型 Qwen1.5-110B，基础性能对标 Meta-Llama3-70B，在 MT-Bench 和 AlpacaEval 2.0 对话评测中表现优异。

开源生态数据/训练模型发布

推荐理由：阿里Qwen开源110B参数大模型，性能对标Llama3-70B

4月22日

14:55

DeepSeek：GitHub 新仓库

精选

DeepSeek-V2：一种强大、经济且高效的混合专家语言模型

DeepSeek-AI发布第二代大模型DeepSeek-V2，采用MoE架构，总参数量236B、每次前向传播仅激活21B参数，在保持接近GPT-4性能的同时显著降低计算成本。模型支持128K长上下文，通过创新的多头潜在注意力机制提升推理效率，训练成本与API定价均远低于同类模型。

DeepSeek开源/仓库推理模型发布

关联讨论 1 条

推荐理由：DeepSeek 开源 V2 模型，MoE 架构实现低成本高效推理

4月19日

00:00

LMSYS：Blog（Chatbot Arena 团队）

从实时数据到高质量基准：Arena-Hard Pipeline

研究团队推出 Arena-Hard 数据流程及 Arena Hard Auto v0.1 基准测试，用于从 Chatbot Arena 实时用户数据中自动构建高质量 LLM 评估集。该基准在模型区分度上显著优于 MT Bench，与 Chatbot Arena 人类偏好排序的一致性达 89.1%，可分离性达 87.4%，单次评估成本仅需 25 美元。流程通过主题建模从 20 万条用户查询中筛选多样化、高质量提示词，并采用 GPT-4-Turbo 作为评判，解决了传统静态基准测试集泄露和区分度不足的问题。

数据/训练论文/研究评测/基准

4月15日

08:00

Anthropic：Transformer Circuits（可解释性研究）

精选76

2024年4月机制可解释性研究动态与团队招聘计划

Anthropic可解释性团队分享了2024年4月的研究进展与招聘规划。团队现有17人，预计2024至2025年将持续大规模扩张，重点招聘管理、研究科学家和工程师等职位。研究方面，团队探讨了字典学习的扩展规律，分析了计算资源分配与稀疏自编码器（SAE）训练效果的关系，并以一个具体案例展示了通过大规模超参数扫描寻找最优配置的过程。团队强调，这些成果属于初步分享，类似于实验室会议上的非正式交流。

Anthropic推理数据/训练论文/研究

推荐理由：可解释性研究揭示AI内部机制，助力构建更安全可靠的AI产品。

01:00

EleutherAI：Blog

Pile-T5：基于 The Pile 训练的 T5 模型

Pile-T5 是研究人员基于 T5 架构，在 The Pile 大规模文本数据集上训练的语言模型。该模型继承了 T5 的文本到文本转换框架，通过在大规模多样化语料上的预训练，提升了自然语言理解与生成能力。Pile-T5 的发布为相关研究提供了基于 The Pile 数据训练的 T5 变体，适用于各类下游自然语言处理任务。

开源生态数据/训练模型发布

4月2日

13:33

Qwen：Research（API）

Qwen1.5-32B：为 Qwen1.5 语言模型系列补上关键一环

Qwen1.5-32B 作为该系列新成员发布，采用 32B 参数规模，架构除引入分组查询注意力（GQA）外，与系列内其他模型保持一致。

模型发布端侧

3月28日

11:31

Qwen：Research（API）

精选

Qwen1.5-MoE：以1/3激活参数匹敌7B模型性能

Qwen1.5-MoE-A2.7B 发布，仅2.7B激活参数（约为7B模型的1/3）即可匹敌 Mistral 7B 和 Qwen1.5-7B 的性能。

模型发布部署/工程

推荐理由：阿里Qwen发布MoE架构小模型，2.7B激活参数匹敌7B性能，大幅降低推理成本