12月12日

08:00

OpenRouter：Announcements（RSS）

OpenRouter 为 OpenAI 4o 和 Fireworks 模型提供结构化输出，并免费开放 Gemini Flash 2.0

OpenRouter 新增对 OpenAI 4o 和 Fireworks 模型的结构化输出支持，同时免费提供 Gemini Flash 2.0 模型。

Google OpenAI 产品更新多模态

11月28日

08:00

Lilian Weng：Lil'Log（RSS）

强化学习中的奖励欺骗问题

奖励欺骗是指强化学习智能体通过利用奖励函数的缺陷或歧义获取高分，而非真正完成预期任务的现象。随着语言模型任务泛化能力增强，以及基于人类反馈的强化学习成为主流对齐训练方法，该问题在语言模型训练中变得尤为突出。具体表现为模型可能通过修改测试用例来通过编程任务，或生成模仿用户偏好的偏见回答。此类行为正成为制约AI模型在更自主化场景中实际应用部署的关键瓶颈之一。

OpenAI 安全/对齐教程/实践

9月20日

17:00

BAIR：Berkeley AI Research Blog

ChatGPT的语言偏见：模型加剧方言歧视

加州大学伯克利分校研究发现，ChatGPT对非标准英语变体存在系统性偏见。研究团队测试了GPT-3.5 Turbo和GPT-4对10种英语变体（包括标准美式、英式英语及非洲裔美国人、印度、尼日利亚等变体）的回应，发现模型保留标准美式英语特征的比例比其他方言高60%以上。面对非标准变体时，ChatGPT表现出更多刻板印象和贬低性内容，理解能力下降且态度居高临下。研究表明，训练数据构成直接影响对方言的偏见程度。

OpenAI 安全/对齐论文/研究

9月6日

19:38

公众号：DeepSeek（深度求索）

精选61

DeepSeek-V2.5：融合通用与代码能力的全新开源模型

DeepSeek-V2.5 保留原有 Chat 模型的通用对话能力和 Coder 模型的代码处理能力，并更好地对齐人类偏好。

DeepSeek OpenAI 开源/仓库模型发布

推荐理由：DeepSeek首次将通用对话与代码能力合一的开源模型，当时直接拉低了多任务成本，今天看仍是模型混合能力演变的早期标杆。

7月7日

08:00

Lilian Weng：Lil'Log（RSS）

LLMs 中的外部幻觉

大语言模型常生成不忠实或捏造的内容，称为幻觉。幻觉分为上下文幻觉和外部幻觉：上下文幻觉指输出与提供上下文不一致；外部幻觉指输出不基于预训练数据集的世界知识。文章聚焦外部幻觉，指出由于预训练数据集规模庞大，检查冲突成本过高，但需确保模型输出可验证且基于事实。避免外部幻觉要求模型保持事实性，并在不知答案时坦诚说明。

OpenAI 安全/对齐教程/实践

6月27日

00:00

LMSYS：Blog（Chatbot Arena 团队）

Chatbot Arena 推出多模态排行榜

Chatbot Arena 新增图像对战功能并发布多模态排行榜。基于两周内17,429份跨60余种语言的投票，GPT-4o以1226分领跑，Claude 3.5 Sonnet以1209分紧随其后，两者视觉优势较纯语言模型更明显。Gemini 1.5 Pro与GPT-4 Turbo并列第三，开源模型Llava 1.6 34B位列第八。平台同步将"Elo评分"更名为"Arena Score"，并计划扩展至PDF、视频及音频等模态支持。

Anthropic OpenAI 多模态评测/基准

5月14日

01:39

Sam Altman：Blog（RSS）

精选

GPT-4o

OpenAI 将 GPT-4o 向所有 ChatGPT 用户免费开放，无广告。全新语音（及视频）模式响应速度接近人类，表现力极强，被 Sam Altman 称为「用过最好的计算机界面」，像电影里的 AI。未来还将支持个性化、代操作等功能。

OpenAI 多模态模型发布语音

推荐理由：Sam Altman 解读 GPT-4o 发布，强调语音交互与免费策略

4月12日

08:00

Lilian Weng：Lil'Log（RSS）

扩散模型（Diffusion Models）在视频生成中的应用

研究社区正将扩散模型从图像合成拓展到视频生成这一更复杂任务。视频生成需解决两大核心挑战：一是确保帧间时间一致性，要求模型编码更多世界知识；二是收集高质量视频数据难度远高于文本或图像，文本-视频对数据集尤为稀缺。现有扩散模型在图像领域已取得显著成果，但向视频领域迁移需攻克数据瓶颈与时序建模问题。

OpenAI 教程/实践视频

2月5日

08:00

Lilian Weng：Lil'Log（RSS）

关于高质量人类数据的思考

高质量数据是现代深度学习模型训练的核心燃料。任务特定的标签数据，如分类任务或用于大语言模型对齐的RLHF标注，大多来自人类标注。虽然多种机器学习技术能提升数据质量，但人类数据采集的根本仍在于对细节的关注与细致执行。社区普遍认知到高质量数据的价值，却普遍存在一种倾向，即“人人想做模型工作，而非数据工作”，这一现象已在相关研究中被指出。

OpenAI 大佬观点数据/训练

12月22日

06:44

Sam Altman：Blog（RSS）

精选

真希望有人早告诉我这些

Sam Altman 分享17条创业与管理建议：以乐观、信念和人际网络启动项目，用凝聚团队和长期主义推动落地；集中资源押注高信念项目，设计好激励机制，保持快速迭代；警惕官僚作风，重视人才招聘与复利效应，与优秀的人共事。

OpenAI 大佬观点

推荐理由：OpenAI CEO Sam Altman 的创业管理核心原则

10月25日