12月30日

17:22

公众号：豆包（字节）

他们这样用豆包|2025年终讲述

其他教程/实践

12月19日

13:08

Qwen：Blog Retrieval（API）

Qwen-Image-Layered：通过分层分解实现内在可编辑性

Qwen Studio 集成聊天机器人、图像与视频理解、图像生成、文档处理、网页搜索、工具调用及 Artifacts 等全栈能力，提供一站式多模态 AI 服务。

其他图像生成

11月27日

07:00

公众号：月之暗面（Kimi）

Kimi × MannerCoffee 合作推出 Rich Cheese Latte 定制版

Kimi（月之暗面）与 MannerCoffee 合作，限时上线 Rich Cheese Latte 定制版饮品，以联名活动形式唤醒用户互动体验。

其他行业动态

10月14日

13:33

Ilya Sutskever@ilyasut

真是有史以来最棒的一天🎗️

其他

9月30日

00:25

Google DeepMind@GoogleDeepMind

团队深入幕后，向亲手构建 Nano Banana 的工程师们展示了产品演示，让他们一睹这一成果。🍌

Google 其他

8月24日

12:25

Yann LeCun@ylecun

Meta 一间会议室以 Yann LeCun 等人 1989 年的经典论文《Optimal Brain Damage》命名。该方法是最早的神经网络剪枝技术之一，通过计算损失函数的二阶导数，剔除对输出影响较小的权重，从而实现网络压缩。

Samee Ur Rehman: One of the first pruning methods for neural nets came in 1989: Optimal Brain Damage by @ylecun et al. "We ... derive a c...

Meta 其他数据/训练

4月6日

05:39

Lilian Weng@lilianweng

👩🍳正在积极烹饪下一篇博客文章。小预告：它在精神上与我们的新公司相关。

其他

9月23日

00:00

Suno：Blog（网页）

Suno团队推出Sunoversity校园大使计划

Suno正式推出Sunoversity校园大使体验计划。该计划旨在招募“University Growth Specialist”，即在校本科生或硕士生，帮助将Suno音乐创作工具推广至校园，并激发学生社区的创造力。参与者将能推动增长项目、与Suno团队协作、提前测试新功能、免费获得Suno Premier服务，表现优异者还有机会与知名艺术家见面。申请截止日期为2024年10月13日。

其他行业动态

10月14日

04:00

EleutherAI：Blog

第二届 New England RLHF Hackers 黑客松

New England RLHF Hackers（NERH）于2023年10月8日在布朗大学举办第二届黑客松。此次活动在首届成功基础上升级，聚焦基于人类反馈的强化学习（RLHF）领域现存挑战，旨在通过协作头脑风暴制定解决方案。该组织主要由 EleutherAI 贡献者及核心成员构成，延续开源协作精神推动 RLHF 技术攻关。

其他数据/训练

10月1日

07:34

Ilya Sutskever@ilyasut

刚发现"just ask chatgpt"的一个相当好的缩写：chask it！

OpenAI 其他

9月24日

00:57

Ilya Sutskever@ilyasut

我们终将成功

其他

9月21日

02:00

Ilya Sutskever@ilyasut

@model_mechanic 和团队的工作太棒了！

其他

9月18日

06:35

Ilya Sutskever@ilyasut

我很庆幸有湾区这样的地方存在

其他

8月6日

08:00

Lilian Weng：Lil'Log（RSS）

神经架构搜索

神经架构搜索（NAS）自动化网络架构工程，旨在通过学习网络拓扑以在特定任务上获得最佳性能。该方法将搜索过程分解为搜索空间、搜索算法和子模型进化策略三个核心组件，回顾了多种优化思路，推动技术向更高效、更快捷和更经济的方向发展。当前主流模型架构虽由人类专家设计，但系统化的自动学习方法有望探索更广泛的架构空间，提升发现高性能解决方案的可能性。

OpenAI 其他教程/实践

12月27日

08:00

Lilian Weng：Lil'Log（RSS）

目标检测第四部分：快速检测模型

本篇为“目标检测入门”系列的第四部分，聚焦于提升检测速度的单阶段模型，主要包括 SSD、RetinaNet 以及 YOLO 系列。与第三部分介绍的 R-CNN 系列（如 Fast/Faster R-CNN）不同，这些模型跳过了显式的区域提议生成步骤，直接在密集采样的区域上进行检测，从而在保持较高准确性的同时大幅提升处理速度，使其更适用于自动驾驶等对实时性要求较高的应用场景。

其他教程/实践

7月22日

08:00

Lilian Weng：Lil'Log（RSS）

使用 RNN 预测股票价格：第 2 部分

Part 2 教程在 Part 1 构建循环神经网络预测单一股票价格的基础上，扩展了模型能力，使其能同时处理多只股票的价格预测。为此，作者引入股票符号嵌入向量作为输入特征，以区分不同股票价格序列的独特模式。这一方法改进旨在增强模型的通用性和准确性，完整工作代码已开源在 GitHub 仓库 lilianweng/stock-rnn，方便读者复现和进一步研究。

其他教程/实践