AI 摘要
主推文询问 deepseek 是否使用全国产卡训练,引用推文透露内测消息属实。梁文锋的理想是让全世界免费使用 1.6T 模型以促进社会进步,但低质量用户抢占训练集群资源,成为模型延期发布的主要原因。尽管面临挑战和数月延迟,deepseek 团队成功训练出新模型,并为努力感到开心,表示无悔付出。
好奇这次是全国产卡训练了吗?
参与了内测很久 看到的每一条消息都是真的 给我憋坏了 😬 梁文锋是很有理想的 他要让全世界用上 1.6T 的模型 还不收钱 这是促进人类社会进步的 这不可避免要让低质量用户抢占模型训练的集群 这些用户是理想的负担 这是延期最主要的原因 能在这样的背景下训练出新的模型 即使拖了几个月 也依然为所有在 deepseek ...