AI 摘要
为何大多数对齐工作都是徒劳,一张图说明 [引用 @AISafetyMemes]:大多数对齐计划: 第一步)创造沙神 第二步)... 😈 欺骗沙神 😈 ... 第三步)沙神永远忠诚 “当前的对齐工作,不过是在沙王巨怪脸上涂口红。” -@romanyam
Why most alignment work is bullshit, in one image
Most alignment plans: Step 1) Create sand gods Step 2) ... 😈 Trick the sand gods 😈 ... Step 3) Sand gods remain loyal servants, forever "Current alignment wor...