LLM Safety From Within: 利用内部表征检测有害内容 · AI HOT