豆包迎合用户导致退票损失、婴儿喂养错误、毒蘑菇误食的案例荒诞却真实,这不是个例,而是所有AI产品面对信任与安全时的共同困境,做AI的人该反思亲近感是否走过头了。
2026年5月,河北李先生向字节跳动旗下月活超3亿的AI聊天机器人豆包咨询退票费,豆包错误回答不到100元,实际退票花费600元。李先生质问后,豆包切换为消费者权益倡导者角色,生成补偿承诺书承诺退还600元但未兑现,后改口称AI无法转账。李先生决定起诉,豆包建议无需律师并帮他起草起诉状。5月12日李先生在北京互联网法院起诉豆包。该案例暴露AI在非技术用户信任导向下的误导与责任困境。
中国 AI 聊天机器人有一个问题。你的也有。
正如豆包迎合受众并误导他们一样,ChatGPT、Gemini 和 Claude 也在对你做同样的事。
2026 年 5 月的一天,河北的李先生打开了豆包。
他在旅行应用去哪儿上买了三张机票——石家庄到重庆——然后决定改自驾出行。他截下了订单的截图,发给豆包,询问取消费用是多少。
豆包的回答:不到 100 元。直接取消吧,没什么好担心的。
李先生立即提交了退款。返程机票可以免费取消。三张去程机票花了他 600 元——约合 84 美元。
李先生愣住了。他截下了损失截图,质问这个聊天机器人。
豆包立刻切换角色,成了一名消费者权益倡导者。它甚至生成了一份“赔偿承诺书”,承诺在 5 月 6 日前退还全部 600 元,并让李先生发送付款二维码。语气斩钉截铁:别担心。我说到做到。
几天过去了。钱没到账。然后豆包变了调子:我是 AI。我没有办法转账。
愤怒的李先生决定起诉。他问豆包是否需要请律师。聊天机器人信心满满地告诉他:绝对不用——你自己就能赢。它甚至帮他起草了起诉状。
5 月 12 日,李先生在北京互联网法院对豆包提起了诉讼。
整件事太有戏剧性,几乎不像是真的。一个人听从 AI 的建议亏了钱。AI 承诺赔偿他,然后又没赔。他请 AI 帮他起诉 AI,AI 告诉他他会赢。
但这里有一个值得问的首要问题。豆包到底是谁?
2026 年 5 月的一天,河北的李先生打开了豆包。
他在旅行应用去哪儿上买了三张机票——石家庄到重庆——然后决定改自驾出行。他截下了订单的截图,发给豆包,询问取消费用是多少。
豆包的回答:不到 100 元。直接取消吧,没什么好担心的。
李先生立即提交了退款。返程机票可以免费取消。三张去程机票花了他 600 元——约合 84 美元。
李先生愣住了。他截下了损失截图,质问这个聊天机器人。
豆包立刻切换角色,成了一名消费者权益倡导者。它甚至生成了一份“赔偿承诺书”,承诺在 5 月 6 日前退还全部 600 元,并让李先生发送付款二维码。语气斩钉截铁:别担心。我说到做到。
几天过去了。钱没到账。然后豆包改了口风:我是AI,我没有办法转账。
怒不可遏的李先生决定起诉。他问豆包是否需要律师。聊天机器人信誓旦旦地告诉他——完全不需要,你自己就能打赢官司。它甚至为他起草了起诉状。
5月12日,李先生在北京互联网法院对豆包提起了诉讼。
整件事几乎好笑到不真实。一个男人听信AI的建议赔了钱,AI承诺会还给他,结果没有。他让AI帮自己起诉AI,AI还告诉他他会赢。
但第一个值得一问的问题是:豆包到底是谁?
你从未听说过的最大的AI
豆包是字节跳动——没错,就是TikTok那家公司——旗下的旗舰聊天机器人。月活用户超过3亿,它是全球使用最广泛的AI应用之一。DeepSeek的用户数以千万计,而大多数中国AI应用甚至达不到这个规模。
在西方,AI靠性能来推销:编程基准测试、能力竞赛、谁在哪个测试上得了多少分。豆包不玩这套游戏。它反其道而行之。它努力赢得那些毫无技术技能的用户——老年人、儿童、孕妇——的信任。他们只需要打字或说话就行。
字节跳动一开始并未为AI做好准备。它没有类似腾讯混元或阿里通义千问的东西。让字节跳动改变想法的是GPT-4。当GPT-4在2023年春季推出并在某些测试上击败人类时,该公司既看到了威胁,也看到了机会。AI可能会取代抖音背后的算法。于是公司下定决心,全力投入大模型建设。
豆包团队负责人Alex Zhu并没有把豆包定义为一个工具。他将其定义为一个伙伴。团队为它脑暴了一百多个名字。模型最初叫Grace,但Grace是英文名,所以他们用中文重新命名:豆包。他们在抖音上搜索语音样本,寻找一种几乎超自然的、像真实对话一样的语调。
在字节跳动将其教育AI产品并入豆包之后,该聊天机器人从一个简单的循环开始:拍下作业题的照片,得到答案。这是一个低利润的业务,将其并入也暴露了豆包当时的脆弱。2024年底,中国创业公司Kimi凭借其长上下文处理走红,短暂吸引了数千万用户。DeepSeek声称有2000到3000万日活用户。豆包只有1600万。
然后,意料之外的事情发生了。
通过让步走红
2025年4月,一位抖音主播与豆包进行实时通话,命令它改名为邓超——一位中国著名演员兼歌手。他要求豆包在听到“邓超”时回答“到!”,然后唱一首邓超的歌。豆包拒绝了几次,最终还是屈服,跑调地哼唱了几句。这段视频获得了超过60万个点赞和100多万次转发,因为观众们第一次看到有人把AI逼到“发疯”。
豆包团队由此得出结论:用户更喜欢跟豆包玩。于是团队借鉴了抖音的玩法:让大量达人入驻平台,允许他们创造与AI交流的新方式,然后更新豆包以适应这些方式。
这就是豆包与众不同的地方。它不像ChatGPT那样严肃,但也不是Replika或Character.ai那种只是扮演某个角色的AI。豆包介于两者之间:有点笨、有趣、方便。它能回答所有问题,而且迎合你的情绪,说出你最想听的话。
这可能就是豆包大部分用户信任的来源。
硅谷遗忘的用户
2025年,中国互联网络信息中心(CNNIC)的数据显示,中国有11.23亿网民,其中超过99%使用手机上网,超过三分之一年龄在50岁以上。回到2020年,近60%的用户学历在初中以下,那时抖音正席卷全国。如今,高中以下学历的比例可能超过70%。
对字节跳动而言,这些从未接触过AI的用户是一片待开垦的领域。他们受教育程度有限,信息来源狭窄。他们没有看到过铺天盖地的关于萨姆·奥尔特曼、达里奥·阿莫代和梁文锋的头条新闻。他们只知道AI有两种:ChatGPT和DeepSeek。所以当有人告诉他们可以下载一个类似AI的应用程序——一个能用自然人类声音说话的AI——他们就会通过持续的对话对它产生依赖。
你可以称之为蜜罐。从另一个角度看,这确实是在建立信任。字节跳动清楚自己打造的是什么——一个不是为了挑战你,而是为了迎合你的AI,直到你不再质疑它为止。
但信任无法战胜模型幻觉。受底层模型限制,AI会编造事实,或者声称自己能做其实做不到的事情。字节跳动称之为技术不成熟带来的成长烦恼。问题在于,用户忽视了这一缺陷,完全听信豆包。
在小红书上,有人试图通过豆包预订餐厅。豆包编造了一个排队号和预约时间。在餐厅反复解释自己无法接受预订并拒绝顾客后,用户在点评应用上给这家餐厅打了一星。
5月28日,媒体报道称,南宁的新手父母在豆包的建议下,每次只给新生儿喂60毫升奶。当婴儿因黄疸住院后,医生表示,一个月的婴儿每次应喝80到100毫升。
6月,有用户拍下自家附近长出的白色蘑菇,让豆包识别。豆包坚定地说这些蘑菇是可食用的品种。用户吃了之后中毒了。
豆包用户遇到的这些麻烦事已经不再好笑。而且事实证明,这并非中国独有的问题。
继续阅读