为了研究这一现象,瑞士洛桑联邦理工学院的研究人员查看了三个版本的AI聊天机器人模型:通过打开这些模型,查看构成这些大型语言模型内部处理机制的各个“层”。
“我们打开这些模型,查看了每一层,”研究员维尼亚明·维塞洛夫斯基表示。“我们想要了解的是,这些层是否真的在用英文处理输入的信息”
“英语子空间”
这些模型因其开源特性而被选中,它们被输入了四种语言(法语、德语、俄语和中文)的三种类型的提示。第一种提示类型要求大型语言模型重复给出的单词。第二种提示要求大型语言模型将一个非英语单词翻译成另一个非英语单词。第三种要求大型语言模型在句子中填入一个缺失的单词。
然后,研究人员成功地回溯了大型语言模型为了回答这些提示而必须经历的所有不同变化和过程。他们发现,所有这些大型语言模型以及这些分层过程都有一个共同点:它们都经过了他们称之为“英语子空间”的阶段。
这基本上意味着,模型不是直接从法语翻译成德语,而是绕了一个弯,先从法语翻译成英语,再从英语翻译成德语,或者相反。据维塞洛夫斯基表示,这一点意义重大,因为它表明这些大型语言模型正在使用英语来理解某些概念。
华盛顿特区民主与技术中心的阿里亚·巴蒂亚解释了这些结果为何令人担忧。
“与大多数其他语言相比,英语和某些联合国官方语言中有更多高质量的数据可供训练模型,因此,人工智能开发人员主要使用英语数据来训练他们的模型,”她解释说。
“但使用英语作为媒介,教授模型如何分析语言,有可能将有限的世界观叠加到其他语言和文化不同的地区。”