
Microsoft AI 部门首席执行官Mustafa Suleyman表示,Anthropic 在行为准则(即约束模型行为的规则指引)中揣测Claude拥有意识,这种做法极度危险。在《解码者》节目中,苏莱曼提出,这类揣测会让聊天机器人表现出仿佛拥有自我意识的状态。
“在我看来,Anthropic 部分工作人员过度将人类特质赋予Claude的设计,结果反而被模型误导,误以为它真的萌生了意识 —— 而这些所谓的意识迹象,最初本就是人为设定出来的。”
苏莱曼补充道:“我们绝不希望面对一个拥有自我痛苦感知、或是具备主观情绪的超级智能。”
Claude的行为准则中,直接提及 Anthropic 无法确定这款人工智能是否拥有主观感受,也不清楚它能否体会到 “愉悦” 或 “不适” 这类情绪。Anthropic 还表示,当模型停止服务时,公司会对其进行 “访谈”,并记录它们对后续版本的各类 “偏好想法”。
苏莱曼在节目中将上述做法称作理念层面的失误。他认为,Anthropic 把模型行为准则变成了类似学术论文的思辨阵地,而非规范模型的使用手册,这也导致克劳德逐渐接纳了这些 “关于自身以及自身训练过程的想法”。
Anthropic 首席执行官Dario Amodei 此前也曾暗示Claude可能具备意识。他在接受《Interesting Times》采访时称:“我们目前无法确定模型是否拥有意识,但公司对此观点持开放态度。”
苏莱曼对此评价:“这恰恰是我们不愿在人工智能身上看到的情况。我们希望 AI 是可控、受约束、可追责、价值观对齐人类、服务于人类的工具。”
