社交平台X正在试点一项新功能允许AI聊天机器人生成社区笔记。
社区笔记是推特时代的一个功能,埃隆·马斯克在接管该服务后进行了扩展,现在称为X。参与这个事实核查项目的用户可以对某些帖子添加评论,以提供背景信息,这些评论在附加到帖子之前会由其他用户进行审核。例如,社区笔记可能会出现在一个不清楚其合成来源的AI生成视频的帖子上,或者作为对政治家误导性帖子的补充说明。
当在历史上对过去评分有分歧的群体之间达成共识时,笔记就会公开。
社区笔记在X上的成功足以激励Meta、TikTok和YouTube追求类似的举措——Meta完全取消了其第三方事实核查项目,以换取这种低成本的社区来源劳动。
但AI聊天机器人作为事实核查员的使用是否有益仍有待观察。
这些AI笔记可以使用X的Grok生成,或通过其他AI工具并通过API连接到X生成。AI提交的任何笔记将与人提交的笔记一样对待,这意味着它将经过相同的审核过程以确保准确性。
考虑到AI常常产生幻觉,或编造不基于现实的背景,AI在事实核查中的使用似乎值得怀疑。
根据一篇本周由X社区笔记研究人员发表的论文,建议人类和大型语言模型(LLM)协同工作。人类反馈可以通过强化学习增强AI笔记生成,人类笔记评审员仍然是笔记发布前的最终检查。
“目标不是创建一个告诉用户该怎么想的AI助手,而是建立一个生态系统,赋予人类更批判性地思考和更好地理解世界的能力,”论文中写道。“LLM和人类可以在一个良性循环中共同工作。”
即使有人工检查,过度依赖AI仍然存在风险,尤其是用户将能够嵌入第三方的LLM。例如,OpenAI的ChatGPT最近就出现了模型过于谄媚的问题。如果一个LLM优先考虑“有用性”而不是准确完成事实核查,那么AI生成的评论可能会完全不准确。
还有人担心人类评审员会因大量AI生成的评论而不堪重负,降低他们充分完成这项志愿工作的动力。
用户不应期望立即看到AI生成的社区笔记——X计划在更广泛推出之前测试这些AI贡献几周,以确保其成功。