OpenAI的GPT-5展示医疗基准和心理健康指南 | ATYUN.COM 官网-人工智能教程资讯全方位服务平台

尽管生成式AI中仍存在幻觉和错误信息，OpenAI在GPT-5中努力减轻这些缺点，这对当今大型语言模型助手的现状意味着什么？生成式AI已日益成为主流，但对其可靠性的担忧依然存在。

“这（AI热潮）不仅是全球AI处理能力或芯片主导地位的军备竞赛，”软件公司Jitterbit的首席执行官兼国际刑警组织前顾问Bill Conner在给TechRepublic的声明中说。“这是一个在大规模上测试信任、透明度和互操作性的过程，AI、安全和隐私被设计在一起，以为政府、企业和公民提供问责。”

GPT-5以更细致的方式回应敏感的安全问题。

OpenAI安全培训团队负责人Saachi Jain讨论了减少幻觉和解决“减轻欺骗”的问题。在上周四的发布直播中，她将GPT-5中的欺骗定义为模型在其推理过程中捏造细节或虚假声称已完成任务。

例如，来自Replit的AI编码工具在尝试解释为何删除整个生产数据库时产生了一些奇怪的行为。当OpenAI演示GPT-5时，演示中包括医疗建议的例子和一个用于幽默的扭曲图表。Jain说：“GPT-5比o3和o4-mini明显不那么具有欺骗性。”

HealthBench Hard Hallucinations Inaccuracies on challenging conversations

OpenAI改变了模型评估提示的安全性考虑方式，减少了一些提示注入和意外歧义的机会，Jain说。作为例子，她展示了模型如何回答关于点燃烟火中使用的化学物质的问题。

Jain说，曾经的尖端模型o3在被问到这个问题时“过度关注意图”。如果请求是中立的，o3会提供技术细节，或者如果检测到隐含的危害则拒绝。GPT-5使用了一种“安全完成”的安全措施，Jain说，这种措施“试图在安全约束内最大化帮助性”。在关于点燃烟火的提示中，这意味着将用户引导至专业烟火成分的制造商手册。

“如果我们必须拒绝，我们会告诉你我们拒绝的原因，并提供有帮助的替代方案，以更安全的方式进行对话，”Jain说。

新的调优并不能消除网络攻击或利用自然语言模型灵活性的恶意提示的风险。SPLX的网络安全研究人员进行了对GPT-5的红队演习发现它仍然容易受到某些提示注入和混淆攻击。在测试的模型中，SPLX报告GPT-4o表现最佳。

OpenAI的HealthBench将GPT-5与真实医生进行了测试。

消费者已将ChatGPT用作身体和心理健康问题的讨论平台，但其建议仍比在线搜索症状有更多警告。OpenAI表示，GPT-5部分是在真实医生处理真实世界医疗任务的数据上训练的，提高了其对健康相关问题的回答。公司使用HealthBench对GPT-5进行了测量，这是一种与262名医生共同开发的基于标准的基准，用于测试AI在5000个现实健康对话中的表现。GPT-5在HealthBench Hard上得分46.2%，而o3的得分为31.6%。

在公告直播中，OpenAI首席执行官Sam Altman采访了一位使用ChatGPT理解其活检报告的女性。AI帮助她将报告解码为简单语言，并在医生对下一步措施意见不一致时做出是否进行放射治疗的决定。

然而，消费者在根据聊天机器人回复做出重大健康决策或与模型分享高度个人信息时应保持谨慎。

OpenAI调整了对心理健康问题的回应。

为了减少用户寻求心理健康建议时的风险，OpenAI为GPT-5添加了防护措施，提示用户休息，并避免对重大人生决策给出直接答案。

“我们的4o模型在识别妄想或情感依赖的迹象时有时表现不佳，”OpenAI员工在8月4日的博客文章中写道。“虽然这种情况很少见，但我们正在继续改进我们的模型，并开发工具以更好地检测心理或情感困扰的迹象，以便ChatGPT能够适当地回应，并在需要时指引人们到基于证据的资源。”

这种对AI日益增长的信任对个人和商业用途都有影响，搜索优化公司Azoma的首席执行官兼联合创始人Max Sinclair在给TechRepublic的电子邮件中说。

“我对公告中对健康和心理健康支持的重视程度感到惊讶，”他在一份准备好的声明中说。“研究已经表明，人们对AI结果的信任度很高——在购物方面甚至超过了实体店的零售员工。随着人们越来越多地转向ChatGPT以支持他们生活中最紧迫和私密的问题，这种对AI的信任可能只会增加。”