对抗训练改进了心理健康对话优化的用户模拟
分析
本文介绍了一种对抗训练框架,旨在提高面向任务的对话(TOD)系统(特别是在心理健康领域)的用户模拟器的真实性。核心思想是使用生成器-判别器设置来迭代改进模拟器暴露聊天机器人故障模式的能力。结果表明,在暴露系统问题、多样性、分布对齐和预测有效性方面,与基线模型相比有显着改进。模拟失败率与实际失败率之间的强相关性是一个关键发现,表明了经济高效的系统评估的潜力。判别器准确性的降低进一步支持了模拟器真实性提高的说法。这项研究为开发更可靠、更高效的心理健康支持聊天机器人提供了一种有前景的方法。