本文介绍了一项关于对话中人物属性提取(Persona Attribute Extraction in Dialogues, PAED)的研究,由Luyao Zhu、Wei Li、Rui Mao、Vlad Pandelea和Erik Cambria共同完成,研究团队来自新加坡南洋理工大学。该研究发表于2023年7月9日至14日举行的第61届计算语言学协会年会(ACL 2023)上,收录于会议论文集的第一卷长论文部分,页码为9771至9787。
人物属性提取是个性化人机交互中的关键任务,尤其是在对话系统中,提取用户的人物属性可以帮助系统生成更具个性化的响应。尽管已有一些公开的数据集用于从对话中提取人物属性,但这些数据集通常存在标签不明确、注释不一致等问题。为了解决这些问题,本研究提出了一个基于对比学习和生成模型的框架,并引入了一种新的硬负采样策略(Hard Negative Sampling, HNS),用于广义零样本学习(Generalized Zero-Shot Learning, GZSL)场景下的人物属性提取。
研究主要分为以下几个步骤:
数据集构建:研究团队从现有的对话数据集(如PersonaChat和Dialogue NLI)中提取数据,构建了一个新的数据集PersonaExt。该数据集通过手动修正1896个三元组标签,并使用更保守的策略为对话分配标签,确保了标签的可靠性和一致性。具体来说,只有通过BERT和TF-IDF分类器双重确认的标签才会被分配给对话。
模型设计:研究提出了一个基于生成的框架,用于零样本人物属性提取。该框架包括两个主要部分:人物属性生成器(Persona Attribute Generator, PAG)和人物属性提取器(Persona Attribute Extractor, PAE)。PAG用于生成包含人物描述的合成对话,PAE则在这些合成数据上进行训练,以提取未见过的目标数据中的人物属性。
硬负采样策略:为了应对零样本学习中的硬样本问题,研究提出了一种新的硬负采样策略,称为Meta-VAE采样器。该采样器使用变分自编码器(Variational Autoencoder, VAE)来表示不同关系下的对话分布,并通过对比结构化约束(Contrastive Structured Constraint, CSC)来增强模型的表示能力。
实验与评估:研究在PersonaExt数据集和一个公开数据集FewRel上进行了基准测试,结果表明,所提出的模型在人物属性提取任务中显著优于现有的基线模型。特别是在硬负采样方面,Meta-VAE采样器的表现远超其他方法。
研究的主要结果包括: - 数据集改进:PersonaExt数据集通过手动修正和自动交叉分配策略,显著提高了标签的准确性和一致性。 - 模型性能:所提出的模型在PersonaExt数据集上的准确率比现有基线模型高出1.06%,在FewRel数据集上的多三元组提取任务中,准确率提高了3.18%。 - 硬负采样效果:Meta-VAE采样器在人物属性提取任务中比其他采样器高出2.66%。
该研究的贡献主要体现在以下几个方面: 1. 数据集贡献:构建了一个高质量的人物属性提取数据集PersonaExt,包含1896个手动修正的三元组标签和6357个修正的对话-三元组对。 2. 模型创新:提出了一个基于生成的零样本人物属性提取框架,并引入了Meta-VAE采样器和CSC损失,显著提升了模型的性能。 3. 实验结果:所提出的模型在多个数据集上均表现出色,特别是在硬负采样方面,展示了其强大的泛化能力。
研究还探讨了模型的局限性,例如在处理隐式人物属性时的挑战,以及如何从多轮对话中准确匹配人物属性。此外,研究团队还公开了代码和数据,供其他研究者使用和验证。
总的来说,这项研究为对话系统中的人物属性提取提供了新的思路和方法,具有重要的科学和应用价值。