迈向认知共情,华南理工团队全面开源心理咨询师数字孪生大模型SoulChat2.0
迈向认知共情,华南理工团队全面开源心理咨询师数字孪生大模型SoulChat2.0
华南理工大学数字孪生人实验室近期推出了心理咨询师数字孪生大模型SoulChat2.0,该模型通过创新的数据生成框架和建模方法,实现了对特定心理咨询师语言风格和咨询技术的精准模拟。这一突破性成果不仅为心理健康领域的大模型研究开辟了新路径,也为实际的心理咨询工作提供了有力的技术支持。
研究背景与挑战
自ChatGPT诞生以来,国内外已有大量研究将大模型应用于情感陪护、心理健康支持对话等领域。然而,以往的工作主要通过精心设计的提示词构建多轮对话数据集,导致训练出的“心理健康大模型”容易出现回答同质化、模板化的问题,难以应对复杂多变的来访者需求。
SoulChat2.0的核心创新
针对上述问题,华南理工大学未来技术学院与广东省数字孪生人重点实验室在灵心大模型(SoulChat1.0)的基础上,推出了心理咨询师数字孪生大模型SoulChat2.0。该模型首次定义了特定心理咨询师的数字孪生(PsyDT)任务,即在有限的咨询案例基础上,通过先进的LLMs语言总结能力,提取心理咨询师的语言风格和咨询技术应用方式。
图 1:心理咨询师数字孪生数据生成框架
数据生成框架
为了克服数据采集的困难,研究团队建立了一种仅需少量咨询案例的数据生成框架。该框架通过分析心理咨询师的咨询案例,提取其语言风格和咨询技术特点,并结合心理咨询技术知识库,生成高质量的数字孪生数据。同时,通过对单轮对话咨询数据库中的来访者进行大五人格分析,确保生成数据的多样性和真实性。
图 4:不同的数据生成方法构建的数据与给定咨询师案例的咨询技术一致性比较
建模方法
在数据生成的基础上,研究团队采用Llama3-8B-Instruct作为基座模型,通过PsyDTCorpus训练集进行微调。实验结果显示,SoulChat2.0在谈话技术、状态与态度、关系建立、疗法技术应用等多个专业维度上均表现出色,特别是在认知共情方面有显著提升。
应用前景与开源贡献
SoulChat2.0的推出为心理健康大模型领域带来了新的研究思路。通过少量真实咨询案例即可实现心理咨询师的数字孪生建模,不仅降低了成本,还提高了效率。这种模型能够辅助真实世界的心理咨询师开展工作,例如执行前置谈话、提供24小时在线服务等。
该项研究的大模型与微调数据已在GitHub和ModelScope全面开源,为学术界和产业界提供了重要的研究资源。