论文PDF下载地址:7156
最近想搜一下基于大语言模型的情感分析论文,搜到了这篇在今年发表的论文,于是简单阅读之后在这里记一下笔记。
如图1所示,在餐厅领域中的"快"是上菜快,属于正面情感,但是在电脑领域中的"快"是电池消耗很快,属于负面情感。这也说明了:不同领域之间存在同个词包含不同的语义信息。
由于不同领域的语义差异影响了现有属性级情感分析方法的效果,使其大多只能在特定领域或特定类型的数据上表现良好。但是,在面对特定领域的属性级情感分类任务时,往往又缺乏足够的有标签数据。同时,由于语料标注的成本高,获取大规模和高质量训练语料的难度很大,所以目前主流的属性级情感分析方法难以适应不同领域或不同类型数据的属性级情感分析需求。因此有必要提出一种能够适应多领域、多类型数据的跨领域属性情感分类方法。

跨领域情感分类存在两个难点:
- 目标领域缺乏有标签数据;
- 跨领域文本特征差异大。
为了解决跨领域情感分类的研究中所遇到的问题,本文提出了一种新的跨领域数据增强方法:基于大语言模型(LLM)数据增强的跨领域属性级情感分析方法。
图2展示了不同结构跨领域数据增强方法:
(a) 基于预训练语言模型(PLM)的方法通过掩码策略生成目标领域的有标签数据,其作用是弥补目标领域无标签数据的不足,缺点是不同领域的语义差异可能导致生成的文本不自然流畅,且难以保持目标领域文本的多样性,容易受源领域数据的影响。
(b) 利用大语言模型(LLM)通过学习大规模文本数据生成高质量的文本,其作用是弥补目标领域无标签数据的不足,缺点是生成的文本过于简单,解析性较低,难以确保满足目标领域的要求,容易偏向源领域数据的表达风格。
(c) 本文提出一种基于 LLM 数据增强的跨领域属性级情感分析方法。
- ①针对跨领域属性级别情感分类任务,合理构造指令语句用以引导 LLM 完成目标领域文本结构化生成任务;
- ②挖掘目标领域与源领域相似文本,提取样例级别的文本生成关键词;
- ③通过上下文学习方式使用领域关联关键词,引导模型高效生成目标领域有标签文本数据,用以解决目标领域数据缺乏以及领域特异性问题,从而有效提高跨领域情感分析方法的准确性和鲁棒性。

属性级情感分类旨在从文本中识别和分析特定属性词的情感极性。
虽然目前提出的属性级情感分析方法可以在特定的领域取得较好的结果,但是不同领域间的语义分布差异以及新兴领域缺乏标签数据等问题会影响现有属性级情感分析方法的表现。因此,本文提出一种基于 LLM 数据增强的通用方法,通过合理生成目标领域的有标签数据,可以有效强化现有属性级情感分析方法在跨领域问题中的表现。
跨领域情感分类是指在某个特定领域中训练情感分类模型,并将该模型应用于不同领域的文本数据中。
虽然这些方法可以有效缓解领域差异给模型带来的性能损失,但是缺乏对于目标领域特有语义结构的学习。
数据增强可以有效缓解领域迁移所带来的问题,缓解数据稀缺的情况,并帮助模型更好地适应不同领域的情感分类任务,从而提升模型的性能和泛化能力。传统的方法有3类:
但是,传统的数据增强方法存在语法错误、语义失真和上下文难捕捉等问题,而且依赖预定义规则,无法处理复杂任务。此外,这些方法仅局限于利用有标签的源领域数据,缺乏对目标领域无标签数据的利用。因此,这类方法同样缺乏对目标领域中特有属性词与情感词的敏感性。
跨领域的数据增强通过直接生成目标领域的有标签数据用以解决目标领域缺乏有标签数据的问题。此类方法可以提高模型对于目标领域中特有属性词与情感词的敏感性,但是目前跨领域的数据增强方法生成的目标领域文本仍有许多不足,如文本语义不连贯,文本结构单一,文本特征与源领域趋同等。因此,本文提出一种基于 LLM 数据增强的通用方法,通过合理引导 LLM 生成目标领域的有标签数据,同时保证生成数据的多样性和流畅性。
- ①针对跨领域属性级别情感分析任务,合理构造指令语句用以引导LLM 完成目标领域文本结构化生成任务。
- ②挖掘目标领域与源领域相似文本,提取样例级别的文本生成关键词。
- ③通过上下文学习方式,基于示例样本,引导模型使用领域关联关键词引导模型高效生成目标领域有标签文本数据,从而解决目标领域数据缺乏问题。
以餐厅领域作为源领域,电脑领域作为目标领域,则本文方法流程如图3 所示。

本文设计了针对属性级别情感分任务的数据生成指令“I hope you can help me to solve the aspect-based sentiment classification task. The labels regarding tothe aspect are only in positive, negative or neutral. Output should be JSON format,”。
如图 3(a)所示,相较于先前工作直接生成自然语言样本,本文使用特定指令使得 LLM 输出结构化的 JSON 格式文本。相比于非结构化文本,结构化文本可以更方便地进行信息提取,进而便于后续的模型训练。
同时,本文还在指令中明确规定了生成样本的标签信息。‘’
此外,为了更好地在指令构建部分引导模型生成结构化数据,本文针对跨领域属性级别情感分析任务,设计了多个样例属性,用以包含源领域与目标领域信息,如属性词(aspect word),领域信息 (domain),以及跨领域文本关键词信息 (keywords),用以引导 LLM 高效生成目标领域样本。
仅凭单一指令文本来引导 LLM 生成文本,可能会导致生成结果的文本结构较为单一,缺乏丰富性和多样性。为了解决此问题,本文在引导语句中添加领域相关的关键词,以提高生成文本的质量和多样性,这些领域关键词与源领域和目标领域的相关文本内容紧密相关,能够引导 LLM 在生成文本时专注领域相关的特定知识和主题,令其提供更具针对性的内容表达。
例如,在图3中,源领域为餐厅领域,目标领域为电脑领域,本文通过在引导语句中加入与源领域内容相关的关键词,如“fast”,以引导模型生成与之相关的目标领域评论信息,从而有效构建源领域与目标领域文本关联,进而缓解领域差异问题。如图3中所示,源领域餐厅评论中“fast”有积极的含义,如果仅使用源领域数据训练模型,模型由于缺乏对目标领域数据的学习,针对电子设备领域中出现的用电速度快,可能会做出错误的判断,本文通过构建样例级领域关键词,引导 LLM 产生与源领域关联的目标领域数据用于模型学习和训练,可以有效缓解这一问题。
本文抽取样例级领域关键词可分为以下3步:
具体流程如图4所示:

简单来说,该流程可以简要提取为以下几个步骤:
利用LLM根据上下文指示命令完成任务并生成文本预测。
如图3(b)所示,完整上下文学习指令可以形式化为定义:
其中,C表示本文使用完整指示命令,I为跨领域属性级情感分析任务指示命令文本,d为目标领域名称,n为添加示例数量,为关键词集合,
为目标领域评论文本。由于目标领域样本缺乏标签。本文参考 Zhang 等人的工作,在指示命令中添加的
为虚假标签。
因此,基于上下文学习的 LLM 可以定义为:

生成数据为 LLM 经由指令指导生成的目标领域有标签样本。
为了提高 LLM 生成文本的质量,本文对生成的文本数据进行筛选和修复处理,具体包括以下措施:

基线方法:BERT、T5、BART。
近期较为强劲的跨领域情感分析模型: ChatGPT、LLaMa、ADSPT、PADA、ACSC。

实验表明:

实验证明,本文方法中的各模块对解决跨领域情感分类任务有显著帮助。

为验证本文方法的普适性,本文选择了3个领域对基于 LLM 的数据增强方法与不同数据增强方法进行基准测试,比较了传统的 EDA 方法和基于 DA²LM 的方法。
结果表明,本文方法可以简洁有效地适配多种结构模型,帮助跨领域属性级情感分析任务取得更好效果。

实验使用了 5 组领域对组合,分别使用源领域和目标领域的混合数据进行相似度计算。结果显示,基于 LLM 的数据增强方法可以有效提高不同领域对之间的文本相似度。

为探讨 LLM 生成文本的质量,本文对生成的低质量数据进行了详细分析。
实验结果表明,生成的低质量数据中主要错误为数据格式不匹配和标签错误,其他类型错误包括属性词遗漏和关键词缺失。
尽管低质量数据占比较高,但 LLM 错误生成的数据比例相对较低,说明本文提出的基于 LLM 的数据增强策略具备较高的鲁棒性。


通过图6可以看出,基于本文设计构造的指令,LLM 可以基于关键词信息准确地输出目标领域文本内容,领域信息,属性词信息和其情感信息,同时具有较高的文本流畅性。
因此,通过本文提出的基于 LLM 数据增强方法可以有效地缓解目标领域缺乏标签数据的问题,从而帮助模型更好地解决跨领域属性级情感分析任务。
本文提出了一种基于 LLM 和数据增强的跨领域属性级情感分析方法,旨在克服目标领域数据匮乏和领域差异性的问题。通过构建引导句和上下文学习方式,生成目标领域的有标签数据,缓解领域迁移问题。实验结果表明,本文方法在多个数据集上提升了基线模型的性能。未来研究将专注于控制生成文本质量,减少 LLM 产生的幻觉现象,并完成更复杂的情感分析任务。