[1]孙晓晔,成彬*,王程.基于ChatGLM3-6B的方面级情感分析研究[J].计算机技术与发展,2025,(05):106-110.[doi:10.20165/j.cnki.ISSN1673-629X.2024.0391]
 SUN Xiao-ye,CHENG Bin*,WANG Cheng.Research on Aspect-based Sentiment Analysis Based on ChatGLM3-6B[J].,2025,(05):106-110.[doi:10.20165/j.cnki.ISSN1673-629X.2024.0391]
点击复制

基于ChatGLM3-6B的方面级情感分析研究()

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2025年05期
页码:
106-110
栏目:
人工智能
出版日期:
2025-05-10

文章信息/Info

Title:
Research on Aspect-based Sentiment Analysis Based on ChatGLM3-6B
文章编号:
1673-629X(2025)05-0106-05
作者:
孙晓晔12成彬12*王程12
1. 河北省科学院应用数学研究所,河北 石家庄 050081;
2. 河北省信息安全认证技术创新中心,河北 石家庄 050081
Author(s):
SUN Xiao-ye12CHENG Bin12*WANG Cheng12
1. Institute of Applied Mathematics,Hebei Academy of Sciences,Shijiazhuang 050081,China;
2. Information Security Authentication Technology Innovation Center of Hebei Province,Shijiazhuang 050081,China
关键词:
自然语言处理方面级情感分析大语言模型数据筛选指令微调
Keywords:
natural language processingaspect-based sentiment analysislarge language modeldata screeninginstruction tuning
分类号:
TP391.1
DOI:
10.20165/j.cnki.ISSN1673-629X.2024.0391
摘要:
为了利用大语言模型不依赖于标注数据、上下文理解和迁移能力强的优势,该文将 LLM 用于公开数据集匮乏的统一方面级情感分析(Unified Aspect-Based Sentiment Analysis,UABSA)任务,提出了一种结合数据筛选和 LLM 指令微调的方法 SLIT,并在多个领域的中英文数据集上进行了实验。 首先,通过对比训练集中样本之间的相似度,筛除相似度高的部分样本数据,得到精简数据集;然后,设计提示模板,用精简数据集构造用于微调的指令数据集;最后,对 ChatGLM3-6B 大模型进行 P-Tuning v2 微调,在测试集上验证效果。 实验结果表明,与使用未经过数据筛选的 ChatGLM3-6B+微调方法相比,SLIT 虽然使用的数据更少,但在 Rest14、Laptop14、扫地机器人 3 个数据集上的 F1 值分别提高了 3. 95 百分点、2. 01 百分点、4. 62 百分点,与其他基准方法相比,在 Rest14 数据集上的效果达到了最佳。
Abstract:
To leverage the advantages of large language models,including the independence from labeled data,the excellent capabilities of contextual understanding and transfer learning,we apply LLM to the Unified Aspect-Based Sentiment Analysis (UABSA) task,which lacks labeled datasets. We propose a method called SLIT that combines data screening and LLM instruction tuning and have conducted experiments on Chinese and English datasets across various domains. Firstly,by comparing the similarity between samples in the training set,we filter out some highly similar samples to get a refined dataset. Secondly,we design a prompt template and construct an instruction dataset using the refined dataset. Finally,we apply P-Tuning v2 fine-tuning on the ChatGLM3-6B model and verify the results on the test set. The experiment shows that compared to the ChatGLM3-6B+fine-tuning method without data screening,SLIT improves the F1 score by 3. 95 percentage points,2. 01 percentage points,and 4. 62 percentage points on the Rest14,Laptop14,and robotic vacuum cleaner datasets,respectively. Compared to other baseline methods,SLIT achieves the best performance on the Rest14 dataset.

相似文献/References:

[1]陈国华 赵克 李亚涛 易帅.自然语言处理系统中的事件类名词的耦合处理[J].计算机技术与发展,2008,(06):60.
 CHEN Guo-hua,ZHAO Ke,LI Ya-tao,et al.Coupling Processing of Event Noun in NLP Systems[J].,2008,(05):60.
[2]程节华.基于FAQ的智能答疑系统中分词模块的设计[J].计算机技术与发展,2008,(07):181.
 CHENG Jie-hua.Design of Words Module in Intelligent Q/A System Based on FAQ[J].,2008,(05):181.
[3]杨欢 许威 赵克 陈余.动词属性在自然语言处理当中的研究与应用[J].计算机技术与发展,2008,(07):233.
 YANG Huan,XU Wei,ZHAO Ke,et al.Research and Application of Verb Attributes in Natural Language Processing[J].,2008,(05):233.
[4]孙超 张仰森.面向综合语言知识库的知识融合与获取研究[J].计算机技术与发展,2010,(08):25.
 SUN Chao,ZHANG Yang-sen.Research of Knowledge Integration and Obtaining Oriented Comprehensive Language Knowledge System[J].,2010,(05):25.
[5]党建 亿珍珍 赵克 殷鸿.数学领域集体词结构形式化处理研究[J].计算机技术与发展,2007,(05):121.
 DANG Jian,YI Zhen-zhen,ZHAO Ke,et al.Research of Formalization Processing for Collective Structures in Mathematics Domain[J].,2007,(05):121.
[6]江有福 郑庆华.自然语言网络答疑系统中倒排索引技术的研究[J].计算机技术与发展,2006,(02):126.
 JIANG You-fu,ZHENG Qing-hua.Research of Inverted Index in NLWAS[J].,2006,(05):126.
[7]刘亚清 张瑾 于纯妍.基于义原同现频率的汉语词义排歧系统[J].计算机技术与发展,2006,(05):184.
 LIU Ya-qing,ZHANG Jin,YU Chun-yan.A Chinese Word Sense Disambiguation System Based on Primitive CO- Occurrence Data[J].,2006,(05):184.
[8]刘政怡 李炜 吴建国.基于IMM—IME的汉字键盘输入法编程技术研究[J].计算机技术与发展,2006,(12):43.
 LIU Zheng-yi,LI Wei,WU Jian-guo.Research of Programming Technology of Chinese Input Method Based on IMM- IME[J].,2006,(05):43.
[9]赵鹏 何留进 孙凯 方薇[].基于情感计算的网络中文信息分析技术[J].计算机技术与发展,2010,(11):146.
 ZHAO Peng,HE Liu-jin,SUN Kai,et al.Analyzing Technologies of Internet Chinese Information Based on Affective Computing[J].,2010,(05):146.
[10]徐远方 李成城.基于SVM和词间特征的新词识别研究[J].计算机技术与发展,2012,(05):134.
 XU Yuan-fang,LI Cheng-cheng.Research on New Word Identification Based on SVM and Word Characteristics[J].,2012,(05):134.

更新日期/Last Update: 2025-05-10