[1]刘昌澍,李 响,詹瑾瑜,等.基于TextCNN和LightGBM 的导游违规行为检测[J].计算机技术与发展,2021,31(05):143-149.[doi:10. 3969 / j. issn. 1673-629X. 2021. 05. 025]
 ,,et al.IllegalTourGuideBehaviorDetectionBasedonTextCNNandLightGBM[J].,2021,31(05):143-149.[doi:10. 3969 / j. issn. 1673-629X. 2021. 05. 025]
点击复制

基于TextCNN和LightGBM 的导游违规行为检测()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
31
期数:
2021年05期
页码:
143-149
栏目:
应用前沿与综合
出版日期:
2021-05-10

文章信息/Info

Title:
IllegalTourGuideBehaviorDetectionBasedonTextCNNandLightGBM
文章编号:
1673-629X(2021)05-0143-07
作者:
刘昌澍12李 响23詹瑾瑜12江 维1李博智1曹 扬23杨 瑞23
1.电子科技大学信息与软件工程学院,四川成都610054
2.中电科大数据研究院有限公司,贵州贵阳550022
3.提升政府治理能力大数据应用技术国家工程实验室,贵州贵阳550022
Author(s):
LIUChang-shu1LIXiang2ZHANJin-yu1JIANGWei1LIBo-zhi1CAOYang2YANGRui2
1.SchoolofInformationandSoftwareEngineering,UniversityofElectronicScienceandTechnologyofChina,Chengdu610054,China
2.CETCBigDataResearchInstituteCo.,Ltd.,Guiyang550022,China
3.BigDataApplicationonImprovingGovernmentGovernanceCapabilitiesNationalEnginee
关键词:
自然语言处理情感分析导游违规行为文本卷积神经网络梯度提升决策树
Keywords:
naturallanguageprocessingemotionanalysisillegaltourguidebehaviorsTextCNNLightGBM
分类号:
TP391
DOI:
10. 3969 / j. issn. 1673-629X. 2021. 05. 025
摘要:
人工处理旅游评论需要耗费大量人力,如何自动分析旅游评论检测出导游违规行为,为旅游监管提供依据,成为一个迫切需要解决的热点问题。该文提出了一种基于TextCNN和LightGBM的导游违规行为检测方法,首先构建旅游评论的文本卷积神经网络(TextCNN)从海量旅游评论信息中筛选出负面评论;再将这些负面评论送入基于梯度提升决策树(LightGBM)的导游违规行为分类模型,分析得到导游违规行为的具体类型分类及分类概率。使用准确率、召回率、F1值等多个性能指标对提出的模型进行测试与分析,实验数据表明,基于TextCNN和LightGBM的导游违规行为检测方法比一些其他主流方法和模型(SVM、LSTM、XGBoost等)具有更好的准确性和合理性。同时,该方法应用在实际旅游大数据系统中可以得到91.57%的准确率。
Abstract:
Ittakesalotofmanpowertoprocesstouristcommentsmanually.Howtoprocesstouristcommentsautomaticallyandprovidetheevidencefortourismregulationhasbecomeanissuethatneedstobeaddressedurgently.WeproposeanillegaltourguidebehaviordetectionmethodbasedonTextCNNandLightGBM.Firstly,thetourguidenegativecommentidentificationmodelbasedontextconvolutionalneuralnetworks(TextCNN)ispresentedtofilterthetouristcommentsbyemotionanalysis.Thenthefilterednegativetouristcommentsaresentintotheillegaltourguidebehaviordetectionmodelbasedonlightgradientboostingmachine(LightGBM)toobtainthecorrespondingclassification.Weuseprecision,recall,F1-scoretoevaluatetheperformanceoftheproposedmodels.TheexperimentshowsthattheproposedillegaltourguidebehaviordetectionmethodhasbetteraccuracyandrationalitycomparedwithothermodelsincludingSVM,LSTM,XGBoost,etc.Andtheproposedmethodcanachieve91.57% precisioninthepracticaltourismbigdatasystem.

相似文献/References:

[1]陈国华 赵克 李亚涛 易帅.自然语言处理系统中的事件类名词的耦合处理[J].计算机技术与发展,2008,(06):60.
 CHEN Guo-hua,ZHAO Ke,LI Ya-tao,et al.Coupling Processing of Event Noun in NLP Systems[J].,2008,(05):60.
[2]程节华.基于FAQ的智能答疑系统中分词模块的设计[J].计算机技术与发展,2008,(07):181.
 CHENG Jie-hua.Design of Words Module in Intelligent Q/A System Based on FAQ[J].,2008,(05):181.
[3]杨欢 许威 赵克 陈余.动词属性在自然语言处理当中的研究与应用[J].计算机技术与发展,2008,(07):233.
 YANG Huan,XU Wei,ZHAO Ke,et al.Research and Application of Verb Attributes in Natural Language Processing[J].,2008,(05):233.
[4]孙超 张仰森.面向综合语言知识库的知识融合与获取研究[J].计算机技术与发展,2010,(08):25.
 SUN Chao,ZHANG Yang-sen.Research of Knowledge Integration and Obtaining Oriented Comprehensive Language Knowledge System[J].,2010,(05):25.
[5]党建 亿珍珍 赵克 殷鸿.数学领域集体词结构形式化处理研究[J].计算机技术与发展,2007,(05):121.
 DANG Jian,YI Zhen-zhen,ZHAO Ke,et al.Research of Formalization Processing for Collective Structures in Mathematics Domain[J].,2007,(05):121.
[6]江有福 郑庆华.自然语言网络答疑系统中倒排索引技术的研究[J].计算机技术与发展,2006,(02):126.
 JIANG You-fu,ZHENG Qing-hua.Research of Inverted Index in NLWAS[J].,2006,(05):126.
[7]刘亚清 张瑾 于纯妍.基于义原同现频率的汉语词义排歧系统[J].计算机技术与发展,2006,(05):184.
 LIU Ya-qing,ZHANG Jin,YU Chun-yan.A Chinese Word Sense Disambiguation System Based on Primitive CO- Occurrence Data[J].,2006,(05):184.
[8]刘政怡 李炜 吴建国.基于IMM—IME的汉字键盘输入法编程技术研究[J].计算机技术与发展,2006,(12):43.
 LIU Zheng-yi,LI Wei,WU Jian-guo.Research of Programming Technology of Chinese Input Method Based on IMM- IME[J].,2006,(05):43.
[9]赵鹏 何留进 孙凯 方薇[].基于情感计算的网络中文信息分析技术[J].计算机技术与发展,2010,(11):146.
 ZHAO Peng,HE Liu-jin,SUN Kai,et al.Analyzing Technologies of Internet Chinese Information Based on Affective Computing[J].,2010,(05):146.
[10]徐远方 李成城.基于SVM和词间特征的新词识别研究[J].计算机技术与发展,2012,(05):134.
 XU Yuan-fang,LI Cheng-cheng.Research on New Word Identification Based on SVM and Word Characteristics[J].,2012,(05):134.

更新日期/Last Update: 2020-05-10