[1]何烨辛,谷 林,孙 晨.基于CNN的程序编译错误信息特征提取[J].计算机技术与发展,2021,31(05):204-208.[doi:10. 3969 / j. issn. 1673-629X. 2021. 05. 035]
 ,CNN-basedProgram CompilationErrorMessageFeatureExtractio[J].,2021,31(05):204-208.[doi:10. 3969 / j. issn. 1673-629X. 2021. 05. 035]
点击复制

基于CNN的程序编译错误信息特征提取()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
31
期数:
2021年05期
页码:
204-208
栏目:
应用前沿与综合
出版日期:
2021-05-10

文章信息/Info

Title:
CNN-basedProgram CompilationErrorMessageFeatureExtractio
文章编号:
1673-629X(2021)05-0204-05
作者:
何烨辛1谷 林1孙 晨2
1.西安工程大学计算机科学学院,陕西 西安710048;
2.西安科技大学管理学院,陕西 西安710054
Author(s):
HEYe-xin1GULin1SUNChen2
1.SchoolofComputerScience,Xi’anPolytechnicUniversity,Xi’an710048,China;
2.SchoolofManagement,Xi’anUniversityofScienceandTechnology,Xi’an710054,China
关键词:
word2vec编译错误信息skip-gram模型CNN支持向量机
Keywords:
word2veccompileerrormessageskip-grammodelCNNSVM
分类号:
TP391.1;TP18
DOI:
10. 3969 / j. issn. 1673-629X. 2021. 05. 035
摘要:
伴随着互联网行业的迅速发展,在自然语言处理领域中,有效地将输入表示为固定长度的特征向量是机器学习算法中的一个重要研究方向。海量的编译错误信息不仅可以用于程序错误相似度的研究,也可将编译错误信息进行聚类、分类之后给教师在计算机编程类课程的教育教学中给予针对性的指导。这些应用的根本在于高效地提取编译错误信息特征。该文提出了一种基于word2vec模型结合卷积神经网络(convolutionalneuralnetworks,CNN)对编译错误信息进行特征提取的方法,首先利用word2vec工具中的skip-gram模型以词向量的形式表示编译错误信息,然后利用CNN神经网络完整地表征编译错误信息特征向量。有效地从可变长度的编译错误信息中学习固定长度的特征表示。最后使用支持向量机(SVM)分类算法进行实验结果的验证。结果表明,该特征提取方法在编译错误信息中有显著的效果。
Abstract:
WiththerapiddevelopmentoftheInternetindustry,inthefieldofnaturallanguageprocessing,theeffectiverepresentationofinputasfixedlengthfeaturevectorsisanimportantresearchdirectioninmachinelearningalgorithms.Massivecompilationerrormessagecannotonlybeusedtostudythesimilarityofprogramerror,butalsotoclusterandclassifythecompilationerrormessagetogiveteachersspecificguidanceintheeducationandteachingofcomputerprogrammingcourses.Theessenceoftheseapplicationsliesintheefficientextractionofcompilererrormessagecharacteristics.Weproposeamethodoffeatureextractionofthecompilederrormessagebasedonword2vecmodelandconvolutionalneuralnetworks(CNN).Atfirst,thecompilederrormessageisrepresentedbytheskip-grammodelintheword2vectoolintheformofwordvector,andthenthecompletecharacteristicvectorofthecompilederrormessageisrepresentedbytheCNN.Effectivelylearnfixed-lengthfeaturerepresentationsfrom variable-lengthcompileerrormessage.Finally,SVMclassificationalgorithmisusedtoverifytheexperimentalresults.Itisshowedthatthefeatureextractionmethodiseffectiveincompilingerrormessage.

相似文献/References:

[1]卫华,韩立新,夏建华. 基于Word2 fea模型的文本建模方法[J].计算机技术与发展,2016,26(02):165.
 WEI Hua,HAN Li-xin,XIA Jian-hua. Text Modeling Method Based on Word2 fea Model[J].,2016,26(05):165.
[2]张兴兰,刘炀. 基于复杂网络及神经网络挖掘用户兴趣的方法[J].计算机技术与发展,2016,26(12):22.
 ZHANG Xing-lan,LIU Yang. Method of Mining User Interest Based on Complex Network and Neural Network[J].,2016,26(05):22.
[3]倪高伟,李 涛,刘 峥.结合语义和结构的短文本相似度计算[J].计算机技术与发展,2018,28(08):104.[doi:10.3969/ j. issn.1673-629X.2018.08.022]
 NI Gao-wei,LI Tao,LIU Zheng.Similarity Calculation of Short Text Combined with Semantic and Structure[J].,2018,28(05):104.[doi:10.3969/ j. issn.1673-629X.2018.08.022]
[4]贾 清,杨 抒.基于 Word2vec 的克隆代码检测方法研究[J].计算机技术与发展,2020,30(08):124.[doi:10. 3969 / j. issn. 1673-629X. 2020. 08. 021]
 JIA Qing,YANG Shu.Research on Clone Code Detection Method Based on Word2vec[J].,2020,30(05):124.[doi:10. 3969 / j. issn. 1673-629X. 2020. 08. 021]
[5]李 鑫.一种面向 Mashup 应用的 API 推荐方法[J].计算机技术与发展,2021,31(02):38.[doi:10. 3969 / j. issn. 1673-629X. 2021. 02. 007]
 LI Xin.An API Recommendation Method for Mashup Application[J].,2021,31(05):38.[doi:10. 3969 / j. issn. 1673-629X. 2021. 02. 007]
[6]冼广铭,王鲁栋,曾碧卿,等.基于 LDA 和 BiGRU 的文本分类[J].计算机技术与发展,2022,32(04):15.[doi:10. 3969 / j. issn. 1673-629X. 2022. 04. 003]
 XIAN Guang-ming,WANG Lu-dong,ZENG Bi-qing,et al.Text Classification Based on LDA and BiGRU[J].,2022,32(05):15.[doi:10. 3969 / j. issn. 1673-629X. 2022. 04. 003]
[7]王小楠,黄卫东.基于类别主题词集的加权相似度短文本分类[J].计算机技术与发展,2022,32(09):95.[doi:10. 3969 / j. issn. 1673-629X. 2022. 09. 015]
 WANG Xiao-nan,HUANG Wei-dong.Short Text Classification with Weighted Similarity Based on Category Topic Word Set[J].,2022,32(05):95.[doi:10. 3969 / j. issn. 1673-629X. 2022. 09. 015]
[8]关 慧,曹同洲.基于 CNN 和多注意力机制的 XSS 检测模型[J].计算机技术与发展,2023,33(04):175.[doi:10. 3969 / j. issn. 1673-629X. 2023. 04. 026]
 GUAN Hui,CAO Tong-zhou.XSS Detection Model Based on CNN and Multi-attention Mechanism[J].,2023,33(05):175.[doi:10. 3969 / j. issn. 1673-629X. 2023. 04. 026]

更新日期/Last Update: 2020-05-10