«上一篇/Previous Article|本期目录/Table of Contents|下一篇/Next Article»

j. issn. 1673-629X. 2021. 05. 035]
点击复制

基于ＣＮＮ的程序编译错误信息特征提取()

分享到：

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:: 31
期数:: 2021年05期

页码:: 204-208

栏目:: 应用前沿与综合

出版日期:: 2021-05-10

文章信息/Info

Title:: ＣＮＮ－ｂａｓｅｄＰｒｏｇｒａｍＣｏｍｐｉｌａｔｉｏｎＥｒｒｏｒＭｅｓｓａｇｅＦｅａｔｕｒｅＥｘｔｒａｃｔｉｏ

文章编号:: 1673-629X(2021)05-0204-05

作者:: 何烨辛¹; 谷　林¹; 孙　晨²; １．西安工程大学计算机科学学院，陕西西安７１００４８；
２．西安科技大学管理学院，陕西西安７１００５４

Author(s):: ＨＥＹｅ－ｘｉｎ１; ＧＵＬｉｎ１; ＳＵＮＣｈｅｎ２; １．ＳｃｈｏｏｌｏｆＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅ，Ｘｉ’ａｎＰｏｌｙｔｅｃｈｎｉｃＵｎｉｖｅｒｓｉｔｙ，Ｘｉ’ａｎ７１００４８，Ｃｈｉｎａ；
２．ＳｃｈｏｏｌｏｆＭａｎａｇｅｍｅｎｔ，Ｘｉ’ａｎＵｎｉｖｅｒｓｉｔｙｏｆＳｃｉｅｎｃｅａｎｄＴｅｃｈｎｏｌｏｇｙ，Ｘｉ’ａｎ７１００５４，Ｃｈｉｎａ

关键词:: ｗｏｒｄ２ｖｅｃ; 编译错误信息; ｓｋｉｐ－ｇｒａｍ模型; ＣＮＮ; 支持向量机

Keywords:: ｗｏｒｄ２ｖｅｃ; ｃｏｍｐｉｌｅｅｒｒｏｒｍｅｓｓａｇｅ; ｓｋｉｐ－ｇｒａｍｍｏｄｅｌ; ＣＮＮ; ＳＶＭ

分类号:: ＴＰ３９１.１；ＴＰ１８

DOI:: 10. 3969 / j. issn. 1673-629X. 2021. 05. 035

摘要:: 伴随着互联网行业的迅速发展，在自然语言处理领域中，有效地将输入表示为固定长度的特征向量是机器学习算法中的一个重要研究方向。海量的编译错误信息不仅可以用于程序错误相似度的研究，也可将编译错误信息进行聚类、分类之后给教师在计算机编程类课程的教育教学中给予针对性的指导。这些应用的根本在于高效地提取编译错误信息特征。该文提出了一种基于ｗｏｒｄ２ｖｅｃ模型结合卷积神经网络（ｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｕｒａｌｎｅｔｗｏｒｋｓ，ＣＮＮ）对编译错误信息进行特征提取的方法，首先利用ｗｏｒｄ２ｖｅｃ工具中的ｓｋｉｐ－ｇｒａｍ模型以词向量的形式表示编译错误信息，然后利用ＣＮＮ神经网络完整地表征编译错误信息特征向量。有效地从可变长度的编译错误信息中学习固定长度的特征表示。最后使用支持向量机（ＳＶＭ）分类算法进行实验结果的验证。结果表明，该特征提取方法在编译错误信息中有显著的效果。

Abstract:: ＷｉｔｈｔｈｅｒａｐｉｄｄｅｖｅｌｏｐｍｅｎｔｏｆｔｈｅＩｎｔｅｒｎｅｔｉｎｄｕｓｔｒｙ，ｉｎｔｈｅｆｉｅｌｄｏｆｎａｔｕｒａｌｌａｎｇｕａｇｅｐｒｏｃｅｓｓｉｎｇ，ｔｈｅｅｆｆｅｃｔｉｖｅｒｅｐｒｅｓｅｎｔａｔｉｏｎｏｆｉｎｐｕｔａｓｆｉｘｅｄｌｅｎｇｔｈｆｅａｔｕｒｅｖｅｃｔｏｒｓｉｓａｎｉｍｐｏｒｔａｎｔｒｅｓｅａｒｃｈｄｉｒｅｃｔｉｏｎｉｎｍａｃｈｉｎｅｌｅａｒｎｉｎｇａｌｇｏｒｉｔｈｍｓ．Ｍａｓｓｉｖｅｃｏｍｐｉｌａｔｉｏｎｅｒｒｏｒｍｅｓｓａｇｅｃａｎｎｏｔｏｎｌｙｂｅｕｓｅｄｔｏｓｔｕｄｙｔｈｅｓｉｍｉｌａｒｉｔｙｏｆｐｒｏｇｒａｍｅｒｒｏｒ，ｂｕｔａｌｓｏｔｏｃｌｕｓｔｅｒａｎｄｃｌａｓｓｉｆｙｔｈｅｃｏｍｐｉｌａｔｉｏｎｅｒｒｏｒｍｅｓｓａｇｅｔｏｇｉｖｅｔｅａｃｈｅｒｓｓｐｅｃｉｆｉｃｇｕｉｄａｎｃｅｉｎｔｈｅｅｄｕｃａｔｉｏｎａｎｄｔｅａｃｈｉｎｇｏｆｃｏｍｐｕｔｅｒｐｒｏｇｒａｍｍｉｎｇｃｏｕｒｓｅｓ．Ｔｈｅｅｓｓｅｎｃｅｏｆｔｈｅｓｅａｐｐｌｉｃａｔｉｏｎｓｌｉｅｓｉｎｔｈｅｅｆｆｉｃｉｅｎｔｅｘｔｒａｃｔｉｏｎｏｆｃｏｍｐｉｌｅｒｅｒｒｏｒｍｅｓｓａｇｅｃｈａｒａｃｔｅｒｉｓｔｉｃｓ．Ｗｅｐｒｏｐｏｓｅａｍｅｔｈｏｄｏｆｆｅａｔｕｒｅｅｘｔｒａｃｔｉｏｎｏｆｔｈｅｃｏｍｐｉｌｅｄｅｒｒｏｒｍｅｓｓａｇｅｂａｓｅｄｏｎｗｏｒｄ２ｖｅｃｍｏｄｅｌａｎｄｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｕｒａｌｎｅｔｗｏｒｋｓ（ＣＮＮ）．Ａｔｆｉｒｓｔ，ｔｈｅｃｏｍｐｉｌｅｄｅｒｒｏｒｍｅｓｓａｇｅｉｓｒｅｐｒｅｓｅｎｔｅｄｂｙｔｈｅｓｋｉｐ－ｇｒａｍｍｏｄｅｌｉｎｔｈｅｗｏｒｄ２ｖｅｃｔｏｏｌｉｎｔｈｅｆｏｒｍｏｆｗｏｒｄｖｅｃｔｏｒ，ａｎｄｔｈｅｎｔｈｅｃｏｍｐｌｅｔｅｃｈａｒａｃｔｅｒｉｓｔｉｃｖｅｃｔｏｒｏｆｔｈｅｃｏｍｐｉｌｅｄｅｒｒｏｒｍｅｓｓａｇｅｉｓｒｅｐｒｅｓｅｎｔｅｄｂｙｔｈｅＣＮＮ．Ｅｆｆｅｃｔｉｖｅｌｙｌｅａｒｎｆｉｘｅｄ－ｌｅｎｇｔｈｆｅａｔｕｒｅｒｅｐｒｅｓｅｎｔａｔｉｏｎｓｆｒｏｍｖａｒｉａｂｌｅ－ｌｅｎｇｔｈｃｏｍｐｉｌｅｅｒｒｏｒｍｅｓｓａｇｅ．Ｆｉｎａｌｌｙ，ＳＶＭｃｌａｓｓｉｆｉｃａｔｉｏｎａｌｇｏｒｉｔｈｍｉｓｕｓｅｄｔｏｖｅｒｉｆｙｔｈｅｅｘｐｅｒｉｍｅｎｔａｌｒｅｓｕｌｔｓ．Ｉｔｉｓｓｈｏｗｅｄｔｈａｔｔｈｅｆｅａｔｕｒｅｅｘｔｒａｃｔｉｏｎｍｅｔｈｏｄｉｓｅｆｆｅｃｔｉｖｅｉｎｃｏｍｐｉｌｉｎｇｅｒｒｏｒｍｅｓｓａｇｅ．

相似文献/References:

[1]卫华,韩立新,夏建华. 基于Word2 fea模型的文本建模方法[J].计算机技术与发展,2016,26(02):165.
　WEI Hua,HAN Li-xin,XIA Jian-hua. Text Modeling Method Based on Word2 fea Model[J].,2016,26(05):165.
[2]张兴兰,刘炀. 基于复杂网络及神经网络挖掘用户兴趣的方法[J].计算机技术与发展,2016,26(12):22.
　ZHANG Xing-lan,LIU Yang. Method of Mining User Interest Based on Complex Network and Neural Network[J].,2016,26(05):22.
[3]倪高伟,李涛,刘峥.结合语义和结构的短文本相似度计算[J].计算机技术与发展,2018,28(08):104.[doi:10.3969/ j. issn.1673-629X.2018.08.022]
　NI Gao-wei,LI Tao,LIU Zheng.Similarity Calculation of Short Text Combined with Semantic and Structure[J].,2018,28(05):104.[doi:10.3969/ j. issn.1673-629X.2018.08.022]
[4]贾清,杨抒.基于 Word2vec 的克隆代码检测方法研究[J].计算机技术与发展,2020,30(08):124.[doi:10. 3969 / j. issn. 1673-629X. 2020. 08. 021]
　JIA Qing,YANG Shu.Research on Clone Code Detection Method Based on Word2vec[J].,2020,30(05):124.[doi:10. 3969 / j. issn. 1673-629X. 2020. 08. 021]
[5]李鑫.一种面向 Mashup 应用的 API 推荐方法[J].计算机技术与发展,2021,31(02):38.[doi:10. 3969 / j. issn. 1673-629X. 2021. 02. 007]
　LI Xin.An API Recommendation Method for Mashup Application[J].,2021,31(05):38.[doi:10. 3969 / j. issn. 1673-629X. 2021. 02. 007]
[6]冼广铭,王鲁栋,曾碧卿,等.基于 LDA 和 BiGRU 的文本分类[J].计算机技术与发展,2022,32(04):15.[doi:10. 3969 / j. issn. 1673-629X. 2022. 04. 003]
　XIAN Guang-ming,WANG Lu-dong,ZENG Bi-qing,et al.Text Classification Based on LDA and BiGRU[J].,2022,32(05):15.[doi:10. 3969 / j. issn. 1673-629X. 2022. 04. 003]
[7]王小楠,黄卫东.基于类别主题词集的加权相似度短文本分类[J].计算机技术与发展,2022,32(09):95.[doi:10. 3969 / j. issn. 1673-629X. 2022. 09. 015]
　WANG Xiao-nan,HUANG Wei-dong.Short Text Classification with Weighted Similarity Based on Category Topic Word Set[J].,2022,32(05):95.[doi:10. 3969 / j. issn. 1673-629X. 2022. 09. 015]
[8]关慧,曹同洲.基于 CNN 和多注意力机制的 XSS 检测模型[J].计算机技术与发展,2023,33(04):175.[doi:10. 3969 / j. issn. 1673-629X. 2023. 04. 026]
　GUAN Hui,CAO Tong-zhou.XSS Detection Model Based on CNN and Multi-attention Mechanism[J].,2023,33(05):175.[doi:10. 3969 / j. issn. 1673-629X. 2023. 04. 026]

常用功能

工具/Tools

统计/Statistics

摘要浏览/Viewed1162
全文下载/Downloads744
评论/Comments