[1]熊可欣,李 涛*,余 琴,等.PDGcross:基于跨文件图表征的源代码漏洞检测[J].计算机技术与发展,2023,33(08):102-107.[doi:10. 3969 / j. issn. 1673-629X. 2023. 08. 015]
 XIONG Ke-xin,LI Tao*,YU Qin,et al.PDGcross:Source Code Vulnerability Detection Based on Cross-file Graph Representation[J].,2023,33(08):102-107.[doi:10. 3969 / j. issn. 1673-629X. 2023. 08. 015]
点击复制

PDGcross:基于跨文件图表征的源代码漏洞检测()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
33
期数:
2023年08期
页码:
102-107
栏目:
网络空间安全
出版日期:
2023-08-10

文章信息/Info

Title:
PDGcross:Source Code Vulnerability Detection Based on Cross-file Graph Representation
文章编号:
1673-629X(2023)08-0102-06
作者:
熊可欣1 李 涛2* 余 琴1 乔梦晴1
1. 武汉科技大学 计算机科学与技术学院,湖北 武汉 430065;
2. 智能信息处理与实时工业系统湖北省重点实验室,湖北 武汉 430065
Author(s):
XIONG Ke-xin1 LI Tao2* YU Qin1 QIAO Meng-qing1
1. School of Computer Science and Technology,Wuhan University of Science and Technology,Wuhan 430065,China;
2. Hubei Province Key Laboratory of Intelligent Information Processing and Real-time Industrial System,Wuhan 430065,China
关键词:
函数调用程序依赖图漏洞检测源代码深度学习
Keywords:
function callingprogram dependence graphvulnerability detectionsource codedeep learning
分类号:
TP309
DOI:
10. 3969 / j. issn. 1673-629X. 2023. 08. 015
摘要:
随着软件安全性需求不断增长,大量的研究工作将深度学习应用于漏洞检测领域,目前存在多种源代码漏洞检测方法。 现阶段在检测单个文件中由于函数调用
导致的漏洞方面有较好的效果,但由于复杂函数调用关系可能涉及到多个文件,针对多文件的漏洞检测是当前的检测难点之一。 因此,该文在源代码程序依赖图
的基础上提出了一个新的图表征PDGcross,从一个文件入口合并其他被调 用 的 文 件, 生 成 一 个 图 表 征 即 PDGcross。 再 运 用 Node2Vec 图 嵌 入 算 法 将PDGcross 进一步处理为特征矩阵,利用长短时记忆神经网络训练出漏洞分类模型,实现了一种基于跨文件程序依赖图表征和深度学习的源代码检测方法。 在实验中,针对跨文件间的函数调用产生的漏洞,Fortify 和 PDG 表征的检测效率很低,而提出的基于 PDGcross 表征的检测方法则明显优于该两类方法。
Abstract:
With the increasing demand for software security,a large number of research works have applied deep learning to the field ofvulnerability detection.
?At this stage,it has a good effect in detecting vulnerabilities caused by function calls in a single file,however,thecomplex function call relationships may?
involve multiple files,the vulnerability detection for multiple files is one of the current detectiondifficulties. Therefore,we propose a new graph represent-
ation PDGcross based on the dependency graph of the source code program,which is generated by merging other called files from one file entry. Node-
2Vec graph embedding algorithm is used to further processPDGcross into feature matrix. Long Short Term Memory Network is used to train the vulnera-
bility classification model,and a method ofsource code detection based on cross-file program dependence graph representation and deep learning is implemented. In the experiment,Fortify and PDG representation have low detection efficiency for vulnerabilities generated by cross-file function calls,while the detectionmethod based on PDGcross representation proposed is significantly better than these two methods.

相似文献/References:

[1]周婕 慕晓冬 王杰.一种C++程序切片系统的设计与实现[J].计算机技术与发展,2006,(07):20.
 ZHOU Jie,MU Xiao-dong,WANG Jie.Design and Implementation of a Kind of C + + Program Slicing[J].,2006,(08):20.
[2]秦军,张海鹏,苏志和,等.一种基于二维行为特征的恶意代码识别方法[J].计算机技术与发展,2013,(06):143.
 QIN Jun[],ZHANG Hai-peng[],SU Zhi-he[],et al.A Malicious Code Detection Method Based on Two-dimensional Behavior Characterization[J].,2013,(08):143.

更新日期/Last Update: 2023-08-10