[1]南雨宏 陈绮.基于散列辞典的蛋白质二级结构预测方法[J].计算机技术与发展,2011,(10):168-170.
 NAN Yu-hong,CHEN Qi.A Protein Secondary Structure Prediction Method Based on Hash-Dictionary[J].,2011,(10):168-170.
点击复制

基于散列辞典的蛋白质二级结构预测方法()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2011年10期
页码:
168-170
栏目:
应用开发研究
出版日期:
1900-01-01

文章信息/Info

Title:
A Protein Secondary Structure Prediction Method Based on Hash-Dictionary
文章编号:
1673-629X(2011)10-0168-03
作者:
南雨宏 陈绮
海南大学信息科学技术学院
Author(s):
NAN Yu-hong CHEN Qi
College of Information Science and technology, Hainan University
关键词:
蛋白质二级结构序列片段散列辞典α-螺旋β-折叠
Keywords:
protein secondary structure sequence fragments hash dictionaries α-helixβ-sheet
分类号:
TP311
文献标志码:
A
摘要:
提出一种易于修改的蛋白质二级结构预测算法。以蛋白质数据银行中PDB文本数据作为数据源,提取所有蛋白质氨基酸序列并以此建立样本数据库,然后针对α-螺旋、β-折叠分别利用基于散列辞典的不同改进方法编程实现蛋白质二级结构序列片段预测,在预测过程中,随机抽取68421个蛋白质中部分样本作为测试集,对未知序列根据建立的散列辞典中的片段使用正向最大匹配分词法进行切分对比。从实验结果来看,对未知序列片段预测的准确度达到了83.9%,而且能够较好地体现片段之间的连接顺序
Abstract:
This paper proposes a kind of easy to modify protein secondary structure prediction algorithm. Using PDB files from Protein Data Bank as a data source, extract all the protein amino acid sequences and build up a database, then for α-helix, β-sheet, use different improved methods based on hash dictionary to implements the fragments prediction of protein' s secondary structure. During the forecasting process, taking 68 421 samples as part of the protein in the test set. For unknown sequence according to the established the fragments of hash dictionary use positive maximal matching points for segmentation lexical contrast. The results shows the prediction of segment reached 83.9% accuracy ,but also to better reflect the sequence of amino acids connection

相似文献/References:

[1]王菲露 宋杰 宋杨.BP神经网络在蛋白质二级结构预测中的应用[J].计算机技术与发展,2009,(05):217.
 WANG Fei-lu,SONG Jie,SONG Yang.Application of BP Neural Network in Protein Secondary Structure Prediction[J].,2009,(10):217.
[2]郑婷婷 毛军军 吴涛 程家兴.Profile覆盖算法在蛋白质二级结构预测中的应用[J].计算机技术与发展,2007,(09):171.
 ZHENG Ting-ting,MAO Jun-jun,WU Tao,et al.Application of Profile Covering Method in Protein Secondary Structure Prediction[J].,2007,(10):171.
[3]高冶,陈绮.基于蚁群聚类的蛋白质二级结构特征研究[J].计算机技术与发展,2013,(06):191.
 GAO Ye,CHEN Qi.Research on Features of Protein Secondary Structure Based on Ant Colony Clustering[J].,2013,(10):191.

备注/Memo

备注/Memo:
海南省自然科学基金资助项目(609003)南雨宏(1990-),男,研究方向为数据挖掘;陈绮,教授,博士,硕士生导师,研究方向为数据挖掘
更新日期/Last Update: 1900-01-01