摘要
本文从s wiss-prot中选取经过试验验证的水稻蛋白质磷酸化位点数据作为训练集合,应用蛋白质序列的氨基酸频率计算方法来进行特征提取,再利用SVM算法构建专门针对水稻蛋白质磷酸化位点的预测新工具.氨基酸频率算法指的是计算出相应待预测磷酸化位点附近氨基酸的出现频率,进一步反映了残基之间的相关性.本文利用LibSVM软件包对已通过氨基酸频率算法特征提取出来的数值特征对磷酸化位点进行预测,从而为之后构建水稻蛋白质磷酸化位点的预测工具做准备.结果表明,本文基于SVM和氨基酸频率方法的水稻蛋白质磷酸化位点预测在丝氨酸,苏氨酸和酪氨酸的平均预测准确性为77.665%,马修斯系数为0.571.与PlantPhos和Musite的预测性能的对比结果显示,在磷酸化苏氨酸位点的预测性能显著高于PlantPhos及Musite.
出处
《赤峰学院学报(自然科学版)》
2014年第5期11-13,共3页
Journal of Chifeng University(Natural Science Edition)