期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
分子场快速计算及在蛋白质识别研究中的应用
1
作者 张繁 王章野 +1 位作者 吴韬 彭群生 《计算机科学与探索》 CSCD 2013年第3期227-235,共9页
蛋白质识别关键区域的研究对揭示生命现象的本质规律,提高药物设计效率,降低新药物开发的成本和周期有重大的应用价值。但由于蛋白质大分子结构的高度复杂性,一般的计算机系统难以对蛋白质识别过程中结构与功能的连续性变化实现快速动... 蛋白质识别关键区域的研究对揭示生命现象的本质规律,提高药物设计效率,降低新药物开发的成本和周期有重大的应用价值。但由于蛋白质大分子结构的高度复杂性,一般的计算机系统难以对蛋白质识别过程中结构与功能的连续性变化实现快速动态分析。设计并实现了一种基于GPU/CPU异构的集群系统,根据生物计算的特点对异构集群进行数据结构和算法设计,建立起基于GPU的Kd-tree构造和访问的高效算法,以提高系统并行计算的性能。在此基础上对蛋白质分子场的动态时变序列进行快速计算,对结果进行分类,能快速高效地确定出蛋白质的相互作用关键区域。该方法得到了相应的生化实验结果验证,为揭示蛋白质作用机制提供了一种高效直观的新方法。 展开更多
关键词 生物计算 第一性原理 并行计算 分子对接 蛋白质识别
下载PDF
一种基于多层PPI网络的关键蛋白质识别方法 被引量:1
2
作者 王希 潘理 +2 位作者 蒋军强 杨勃 李文彬 《湖南理工学院学报(自然科学版)》 CAS 2020年第1期44-50,共7页
关键蛋白质是生物体存活和繁育后代所必需的重要物质,通过蛋白质相互作用网络识别关键蛋白质是当前生物信息学研究的热点.现有方法主要通过整合蛋白质相互作用数据和基因表达水平时间序列数据来提高关键蛋白质识别率,但是这些方法通常... 关键蛋白质是生物体存活和繁育后代所必需的重要物质,通过蛋白质相互作用网络识别关键蛋白质是当前生物信息学研究的热点.现有方法主要通过整合蛋白质相互作用数据和基因表达水平时间序列数据来提高关键蛋白质识别率,但是这些方法通常基于单层网络进行中心性计算和关键蛋白质识别,没有充分挖掘基因表达水平数据的时序特性.本文提出一种基于多层网络的关键蛋白质识别方法,该方法首先构建各观测时点的活跃蛋白质相互作用子网络,并对各个网络的活跃蛋白质进行中心性计算,然后将每个蛋白质所有时点的中心性值进行加权求和,最后计算前100到600蛋白质中包含的关键蛋白质数量.实验表明,该方法比现有单层网络方法具有更高的识别率. 展开更多
关键词 蛋白质相互作用网络 多层网络 加权中心性方法 关键蛋白质识别
下载PDF
表面分子印迹聚合物纳米线用于蛋白质的特异性识别 被引量:21
3
作者 李永 杨黄浩 +1 位作者 庄峙厦 王小如 《高等学校化学学报》 SCIE EI CAS CSCD 北大核心 2005年第9期1634-1636,共3页
Molecularly imprinted polymers(MIPs) are artificial, template-made receptors with the ability to recognize and to specially bind the target molecule. The advantage of stability of the polymer, ease of the preparation ... Molecularly imprinted polymers(MIPs) are artificial, template-made receptors with the ability to recognize and to specially bind the target molecule. The advantage of stability of the polymer, ease of the preparation and low cost of these MIPs have led to their assessment as substitutes for antibodies or enzymes in chemical sensors, catalysis and separations. Although creating a MIPs against small molecules is straightforward now, imprinting of large structures, such as proteins and other biomacromolecules, is still a challenge. The major problem associated with the imprinting of such large structures lies on the restricted mobility of them within highly cross-linked polymer networks and the poor efficiency in rebinding. In this paper, we present a technique for the preparation of polymer nanowires with the protein molecule imprinted and binding sites on surface. These surface imprinting nanowires exhibit highly selective recognition for a variety of template proteins, including albumin, hemoglobin and cytochrome c. Since the protein imprinted sites are located on, or close to, the surface, these imprinted nanowires have a good site accessibility towards the target protein molecules. Furthermore, the large surface area of the nanowires results in larger protein molecules binding capacity of the imprinted nanowires compared to previously report surface imprinting MIPs. 展开更多
关键词 分子印迹聚合物 纳米线 蛋白质识别
下载PDF
可视交叉传感阵列对蛋白质及其热变性过程的快速识别 被引量:4
4
作者 霍丹群 李娟 +5 位作者 董家乐 侯长军 黄承洪 戴斌 法焕宝 张良 《高等学校化学学报》 SCIE EI CAS CSCD 北大核心 2012年第11期2422-2429,共8页
以卟啉及其衍生物和特异性染料为敏感化学元件,基于交叉响应原理构建了识别蛋白质的可视6×6阵列.该阵列以颜色差谱图显示其与蛋白质作用呈现的特异性光谱反应,采用聚类分析、主成分分析和欧氏距离对图谱进行了分析.结果表明,该阵... 以卟啉及其衍生物和特异性染料为敏感化学元件,基于交叉响应原理构建了识别蛋白质的可视6×6阵列.该阵列以颜色差谱图显示其与蛋白质作用呈现的特异性光谱反应,采用聚类分析、主成分分析和欧氏距离对图谱进行了分析.结果表明,该阵列可以鉴别模式蛋白牛血清白蛋白(BSA)、牛血红蛋白(BHb)和卵清白蛋白(Ova)及其混合物,且有望实现定量分析.此外,阵列的高敏感性使其不仅能识别天然蛋白质和不同变性程度的蛋白质,还能对其热变性过程进行可视化实时监控.该阵列产生的特殊颜色变化与蛋白质的空间构型、微环境pH值的差异及溶解度有关.因此,该方法不仅能实现对蛋白质的快速识别,为蛋白质热变性机理的研究提供新途径,而且在临床医学和食品安全等的实时快速检测方面有潜在的应用价值. 展开更多
关键词 卟啉 可视交叉传感阵列 蛋白质识别 变性蛋白
下载PDF
普施安蓝掺杂二氧化硅纳米棒的制备及其对蛋白质的识别性能
5
作者 邓启良 陈洋 +3 位作者 吴建华 李燕丽 刘春静 宋伟敬 《色谱》 CAS CSCD 北大核心 2011年第9期876-880,共5页
能够有效富集、分离蛋白质的人工合成材料在蛋白质组学研究中具有重要应用价值。本文利用氨丙基三乙氧基硅烷的氨基与普施安蓝分子中三嗪环上氯原子之间的取代反应生成普施安蓝修饰的烷氧基硅烷,在四乙氧基硅烷存在下,通过自组装溶胶-... 能够有效富集、分离蛋白质的人工合成材料在蛋白质组学研究中具有重要应用价值。本文利用氨丙基三乙氧基硅烷的氨基与普施安蓝分子中三嗪环上氯原子之间的取代反应生成普施安蓝修饰的烷氧基硅烷,在四乙氧基硅烷存在下,通过自组装溶胶-凝胶法制备了普施安蓝掺杂的二氧化硅纳米棒。扫描电镜表征显示纳米棒的长度在2~16μm之间,直径在200~500 nm之间。红外光谱、热重-差示扫描量热法表征结果表明:普施安蓝被成功掺入二氧化硅纳米棒。所制备纳米棒对牛血清白蛋白的吸附容量达到57.6 mg/g,30 min内达到饱和容量的80%。通过对不同蛋白质的吸附研究表明:其对胰蛋白酶和溶菌酶表现了较好的吸附,吸附量分别为87.5 mg/g和59.8mg/g;而其几乎不吸附牛血红蛋白和胃蛋白酶,尤其是对牛血红蛋白的吸附量只有3 mg/g。以上研究结果表明:所制备纳米棒材料不仅对蛋白质有较高的吸附容量,而且也表现出良好的选择性,该材料有望进一步应用于蛋白质组学中对相关蛋白质的富集与分离。 展开更多
关键词 普施安蓝 纳米棒 二氧化硅 蛋白质识别 蛋白质组学
下载PDF
基于CdTe量子点的三通道传感器对蛋白质的同步识别
6
作者 马琳 李龙 武国华 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2016年第S1期419-420,共2页
描述了一种利用CdTe量子点对十三种不同蛋白质进行同步识别检测的三通道传感器。实验发现,不同的蛋白质分别与CdTe量子点结合后,可以使得CdTe量子点的荧光强度和颜色发生不同程度的改变;使用线性判别分析处理(LDA)可以实现这十三种蛋白... 描述了一种利用CdTe量子点对十三种不同蛋白质进行同步识别检测的三通道传感器。实验发现,不同的蛋白质分别与CdTe量子点结合后,可以使得CdTe量子点的荧光强度和颜色发生不同程度的改变;使用线性判别分析处理(LDA)可以实现这十三种蛋白质的区分识别。同时,使用荧光显微镜进行观察,可以发现与不同的蛋白质混合后,CdTe量子点可以在玻璃基底上呈现出形态各异的微结构。根据CdTe量子点的荧光强度、颜色和在玻璃基底上的形状变化,即可实现该三通道传感器的构建。该方法简单、快速且成本低,可为多通道生化传感器提供新的思路和素材。 展开更多
关键词 CDTE量子点 多通道传感器 蛋白质识别
下载PDF
基于相关向量机的多类蛋白质折叠识别 被引量:3
7
作者 章文 刘娟 《武汉大学学报(理学版)》 CAS CSCD 北大核心 2008年第3期353-356,共4页
蛋白质折叠的识别是一种不依赖于序列相似性的蛋白质结构研究方法.本文将相关向量机应用于蛋白质折叠的识别,将两类相关向量机推广到多分类情况,对多类蛋白质折叠进行识别.与支持向量机相比较,相关向量机无需调整多余的参数,核函数不需... 蛋白质折叠的识别是一种不依赖于序列相似性的蛋白质结构研究方法.本文将相关向量机应用于蛋白质折叠的识别,将两类相关向量机推广到多分类情况,对多类蛋白质折叠进行识别.与支持向量机相比较,相关向量机无需调整多余的参数,核函数不需要满足mercer条件,实际数据集上的测试结果表明,相关向量机可以得到更加稀疏的模型,在交叉检验中获得了更高的精度,表明相关向量机是一种有效的识别蛋白质折叠的方法. 展开更多
关键词 相关向量机 蛋白质折叠识别 多分类问题 机器学习
下载PDF
基于加权网络和局部适应度的蛋白质复合物识别算法 被引量:2
8
作者 刘翠翠 孙伟 《计算机应用研究》 CSCD 北大核心 2018年第8期2308-2310,2327,共4页
通常在蛋白质网络中挖掘稠密子图或模块来识别其中的蛋白质复合物,限制了其应用范围和识别的准确性。针对该问题,提出了一种基于加权网络和局部适应度的蛋白质复合物识别算法。该算法综合稠密子图的密度指标和模块性定义了新的局部适应... 通常在蛋白质网络中挖掘稠密子图或模块来识别其中的蛋白质复合物,限制了其应用范围和识别的准确性。针对该问题,提出了一种基于加权网络和局部适应度的蛋白质复合物识别算法。该算法综合稠密子图的密度指标和模块性定义了新的局部适应度函数,并基于边聚集系数构建加权的蛋白质网络,根据权值选择边,在加权蛋白质网络中将种子边不断聚类扩展,挖掘综合适应度最大的子图,从而识别出蛋白质复合物。在多个真实蛋白质网络中的实验表明,该算法能够有效提升蛋白质复合物识别的准确性。 展开更多
关键词 加权网络 适应度 蛋白质复合物识别 模块性
下载PDF
极限学习机优化方法在蛋白质折叠类型识别中的应用
9
作者 张志锋 范乃梅 《科学技术与工程》 北大核心 2013年第11期3002-3005,3011,共5页
传统的机器学习方法在处理蛋白质折叠类型识别问题时需要花费大量的时间来调节最佳的参数。利用一种新的极限学习机(Extreme Learning Machine,ELM)分类优化方法(Extreme Learning Machine for Classification,ELMC)对蛋白质折叠进行识... 传统的机器学习方法在处理蛋白质折叠类型识别问题时需要花费大量的时间来调节最佳的参数。利用一种新的极限学习机(Extreme Learning Machine,ELM)分类优化方法(Extreme Learning Machine for Classification,ELMC)对蛋白质折叠进行识别,仅需调节很少的参数值就可达到很好的测试精度。与支持向量机(Support Vector Machine,SVM)和推荐相关向量机(Relevance Vector Machine,RVM)相比,ELMC能获得更好的泛化性能,而且在寻找最优解的训练时间比较上,ELMC比SVM平均要快35倍,比RVM要快12倍。 展开更多
关键词 蛋白质折叠识别 ELM分类优化方法 多类分类
下载PDF
基于ELMC的蛋白质折叠识别方法
10
作者 唐立力 《计算机工程与应用》 CSCD 2013年第10期114-117,共4页
传统的机器学习方法在处理蛋白质折叠类型识别问题时需要花费大量的时间来调节最佳参数,利用一种新的极限学习机(Extreme Learning Machine,ELM)分类优化方法(Extreme Learning Machine for Classification,ELMC)对蛋白质折叠进行识别,... 传统的机器学习方法在处理蛋白质折叠类型识别问题时需要花费大量的时间来调节最佳参数,利用一种新的极限学习机(Extreme Learning Machine,ELM)分类优化方法(Extreme Learning Machine for Classification,ELMC)对蛋白质折叠进行识别,仅需调节很少的参数值就可达到很好的测试精度。与支持向量机(Support Vector Machine,SVM)和推荐相关向量机(Relevance Vector Machine,RVM)相比,ELMC能获得更好的泛化性能,而且在寻找最优解的训练时间比较上,ELMC比SVM平均要快35倍,比RVM要快12倍。 展开更多
关键词 蛋白质折叠识别 ELM分类优化方法 多类分类
下载PDF
蛋白质分子印迹技术的研究进展 被引量:13
11
作者 郭天瑛 夏永清 +1 位作者 郝广杰 张邦华 《化工进展》 EI CAS CSCD 北大核心 2003年第7期713-716,共4页
综述了蛋白质分子印迹技术的研究进展 ,重点介绍了蛋白质分子印迹聚合物的制备条件、聚合方法及其识别机理 ,最后探讨了目前存在的问题及应用前景。
关键词 蛋白质 分子印迹技术 研究进展 蛋白质识别 选择性
下载PDF
一个识别蛋白质折叠模式的SVM分类器 被引量:1
12
作者 郭海娟 吕强 +3 位作者 吴宏杰 吴进珍 杨鹏 黄旭 《生物信息学》 2010年第4期287-290,共4页
蛋白质折叠模式识别是一种分析蛋白质结构的重要方法。以序列相似性较低的蛋白质为训练集,提取蛋白质序列信息频数及疏水性等信息作为折叠类型特征,从SCOP数据库中已分类蛋白质构建1 393种折叠模式的数据集,采用SVM预测蛋白质1 393种折... 蛋白质折叠模式识别是一种分析蛋白质结构的重要方法。以序列相似性较低的蛋白质为训练集,提取蛋白质序列信息频数及疏水性等信息作为折叠类型特征,从SCOP数据库中已分类蛋白质构建1 393种折叠模式的数据集,采用SVM预测蛋白质1 393种折叠模式。封闭测试准确率达99.612 2%,基于SCOP的开放测试准确率达79.632 9%。基于另一个权威测试集的开放测试折叠准确率达64.705 9%,SCOP类准确率达76.470 6%,可以有效地对蛋白质折叠模式进行预测,从而为蛋白质从头预测提供参考。 展开更多
关键词 蛋白质折叠模式识别 SVM 从头预测
下载PDF
基于最大期望算法的蛋白质交互关系识别
13
作者 蔡松成 牛耘 《计算机技术与发展》 2018年第8期48-52,共5页
针对基于远监督的方法中训练数据存在噪音的问题,采用了一种基于最大期望(EM)算法的多实例多标记的方法来进行蛋白质关系的抽取。首先通过对大规模生物医学文本的自动搜索建立目标蛋白质对的签名档,提取出签名档中的词法和语法等特征,... 针对基于远监督的方法中训练数据存在噪音的问题,采用了一种基于最大期望(EM)算法的多实例多标记的方法来进行蛋白质关系的抽取。首先通过对大规模生物医学文本的自动搜索建立目标蛋白质对的签名档,提取出签名档中的词法和语法等特征,作为蛋白质对签名档的向量空间模型(VSM);然后引入隐变量,将蛋白质对的签名档及其标签构建为多实例多标记学习模型,利用最大期望算法来迭代消除训练数据中的噪音;最后通过有监督的方法来预测未知蛋白质对的交互关系。针对蛋白质对描述中还存在的其他蛋白质名称会对交互关系的判断产生影响,改进了蛋白质对的特征表示。实验结果表明,该方法较原始的最大期望算法取得了更高且均衡的精确度和召回率。 展开更多
关键词 蛋白质交互 最大期望算法 多实例多标记 蛋白质实体识别
下载PDF
基于支持向量机的蛋白质命名实体识别的研究
14
作者 龚乐君 付亚星 +2 位作者 孙啸 谢建明 于双鑫 《计算生物学》 2011年第2期5-10,共6页
发展一种利用支持向量机识别蛋白质命名实体的方法,选择四组特征对蛋白质语料进行识别实验。实验表明,与基线系统相比,上下文特征有较小的增幅,而当前词的词性及词形的组合特征获得了最好的性能,达到78.43%的准确率。这一研究结果显示... 发展一种利用支持向量机识别蛋白质命名实体的方法,选择四组特征对蛋白质语料进行识别实验。实验表明,与基线系统相比,上下文特征有较小的增幅,而当前词的词性及词形的组合特征获得了最好的性能,达到78.43%的准确率。这一研究结果显示词性及词形特征在蛋白质实体识别中起着重要的作用。 展开更多
关键词 支持向量机 蛋白质实体识别 特征选择
下载PDF
动态-静态混合的时序蛋白质网络构建方法 被引量:3
15
作者 代启国 郭茂祖 +1 位作者 刘晓燕 王春宇 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2016年第11期41-46,共6页
目前已公开的蛋白质网络多为静态网络,不能有效描述细胞中蛋白质的动态活动特点.通过融合基因表达数据,研究人员可以构建出描述蛋白质动态性的时序蛋白质网络.现有方法假设所有蛋白质都是动态变化的,而事实上除动态蛋白质外细胞中还包... 目前已公开的蛋白质网络多为静态网络,不能有效描述细胞中蛋白质的动态活动特点.通过融合基因表达数据,研究人员可以构建出描述蛋白质动态性的时序蛋白质网络.现有方法假设所有蛋白质都是动态变化的,而事实上除动态蛋白质外细胞中还包含相对稳定的静态蛋白质.为此,提出了一种基于动态-静态蛋白质混合的时序网络构建新方法.该方法根据基因表达变化情况将蛋白质分为动态和静态两类,并在构建各时刻网络时考虑动态与静态蛋白质之间的相互作用关系.实验结果表明,利用本文方法构建的时序蛋白质网络可以提高蛋白质复合体识别的准确性,从而验证了本文方法的可行性. 展开更多
关键词 时序蛋白质网络 蛋白质相互作用 基因表达 生物网络 蛋白质复合体识别
下载PDF
一种构建动态蛋白质相互作用网络的阈值方法 被引量:3
16
作者 李彬 孙静 +3 位作者 王希 李文彬 杨勃 潘理 《湖南理工学院学报(自然科学版)》 CAS 2021年第1期40-44,共5页
蛋白质相互作用网络(PPI网络)分析有助于从系统的角度研究疾病分子机制、发现新药靶点.阈值方法是构建动态PPI网络的重要方法之一.在3Sigma阈值方法的基础上,引入参数h作为标准差指数,通过标准差系数k和指数h共同调节蛋白质基因表达活... 蛋白质相互作用网络(PPI网络)分析有助于从系统的角度研究疾病分子机制、发现新药靶点.阈值方法是构建动态PPI网络的重要方法之一.在3Sigma阈值方法的基础上,引入参数h作为标准差指数,通过标准差系数k和指数h共同调节蛋白质基因表达活性阈值.实验表明,与现有动态PPI网络相比,该阈值方法构建的动态PPI网络具有更高的关键蛋白质识别率. 展开更多
关键词 蛋白质相互作用网络 阈值方法 关键蛋白质识别
下载PDF
生物医学文献中的蛋白质关系抽取研究 被引量:6
17
作者 赵哲焕 杨志豪 +1 位作者 孙聪 林鸿飞 《中文信息学报》 CSCD 北大核心 2018年第7期82-90,共9页
蛋白质关系抽取研究对于生命科学各领域的研究具有广泛的应用价值。但是,基于机器学习的蛋白质关系抽取方法普遍停留在二元关系抽取,失去了丰富的关系类型信息,而基于规则的开放式信息抽取方法可以抽取完整的蛋白质关系("蛋白质1,... 蛋白质关系抽取研究对于生命科学各领域的研究具有广泛的应用价值。但是,基于机器学习的蛋白质关系抽取方法普遍停留在二元关系抽取,失去了丰富的关系类型信息,而基于规则的开放式信息抽取方法可以抽取完整的蛋白质关系("蛋白质1,关系词,蛋白质2"),但是召回率较低。针对以上问题,该文提出了一种混合机器学习和规则方法的蛋白质关系抽取框架。该框架先利用机器学习方法完成命名实体识别和二元关系抽取,然后利用基于句法模板和词典匹配的方法抽取表示当前两个蛋白质间关系类型的关系词。该方法在AImed语料上取得了40.18%的F值,远高于基于规则的Stanford Open IE方法。 展开更多
关键词 关系词抽取 蛋白质实体识别 蛋白质关系抽取
下载PDF
基于卷积神经网络的蛋白质折叠类型最小特征提取 被引量:1
18
作者 潘越 王骏 +2 位作者 李文飞 张建 王炜 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第5期744-753,共10页
通过蛋白质的序列、结构等信息构建完整的蛋白质宇宙是生物信息学中的重要课题,相关研究对蛋白质结构预测、蛋白质进化路径分析以及蛋白质结构设计等方面的研究都有重要的意义.从蛋白质结构的一种简化表示——蛋白质接触图出发,通过训... 通过蛋白质的序列、结构等信息构建完整的蛋白质宇宙是生物信息学中的重要课题,相关研究对蛋白质结构预测、蛋白质进化路径分析以及蛋白质结构设计等方面的研究都有重要的意义.从蛋白质结构的一种简化表示——蛋白质接触图出发,通过训练卷积神经网络进行特征提取,筛选出可识别结构域折叠类型的最小特征向量,构建蛋白质折叠类型空间,并使用谱聚类等方法对不同蛋白质折叠类型的高维分布情况进行分析.得到的最小特征向量兼顾了信息的完整性与冗余度,可以很好地表示全部七种常见蛋白质类的空间关联.该研究结果填补了之前蛋白质宇宙研究中对不常见类的空间位置和相互关系描述的空白,加深了对于蛋白质结构相似性的理解. 展开更多
关键词 蛋白质宇宙 深度学习 卷积神经网络 蛋白质折叠类型识别
下载PDF
一种新的基于多数据源的蛋白质复合物识别算法 被引量:2
19
作者 胡伟 汤希玮 《计算机与应用化学》 CAS CSCD 北大核心 2014年第4期451-456,共6页
蛋白质复合物是许多生物过程得以实现的基石。蛋白质相互作用数据中的假阳性和假阴性对各种识别蛋白质复合物的计算方法有不良影响。为了解决这一问题,1种新的蛋白质复合物识别算法(ICMDS,Identifying Complexes based on Multiple Data... 蛋白质复合物是许多生物过程得以实现的基石。蛋白质相互作用数据中的假阳性和假阴性对各种识别蛋白质复合物的计算方法有不良影响。为了解决这一问题,1种新的蛋白质复合物识别算法(ICMDS,Identifying Complexes based on Multiple Data Sources)被提出。该方法整合基因表达谱、关键蛋白质信息和蛋白质相互作用3种生物数据进行蛋白质复合物的挖掘。首先,ICMDS重新定义了2个相互作用的蛋白质之间的功能相似性(FS,Functional Similarity)。然后,ICMDS选择已知的关键蛋白质作为种子构建蛋白质复合物。为了消除冗余的复合物,ICMDS算法也设计了冗余过滤子程序。另外,ICMDS也使用非关键蛋白质作为种子并将之扩展为蛋白质复合物。实验结果表明ICMDS识别蛋白质复合物的能力明显优于其他计算方法。 展开更多
关键词 蛋白质相互作用网络 关键蛋白质 基因表达谱 蛋白质复合物识别算法
原文传递
基于TIGA_S4VM改进算法的蛋白质序列识别方法 被引量:2
20
作者 王晓峰 随婷婷 《山东大学学报(工学版)》 CAS 北大核心 2014年第1期1-6,共6页
针对安全的半监督支持向量机(safe semi-supervised support vector machine,S4VM)存在参数选择盲目性、正负样本比例不平衡等问题,建立了基于改进的TF-IDF(term frequency-inverse document frequency,TF-IDF)、遗传算法(genetic algor... 针对安全的半监督支持向量机(safe semi-supervised support vector machine,S4VM)存在参数选择盲目性、正负样本比例不平衡等问题,建立了基于改进的TF-IDF(term frequency-inverse document frequency,TF-IDF)、遗传算法(genetic algorithm,GA)和S4VM的蛋白质序列识别方法 TIGA-S4VM。利用改进的TF-IDF算法提取出蛋白质序列中的特征项,将各个特征项在蛋白质序列中出现的频率归一化后作为识别模型的特征值,并结合GA以及S4VM对蛋白质序列进行识别。实验结果表明,TIGA-S4VM优于其它5个识别方法,即使在训练样本率较低时,也能有效地识别蛋白质序列。 展开更多
关键词 支持向量机 安全的半监督支持向量机 蛋白质序列识别 遗传算法 半监督算法
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部