期刊文献+
共找到95篇文章
< 1 2 5 >
每页显示 20 50 100
基于BERT和CNN的基因剪接位点识别
1
作者 左敏 王虹 +1 位作者 颜文婧 张青川 《计算机应用》 CSCD 北大核心 2023年第10期3309-3314,共6页
随着高通量测序技术的发展,海量的基因组序列数据为了解基因组的结构提供了数据基础。剪接位点识别是基因组学研究的重要环节,在基因发现和确定基因结构方面发挥着重要作用,且有利于理解基因性状的表达。针对现有模型对脱氧核糖核酸(DNA... 随着高通量测序技术的发展,海量的基因组序列数据为了解基因组的结构提供了数据基础。剪接位点识别是基因组学研究的重要环节,在基因发现和确定基因结构方面发挥着重要作用,且有利于理解基因性状的表达。针对现有模型对脱氧核糖核酸(DNA)序列高维特征提取能力不足的问题,构建了由BERT(Bidirectional Encoder Representations from Transformer)和平行的卷积神经网络(CNN)组合而成的剪接位点预测模型——BERT-splice。首先,采用BERT预训练方法训练DNA语言模型,从而提取DNA序列的上下文动态关联特征,并且使用高维矩阵映射DNA序列特征;其次,采用人类参考基因组序列hg19数据,使用DNA语言模型将该数据映射为高维矩阵后作为平行CNN分类器的输入进行再训练;最后,在上述基础上构建了剪接位点预测模型。实验结果表明,BERT-splice模型在DNA剪接位点供体集上的预测准确率为96.55%,在受体集上的准确率为95.80%,相较于BERT与循环卷积神经网络(RCNN)构建的预测模型BERT-RCNN分别提高了1.55%和1.72%;同时,在5条完整的人类基因序列上测试得到的所提模型的供体/受体剪接位点平均假阳性率(FPR)为4.74%。以上验证了BERT-splice模型用于基因剪接位点预测的有效性。 展开更多
关键词 剪接位点识别 BERT 卷积神经网络 深度学习 脱氧核糖核酸
下载PDF
预测竞争性和非竞争性剪接位点对(英文)
2
作者 杨乌日吐 李前忠 +1 位作者 林昊 杨科利 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2008年第3期294-299,共6页
基于剪接位点竞争机制,剪接位点对分成竞争性剪接位点对和非竞争性剪接位点对.并且竞争性和非竞争性剪接位点对的分类是一个很重要的工作.结合位置权重矩阵、离散量和支持向量机,提出了预测竞争性和非竞争性剪接位点对的新方法.独立检... 基于剪接位点竞争机制,剪接位点对分成竞争性剪接位点对和非竞争性剪接位点对.并且竞争性和非竞争性剪接位点对的分类是一个很重要的工作.结合位置权重矩阵、离散量和支持向量机,提出了预测竞争性和非竞争性剪接位点对的新方法.独立检验集中90%以上的剪接位点对能被正确地分类成竞争性和非竞争性剪接位点对.此预测成功率高于其它方法. 展开更多
关键词 竞争性剪接位点 非竞争性剪接位点 支持向量机
下载PDF
基于支持向量机(SVM)的剪接位点识别 被引量:19
3
作者 闻芳 卢欣 +1 位作者 孙之荣 李衍达 《生物物理学报》 CAS CSCD 北大核心 1999年第4期733-739,共7页
剪接位点的识别作为基因识别中的一个重要环节, 一直受到研究人员的关注。考虑到剪接位点附近存在的序列保守性,已有一些基于统计特性的方法被用于剪接位点的识别中,但效果仍有待进一步改进。支持向量机(Support Vecto... 剪接位点的识别作为基因识别中的一个重要环节, 一直受到研究人员的关注。考虑到剪接位点附近存在的序列保守性,已有一些基于统计特性的方法被用于剪接位点的识别中,但效果仍有待进一步改进。支持向量机(Support Vector Machines) 作为一种新的基于统计学习理论的学习机,近几年有了很大的发展,已被应用在模式识别的许多问题中。文中将其用于剪接位点的识别中,并针对满足GT- AG 规则的序列样本中虚假剪接位点的样本数远大于真实位点这一特性, 提出了一种基于SVM 的平衡取小法以获得更好的识别效果。实验结果表明,应用支持向量机进行剪接位点的识别能更好地提取位点附近保守序列的统计特征,对测试集具有更好的推广能力,并且使用上更加简单。这一结果为剪接位点的识别提供了一种新的方法,同时也为生物大分子研究中结构和位点的识别问题的解决提供了新的线索。 展开更多
关键词 基因识别 支持向量机 剪接位点 识别
下载PDF
用神经网络法预测mRNA的剪接位点 被引量:7
4
作者 孙键 徐军 +2 位作者 凌伦奖 沈如群 陈润生 《生物物理学报》 CAS CSCD 北大核心 1993年第1期127-131,共5页
用神经网络预测了mRNA的剪接位点,比较了在各种不同的情况下,神经网络的学习与预测的情况,讨论了能反映真实剪接位点预测情况的有效预测成功率,指出它可达64%,而且总的预测成功率可达98%.预测的相关系数为0.66.
关键词 神经网络 剪接位点 MRNA
下载PDF
基于支持向量机的人类5'非翻译区剪接位点识别 被引量:6
5
作者 晏春 杜耀华 +1 位作者 高青斌 王正志 《生物物理学报》 CAS CSCD 北大核心 2005年第4期284-288,共5页
基因非编码区域剪接位点的识别是基因识别中一个非常具有挑战性的问题,尤其是5'非翻译区中剪接位点的识别。与一般剪接位点不同,5'非翻译区剪接位点的两侧不存在由编码到非编码的状态转移,所以通常的剪接位点识别算法在非翻译... 基因非编码区域剪接位点的识别是基因识别中一个非常具有挑战性的问题,尤其是5'非翻译区中剪接位点的识别。与一般剪接位点不同,5'非翻译区剪接位点的两侧不存在由编码到非编码的状态转移,所以通常的剪接位点识别算法在非翻译区的性能不太理想。文章采用了基于支持向量机的方法对5'非翻译区中的剪接位点进行识别。为了提高识别精度,采用了基于矩阵相似性度量的核函数参数选取方法,它能够简单快速地确定合适的核函数参数,进而提高核函数的识别性能。通过实验验证,经过参数选择后的支持向量机能够较好地识别5'非翻译区剪接位点。 展开更多
关键词 5’非翻译区剪接位点 识别 支持向量机 核函数 参数选择
下载PDF
Sox8基因HMG盒区内含子剪接位点分析 被引量:4
6
作者 任莉莉 龚炜 +1 位作者 周荣家 程汉华 《遗传》 CAS CSCD 北大核心 2001年第4期298-300,共3页
Sox基因参与广泛的发育调控过程。为了确定Sox8基因HMG盒区内含子的大小及剪接位点 ,通过计算机分析本室克隆得到的泥鳅Sox8基因包括HMG盒区在内的一段基因组序列 ,推测在HMG盒区可能存在一个内含子 ,进一步通过RT -PCR方法 ,克隆泥鳅S... Sox基因参与广泛的发育调控过程。为了确定Sox8基因HMG盒区内含子的大小及剪接位点 ,通过计算机分析本室克隆得到的泥鳅Sox8基因包括HMG盒区在内的一段基因组序列 ,推测在HMG盒区可能存在一个内含子 ,进一步通过RT -PCR方法 ,克隆泥鳅Sox8基因HMG盒区cDNA片段 ,与基因组序列比较分析 ,确认在泥鳅Sox8基因的HMG盒区存在一个内含子 ,并确定了该内含子的序列及剪切位点。同时 ,比较分析了人和泥鳅Sox8在HMG盒区的内含子的剪切位点。结果显示 ,Sox8基因HMG盒区内含子剪切位点在进化上是保守的。 展开更多
关键词 Sox8基因 内含子 非编码序列 HMG盒区 剪接位点
下载PDF
基于贝叶斯网络的DNA序列剪接位点预测 被引量:4
7
作者 李骜 王涛 +1 位作者 冯焕清 王明会 《生物物理学报》 CAS CSCD 北大核心 2003年第4期431-436,共6页
采用基于贝叶斯网络的建模方法,预测真核生物DNA序列中的剪接位点。分别建立了供体住点和受体位点模型,并根据两种位点的生物学特性,对模型的拓扑结构和上下游节点的选择进行了优化。通过贝叶斯网络的最大似然学习算法求出模型参数后,利... 采用基于贝叶斯网络的建模方法,预测真核生物DNA序列中的剪接位点。分别建立了供体住点和受体位点模型,并根据两种位点的生物学特性,对模型的拓扑结构和上下游节点的选择进行了优化。通过贝叶斯网络的最大似然学习算法求出模型参数后,利用10分组交互验证方法对测试数据进行剪接位点预测。结果显示,受体位点的平均预测准确率为92.5%,伪受体位点的平均预测准确率为94.0%,供体位点的平均预测准确率为92.3%,伪供体位点的平均预测准确率为93.5%,整体效果要好于基于使用独立和条件概率矩阵、以及隐Markov模型的预测方法。表明利用贝叶斯网络对剪接位点建模是预测剪接位点的一种有效手段。 展开更多
关键词 贝叶斯网络 DNA序列 剪接位点 供体位点 受体位点 遗传信息
下载PDF
人类基因组盒式外显子和内含子保留的可变剪接位点预测 被引量:6
8
作者 邢永强 张利绒 罗辽复 《生物物理学报》 CAS CSCD 北大核心 2008年第5期393-401,共9页
信使RNA的可变剪接是真核生物有别于原核生物的基本特征之一,信使RNA前体的可变剪接极大地丰富了高等真核生物蛋白质的多样性,并与生物体的组织特异性密切相关。文章对人类盒式外显子和内含子保留的一些基本特征进行了统计;根据剪接位... 信使RNA的可变剪接是真核生物有别于原核生物的基本特征之一,信使RNA前体的可变剪接极大地丰富了高等真核生物蛋白质的多样性,并与生物体的组织特异性密切相关。文章对人类盒式外显子和内含子保留的一些基本特征进行了统计;根据剪接位点附近的单碱基、碱基二联体和三联体的保守性等特征,利用基于多样性指标的二次判别法,对盒式外显子和内含子保留的供体端和受体端可变剪接位点进行了预测。交叉检验结果表明,盒式外显子供体端和受体端的识别精度分别达到93%、84%以上的水平;内含子保留供体端和受体端的识别精度分别达到89%、81%以上的水平。 展开更多
关键词 盒式外显子 内含子保留 多样性指标 剪接位点
下载PDF
基于特征挖掘与融合的剪接位点识别 被引量:4
9
作者 周艳红 王卉 杨雷 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第12期117-120,共4页
在基于保守序列这一信号特征识别剪接位点的基础上,挖掘了可用于剪接位点识别的其他多个特征(包括剪接位点上、下游序列的碱基组成,剪接位点信号和上、下游序列的碱基组成随位点邻近序列C+G含量的变化等统计特征),建立了描述这些特征的... 在基于保守序列这一信号特征识别剪接位点的基础上,挖掘了可用于剪接位点识别的其他多个特征(包括剪接位点上、下游序列的碱基组成,剪接位点信号和上、下游序列的碱基组成随位点邻近序列C+G含量的变化等统计特征),建立了描述这些特征的模型,设计了能有效融合这些特征对剪接位点进行识别的对数线性模型,开发了剪接位点识别程序SpliceKey.测试结果表明:SpliceKey识别剪接位点的精度不仅较WAM方法有显著的提高,而且也优于国际上最新发布的剪接位点识别软件DGSplice.SpliceKey已提供网络服务:http:∥infosci.hust.edu.cn/SpliceKey/. 展开更多
关键词 剪接位点 对数线性模型 C+G含量 权重阵列模型
下载PDF
内含子二级结构与剪接位点 被引量:9
10
作者 张静 刘次全 《生物物理学报》 CAS CSCD 北大核心 1996年第3期477-481,共5页
对67个内含子的二级结构进行分析后,我们发现内含子两末端的碱基G绝大多数是游离的,剪接过程中形成“马套”结构的分枝点A有80%以上位于环区或游离的单链区,内含子5’端的G与分枝点A在空间位置上彼此靠近。
关键词 内含子 二级结构 剪接位点
下载PDF
基于模糊支持向量机的剪接位点识别 被引量:2
11
作者 孙波 李小霞 李铖果 《计算机应用》 CSCD 北大核心 2011年第4期1117-1120,共4页
为了提高模糊支持向量机(FSVM)对剪接位点的识别精度,提出一种计算样本隶属度的新方法。将样本到两聚类中心的距离比值作为样本的初始隶属度,采用K近邻(KNN)方法计算样本的紧密度,最后将初始隶属度与紧密度的乘积作为样本的最终隶属度,... 为了提高模糊支持向量机(FSVM)对剪接位点的识别精度,提出一种计算样本隶属度的新方法。将样本到两聚类中心的距离比值作为样本的初始隶属度,采用K近邻(KNN)方法计算样本的紧密度,最后将初始隶属度与紧密度的乘积作为样本的最终隶属度,这样既提高了支持向量的隶属度,又降低了噪声样本的隶属度。将此方法应用到剪接位点的识别中,对组成性5'和3'剪接位点的识别精度分别达到了94.65%和88.79%,与经典支持向量机相比,3'剪接位点的识别精度提高了7.94%。 展开更多
关键词 模糊支持向量机 隶属度 紧密度 剪接位点识别 选择性剪接
下载PDF
一种改进的贝叶斯分类器剪接位点预测 被引量:1
12
作者 郭烁 朱义胜 王庆辉 《系统仿真学报》 CAS CSCD 北大核心 2011年第7期1429-1432,共4页
虽然现有的DNA剪接位点辨识算法取得很高的辨识精度,但是大多数方法计算量很大。朴素贝叶斯分类器是一种简单而高效的分类器,但是它的属性独立性假设使其无法表示现实世界属性之间的依赖关系,影响了它的分类性能。将朴素贝叶斯分类器进... 虽然现有的DNA剪接位点辨识算法取得很高的辨识精度,但是大多数方法计算量很大。朴素贝叶斯分类器是一种简单而高效的分类器,但是它的属性独立性假设使其无法表示现实世界属性之间的依赖关系,影响了它的分类性能。将朴素贝叶斯分类器进行改进,推导出决策属性和各条件属性对数值间存在线性关系,并用最小二乘法求出这种线性关系系数,设计出一种新的贝叶斯分类器。将改进的贝叶斯分类器应用于DNA序列剪接位点的辨识中。仿真结果表明,本算法计算时间和测试样本的数量成线性关系,辨识精度较朴素贝叶斯分类器有明显提高,同时高于现有辨识算法。 展开更多
关键词 剪接位点 朴素贝叶斯分类器 最小二乘法 线性关系
原文传递
一种基于概率统计特征的剪接位点识别方法 被引量:2
13
作者 李绍燕 邓伟 《计算机工程与应用》 CSCD 北大核心 2011年第31期182-184,共3页
依据剪接位点附近存在的序列保守性出现了多种机器学习识别方法,如基于统计概率的方法、基于隐马尔可夫模型(Hidden Markov Model,HMM)的方法和基于支持向量机(Support Vector Machines,SVM)的方法等,这些方法识别精度较高,但算法过程... 依据剪接位点附近存在的序列保守性出现了多种机器学习识别方法,如基于统计概率的方法、基于隐马尔可夫模型(Hidden Markov Model,HMM)的方法和基于支持向量机(Support Vector Machines,SVM)的方法等,这些方法识别精度较高,但算法过程复杂。基于剪接位点附近碱基之间的相关性和统计特征,构造了一种固定位点上碱基间的网络结构图,并在此网络结构图的基础上提出了基于概率统计特征的剪接位点识别计算公式,利用N269数据库对识别方法和其他传统方法的性能进行了比较。实验结果表明,基于概率统计特征的方法预测人类的剪接位点,有较好的预测效果,与其他的一些算法相比,表现出参数少,精度高等优点。 展开更多
关键词 剪接位点识别 机器学习 概率统计特征
下载PDF
多尺度组分特征和位点关联特征相融合的剪接位点识别 被引量:1
14
作者 周雄 《计算机工程与应用》 CSCD 2014年第10期120-123,187,共5页
为了提高剪接位点的识别精度,提出一种多尺度组分和位点关联特征相融合的剪接位点识别模型(MSC-APR)。确定剪接位点序列保守性的窗口长度,分别提取序列的多尺度组分和位点关联特征,然后将两类特征组合输入最小二乘支持向量机构建剪接位... 为了提高剪接位点的识别精度,提出一种多尺度组分和位点关联特征相融合的剪接位点识别模型(MSC-APR)。确定剪接位点序列保守性的窗口长度,分别提取序列的多尺度组分和位点关联特征,然后将两类特征组合输入最小二乘支持向量机构建剪接位点分类器,采用数据集HS3D和NN269进行仿真实验。结果表明,MSC-APR的剪接位点识别精度明显优于对比模型的识别精度。 展开更多
关键词 剪接位点 最小二乘支持向机 位点关联特征 多尺度组分特征
下载PDF
基于改进的Winnow算法的剪接位点识别
15
作者 晏春 倪青山 +1 位作者 杜耀华 王正志 《生命科学研究》 CAS CSCD 2005年第3期218-226,共9页
DNA序列功能位点的识别是目前生物信息学领域的一个研究热点,剪接位点的识别就是其中之一.为了充分利用剪接位点的特征模式,从而更好地识别剪接位点,建立了一个基于改进Winnow算法的剪接位点识别系统.与其他方法相比较,改进的Winnow算... DNA序列功能位点的识别是目前生物信息学领域的一个研究热点,剪接位点的识别就是其中之一.为了充分利用剪接位点的特征模式,从而更好地识别剪接位点,建立了一个基于改进Winnow算法的剪接位点识别系统.与其他方法相比较,改进的Winnow算法具有更好的鲁棒性,适用于高维特征空间,能够融合多种模式信息,即使在包含很多不相关特征的情况下,也能有很好的性能.同时在训练的时候,对特征集进行了剪枝,把一些对识别几乎没有贡献的特征去除,这样做对结果的影响可以忽略,而且提高了算法的效率.通过实验验证,改进的Winnow算法可以很好地识别剪接位点,其多个性能指标达到或超过目前国际上流行的剪接位点识别软件. 展开更多
关键词 剪接位点识别 改进Winnow算法 信息融合 乘法权更新方法 特征分析
下载PDF
RS-GA-KNN算法识别灵长类动物DNA序列剪接位点
16
作者 张运陶 丁保淼 黎云祥 《华中师范大学学报(自然科学版)》 CAS CSCD 2006年第1期90-94,共5页
以灵长类动物DNA序列的剪接位点识别资料为研究对象,将选定样本序列中各碱基编码作为原始变量数据,用粗糙集方法和遗传算法对原始变量数据进行变量筛选,即以粗糙集方法选取的变量为基础,用遗传算法进行变量的二次搜索,从样本序列各碱基... 以灵长类动物DNA序列的剪接位点识别资料为研究对象,将选定样本序列中各碱基编码作为原始变量数据,用粗糙集方法和遗传算法对原始变量数据进行变量筛选,即以粗糙集方法选取的变量为基础,用遗传算法进行变量的二次搜索,从样本序列各碱基中挑选出保守性强的碱基对应的变量构成变量集,采用最近邻聚类识别灵长类动物DNA序列剪接位点类型,总识别准确率达90.66%,明显高于直接使用原始变量数据或将粗糙集理论方法和遗传算法单独用于变量选取的识别结果. 展开更多
关键词 粗糙集理论 遗传算法 最近邻聚类 剪接位点 识别
下载PDF
基因短序列模式分析及其在5’剪接位点识别中的应用
17
作者 晏春 杜耀华 王正志 《国防科技大学学报》 EI CAS CSCD 北大核心 2006年第1期51-56,共6页
短序列模式分析是基因序列分析的一个重要组成部分,在进行生物信号识别的时候,一般都会利用到短序列模式的信息。通常短序列模式的数目很多,如果每个都应用到生物信号识别中,会产生大量的参数,而且无法体现信号的主要特征。为了找出在... 短序列模式分析是基因序列分析的一个重要组成部分,在进行生物信号识别的时候,一般都会利用到短序列模式的信息。通常短序列模式的数目很多,如果每个都应用到生物信号识别中,会产生大量的参数,而且无法体现信号的主要特征。为了找出在识别信号位点中起关键作用的短序列模式,以信息增益作为评价依据,按照逐步选择的策略,将模式进行排队。根据排队结果,选取信息增益突出的短序列模式作为识别生物信号的关键依据,这样可以用较少的模式得到较好的结果。结合选取的短序列模式,用最大熵模型作为信号序列真实分布的估计,从而对给定序列进行识别。最后将这个方法用于5’剪接位点的识别,得到了满意的结果。 展开更多
关键词 5’剪接位点识别 模式分析 最大熵模型
下载PDF
利用条件随机场实现DNA剪接位点的预测
18
作者 杨王黎 许少华 《重庆大学学报(自然科学版)》 EI CAS CSCD 北大核心 2010年第10期129-132,共4页
为解决传统的基因识别算法主要关注编码区的整体特性,而并不着重考虑个别位点的信息,因此难以准确地识别出剪接位点的缺点,提出了基于条件随机场的剪接位点预测方法,条件随机场能够更好的处理标记数据之间的依赖关系,并且能够避免数据... 为解决传统的基因识别算法主要关注编码区的整体特性,而并不着重考虑个别位点的信息,因此难以准确地识别出剪接位点的缺点,提出了基于条件随机场的剪接位点预测方法,条件随机场能够更好的处理标记数据之间的依赖关系,并且能够避免数据标记偏置的问题。实验结果表明基于条件随机场的剪接位点预测方法是一种合适的方法,能够取得更好的效果。 展开更多
关键词 剪接位点 条件随机场 基因编码区域
原文传递
基于卷积神经网络的基因剪接位点预测
19
作者 李国斌 杜秀全 +1 位作者 李新路 吴志泽 《盐城工学院学报(自然科学版)》 CAS 2020年第2期20-24,共5页
研究剪接位点可以更深入地探索剪接机制和基因预测方法,准确预测剪接位点至关重要。基于深度学习技术提出一种新的预测方法,无需人工提取样本特征,以基因序列的K-MER编码向量作为输入,采用训练后的卷积神经网络(CNN)模型进行预测。基于... 研究剪接位点可以更深入地探索剪接机制和基因预测方法,准确预测剪接位点至关重要。基于深度学习技术提出一种新的预测方法,无需人工提取样本特征,以基因序列的K-MER编码向量作为输入,采用训练后的卷积神经网络(CNN)模型进行预测。基于人类基因HS3D供体数据集,与传统机器学习方法进行预测比较,结果表明预测模型的主要性能指标,包含马修斯相关系数(MCC)、灵敏度(SN)均超过传统的机器学习方法。 展开更多
关键词 深度学习 卷积神经网络 剪接位点预测 K-MER编码
下载PDF
低维输入空间的支持向量机识别人类剪接位点 被引量:3
20
作者 刘利 李前忠 樊国梁 《生物物理学报》 CAS CSCD 北大核心 2008年第1期49-56,共8页
真核生物剪接位点的识别作为基因结构注释的重要环节,一直以来倍受关注。利用离散增量和权重矩阵构成的向量来表示序列,用支持向量机在六维向量空间中寻找最优超平面,从而将真实的剪接位点和虚假的剪接位点进行分类。计算结果表明,利用... 真核生物剪接位点的识别作为基因结构注释的重要环节,一直以来倍受关注。利用离散增量和权重矩阵构成的向量来表示序列,用支持向量机在六维向量空间中寻找最优超平面,从而将真实的剪接位点和虚假的剪接位点进行分类。计算结果表明,利用这样的算法预测人类的剪接位点,有较好的预测效果。与其他的一些算法相比,表现出参数少、精度高等优点。 展开更多
关键词 离散增量 权重矩阵 支持向量机 剪接位点
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部