期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于宏基因组长片段的基因预测算法基准 被引量:1
1
作者 李瑞琳 尚秋明 +4 位作者 韩鑫胤 张裕 祝海栋 LI Weizhong 牛北方 《计算机应用》 CSCD 北大核心 2019年第A01期143-149,共7页
目前,围绕宏基因组的模拟读长(reads)或片段、全基因组等不同类型的输入数据,新的基因预测算法、软件与工具层出不穷,但存在三方面的问题:一、基于模拟reads或片段得出的结果无法准确反映真实基因的预测效果,而基于全基因组得出的结果... 目前,围绕宏基因组的模拟读长(reads)或片段、全基因组等不同类型的输入数据,新的基因预测算法、软件与工具层出不穷,但存在三方面的问题:一、基于模拟reads或片段得出的结果无法准确反映真实基因的预测效果,而基于全基因组得出的结果不能实现未知物种的预测;二、模拟reads或片段大多小于真实基因的总长度,软件很难预测出完整的基因,甚至丢失部分真实基因;三、长片段基因预测的基准衡量研究较少,大大限制了基因预测在不同领域的应用。针对以上问题,提出基于真实数据长片段基因预测的基准衡量方法。首先,对两个包含20种细菌株的真实序列数据集进行过滤及组装处理;其次,利用组装后得到的长片段支架(scaffolds)作为输入,对6种软件进行基准性能评估;最后,基于评估结果进行错误率上限分析。实验结果表明,在覆盖度较高的数据集上,Prodigal、GeneMarkS-2、MetaGeneAnnotator和FragGeneScan这4种软件错误率接近且最低,在3.5%~22.8%变化;在低覆盖度的数据集上,GeneMarkS-2错误率最低,在27.1%~54.7%变化。 展开更多
关键词 宏基因组 基因预测 开放阅读框 组装 基准衡量
下载PDF
六倍体小麦基因组注释流程构建与优化 被引量:1
2
作者 祝海栋 李瑞琳 +3 位作者 何小雨 赵丹 韩鑫胤 牛北方 《计算机系统应用》 2019年第8期222-228,共7页
野生小麦是异源六倍体,基因组规模较大(约14 GB),且包含大量重复序列.为了培育具有优良性状的新品种,首先要定位控制目标性状的基因,因此建立一个完整准确的基因组注释软件流程至关重要.传统的基因组注释方法基于数据库比对,具有三个明... 野生小麦是异源六倍体,基因组规模较大(约14 GB),且包含大量重复序列.为了培育具有优良性状的新品种,首先要定位控制目标性状的基因,因此建立一个完整准确的基因组注释软件流程至关重要.传统的基因组注释方法基于数据库比对,具有三个明显的缺点:一是比对速度慢;二是难以发现新基因;三是软件选择没有统一标准.本文提出了一种新的生物信息学注释流程,结合了基因数据库比对、转录组高通量测序数据分析、全长转录组单分子测序数据分析等多种技术手段,实现了六倍体小麦科农9204基因组完整准确的注释,为揭示小麦生长发育规律和培育新品种提供了重要参考和软件技术支撑. 展开更多
关键词 基因组 基因注释 高通量测序 生物信息学 全长转录组
下载PDF
单肿瘤组织微卫星不稳定探测方法 被引量:1
3
作者 赵丹 尚秋明 +4 位作者 韩鑫胤 李瑞琳 何小雨 祝海栋 牛北方 《计算机系统应用》 2019年第9期50-57,共8页
目前,随着下一代测序技术(Next-Generation Sequencing technology,NGS)的发展,围绕高通量测序数据的微卫星不稳定(Micro-Satellite Instability,MSI)探测方法与软件工具层出不穷,但存在需要配对正常组织测序数据做参照或大量微卫星稳定... 目前,随着下一代测序技术(Next-Generation Sequencing technology,NGS)的发展,围绕高通量测序数据的微卫星不稳定(Micro-Satellite Instability,MSI)探测方法与软件工具层出不穷,但存在需要配对正常组织测序数据做参照或大量微卫星稳定(Micro-Satellite Stable,MSS)样本的正常组织测序数据构建基准线的问题,这会在一定程度上给使用者造成不便.针对以上问题,本文提出一种基于信息熵理论使用样本肿瘤组织测序数据探测MSI的模型.首先,基于之前开发的探测软件MSlsensor1.1,增加在单肿瘤组织测序数据上探测样本MSI状态的模块,扩增后的软件可实现基于两种数据模式的MSI探测.两种数据模式分别是肿瘤与正常组织成对测序数据和单肿瘤组织测序数据.其次,对扩展模块进行性能评估.依托于该模块,使用样本肿瘤组织的外显子测序数据对衡量软件性能的指标进行评估.结果显示,本研究提出的基于信息熵理论在单肿瘤组织测序数据上的探测模块性能表现较好,这为后续更为复杂的变异信号探测提供了理论依据和技术支撑. 展开更多
关键词 基因组 微卫星 微卫星不稳定 信息熵理论 单肿瘤组织测序数据
下载PDF
以青海为代表的全国新生儿出生缺陷研究综述 被引量:1
4
作者 赵得雄 尚秋明 +9 位作者 栾海晶 代闯闯 李瑞琳 何小雨 韩鑫胤 祝海栋 何志鹏 牛北方 迟学斌 陆忠华 《科研信息化技术与应用》 2019年第2期78-88,共11页
[目的]分析我国新生儿出生缺陷的发生状况,探究影响新生儿出生缺陷的因素。[方法]采用了回顾性分析的研究方法,对我国主要省、直辖市、自治区的新生儿的出生缺陷率进行了统计分析。结果我国新生儿出生缺陷率在胎儿性别、地域、产妇年龄... [目的]分析我国新生儿出生缺陷的发生状况,探究影响新生儿出生缺陷的因素。[方法]采用了回顾性分析的研究方法,对我国主要省、直辖市、自治区的新生儿的出生缺陷率进行了统计分析。结果我国新生儿出生缺陷率在胎儿性别、地域、产妇年龄等方面有显著性差异:男性出生缺陷率高于女性出生缺陷率,农村出生缺陷率明显高于城市出生缺陷率,产妇年龄低于20岁以及高于35岁出现出生缺陷的概率明显高于其他年龄段。进一步研究发现,影响我国出生缺陷的主要因素有:妊娠期患病、孕妇年龄、孕期接触有害物质、分娩季度、孕期服用避孕药、孕期发热、异常生育史、家族遗传病、行为习惯等九大因素。[结论]孕产妇做好孕期保健,进行常规产前检查,保持良好的行为习惯,是降低出生缺陷率的有效举措。 展开更多
关键词 出生缺陷 出生缺陷率 环境因素 遗传因素 新生儿
原文传递
四种肿瘤体细胞单核苷酸突变检测方法的比较
5
作者 李晓东 何小雨 +9 位作者 陈玮 李瑞琳 赵丹 祝海栋 张裕 代闯闯 陆忠华 迟学斌 牛北方 郎显宇 《科研信息化技术与应用》 2017年第6期77-87,共11页
随着高通量测序成本的不断降低,基于DNA测序技术的肿瘤基因组研究已经成为揭示肿瘤分子机制的主流方法,并在临床诊断和治疗中逐渐得到应用。肿瘤体细胞单核苷酸突变变异(single nucleotide variant,SNV)作为最简单的一种基因变异类型,... 随着高通量测序成本的不断降低,基于DNA测序技术的肿瘤基因组研究已经成为揭示肿瘤分子机制的主流方法,并在临床诊断和治疗中逐渐得到应用。肿瘤体细胞单核苷酸突变变异(single nucleotide variant,SNV)作为最简单的一种基因变异类型,其检测会受到家系多态性、肿瘤异质性、测序和分析误差等多个因素的影响,从而导致一些假阳性的结果。目前,已有一些基于肿瘤基因组测序数据的体细胞SNV检测软件,如Varscan2,Mutect2,Strelka,Somatic Sniper等。本文选取四种典型的检测方法,对每种方法的检测原理进行研究,并使用ICGC-TCGA提供的全基因组数据,对上述四种变异检测软件进行测试。参照每种方法的分析流程,获得每种方法识别的候选变异位点集,并与真实的变异位点集合进行比较,分析每种算法的优缺点,从而为研究人员使用这些方法提供指导。 展开更多
关键词 体细胞单核苷酸变异 基因序列 突变检测 假阳性 测序深度
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部