针对DNA序列编码区的识别问题,本研究提出一个特征向量和逻辑回归的组合模型。首先对DNA序列进行数值处理转化为特征向量,并结合k字符相对频率技术提取特征向量的元素特征,之后利用二分类逻辑回归算法,对编码区和非编码区进行准确区分...针对DNA序列编码区的识别问题,本研究提出一个特征向量和逻辑回归的组合模型。首先对DNA序列进行数值处理转化为特征向量,并结合k字符相对频率技术提取特征向量的元素特征,之后利用二分类逻辑回归算法,对编码区和非编码区进行准确区分。选取了HMR195和BG570两个基准数据集进行五折交叉验证,结果表明,平均AUC(Area Under Curve)值分别为0.9813和0.9874,明显优于传统的贝叶斯判别法和VOSSDFT等方法。此外,本文提出的特征向量的维度很低,提高了运算效率。因此,本文组合模型能够较为高效准确地识别蛋白质编码区。展开更多
设计14对水稻编码区SSR引物和选取已公布的非编码区SSR引物12对、编码区SSR引物3对,采用SSR技术,对29个标记在60个水稻材料中的多态性进行分析。结果表明,编码区SSR标记平均检测到3.59个多态性位点,多态信息量PIC(polymorphism informat...设计14对水稻编码区SSR引物和选取已公布的非编码区SSR引物12对、编码区SSR引物3对,采用SSR技术,对29个标记在60个水稻材料中的多态性进行分析。结果表明,编码区SSR标记平均检测到3.59个多态性位点,多态信息量PIC(polymorphism information conten)在0.032~P0.853之间,平均值为0.447;非编码区SSR标记平均检测到3.92个多态性位点,PIC在0.063~P0.795之间,平均值为0.521。聚类分析显示,非编码区SSR标记能更加精确地区分来自不同地区的水稻类群,编码区SSR标记也具有良好的多态性,同样可以用于分析水稻的亲缘关系。展开更多
[目的 ]扩增和克隆猪带绦虫囊尾蚴 Ag B基因的 c DNA编码区。 [方法 ]提取猪囊尾蚴总 RNA中 ,利用 RT- PCR技术扩增出 Ag B基因 c DNA编码区 ,然后将其克隆到载体 p UC118中进行序列分析。 [结果 ]PCR反应产物为单一条带 ,大小为 2 .6 k...[目的 ]扩增和克隆猪带绦虫囊尾蚴 Ag B基因的 c DNA编码区。 [方法 ]提取猪囊尾蚴总 RNA中 ,利用 RT- PCR技术扩增出 Ag B基因 c DNA编码区 ,然后将其克隆到载体 p UC118中进行序列分析。 [结果 ]PCR反应产物为单一条带 ,大小为 2 .6 kb。测序结果与澳大利亚株猪囊尾蚴 Ag B序列有 99.8%的同源性 ,二者的氨基酸序列有 99.3%的同源性。 [结论 ]成功地克隆了猪囊尾蚴 Ag B基因 c DNA编码区。展开更多
文摘针对DNA序列编码区的识别问题,本研究提出一个特征向量和逻辑回归的组合模型。首先对DNA序列进行数值处理转化为特征向量,并结合k字符相对频率技术提取特征向量的元素特征,之后利用二分类逻辑回归算法,对编码区和非编码区进行准确区分。选取了HMR195和BG570两个基准数据集进行五折交叉验证,结果表明,平均AUC(Area Under Curve)值分别为0.9813和0.9874,明显优于传统的贝叶斯判别法和VOSSDFT等方法。此外,本文提出的特征向量的维度很低,提高了运算效率。因此,本文组合模型能够较为高效准确地识别蛋白质编码区。
文摘设计14对水稻编码区SSR引物和选取已公布的非编码区SSR引物12对、编码区SSR引物3对,采用SSR技术,对29个标记在60个水稻材料中的多态性进行分析。结果表明,编码区SSR标记平均检测到3.59个多态性位点,多态信息量PIC(polymorphism information conten)在0.032~P0.853之间,平均值为0.447;非编码区SSR标记平均检测到3.92个多态性位点,PIC在0.063~P0.795之间,平均值为0.521。聚类分析显示,非编码区SSR标记能更加精确地区分来自不同地区的水稻类群,编码区SSR标记也具有良好的多态性,同样可以用于分析水稻的亲缘关系。
文摘[目的 ]扩增和克隆猪带绦虫囊尾蚴 Ag B基因的 c DNA编码区。 [方法 ]提取猪囊尾蚴总 RNA中 ,利用 RT- PCR技术扩增出 Ag B基因 c DNA编码区 ,然后将其克隆到载体 p UC118中进行序列分析。 [结果 ]PCR反应产物为单一条带 ,大小为 2 .6 kb。测序结果与澳大利亚株猪囊尾蚴 Ag B序列有 99.8%的同源性 ,二者的氨基酸序列有 99.3%的同源性。 [结论 ]成功地克隆了猪囊尾蚴 Ag B基因 c DNA编码区。