期刊文献+
共找到585篇文章
< 1 2 30 >
每页显示 20 50 100
考虑样本不平衡的模型无关的基因选择方法 被引量:24
1
作者 李建中 杨昆 +2 位作者 高宏 骆吉洲 郭政 《软件学报》 EI CSCD 北大核心 2006年第7期1485-1493,共9页
在基因表达数据分析中,鉴别基因是后续研究中非常重要的信息基因.有很多研究致力于从基因表达数据中选出信息基因这一挑战性工作,并提出了一些基因选择方法.然而,这些方法(特别是非参数选择方法)都没有考虑不同样本类别中样本大小的不... 在基因表达数据分析中,鉴别基因是后续研究中非常重要的信息基因.有很多研究致力于从基因表达数据中选出信息基因这一挑战性工作,并提出了一些基因选择方法.然而,这些方法(特别是非参数选择方法)都没有考虑不同样本类别中样本大小的不平衡性问题.考虑样本不平衡性和基因选择方法的稳定性,给出一个全新的与数据分布模型无关的基因选择方法.在类内变化小和类间差别大的策略下,选择敏感的度量函数提高方法的鉴别能力,同时,利用类内变化和类间差别的一致性来增加方法的稳定性和适用性.这一方法不但可以应用于两个类别的情况,也可以应用于多个类别的情况.最后,使用两组真实的基因表达数据对所提出的方法进行了验证.实验结果表明,这一方法比其他方法具有更高的有效性和稳健性. 展开更多
关键词 基因选择 基因表达 分类 微阵列
下载PDF
非平衡基因数据的差异表达基因选择算法研究 被引量:11
2
作者 谢娟英 王明钊 +2 位作者 周颖 高红超 许升全 《计算机学报》 EI CSCD 北大核心 2019年第6期1232-1251,共20页
针对准确率不适于评价不平衡数据特征子集性能的缺陷,提出了 F2 -measure(简称 F2 )准则.为避免mRMR(minimal Redundancy-Maximal Relevance)的互信息方法倾向于选择多值特征,提出了归一化互信息 SU (Symmetrical Uncertainty).针对最大... 针对准确率不适于评价不平衡数据特征子集性能的缺陷,提出了 F2 -measure(简称 F2 )准则.为避免mRMR(minimal Redundancy-Maximal Relevance)的互信息方法倾向于选择多值特征,提出了归一化互信息 SU (Symmetrical Uncertainty).针对最大化 AUC (Area Under an ROC Curve)框架下,特征选择算法的特征与类标相关性、特征间相关性的取值范围(量纲)不一致问题,提出了归一化的特征权重.为加快特征选择过程,提出了结合 SU和AUC 的特征预选择,缩小特征搜索空间.提出动态加权顺序前向搜索DWSFS(Dynamic Weighted Sequential Forward Search)和动态加权顺序前向浮动搜索DWSFFS(Dynamic Weighted Sequential Forward Floating Search),以期得到分类性能更好的特征子集.基于最大化 AUC 和mRMR框架,结合上述创新点,设计出16种特征选择算法.7个经典二类不平衡基因数据集、3个多类不平衡(或近似平衡)基因数据集的50次重复实验表明:所提算法选择的基因子集具有非常好的分类识别能力;提出的 F2、SU、归一化基因权重、基因预选择,以及DWSFS和DWSFFS对选择非平衡基因数据集的差异表达基因非常有效.提出的 SU 在度量基因冗余性时优于斯皮尔曼等级相关系数 RCC (Rank Correlation Coefficient);基因选择过程中的权值度量采用基因与类标相关性减去基因间冗余性优于采用基因与类标相关性除以基因冗余性方案.与现有经典基因选择算法的实验比较表明:提出的基因选择算法的性能优于现有基因选择算法. 展开更多
关键词 基因选择 AUC 互信息 mRMR 不平衡数据
下载PDF
基于迭代Lasso的肿瘤分类信息基因选择方法研究 被引量:18
3
作者 张靖 胡学钢 +1 位作者 李培培 张玉红 《模式识别与人工智能》 EI CSCD 北大核心 2014年第1期49-59,共11页
近年来,基于基因表达谱的肿瘤分类问题引起了广泛关注,为癌症的精确诊断及分型提供了极大的便利.然而,由于基因表达谱数据存在样本数量小、维数高、噪声大及冗余度高等特点,给深入准确地挖掘基因表达谱中所蕴含的生物医学知识和肿瘤信... 近年来,基于基因表达谱的肿瘤分类问题引起了广泛关注,为癌症的精确诊断及分型提供了极大的便利.然而,由于基因表达谱数据存在样本数量小、维数高、噪声大及冗余度高等特点,给深入准确地挖掘基因表达谱中所蕴含的生物医学知识和肿瘤信息基因选择带来了极大困难.文中提出一种基于迭代Lasso的信息基因选择方法,以获得基因数量少且分类能力较强的信息基因子集.该方法分为两层:第一层采用信噪比指标衡量基因的重要性,以过滤无关基因;第二层采用改进的Lasso方法进行冗余基因的剔除.实验采用5个公开的肿瘤基因表达谱数据集验证了本文方法的可行性和有效性,与已有的信息基因选择方法相比具有更好的分类性能. 展开更多
关键词 基因表达谱 肿瘤分类 迭代Lasso 基因选择
下载PDF
一种基于互信息最大化的模型无关基因选择方法 被引量:7
4
作者 魏莎莎 陆慧娟 +2 位作者 安春霖 郑恩辉 金伟 《计算机科学》 CSCD 北大核心 2014年第9期243-247,共5页
针对大规模基因芯片高维度的基因表达数据存在大量无关和冗余特征可能降低分类器性能的问题,提出了一种基于互信息最大化方法(MMI)和与遗传算法的模型无关的基因选择方法来将特征选择转化为全局优化问题,其中的适应度函数定义为类间距... 针对大规模基因芯片高维度的基因表达数据存在大量无关和冗余特征可能降低分类器性能的问题,提出了一种基于互信息最大化方法(MMI)和与遗传算法的模型无关的基因选择方法来将特征选择转化为全局优化问题,其中的适应度函数定义为类间距离与类内距离之比,适应程度高。为了评价算法的性能,采用3个数据集进行了实验,结果表明MMIGA-Selection取得了较好的效果,在每个数据集上获得了较高的5折交叉验证正确率。MMIGA-Selection主要有两个优点:一是可以有效减少冗余基因;二是模型无关性,选择得出的特征子集可直接用于其他类型的分类器,分类精度较高。 展开更多
关键词 互信息最大化 模型无关 遗传算法 基因选择
下载PDF
基于对称不确定性和SVM递归特征消除的信息基因选择方法 被引量:14
5
作者 叶明全 高凌云 +1 位作者 伍长荣 万春圆 《模式识别与人工智能》 EI CSCD 北大核心 2017年第5期429-438,共10页
基因表达谱中存在大量与肿瘤分类无关的基因,严重降低肿瘤诊断的准确率.基因表达谱还存在高维小样本、噪声大等问题,增加肿瘤诊断的难度.为了获取基因数量较少且分类能力较强的信息基因子集,文中提出基于对称不确定性(SU)和支持向量机... 基因表达谱中存在大量与肿瘤分类无关的基因,严重降低肿瘤诊断的准确率.基因表达谱还存在高维小样本、噪声大等问题,增加肿瘤诊断的难度.为了获取基因数量较少且分类能力较强的信息基因子集,文中提出基于对称不确定性(SU)和支持向量机递归特征消除(SVM-RFE)的信息基因选择方法.首先利用SU评估基因和类标签之间的相关性,根据SU定义近似马尔科夫毯,快速消除大量无关和冗余基因.然后利用SVM-RFE进一步剔除冗余基因,获取有效的信息基因子集.实验表明,文中方法可以在选取维数较少或相等的信息基因子集情况下获取较高的肿瘤分类性能. 展开更多
关键词 基因选择 对称不确定性 支持向量机 递归特征消除 肿瘤分类
下载PDF
基于SVM-RFE-SFS的基因选择方法 被引量:11
6
作者 游伟 李树涛 谭明奎 《中国生物医学工程学报》 CAS CSCD 北大核心 2010年第1期93-99,共7页
基因微阵列数据通常包含大量与肿瘤分类无关的数据,会严重降低肿瘤诊断的准确率;基因微阵列数据还存在小样本、高维度的问题,也增加了肿瘤诊断的难度,所以必须对其进行基因选择。提出一种新的基于支持向量机(SVM)、联合递归特征去除(RFE... 基因微阵列数据通常包含大量与肿瘤分类无关的数据,会严重降低肿瘤诊断的准确率;基因微阵列数据还存在小样本、高维度的问题,也增加了肿瘤诊断的难度,所以必须对其进行基因选择。提出一种新的基于支持向量机(SVM)、联合递归特征去除(RFE)和序列前向选择(SFS)的基因选择方法。首先利用SVM计算每个基因的排序准则分数,再利用排序准则分数的一阶差分把基因划分为若干小组;对排序准则分数值最小的基因小组进行递归特征去除,消去噪声基因,同时对排序准则分数值最大的基因小组进行序列前向选择,选取有效信息基因。对白血病、结肠癌、乳腺癌基因微阵列数据的实验结果表明,所提出的方法运行效率高、分类性能好。 展开更多
关键词 基因选择 支持向量机 递归特征去除 序列前向选择
下载PDF
基于蚁群优化算法的基因选择 被引量:7
7
作者 蔡立军 蒋林波 易叶青 《计算机应用研究》 CSCD 北大核心 2008年第9期2754-2757,共4页
将蚁群优化算法(ant colony optimization algorithm,ACO)引入基因选择领域,并用基因与类别的相关性分析所得值来初始化最优化问题,缩短了找寻最优解的时间;以基因子集整体的样本辨别能力与子集中基因之间的平均距离的线性表达作为目标... 将蚁群优化算法(ant colony optimization algorithm,ACO)引入基因选择领域,并用基因与类别的相关性分析所得值来初始化最优化问题,缩短了找寻最优解的时间;以基因子集整体的样本辨别能力与子集中基因之间的平均距离的线性表达作为目标函数,有利于在找到关键基因的同时消除冗余;同时,由于目标函数不采用分类准确度,大大降低了计算复杂度,提高了方法的灵活性和适应性。 展开更多
关键词 蚁群优化算法 基因选择 相关性
下载PDF
最大化ROC曲线下面积的不平衡基因数据集差异表达基因选择算法 被引量:14
8
作者 谢娟英 王明钊 胡秋锋 《陕西师范大学学报(自然科学版)》 CAS CSCD 北大核心 2017年第1期13-22,共10页
针对ARCO(AUC and rank correlation coefficient optimization)算法在进行两类问题特征选择时,采用斯皮尔曼等级相关系数度量已选特征子集冗余性带来信息损失和特征相关性与冗余性度量取值范围不一致的缺陷,提出改进的Pearson相关系数... 针对ARCO(AUC and rank correlation coefficient optimization)算法在进行两类问题特征选择时,采用斯皮尔曼等级相关系数度量已选特征子集冗余性带来信息损失和特征相关性与冗余性度量取值范围不一致的缺陷,提出改进的Pearson相关系数度量特征冗余性,并归一化特征相关性和冗余性度量范围,得到APCO(AUC and improved Pearson correlation coefficient optimization)算法以克服ARCO算法的不足。同时,针对实现多类特征选择的MAUCD(using MAUC as the relevance metric to rank features directly)和MDFS(MAUC decomposition based feature selection method)算法没有考虑特征冗余,且MDFS易选择到局部最优特征子集的问题,提出适于多类问题的改进Pearson相关系数度量特征冗余性,得到基于mRMR(maximal relevance-minimal redundancy)框架的MAUCP和MDFSP算法,克服MAUCD和MDFS算法的缺陷。以SVM、NB和KNN为分类工具,构造基于所选特征子集的相应分类器,以其AUC(MAUC)值度量相应特征子集的性能。7个二类和3个多类不平衡基因数据集的实验结果表明:提出的APCO、MAUCP和MDFSP算法分别优于ARCO、MAUCD和MDFS算法,也优于其他经典基因选择算法。 展开更多
关键词 基因选择 差异表达基因 AUC mRMR 不平衡数据
下载PDF
微阵列数据癌症分类问题中的基因选择 被引量:19
9
作者 张丽娟 李舟军 《计算机研究与发展》 EI CSCD 北大核心 2009年第5期794-802,共9页
微阵列数据广泛而成功地应用于生物医学的癌症分类研究.一个典型的微阵列数据集包含大量(通常成千上万,甚至数十万)的基因、相对少量(往往不足一百)的样本.在这成千上万的基因中,仅仅一少部分基因对癌症分类有贡献.因而,对于癌症分类来... 微阵列数据广泛而成功地应用于生物医学的癌症分类研究.一个典型的微阵列数据集包含大量(通常成千上万,甚至数十万)的基因、相对少量(往往不足一百)的样本.在这成千上万的基因中,仅仅一少部分基因对癌症分类有贡献.因而,对于癌症分类来说,最重要的一个问题就是识别出对癌症分类最有贡献的基因.这一识别过程称为基因选择.基因选择在统计模式识别、机器学习和数据挖掘领域已得到广泛研究.介绍基因选择问题所涉及到的相关背景知识和基本概念;全面地回顾统计学、机器学习和数据挖掘领域对基因选择问题的解决方法;通过实验展示了几种典型算法在微阵列数据上的性能;指出当前存在的问题和未来的研究方向. 展开更多
关键词 基因选择 微阵列数据 癌症分类 属性相关性 相关性度量
下载PDF
基于优化的邻域粗糙集的混合基因选择算法 被引量:7
10
作者 陈涛 洪增林 邓方安 《计算机科学》 CSCD 北大核心 2014年第10期291-294,316,共5页
DNA微阵列技术可以同时检测细胞内成千上万的基因的活性,被广泛应用于重大基因疾病的临床诊断。然而微阵列数据通常具有高维小样本特点,且存在大量噪声和冗余基因。为了进一步提高微阵列数据分类性能,提出一种特征基因混合选择算法。首... DNA微阵列技术可以同时检测细胞内成千上万的基因的活性,被广泛应用于重大基因疾病的临床诊断。然而微阵列数据通常具有高维小样本特点,且存在大量噪声和冗余基因。为了进一步提高微阵列数据分类性能,提出一种特征基因混合选择算法。首先采用ReliefF算法剔除大量无关基因,获得特征基因候选子集;然后采用基于差分进化算法优化的邻域粗糙集模型实现特征基因选择;最后利用支持向量机进行分类,以验证算法的有效性。仿真实验结果表明,该算法能用尽可能少的特征基因来获得更高的分类精度,既增强了算法的泛化性能,又提高了时间效率,而且对致病基因的临床诊断有着重要的参考意义。 展开更多
关键词 特征基因选择 RELIEFF算法 邻域粗糙集模型 差分进化算法
下载PDF
基于粒子群优化和判别熵信息的基因选择算法 被引量:7
11
作者 关健 韩飞 杨善秀 《计算机工程》 CAS CSCD 2013年第11期187-190,196,共5页
为了以较少冗余的特征基因得到较高的分类准确率,提出一种基因选择算法。通过分析基因对不同类别间的判别熵信息,剔除大量的冗余基因,以形成一个初选基因库。在初选基因库中,运用粒子群优化算法结合基因组,对不同类别间的判别熵信息和... 为了以较少冗余的特征基因得到较高的分类准确率,提出一种基因选择算法。通过分析基因对不同类别间的判别熵信息,剔除大量的冗余基因,以形成一个初选基因库。在初选基因库中,运用粒子群优化算法结合基因组,对不同类别间的判别熵信息和样本分类准确率进行最优基因子集选择。在2组基因微阵列数据上的实验结果表明,该算法不仅能够获取较少冗余的可解释基因子集,而且对最终选择出的特征基因也能获得较高的样本识别率。 展开更多
关键词 粒子群优化 判别熵 微阵列数据 基因选择 极端学习机 先验信息
下载PDF
基于相关性分析的基因选择算法 被引量:4
12
作者 王明怡 吴平 王德林 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2004年第10期1289-1292,共4页
常用的排列法从微阵列数据中选择的基因集合会包含相关性较高的基因,这会影响分类器的性能,为了去除这些冗余基因(特征),提出了无监督的特征选择算法.该算法主要包含:将原始特征集划分为一组相似的子集(聚类);从每个聚类中选择代表性特... 常用的排列法从微阵列数据中选择的基因集合会包含相关性较高的基因,这会影响分类器的性能,为了去除这些冗余基因(特征),提出了无监督的特征选择算法.该算法主要包含:将原始特征集划分为一组相似的子集(聚类);从每个聚类中选择代表性特征.特征的划分采用特征间的相关性作为测度以k近邻原则来完成.该算法无需指定聚类数量,时间复杂度低.真实的生物学数据实验证明该算法可显著提高分类器的分类准确性. 展开更多
关键词 微阵列 基因选择 相关性分析 无监督学习
下载PDF
基于聚类和微粒群优化的基因选择新方法 被引量:4
13
作者 杨善秀 韩飞 关健 《计算机应用》 CSCD 北大核心 2013年第5期1285-1288,共4页
鉴于传统的基因选择方法会选出大量冗余基因从而导致较低的样本预测准确率,提出一种基于聚类和微粒群优化的基因选择算法。首先采用聚类算法将基因分成固定数目的簇;然后,采用极限学习机作为分类器进行簇中的特征基因分类性能评价,得到... 鉴于传统的基因选择方法会选出大量冗余基因从而导致较低的样本预测准确率,提出一种基于聚类和微粒群优化的基因选择算法。首先采用聚类算法将基因分成固定数目的簇;然后,采用极限学习机作为分类器进行簇中的特征基因分类性能评价,得到一个备选基因库;最后,采用基于微粒群优化和极限学习机的缠绕法从备选基因库中选择具有最大分类率、最小数目的基因子集。所选出的基因具有良好的分类性能。在两个公开的微阵列数据集上的实验结果表明,相对于一些经典的方法,新方法能够以较少的基因获得更高的分类性能。 展开更多
关键词 基因选择 微阵列数据 聚类 微粒群优化 极限学习机
下载PDF
基于RD-SVM的肿瘤信息基因选择算法 被引量:4
14
作者 谢志伟 王志明 骆剑锋 《计算机应用与软件》 CSCD 2015年第5期310-313,共4页
为了从高维、小样本的基因表达数据中有效地选择特征基因,消除与肿瘤分类无关的数据,提出一种随机矩阵替换与支持向量机的肿瘤信息基因选择算法(RD-SVM)。首先构建多组0/1随机向量表示的信息基因子集,并以支持向量机构建分类器评价每组... 为了从高维、小样本的基因表达数据中有效地选择特征基因,消除与肿瘤分类无关的数据,提出一种随机矩阵替换与支持向量机的肿瘤信息基因选择算法(RD-SVM)。首先构建多组0/1随机向量表示的信息基因子集,并以支持向量机构建分类器评价每组子集的优劣,然后考虑各特征之间的相互作用,以0、1替换策略对基因子集评估,并找到最优基因子集,最后采用5个肿瘤信息基因表达谱数据对算法性能进行测试。结果表明,相对于参比算法,RD-SVM算法不仅提高了肿瘤信息基因的识别精度,同时所选信息基因最少。 展开更多
关键词 基因选择 肿瘤表达谱 信息基因 支持向量机
下载PDF
K-S检验与mRMR相结合的基因选择算法 被引量:5
15
作者 谢娟英 胡秋锋 董亚非 《计算机应用研究》 CSCD 北大核心 2016年第4期1013-1018,1043,共7页
为了解决基因数据集的基因选择难题,提出一种基于K-S检验与最小冗余最大相关(minimum redundancy-maximum relevance,mRMR)原则的基因选择算法。该算法先采用K-S检验选择出具有一定区分能力的基因,然后对选择到的基因进行mRMR判断,保留... 为了解决基因数据集的基因选择难题,提出一种基于K-S检验与最小冗余最大相关(minimum redundancy-maximum relevance,mRMR)原则的基因选择算法。该算法先采用K-S检验选择出具有一定区分能力的基因,然后对选择到的基因进行mRMR判断,保留与类别高度相关而其间相关性较小的基因构成最终被选基因子集。以SVM为分类器,以F1_measure、分类准确率和AUC为评价指标对该算法选择的基因子集进行评估,并将本算法与K-S检验、mRMR,以及经典的RELIEF和FAST算法进行比较。五个经典基因数据集上的平均实验结果表明:本算法的运行时间远低于mRMR算法,且其各项评价指标值优于其他比较算法。因此,提出的K-S检验与mRMR结合的基因选择算法能选择到非常有效的基因子集。 展开更多
关键词 基因选择 K-S检验 最小见余最大相关 支持向量机 F1_measure AUC RELIEF FAST
下载PDF
基于相容关系的基因选择方法 被引量:4
16
作者 焦娜 苗夺谦 《计算机科学》 CSCD 北大核心 2010年第10期217-220,共4页
有效的基因选择是对基因表达数据进行分析的重要内容。粗糙集作为一种软计算方法能够保持在数据集分类能力不变的基础上,对属性进行约简。由于基因表达数据的连续性,为了避免运用粗糙集方法所必需的离散化过程带来的信息丢失,将相容粗... 有效的基因选择是对基因表达数据进行分析的重要内容。粗糙集作为一种软计算方法能够保持在数据集分类能力不变的基础上,对属性进行约简。由于基因表达数据的连续性,为了避免运用粗糙集方法所必需的离散化过程带来的信息丢失,将相容粗糙集应用于基因的特征选取,提出了基于相容关系的基因选择方法。首先,通过t-检验对基因表达数据进行排列,选择评分靠前的若干基因;然后,通过相容粗糙集对这些基因进一步约简。在两个标准的基因表达数据上进行了实验,结果表明该方法是可行性和有效性的。 展开更多
关键词 基因表达数据 基因选择 属性约简 粗糙集 相容关系
下载PDF
两种基于树结构的基因选择算法 被引量:2
17
作者 谢倩倩 李订芳 章文 《计算机科学》 CSCD 北大核心 2015年第7期250-253,共4页
癌症诊断是生物信息学领域的重要课题,其中从基因表达数据中选择与癌症相关的基因子集是癌症诊断的关键。随机森林是近年来很热门的算法,它能够评估分类中特征的重要性(该方法简称为PBM)。受此启发,提出了两种基于树结构的基因选择方法 ... 癌症诊断是生物信息学领域的重要课题,其中从基因表达数据中选择与癌症相关的基因子集是癌症诊断的关键。随机森林是近年来很热门的算法,它能够评估分类中特征的重要性(该方法简称为PBM)。受此启发,提出了两种基于树结构的基因选择方法 FBM和ABM,分别以树结构中特征出现的频率和重要性打分的平均值作为属性重要性的指标。数值实验中,使用提出的方法选取特征子集,并建立随机森林分类器,通过AUC结果评估基因选择的优劣。实验结果表明,当PBM的AUC值不低于0.900时,其在Leukemia数据集上至少需要26个基因,在Colon Cancer数据集上至少需要48个基因。而在仅选取前10个基因时,FBM和ABM在Leukemia数据集的AUC值均达到0.989,在Colon Cancer数据集的AUC值达到0.900。此外,与其它典型的基因选择方法 mRMR和ECRP等相比,提出的方法也有较高的精度,这对癌症的精确诊断和及早治疗具有重要的现实意义。 展开更多
关键词 分类 基因选择 随机森林
下载PDF
基于改进的有效区域基因选择与跨模态语义挖掘的图像属性标注 被引量:3
18
作者 张红斌 蒋子良 +4 位作者 熊其鹏 武晋鹏 邬任重 袁天 姬东鸿 《电子学报》 EI CAS CSCD 北大核心 2020年第4期790-799,共10页
图像属性标注是一种更细化的图像标注,它能缩小认知与特征间“语义鸿沟”.现有研究多基于单特征且未挖掘属性蕴含的深层语义,故无法准确刻画图像内容.改进有效区域基因选择算法融合图像特征,并设计迁移学习策略,实现材质属性标注;基于... 图像属性标注是一种更细化的图像标注,它能缩小认知与特征间“语义鸿沟”.现有研究多基于单特征且未挖掘属性蕴含的深层语义,故无法准确刻画图像内容.改进有效区域基因选择算法融合图像特征,并设计迁移学习策略,实现材质属性标注;基于判别相关分析挖掘特征间跨模态语义,以改进相对属性模型,标注材质属性蕴含的深层语义-实用属性.实验表明:材质属性标注精准度达63.11%,较最强基线提升1.97%;实用属性标注精准度达59.15%,较最强基线提升2.85%;层次化的标注结果能全面刻画图像内容. 展开更多
关键词 图像标注 有效区域基因选择 相对属性 迁移学习 跨模态语义 判别相关分析
下载PDF
一种基于Gene Ontology注释信息的基因选择算法 被引量:2
19
作者 马宁 张正国 《中国生物医学工程学报》 CAS CSCD 北大核心 2009年第5期696-700,706,共6页
基因选择算法是辅助生物学分析最重要的方法之一,但这类统计学算法受样本量相对基因数目过少的困扰。提出一种结合Gene Ontology(GO)注释信息的基因选择算法,用GO注释接近基因的方差的加权平均进行修正,增强小样本量下对总体的估计,进... 基因选择算法是辅助生物学分析最重要的方法之一,但这类统计学算法受样本量相对基因数目过少的困扰。提出一种结合Gene Ontology(GO)注释信息的基因选择算法,用GO注释接近基因的方差的加权平均进行修正,增强小样本量下对总体的估计,进而寻找差异表达基因。将该算法与其他5种常见算法对比,以选择出的基因为特征构建分类器,以分类器的可靠性作为衡量算法的标准。3组芯片实验的结果表明,该算法在小样本情况下具有一定优势。亦有Pubmed文献证明,该算法可以鉴别出其他算法未曾发现的致病基因。该方法所建立起来的框架,是把生物学注释信息引入算法改进的一种有效尝试。 展开更多
关键词 基因芯片 基因选择 T检验 置换检验 GO
下载PDF
基因选择的快速Fisher优化模型 被引量:2
20
作者 封举富 时建新 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第1期122-128,共7页
基因选择是基因芯片数据分析中的一个重要问题。基因选择的主要困难在于基因数远远大于实验样本数。在Fisher优化模型的基础上 ,提出了快速Fisher优化模型 ,从而使得算法的计算规模主要依赖于样本数而不是特征数 ,大大提高了计算速度。... 基因选择是基因芯片数据分析中的一个重要问题。基因选择的主要困难在于基因数远远大于实验样本数。在Fisher优化模型的基础上 ,提出了快速Fisher优化模型 ,从而使得算法的计算规模主要依赖于样本数而不是特征数 ,大大提高了计算速度。在公共数据中的实验表明该方法速度快 ,选择的基因对分类结果是有效的。 展开更多
关键词 基因芯片 基因选择 特征选择 Fisher优化模型
下载PDF
上一页 1 2 30 下一页 到第
使用帮助 返回顶部