期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

K-means聚类算法在肿瘤基因变异识别中的应用被引量：6

USING K-MEANS CLUSTERING ALGORITHM FOR CANCER GENE VARIANT DETECTING

下载PDF

导出

摘要二代测序NGS(Next-generation sequencing)数据的迅速发展加快人们对于基因的探索,同时也给测序数据分析任务带来更大的挑战。癌细胞特异变异的识别是测序数据分析的一项重要基础性工作。当前的变异识别工具大多采用贝叶斯模型方法,特异度、灵敏度和速度都远远满足不了需求。K-means是一种简洁高效的无监督聚类算法,基于此将位点信息映射成多维的特征,再进行类别个数为2的聚类过程。该算法明显提高了准确度和召回率,实验结果验证了算法的有效性。 The rapid development of next-generation sequencing data has accelerated the exploration of genes, and has also brought greater challenges to sequencing data analysis tasks. The identification of cancer-specific mutations is an important basic task in sequencing data analysis. Most of the current mutation identification tools use Bayesian model methods, but the specificity, sensitivity, and speed are far from meeting the needs. K-means is a concise and efficient unsupervised clustering algorithm. The algorithm mapped the site information into multidimensional features, and then carried out the clustering process with two classes. The algorithm improved the accuracy and recall rate obviously. Experimental results verify the effectiveness of the algorithm.

作者叶骁 Ye Xiao(Shanghai Key Lab of Intelligent Information Processing, School of Computer Science, Fudan University, Shanghai 200433, China)

机构地区复旦大学计算机科学技术学院智能信息处理重点实验室

出处《计算机应用与软件》北大核心 2019年第3期287-290,333,共5页 Computer Applications and Software

关键词 K-MEANS 变异识别二代测序 K-means Variant calling Next-generation sequencing

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献2

1孟倩.基于高通量测序的短序列生物数据压缩研究[J].计算机应用与软件,2017,34(4):22-27. 被引量：2
2郭占元,林涛.面向大规模数据快速聚类K-means算法的研究[J].计算机应用与软件,2017,34(5):43-47. 被引量：17

二级参考文献7

1牛新征,佘堃.面向大规模数据的快速并行聚类划分算法研究[J].计算机科学,2012,39(1):134-137. 被引量：22
2陈光平,王文鹏,黄俊.一种改进初始聚类中心选择的K-means算法[J].小型微型计算机系统,2012,33(6):1320-1323. 被引量：40
3张靖,段富.优化初始聚类中心的改进k-means算法[J].计算机工程与设计,2013,34(5):1691-1694. 被引量：56
4王秀华.基于随机抽样的加速K-均值聚类方法[J].计算机与现代化,2013(12):27-29. 被引量：7
5谢娟英,王艳娥.最小方差优化初始聚类中心的K-means算法[J].计算机工程,2014,40(8):205-211. 被引量：86
6韩岩,李晓.加速大数据聚类K-means算法的改进[J].计算机工程与设计,2015,36(5):1317-1320. 被引量：14
7王永贵,武超,戴伟.基于MapReduce的随机抽样K-means算法[J].计算机工程与应用,2016,52(8):74-79. 被引量：8

共引文献17

1禤世丽,刘建明.基于Hadoop平台的K-means聚类算法并行化改进研究[J].玉林师范学院学报,2020(3):90-96.
2鲍世方.基于Spark/GraphX图聚类算法的入室盗窃串并案研究[J].计算机应用与软件,2017,34(9):108-113.
3唐德权,史伟奇,张波云.基于多模态信息特征融合的犯罪预测算法研究[J].计算机应用与软件,2018,35(7):221-225. 被引量：6
4高瞻,余辰,向郑涛,陈宇峰.基于网格化的出租车空载寻客路径推荐[J].计算机应用与软件,2019,36(5):281-288. 被引量：6
5张洪瑞,卫文学,车吉鑫,邵婉露.基于DC-YOLO模型的建筑物砌体构件危险性等级鉴定方法[J].计算机应用与软件,2019,36(9):181-185. 被引量：3
6陈鹏,程思,鲍婷婷,翟伶俐,王宏斌.基于二分K均值聚类算法的数字档案优化[J].气象科技,2019,47(6):1032-1036. 被引量：4
7臧艳辉,席运江,赵雪章.基于MapReduce的分治k均值聚类方法[J].计算机工程与设计,2020,41(5):1345-1351. 被引量：8
8李顺勇,张钰嘉,彭晓庆,曹付元,刘恩乾.一种基于分层抽样的大数据快速聚类算法[J].计算机应用与软件,2020,37(10):256-261. 被引量：5
9黄俊义.基于语义分析的农业科技推广服务技术研究[J].佳木斯大学学报（自然科学版）,2020,38(6):138-144.
10姚瑶,周铜.基于局部序列比对相似度的用户会话聚类新方法[J].中州大学学报,2021,38(1):114-119.

同被引文献55

1蒋峰,党亚峥,何泽秀.求解LASSO问题的广义对称交替方向乘子算法[J].智能计算机与应用,2020(4):294-295. 被引量：2
2赵娟,彭彦昆,Sagar Dhakal,张雷蕾.基于机器视觉的苹果外观缺陷在线检测[J].农业机械学报,2013,44(S1):260-263. 被引量：43
3颜苏芊,黄翔,文力,王宁.蒸发冷却技术在我国各区域适用性分析[J].制冷空调与电力机械,2004,25(3):25-28. 被引量：22
4陈沛霖.间接蒸发冷却在我国适用性的分析[J].暖通空调,1994,24(5):3-5. 被引量：42
5花严红,曹阳.蒸发冷却空调系统在我国村镇的适用性研究[J].制冷学报,2008,29(5):49-53. 被引量：7
6饶秀勤,应义斌.水果按表面颜色分级的方法[J].浙江大学学报（工学版）,2009,43(5):869-871. 被引量：22
7江亿,谢晓云,于向阳.间接蒸发冷却技术——中国西北地区可再生干空气资源的高效应用[J].暖通空调,2009,39(9):1-4. 被引量：58
8狄育慧,刘加平,黄翔.蒸发冷却空调应用的气候适应性区域划分[J].暖通空调,2010,40(2):108-111. 被引量：46
9夏建平,周激流,何坤,刘昶,王东方.基于小波变换和Tucker分解的彩色图像数字水印[J].计算机应用研究,2010,27(2):798-800. 被引量：10
10张强,郝玉涛,杨双,马清波.露点间接蒸发冷却技术的研究进展及现状分析[J].制冷与空调,2010,10(1):17-22. 被引量：15

引证文献6

1刘艳峰,李娟,王莹莹,周勇.直接与露点间接蒸发冷却空调技术在我国的地区适用性研究[J].暖通空调,2019,49(12):8-14. 被引量：9
2温生毅,安娟,黄存强,赵雪,李宁可.基于改进K-means聚类算法的配电网区域规划方法研究[J].电子设计工程,2020,28(11):59-63. 被引量：3
3张婧婧,程芸涛,达新民.基于K-means聚类的苹果图像处理与分级设计[J].计算机与数字工程,2021,49(8):1656-1660. 被引量：9
4韩雁鹏,侯进,谭光鸿,罗朔.一种改进的SSD算法及其在车辆目标检测中的应用[J].计算机应用与软件,2021,38(11):191-196. 被引量：3
5丛眸,张平,王宁.改进YOLOv3算法及其在航拍图像车辆检测中的应用[J].计算机应用与软件,2023,40(1):228-233. 被引量：2
6宁玉门.基于稀疏正则低秩张量回归的基因组数据分析[J].计算机应用与软件,2023,40(11):64-71.

二级引证文献26

1陈新华.基于K-Means改进的算法在客户聚类中的应用[J].信息通信,2020(9):35-37. 被引量：2
2荣来誉.露点间接蒸发冷却器的研究概况分析[J].节能,2020,39(11):67-68. 被引量：1
3刘艳峰,汪雨菲,周勇,王莹莹.西北旱区居住建筑蒸发冷却空调适用技术类型分析[J].建筑科学,2021,37(8):9-16. 被引量：3
4林巧红,翁知颖,张国星.基于粒子群算法的中低压配电网无功补偿协同优化方法[J].电子设计工程,2021,29(20):134-137. 被引量：9
5曾婷婷,王玉娇,刘鸣,黄翔,杨立然.基于不同室外气候条件下蒸发冷却空调系统的性能分析[J].西安建筑科技大学学报（自然科学版）,2021,53(6):921-926. 被引量：3
6林海波,卢元栋,丁荣诚,修玉峰.基于图像处理与改进SVM的苹果多特征融合分级方法[J].山东农业科学,2022,54(6):141-149. 被引量：12
7于号,李征涛,王智楷,闫龙超,马林泉,高磊.间接蒸发冷却器在干湿模式下的冷却特性[J].化学工程,2022,50(6):38-42. 被引量：1
8郑新科,钮焱,李军.基于改进SSD算法的遥感图像目标检测研究[J].激光杂志,2022,43(7):106-112. 被引量：2
9颜苏芊,刘倩倩,秦莉,李彪.纺织厂空压机进气预处理与区域适用性研究[J].棉纺织技术,2022,50(10):11-15. 被引量：1
10Haibo LIN,Yuandong LU,Rongcheng DING,Yufeng XIU.A Multi-feature Fusion Apple Classification Method Based on Image Processing and Improved SVM[J].Agricultural Biotechnology,2022,11(5):84-91.

1苗晴,赖承栋.基于K-means聚类方法对广东省各市经济发展评价的研究[J].江西电力职业技术学院学报,2018,31(11):145-147. 被引量：2
2曹巍,张洪波,任冲锋,南政年,席秋义.陕北榆林地区河川径流变异类型的识别方法[J].西北农林科技大学学报（自然科学版）,2019,47(3):138-154. 被引量：3
3王振朝,白莉莎,宋伯尧.UDN中基于K-means聚类算法的干扰协调方案[J].计算机工程,2019,45(3):107-112. 被引量：7
4傅彦铭,李振铎.基于拉普拉斯机制的差分隐私保护k-means++聚类算法研究[J].信息网络安全,2019(2):43-52. 被引量：18
5杜静.任务驱动教学法在会计信息系统应用课程中的实践——以“企业建账”单元教学设计为例[J].职业,2019,0(7):70-71. 被引量：2
6夏宝林.夹具设计方案的分析与优化[J].四川职业技术学院学报,2019,29(1):144-147. 被引量：1
7张东月,周丽华,吴湘云,赵丽红.基于网格耦合的数据流聚类[J].软件学报,2019,30(3):667-683. 被引量：12
8夏茂,陈军浩.溶瘤麻疹病毒抗瘤治疗“瓶颈”与破解对策[J].现代肿瘤医学,2019,27(7):1252-1255.
9张旭,赵越.对外汉语中高级口语课堂任务型教学探讨[J].文学教育,2019,0(5):92-93. 被引量：1
10黄平,彭其渊,文超,李忠灿.高速铁路故障分类及其影响列车数模型[J].中国安全科学学报,2018,28(S2):46-53. 被引量：19

计算机应用与软件

2019年第3期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部