结构推理 基因表达谱中的数据缺失是怎么产生的?常用的数据补缺方法有哪些?
【正确答案】基因表达谱中的数据缺失大致分为两种类型:一种是非随机缺失,在这种情况下数据缺失跟基因的表达丰度有关,例如基因的表达丰度过低,背景值超过前景信号值;或基因的表达丰度过高,高表达基因的荧光强度值超过了最大能检测的信号强度阈值。对于这种情况,目前的数据补缺方法还没有很有效的方法。另一种是随机缺失,即基因表达谱中的数据缺失与基因表达值的高低无关,而是与其他的因素,例如杂交效能低、物理刮伤、指纹、灰尘、图像污染等有关,数据补缺处理对于这种情况比较有效。常用的数据补缺方法有简单补缺法、k近邻法、回归法等。
【答案解析】