结构推理
某医院对200名高血压患者和200名对照个体进行检测,通过限制性内切酶方法对采自这些个体的外周血淋巴细胞进行分析,获得了SNP rs39461的基因型(如下图),假定此次研究不存在采样上的缺陷,问这个SNP是否与高血压的发生相关?
高血压病人及对照个体的基因型统计表
分组基因型合计
CCCTTT
疾病组
对照组3
336
57161
140200
200
合计693301400
【正确答案】分析过程:在一般的SNP分型实验中,我们首先获得的数据就是个体的基因型数据,对这些个体按疾病和对照组进行统计就能得到类似于上表的统计表格。根据学过的统计学知识,我们知道,这个例题事实上是一个两样本频数(计数资料)差异比较问题,如果直接从基因型频率考虑,这个问题适用于自由度为2的卡方检验,那么,我们可以通过下面的过程进行解答:
解:(1)建立检验假,确定检验水准
:在检测群体中,这个SNP与高血压的发生相关
:在检测群体中,这个SNP与高血压的发生不相关
α=0.05
(2)计算检验统计量
,
n为总例数,R、C分别为行数和列数,为每格的频数,v为自由度,将表格中各数值代入公式得,。
(3)确定p值,作出推论
查表得,按α=0.05的水准,接受,即在此检测群体中,SNPrs39461与高血压的发生没有相关性。
注:这个问题也可以先将基因型频数信息转换为等位频数信息,然后采用四格表卡方检验进行处理。
【答案解析】