期刊文献+
共找到84篇文章
< 1 2 5 >
每页显示 20 50 100
基于Stacking模型的学术论文多标签分类系统构建
1
作者 刘爱琴 郭少鹏 《国家图书馆学刊》 CSSCI 北大核心 2024年第2期96-104,共9页
学术论文高质量多标签自动分类是推动学术研究发展的关键程序之一。本研究利用Stacking模型将随机森林、支持向量机、极限树、极端梯度提升和神经网络五个分类器融合为一个异质集成分类器,并利用基于问题转换思想的多二分类模型将该分... 学术论文高质量多标签自动分类是推动学术研究发展的关键程序之一。本研究利用Stacking模型将随机森林、支持向量机、极限树、极端梯度提升和神经网络五个分类器融合为一个异质集成分类器,并利用基于问题转换思想的多二分类模型将该分类器应用于学术论文多标签分类。根据学术论文的特点,依次实现了与之配套的论文特征提取模块、TF-IDF加权模块、数据预处理模块,最终构建成一个面向学术论文的多标签分类系统。仿真实验验证了本研究构建的学术论文多标签分类系统在处理学术论文多标签分类问题时,较传统的单模型分类器或同质集成模型分类器在泛化能力、稳定性与准确率方面都有一定程度的提升。图9。参考文献21。 展开更多
关键词 论文分 Stacking模型 多标签分 二分模型
下载PDF
基于Logsitic回归模型和自适应密度聚类算法的分行业负荷增长规律
2
作者 朱涛 陈翔 +1 位作者 高强 孟庆楠 《电网与清洁能源》 2019年第5期20-28,共9页
电力企业营配大数据的持续积累为电力用户负荷发展规律的研究提供了良好的数据基础。传统分行业负荷特性研究方法在海量数据挖掘上存在一定局限性,且缺乏对用户负荷年度成长模式的研究。应用Logsitic回归模型自动识别电力用户的饱和水... 电力企业营配大数据的持续积累为电力用户负荷发展规律的研究提供了良好的数据基础。传统分行业负荷特性研究方法在海量数据挖掘上存在一定局限性,且缺乏对用户负荷年度成长模式的研究。应用Logsitic回归模型自动识别电力用户的饱和水平值和增长速度,形成3项用户增长特性参数。应用参数自适应的密度聚类算法,分不同行业、不同规模搜索典型用户,获取增长特性参数的典型值,形成分行业分容量的典型负荷成长曲线。所提方法能够识别电力用户的负荷成长模式,降低数据维度,具备较好的大数据处理分析效果。最后对某沿海城市3万个电力用户进行模型验证,结果表明所提方法识别度较高,经挖掘得到的分行业负荷发展规律对负荷预测、电网规划有较强的指导意义。 展开更多
关键词 logsitic模型 负荷成长模式 增长特性参数 应用密度聚算法 分行业负荷增长曲线
下载PDF
基于二分法的聚类负荷模型及其在电力系统可靠性评估中的应用 被引量:17
3
作者 鲁国起 张轶 +1 位作者 张焰 祝达康 《电力系统保护与控制》 EI CSCD 北大核心 2011年第10期31-36,共6页
目前用于可靠性评估的负荷模型主要有峰荷模型、分级负荷模型以及聚类负荷模型等,这些模型难以同时满足计算精度和计算复杂性的要求。建立了基于二分法的聚类负荷模型并将其应用到电力系统可靠性评估中。该模型利用二分法原理较快地确... 目前用于可靠性评估的负荷模型主要有峰荷模型、分级负荷模型以及聚类负荷模型等,这些模型难以同时满足计算精度和计算复杂性的要求。建立了基于二分法的聚类负荷模型并将其应用到电力系统可靠性评估中。该模型利用二分法原理较快地确定最佳分级数,利用快速排序算法和聚类技术将年负荷曲线中各负荷点归并到相应的负荷级,具有降低计算复杂性和提高模拟精度的特点,能较好地反映负荷实际变化趋势。应用该模型对IEEE-RTS79测试系统进行可靠性评估,通过比较几种不同负荷模型下的可靠性评估结果,说明所提模型准确可靠,计算量较小,具有应用价值。 展开更多
关键词 可靠性 负荷模型 二分 快速排序
下载PDF
基于二分类Logistic回归模型的太行山丘陵区县域耕地资源潜力估算 被引量:13
4
作者 高会 谭莉梅 +2 位作者 刘鹏 刘金铜 李晓荣 《中国生态农业学报》 CAS CSCD 北大核心 2017年第4期490-497,共8页
耕地红线划定与人-地资源矛盾日益突出背景下,耕地资源潜力的研究与开发日显重要。我国耕地面积近2/3分布在山区,因此山区耕地资源的合理开发利用及其资源潜力的研究尤为重要。本文以华北地区的太行山为研究区域,选择耕地占比和资源潜... 耕地红线划定与人-地资源矛盾日益突出背景下,耕地资源潜力的研究与开发日显重要。我国耕地面积近2/3分布在山区,因此山区耕地资源的合理开发利用及其资源潜力的研究尤为重要。本文以华北地区的太行山为研究区域,选择耕地占比和资源潜力最大的丘陵区典型县——河北省井陉县为研究案例,选取13个影响耕地资源潜力的基本生态要素,包括5个地形要素和8个直接气象要素或由气象要素计算得到的间接气象要素,引入二分类Logistic回归分析方法,运用偏最大似然估计向前引入法的拟合方法,筛选提取影响耕地资源潜力的关键生态要素;由模型参数Waldc2统计量分析影响耕地资源潜力的关键生态要素的贡献率排序;由模型参数回归系数β分析耕地资源潜力与生态要素的相关关系;由模型参数发生比率OR分析量化关键生态要素对耕地资源潜力的影响,最终建立Logistic回归模型。基于此模型,在GIS软件中得到井陉县耕地资源潜力分布图,进而估算出县域耕地资源潜力。研究结果表明:13个影响井陉县耕地资源潜力的基本生态要素中8个为关键生态要素;关键生态要素中地形要素配置比气象要素配置更为重要;年平均气温和寒冷指数与耕地资源潜力呈负相关关系,其余生态要素则呈正相关关系;由回归模型估算出井陉县具备垦殖为耕地资源的土地面积为60 400 hm^2,而根据遥感影像解译结果得出的现有耕地资源为45 600 hm^2,由此井陉县尚具有14 800 hm^2的后备耕地资源,相当于现有耕地面积的32.5%,这说明在不考虑垦殖所带来的可能负效应的前提下,井陉县具有较大的后备耕地资源开发潜力,该结论为井陉县后备耕地资源的开发与可持续利用提供了理论依据。 展开更多
关键词 太行山丘陵区 二分Logistic回归模型 生态要素 耕地资源潜力 后备耕地资源
下载PDF
纵向观测二分类数据的广义线性模型分析 被引量:3
5
作者 熊林平 曹秀堂 +1 位作者 徐勇勇 陆健 《第二军医大学学报》 CAS CSCD 北大核心 1999年第7期483-485,共3页
目的:利用广义线性模型对纵向观测二分类数据进行分析,充分考虑纵向观测间的相关性,给出一般分析方法。方法:采用Zeger和提出的广义估计方程,拟合logistic广义线性模型,讨论3种协方差矩阵结构。结果:同时获得回归... 目的:利用广义线性模型对纵向观测二分类数据进行分析,充分考虑纵向观测间的相关性,给出一般分析方法。方法:采用Zeger和提出的广义估计方程,拟合logistic广义线性模型,讨论3种协方差矩阵结构。结果:同时获得回归参数、相关参数的估计,完成了较为实用的运行程序,并进行了实例分析。结论:医学研究和临床试验中经常接触到纵向观测数据,对这类数据需采用特殊的方法进行分析处理,以解决重复观测间的相关性问题。 展开更多
关键词 纵向观测 二分数据 广义线性模型 卫生统计
下载PDF
相关二分类反应变量资料的Binomial-Poisson层次模型分析 被引量:2
6
作者 曹文君 李运明 +1 位作者 陈长生 李晨 《中国卫生统计》 CSCD 北大核心 2008年第6期570-572,共3页
目的探讨数据存在相关性时,二分类反应变量资料的统计分析方法。方法构建Binomial-Poisson层次模型,并结合毒理学实例与logistic回归模型进行比较。结果随机效应logistic回归模型和Binomial-Poisson层次模型都考虑了数据间的相关性,假... 目的探讨数据存在相关性时,二分类反应变量资料的统计分析方法。方法构建Binomial-Poisson层次模型,并结合毒理学实例与logistic回归模型进行比较。结果随机效应logistic回归模型和Binomial-Poisson层次模型都考虑了数据间的相关性,假设检验结论一致,但与传统logistic回归模型结论相反,而Binomial-poisson层次模型结果更加稳定。结论层次结构模型可有效分析相关二分类反应变量数据资料。 展开更多
关键词 LOGISTIC回归模型 Binomial-Poisson层次模型 二分反应 过度离散
下载PDF
基于生成模型的Q-learning二分类算法 被引量:1
7
作者 尚志刚 徐若灏 +2 位作者 乔康加 杨莉芳 李蒙蒙 《计算机应用研究》 CSCD 北大核心 2020年第11期3326-3329,3333,共5页
对于二分类问题,基于判别模型的分类器一般都是寻找一条最优判决边界,容易受到数据波动的影响。针对该问题提出一种基于生成模型的Q-learning二分类算法(BGQ-learning),将状态和动作分开编码,得到对应各类的判决函数,增加了决策空间的... 对于二分类问题,基于判别模型的分类器一般都是寻找一条最优判决边界,容易受到数据波动的影响。针对该问题提出一种基于生成模型的Q-learning二分类算法(BGQ-learning),将状态和动作分开编码,得到对应各类的判决函数,增加了决策空间的灵活性,同时在求解参数时,采用最小二乘时序差分(TD)算法和半梯度下降法的组合优化方法,加速了参数的收敛速度。设计实验对比了BGQ-learning算法与三种经典分类器以及一种新颖的分类器的分类性能,在UCI数据库七个数据集上的测试结果表明,该算法有着优良的稳定性以及良好的分类精确度。 展开更多
关键词 Q-LEARNING 生成模型 二分 最小二乘时序差分算法 半梯度下降法
下载PDF
二分类变量logistic回归模型下职业农民培育意愿分析 被引量:4
8
作者 唐现文 董海燕 吉文林 《江苏教育研究(职教)(C版)》 2013年第12期48-50,共3页
随着中国农业现代化进程的不断推进,职业农民在农业生产和经营过程中必将发挥更大的作用,将更多的农民培育成为职业农民是促进农业持续健康发展的必由之路。二分类变量logistic回归模型下职业农民培育意愿分析可为职业农民的培育提供参... 随着中国农业现代化进程的不断推进,职业农民在农业生产和经营过程中必将发挥更大的作用,将更多的农民培育成为职业农民是促进农业持续健康发展的必由之路。二分类变量logistic回归模型下职业农民培育意愿分析可为职业农民的培育提供参考依据。 展开更多
关键词 二分变量 LOGISTIC回归模型 职业农民 培育意愿 分析
下载PDF
超几何-正态模型在稀疏二分类数据Meta分析中的应用及R软件实现 被引量:1
9
作者 张天嵩 《中国循证儿科杂志》 CSCD 北大核心 2020年第5期385-387,共3页
本文介绍Stijnen等^([1])提出的超几何-正态模型(hypergeometricnormal model,HNM),并实例说明采用R软件拟合该模型的具体方法和步骤。1方法1.1研究数据数据来源于一项Meta分析^([2]),该研究主要观察β受体阻滞剂对充血性心力衰竭的干... 本文介绍Stijnen等^([1])提出的超几何-正态模型(hypergeometricnormal model,HNM),并实例说明采用R软件拟合该模型的具体方法和步骤。1方法1.1研究数据数据来源于一项Meta分析^([2]),该研究主要观察β受体阻滞剂对充血性心力衰竭的干预作用,本研究选择测量结局为病死率的相关数据,表1显示,纳入的22个研究中,有2个单零研究、5个双零研究,共含有7个变量。 展开更多
关键词 META分析 正态模型 充血性心力衰竭 R软件 Β受体阻滞剂 二分数据 数据来源 研究数据
下载PDF
基于医学检验大数据的乳腺恶性肿瘤预测模型研究
10
作者 王莹 《电脑知识与技术》 2024年第8期35-38,共4页
[目的]基于医学检验大数据,通过机器学习构建乳腺恶性肿瘤预测模型。[方法]收集某综合性三甲医院2016年至2021年所有门诊和住院乳腺恶性肿瘤患者的医学检验数据,并通过大数据技术处理形成机器学习数据源。采用逻辑回归二分类和支持向量... [目的]基于医学检验大数据,通过机器学习构建乳腺恶性肿瘤预测模型。[方法]收集某综合性三甲医院2016年至2021年所有门诊和住院乳腺恶性肿瘤患者的医学检验数据,并通过大数据技术处理形成机器学习数据源。采用逻辑回归二分类和支持向量机两种算法分别构建乳腺恶性肿瘤预测模型。[结果]逻辑回归二分类预测模型的AUC为0.923,F1-Score为0.875;支持向量机预测模型的AUC为0.957,F1-Score为0.912。[结论]综合评估结果显示,基于医学检验大数据构建的预测模型具有较高准确率,可以有效识别乳腺恶性肿瘤患者。因此,该模型有望成为乳腺恶性肿瘤的一种微创、低成本、快捷有效的筛查手段。 展开更多
关键词 医学检验大数据 乳腺恶性肿瘤 逻辑回归二分 支持向量机 预测模型
下载PDF
线性回归模型中响应值的选取对二分类问题的影响
11
作者 王小英 杨岩丽 陈常龙 《统计学与应用》 2015年第2期47-55,共9页
我们利用多元线性回归模型处理两个总体的分类问题,首先对响应变量按一定的规则赋值,并在最小二乘法的基础上构建判别函数及判别准则,进而论证了响应值的选取对平衡及不平衡数据二分类问题的影响。此外,我们将此判别方法与经典判别分析... 我们利用多元线性回归模型处理两个总体的分类问题,首先对响应变量按一定的规则赋值,并在最小二乘法的基础上构建判别函数及判别准则,进而论证了响应值的选取对平衡及不平衡数据二分类问题的影响。此外,我们将此判别方法与经典判别分析方法如:经典马氏距离判别法、Bayes判别法进行比较,并得到它们之间的内在联系及优缺点。 展开更多
关键词 二分问题 响应值选取 判别分析 线性回归模型 最小二乘法
下载PDF
卫生服务供方可及性对农村居民健康影响的实证分析——基于二分类Logistic回归模型 被引量:2
12
作者 陆莹 《保定学院学报》 2019年第3期33-38,共6页
基于中国家庭追踪调查CFPS2016的数据,运用二分类Logistic回归模型分析卫生服务供方可及性对农村居民健康状况的影响。实证分析结果发现:居民对医生的信任度对农村居民的健康状况有显著的正面影响,信任度越高,健康状况越好;就医机构等... 基于中国家庭追踪调查CFPS2016的数据,运用二分类Logistic回归模型分析卫生服务供方可及性对农村居民健康状况的影响。实证分析结果发现:居民对医生的信任度对农村居民的健康状况有显著的正面影响,信任度越高,健康状况越好;就医机构等级对农村居民的健康状况影响不显著;自付医疗费用对农村居民的健康有显著的负面影响,费用越高,健康状况越不好。此外,性别、年龄、婚姻、教育程度等控制变量对健康状况的影响相对不显著。 展开更多
关键词 卫生服务供方可及性 农村居民 健康 二分Logistic回归模型
下载PDF
基于Python的水下导航适配区分类预测研究
13
作者 王英鉴 蔡昌友 《测绘科学技术》 2024年第4期359-364,共6页
在探讨水下导航系统的区域适配性标定问题时,本研究首先对所提供的重力异常值数据集执行了插值算法,以增强基准图的分辨率。随后,采用Python编程语言实现的k-means聚类算法对数据进行空间分割,并对各个子区域进行精确标定。通过对标定... 在探讨水下导航系统的区域适配性标定问题时,本研究首先对所提供的重力异常值数据集执行了插值算法,以增强基准图的分辨率。随后,采用Python编程语言实现的k-means聚类算法对数据进行空间分割,并对各个子区域进行精确标定。通过对标定结果进行编码,并选取与研究目标密切相关的13个关键指标,运用主成分分析(PCA)方法进行降维处理,以简化模型复杂度并提取最具代表性的特征。进一步构建了逻辑回归模型,通过两次迭代优化,提高分类准确性。通过将模型预测结果与实际值进行比较,构建了接收者操作特征(ROC)曲线,以评估模型的预测性能。通过与标准编码的比较,验证了模型在预测分类区域适配性方面的有效性。在模型迁移性预测方面,对新数据集执行了相同的预处理流程,并在此基础上对仿真参数进行了调整,具体包括上下5%和10%的变动。通过灵敏度分析,绘制了参数变化与模型准确率之间的关系图,从而深入探讨了模型参数对预测结果的影响,进一步验证了模型的鲁棒性和适用性。综合分析结果表明,在推动“海洋强省”建设的战略背景下,实现海洋经济发展规划的关键之一在于海洋高新技术领域的创新。其中,水下导航与定位技术的适配区分类预测技术是核心技术之一。水下航行器在执行任务时,需确保自主性、无源性、高隐蔽性、不受地域和时间限制以及高精度的导航与定位能力。重力辅助导航技术是实现上述要求的有效方法之一。本研究的成果为水下导航系统的适配性标定提供了科学的方法论和技术支持,对于提升水下航行器的导航与定位能力具有重要意义。When exploring the regional adaptability calibration issue of underwater navigation systems, this study first performed interpolation algorithms on the provided gravity anomaly value dataset to enhance the resolution of the reference map. Subsequently, the k-means clustering algorithm, implemented in the Python programming language, was used to spatially segment the data and precisely calibrate each sub-region. The calibration results were encoded, and 13 key indicators closely related to the research objectives were selected for dimensionality reduction using Principal Component Analysis (PCA) to simplify model complexity and extract the most representative features. A logistic regression model was further constructed, and its classification accuracy was improved through two iterations of optimization. By comparing the model’s predicted results with actual values, a Receiver Operating Characteristic (ROC) curve was constructed to assess the model’s predictive performance. The effectiveness of the model in predicting regional adaptability was verified by comparing it with standard encoding. In terms of model translatability prediction, the same preprocessing procedures were performed on a new dataset, and simulation parameters were adjusted accordingly, including variations of 5% and 10% up and down. Through sensitivity analysis, a relationship diagram between parameter changes and model accuracy was plotted, thereby deeply exploring the impact of model parameters on prediction results and further verifying the model’s robustness and applicability. The comprehensive analysis results indicate that one of the keys to promoting the construction of a “Marine Strong Province” under the strategic background of ocean economic development planning lies in innovation in the field of marine high-tech. Among them, the classification prediction technology of adaptive areas for underwater navigation and positioning technology is one of the core technologies. Underwater vehicles need to ensure autonomy, passivity, high concealment, unrestricted by geography and time, and high-precision navigation and positioning capabilities when performing tasks. Gravity-assisted navigation technology is one of the effective methods to achieve the above requirements. The results of this study provide a scientific methodology and technical support for the adaptability calibration of underwater navigation systems, which is of great significance for enhancing the navigation and positioning capabilities of underwater vehicles. 展开更多
关键词 k均值聚模型 二进制编码 二分逻辑回归 灵敏度分析
下载PDF
单独二分类Logit模型在有序分类资料中的应用 被引量:1
14
作者 林党新 许涛 +2 位作者 沈念春 赖胜 邓政伟 《数理医药学杂志》 2010年第6期636-638,共3页
目的:通过幽门螺杆菌与胃癌癌前病变关系研究的资料,探讨单独二分类Logit模型中有序分类资料中的应用。方法:选择293名患有轻度萎缩性胃炎的患者,对病变进展的影响因素分析分别采用累积比数Logit模型和单独的二分类Logit模型,并对两... 目的:通过幽门螺杆菌与胃癌癌前病变关系研究的资料,探讨单独二分类Logit模型中有序分类资料中的应用。方法:选择293名患有轻度萎缩性胃炎的患者,对病变进展的影响因素分析分别采用累积比数Logit模型和单独的二分类Logit模型,并对两种模型的分析结果进行比较。结果:累积比数Logit模型分析结果显示幽门螺杆菌感染对胃癌癌前病变的影响无统计学意义(OR=1.158,95%CI:0.986-2.464),但得分检验发现幽门螺杆菌不满足累积比数Logit模型的比例优势假定条件(χ^2=24.100,P〈0.0001),故采用单独的二分类Logit模型进一步分析。结果表明,幽门螺杆菌阳性者比阴性者有更高的危险至少进展到重度萎缩性胃炎(OR=2.334,95%CI:1.402-3.885)。结论:幽门螺杆菌感染主要作用于胃癌癌前病变的早期阶段。对于有序分类资料的分析,选用模型时应注意其应用条件,若条件不满足最好换用其它更为恰当的方法。 展开更多
关键词 胃癌癌前病变 幽门螺杆菌 累积比数Logit模型 单独的二分Logit模型
下载PDF
基于二分类模型的电子档案管理技术研究
15
作者 许秀霓 《微型电脑应用》 2022年第5期159-163,共5页
随着互联网的飞速发展,电子公文的数量日益增多,以往纸质档案整编方式已经在工作中变得力不从心。鉴于此,研究对基于二分类模型的电子档案管理技术进行了优化设计。首先提出了训练数据的清洗与词向量的构建,其次是二分类模型构建及模型... 随着互联网的飞速发展,电子公文的数量日益增多,以往纸质档案整编方式已经在工作中变得力不从心。鉴于此,研究对基于二分类模型的电子档案管理技术进行了优化设计。首先提出了训练数据的清洗与词向量的构建,其次是二分类模型构建及模型调参,最后对本次研究提出的设计进行了测试分析。测试结果表明,提出的二分类模型将语义特征与数据统计特征进行了有机融合,可以更优的评价关键词语的权重,使得关键词的获取更加可靠,并且测试过程中受到数据影响波动非常小。 展开更多
关键词 二分模型 电子档案 管理技术 词向量
下载PDF
两水平两分类数据的logistic回归模型对比研究 被引量:18
16
作者 王可 赵华硕 +2 位作者 张虹 何鹏 黄水平 《中国卫生统计》 CSCD 北大核心 2014年第5期856-859,共4页
目的研究多水平模型在实际运用过程中的方法学问题,为以后此类具有层次性数据的正确分析提供参考。方法用徐州市区六所幼儿园中3-6岁儿童的资料建立二分类两水平logistic回归模型,并将模型所获得的结果与传统的多因素logistic回归模型... 目的研究多水平模型在实际运用过程中的方法学问题,为以后此类具有层次性数据的正确分析提供参考。方法用徐州市区六所幼儿园中3-6岁儿童的资料建立二分类两水平logistic回归模型,并将模型所获得的结果与传统的多因素logistic回归模型进行对比研究。结果二分类两水平logistic回归模型与传统的多因素logistic回归模型所筛选变量及假设检验基本一致,但二分类两水平logistic回归模型对个别指标的敏感性更强;对于有层次结构的数据,模型拟合优度显示二分类两水平logistic回归模型优于传统的多因素logistic回归模型,偏差信息判据(DIC)值分别为362.225和370.428。结论本研究将多水平模型应用于分类变量的层次结构数据中,作为此类数据分析的新途径,此方法具有更好的适用性,能够克服传统回归模型在处理具有层次结构数据中的局限性。 展开更多
关键词 多水平模型 二分两水平logistic回归模型 单纯性肥胖
下载PDF
具有相关关系的二分类资料处理方法比较 被引量:3
17
作者 张春茂 李婵娟 +1 位作者 蒋志伟 夏结来 《中国卫生统计》 CSCD 北大核心 2010年第5期464-466,469,共4页
目的探讨分析具有相关关系的二分类资料的有效处理方法。方法采用蒙特卡罗模拟比较广义估计方程和广义随机效应模型与一般logistic回归在处理具有相关关系的二分类资料的区别。结果一般logisitc回归处理相关关系的二分类资料时假阳性率... 目的探讨分析具有相关关系的二分类资料的有效处理方法。方法采用蒙特卡罗模拟比较广义估计方程和广义随机效应模型与一般logistic回归在处理具有相关关系的二分类资料的区别。结果一般logisitc回归处理相关关系的二分类资料时假阳性率增加。广义估计方程与广义随机效应模型是处理该类型资料时,I类错误能稳定控制在0.05左右,且检验效能基本一致。结论广义估计方程和广义随机效应模型是处理具有相关关系的二分类资料的合适方法,不能采用一般logistic回归代替。 展开更多
关键词 广义估计方程 广义随机效应模型 LOGISTIC回归 二分资料
下载PDF
利用SAS软件中的PROC GLIMMIX过程步实现二分类数据的网络meta分析
18
作者 陈掌珠 黄碧芬 郑建清 《中国卫生统计》 CSCD 北大核心 2022年第2期305-311,共7页
目的 介绍利用SAS软件中的PROC GLIMMIX过程步实现二分类数据的网络Meta分析。方法 以《高级Meta分析方法——基于Stata实现》一书第十七章第三节的戒烟率数据作为实例,利用SAS软件PROC GLIMMIX过程步实现基于广义线性混合效应模型的Met... 目的 介绍利用SAS软件中的PROC GLIMMIX过程步实现二分类数据的网络Meta分析。方法 以《高级Meta分析方法——基于Stata实现》一书第十七章第三节的戒烟率数据作为实例,利用SAS软件PROC GLIMMIX过程步实现基于广义线性混合效应模型的Meta分析,并提供编程代码。结果 PROC GLIMMIX过程步可以分别拟合固定效应模型NMA和随机效应模型NMA。实例数据的固定效应NMA分析显示,干预措施2、3、4与干预措施1相比的OR点估计值和95%CI分别为1.2531(0.9804,1.6026)、2.1231(1.8939,2.381)、2.2936(1.6287,3.2258);而随机效应分别为1.5898(0.7918,3.1949)、2.2026(1.4641,3.3113)、2.8011(1.3106,5.988)。结论 PROC GLIMMIX可以非常方便地拟合二分类数据的网络Meta分析,并通过均数差分图显示成对比较,具有直观的统计显示效果。 展开更多
关键词 二分数据 广义线性混合效应模型 网络Meta分析 SAS软件
下载PDF
基于医学检验大数据和机器学习构建慢性粒细胞白血病预测模型 被引量:1
19
作者 王莹 顾大勇 《智慧健康》 2023年第5期31-36,共6页
目的 通过大数据技术集成、治理、开发医学检验数据,构建慢性粒细胞白血病机器学习预测模型。方法 收集深圳市第二人民医院2016年10月1日-2021年9月30日全部就诊患者的全量医学检验数据并转化为大数据宽表,通过逻辑回归二分类算法构建... 目的 通过大数据技术集成、治理、开发医学检验数据,构建慢性粒细胞白血病机器学习预测模型。方法 收集深圳市第二人民医院2016年10月1日-2021年9月30日全部就诊患者的全量医学检验数据并转化为大数据宽表,通过逻辑回归二分类算法构建慢性粒细胞白血病机器学习预测模型并采用混淆矩阵和二分类评估两种方法分别进行评估。结果 基于1301项医学检验项目生成的机器学习预测模型的二分类评估结果:AUC为0.9776,F1Score为0.9232;混淆矩阵评估结果:准确率为94.518%,精确率为92.575%,召回率为91.947%。结论 本研究基于真实医学检验大数据,构建的慢性粒细胞白血病机器学习预测模型能够区分慢性粒细胞白血病患者与普通人,有望成为一种新的慢性粒细胞白血病的快速、非侵入式、普适性的辅助诊断方法。 展开更多
关键词 慢性粒细胞白血病 大数据 机器学习 逻辑回归二分 预测模型
下载PDF
基于GMM和二分类特征筛选的多级音频分类方法
20
作者 高前勇 戴蓓蒨 许东星 《中国科学技术大学学报》 CAS CSCD 北大核心 2007年第12期1466-1471,共6页
采用同一种特征参数——Mel倒谱系数及其动态参数区分纯语音、带背景语音、乐器音、歌声和环境音.根据该特征参数的特点以及各类音频之间的差异,给出了一种区分性模型训练和特征筛选相结合的多级二分类音频分类方法,即为各级建立GMM(Gau... 采用同一种特征参数——Mel倒谱系数及其动态参数区分纯语音、带背景语音、乐器音、歌声和环境音.根据该特征参数的特点以及各类音频之间的差异,给出了一种区分性模型训练和特征筛选相结合的多级二分类音频分类方法,即为各级建立GMM(Gaussian mixture model)模型的同时挑选出使当前模型区分程度达到最大的特征子集.对长约2 h的音频数据集的测试结果表明,该方法相对于特征筛选前的分类系统,平均误识率下降了约23.5%,且各二分类子系统的特征维数也有明显地减少. 展开更多
关键词 音频分 Mel倒谱系数及其动态参数 区分性模型训练 特征筛选 多级二分方法
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部