期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于约束的混合类型数据因果推断方法构建研究
1
作者 侯爽 栗景坤 +2 位作者 刘梦洋 郭瑞泽 刘美娜 《中国卫生统计》 CSCD 北大核心 2023年第2期167-171,共5页
目的构建适用于含隐变量混合数据类型的因果推断方法,通过模拟研究评估方法的效果,为观察性数据的因果结构研究提供依据。方法基于约束的FCI-stable结构学习方法,结合条件高斯独立性检验,建立适用于含隐变量混合数据类型的因果推断算法... 目的构建适用于含隐变量混合数据类型的因果推断方法,通过模拟研究评估方法的效果,为观察性数据的因果结构研究提供依据。方法基于约束的FCI-stable结构学习方法,结合条件高斯独立性检验,建立适用于含隐变量混合数据类型的因果推断算法框架。利用Tetrad 6.9.0生成含隐变量的混合类型模拟数据,模拟研究设置不同的离散型数据占比、隐变量占比、网络节点数量及样本量;将FCI_(cg)方法与基于约束的FCI_(chi-square)、FCI_(dg)、FCIF_(fisher-z)、FCI_(kci)及FCI_(mrcit)五种方法进行比较,采用F1 Score和马修斯相关系数(matthews correlation coefficient,MCC)对因果结构识别效果进行评估。结果本研究建立了适用于含隐变量混合数据类型的因果推断方法FCI_(cg),该方法可用于从观察性数据中学习变量间的因果结构。模拟结果表明,在不同离散型数据占比下,除FCI_(chi-square)和FCIF_(fisher-z)外,其他方法估计效果较稳定,FCI_(cg)和FCI_(kci)的估计效果优于FCIdg和FCI_(mrcit);在有无隐变量和隐变量占比随之增加的情况下,除FCI_(mrcit)外其他方法估计效果的变化较平缓,FCIcg和FCIFkci的估计效果好于其他方法;在不同网络大小的情况下,除FCI_(mrcit)外其他方法评估效果较稳定;随着样本数量的增加,FCI_(cg)和FCIF_(fisher-z)估计效果稳步提升;当样本数量为2000,网络节点数量为14时,FCI_(cg)的平均运行时间为(0.580±0.301)秒。结论本文构建的因果推断方法针对含有隐变量的混合数据类型具有良好的效果,算法运行速度快;本方法可作为医学领域观察性数据因果结构识别的推荐方法。 展开更多
关键词 隐变量 混合数据类型 因果推断 观察性数据
下载PDF
基于生成对抗网络的混合类型数据生成方法
2
作者 魏宁 汪龙志 董方敏 《计算机应用与软件》 北大核心 2022年第6期29-34,共6页
为解决由于隐私保护政策中研究人员在获取训练数据时经常受到限制而导致训练数据集匮乏问题,提出一种基于生成对抗网络(Generative Adversarial Networks,GANs)的混合数据(数值和标签)生成模型(mixGAN)用来生成符合真实数据分布的合成数... 为解决由于隐私保护政策中研究人员在获取训练数据时经常受到限制而导致训练数据集匮乏问题,提出一种基于生成对抗网络(Generative Adversarial Networks,GANs)的混合数据(数值和标签)生成模型(mixGAN)用来生成符合真实数据分布的合成数据,以此作为真实数据的补充并增加可用样本的数量。该模型使用预训练的自编码器(Autoencoder)将给定数据集映射到低维连续空间;通过在低维空间中的生成器和原始数据空间中的鉴别器进行对抗学习从而获得具有模拟真实数据的生成模型。通过从属性独立分布和多属性相关性两个方面对生成算法性能进行评估,表明所提出算法比目前其他基于深度学习的生成算法能更好地保持原始数据的分布结构。 展开更多
关键词 生成对抗网络 自编码器 混合类型数据
下载PDF
混合类型数据的聚类算法综述
3
作者 陈绪 严金戈 《信息与电脑》 2018年第7期136-138,共3页
在所有数据挖掘的算法中,聚类算法尤为重要。在实际应用中,数据大多是混合型的数据,既包含数值型,又包含分类型数据。因此,对混合数据进行聚类分析越来越重要。笔者首先介绍了聚类的定义,然后详细阐述了K-prototype聚类算法的基本原理,... 在所有数据挖掘的算法中,聚类算法尤为重要。在实际应用中,数据大多是混合型的数据,既包含数值型,又包含分类型数据。因此,对混合数据进行聚类分析越来越重要。笔者首先介绍了聚类的定义,然后详细阐述了K-prototype聚类算法的基本原理,最后详细介绍了近年来各学者对混合类型数据的聚类算法的研究现状和其具体应用。 展开更多
关键词 混合数据类型 聚类 数据挖掘 K-prototype聚类算法
下载PDF
数值型和分类型混合数据的模糊K-Prototypes聚类算法(英文) 被引量:47
4
作者 陈宁 陈安 周龙骧 《软件学报》 EI CSCD 北大核心 2001年第8期1107-1119,共13页
由于数据库经常同时包含数值型和分类型的属性 ,因此研究能够处理混合型数据的聚类算法无疑是很重要的 .讨论了混合型数据的聚类问题 ,提出了一种模糊 K- prototypes算法 .该算法融合了 K- means和 K- modes对数值型和分类型数据的处理... 由于数据库经常同时包含数值型和分类型的属性 ,因此研究能够处理混合型数据的聚类算法无疑是很重要的 .讨论了混合型数据的聚类问题 ,提出了一种模糊 K- prototypes算法 .该算法融合了 K- means和 K- modes对数值型和分类型数据的处理方法 ,能够处理混合类型的数据 .模糊技术体现聚类的边界特征 ,更适合处理含有噪声和缺失数据的数据库 .实验结果显示 。 展开更多
关键词 数据 数值型混合数据 类型混合数据 模糊K-Prototypes聚类算法
下载PDF
指标及权重均为混合数据类型的广义灰靶决策方法 被引量:7
5
作者 马金山 《统计与决策》 CSSCI 北大核心 2018年第7期58-61,共4页
决策方案指标及权重均为混合数据类型的广义灰靶决策方法,无法采用传统处理确定性数的方法进行方案的集成。为此,文章基于二元联系数向量分别对指标和权重进行处理,然后再进行集成。首先将混合数据类型的指标值及权重值均转化为二元联... 决策方案指标及权重均为混合数据类型的广义灰靶决策方法,无法采用传统处理确定性数的方法进行方案的集成。为此,文章基于二元联系数向量分别对指标和权重进行处理,然后再进行集成。首先将混合数据类型的指标值及权重值均转化为二元联系数向量,基于二元联系数向量计算各方案的各单指标向量与靶心指标向量的接近度并归一化;其次计算各指标权重的二元联系数向量的模并经归一化后作为各自的确定性权重;最后结合求得各方案各单指标的接近度融入各指标的确定性的权重求各方案的综合接近度,以其越小方案越优。算例分析表明所提出的方法较好地解决了指标及权重均为混合属性值的广义灰靶决策方法的集成问题。 展开更多
关键词 权重 混合数据类型 广义灰靶决策方法 二元联系数
下载PDF
利用划分方法进行混合数据聚类 被引量:1
6
作者 梁红 《地理空间信息》 2011年第6期18-20,5,共3页
目前常用的几种基于划分的聚类方法主要处理数值型数据,能有效处理实际应用领域中常用的包括数值和符号混合数据的聚类算法则较少。基于此问题,文章根据k均值、k中心点和k众数等基于划分的聚类方法各自的特点,对其进行集成与改进,提出... 目前常用的几种基于划分的聚类方法主要处理数值型数据,能有效处理实际应用领域中常用的包括数值和符号混合数据的聚类算法则较少。基于此问题,文章根据k均值、k中心点和k众数等基于划分的聚类方法各自的特点,对其进行集成与改进,提出一种能够应用于混合类型数据的聚类分析方法,即将所有的混合类型变量转换到共同的标度区间[0.0,1.0]中,根据合并处理的相异度计算公式计算对象之间的相异度;对于聚类中心中的各变量采取适合于相应类型的最佳方法进行独立更新,从而实现混合类型变更量数据的有效聚类。 展开更多
关键词 划分方法 聚类分析 混合类型数据 相异度
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部