期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
一种海量数据的分析技术——符号数据分析及应用 被引量:19
1
作者 胡艳 王惠文 《北京航空航天大学学报(社会科学版)》 2004年第2期40-44,共5页
传统的统计分析方法在处理海量数据方面存在很大的局限性。为了解决这一问题,符号数据分析(symbolicdataanalysis,SDA)方法被提出并得到了迅速的发展。SDA方法对传统的数据概念做了本质性的扩张,运用'数据打包'的理念,对海量的... 传统的统计分析方法在处理海量数据方面存在很大的局限性。为了解决这一问题,符号数据分析(symbolicdataanalysis,SDA)方法被提出并得到了迅速的发展。SDA方法对传统的数据概念做了本质性的扩张,运用'数据打包'的理念,对海量的原始数据在不破坏其原有内在逻辑关系的前提下,可以进行变量和样本点空间的双重降维,并将传统的统计分析技术扩展到符号数据分析体系中。符号数据的方法体系是知识发现和数据管理领域的最新研究方向之一,目前在国内鲜有相关的研究资料。文章详细阐述了符号数据因素分析技术的原理和概念,并以中国股票市场为案例研究背景,结果表明,SDA因素分析技术对综合简化大规模多维数据系统是十分有效的。 展开更多
关键词 符号数据分析(SDA) 海量数据 数据打包 双重降维 股票市场
下载PDF
基于模态符号数据分析的混合推荐算法 被引量:2
2
作者 郭均鹏 李嫒嫒 +1 位作者 宁静 王启鹏 《系统工程》 CSSCI CSCD 北大核心 2014年第4期111-116,共6页
传统混合推荐算法基于点数据来描述用户模型,存在信息丢失、难以统筹考虑用户所有偏好信息等问题,严重影响了推荐系统的质量和效率。针对该问题,以符号数据为基础,建立了基于模态符号数据分析的混合推荐算法。用模态符号数据对用户建模... 传统混合推荐算法基于点数据来描述用户模型,存在信息丢失、难以统筹考虑用户所有偏好信息等问题,严重影响了推荐系统的质量和效率。针对该问题,以符号数据为基础,建立了基于模态符号数据分析的混合推荐算法。用模态符号数据对用户建模,引入模态符号数据的距离度量计算用户兴趣模型间的相似性,同时整合用户人口统计信息的相似性,形成用户的综合相似性,最终完成推荐。实验结果表明论文方法在应对数据稀疏性及新用户问题时,具有更高的推荐精度。 展开更多
关键词 符号数据分析 混合推荐 用户模型 人口统计信息 综合相似度
原文传递
区间型符号数据的因子分析及其应用 被引量:1
3
作者 李汶华 郭均鹏 高峰 《管理工程学报》 CSSCI 北大核心 2009年第4期100-103,共4页
符号数据分析是一种新兴的数据挖掘技术,区间数是最常用的一种符号数据。基于误差分析理论,研究针对区间数据的因子分析方法。将区间数看作一个由中点和半径构成的有序偶,并将半径视为区间数的极限误差。对中点样本阵进行因子分析,得到... 符号数据分析是一种新兴的数据挖掘技术,区间数是最常用的一种符号数据。基于误差分析理论,研究针对区间数据的因子分析方法。将区间数看作一个由中点和半径构成的有序偶,并将半径视为区间数的极限误差。对中点样本阵进行因子分析,得到因子得分的中点值。然后将半径样本阵按照误差传递公式,得到因子得分的极限误差。由因子得分的中点值和极限误差最终得到因子得分的区间值。最后以股票的市场综合表现评价问题为案例,进行了应用研究。 展开更多
关键词 符号数据分析 因子分析 区间数 误差分析 股票
下载PDF
符号数据典型相关分析技术及其在股市分析中的应用
4
作者 王立元 《系统工程》 CSCD 北大核心 2004年第8期91-95,共5页
采用一种针对大规模复杂数据的分析技术——符号数据分析方法(SymbolicDataAnalysis,SDA),以中信证券风格指数作为研究对象,对2002年中国股票市场的财务指标与市场表现进行典型相关分析。研究结果表明,中国股市财务状况与市场表现相关... 采用一种针对大规模复杂数据的分析技术——符号数据分析方法(SymbolicDataAnalysis,SDA),以中信证券风格指数作为研究对象,对2002年中国股票市场的财务指标与市场表现进行典型相关分析。研究结果表明,中国股市财务状况与市场表现相关性明显,上市公司的收益状况、偿债能力、资金管理能力及价值/成长因素决定股票的运行状况,不同风格股票在财务-市场关系方面差异性显著,行业特征明显。通过分析可以看到,运用符号数据对中国股市运行特征进行的分析结论与客观现实非常吻合,从而证明使用符号数据的典型相关分析技术对大规模多维动态数据系统进行统计分析是十分有效的。 展开更多
关键词 符号数据分析(SDA) 典型相关分析 股票市场 风格指数
下载PDF
大数据背景下的规划产业选择研究——基于区间型符号数据因子分析
5
作者 高峰 《未来与发展》 2016年第3期44-48,共5页
产业方向的选择是规划编制中的重要问题。在大数据背景下,从微观角度——海量企业数据入手进行产业分析与选择,为精确决策提供了可能。基于区间型符号数据的因子分析法可以有效针对大数据进行"打包"分析,弥补传统方法的不足... 产业方向的选择是规划编制中的重要问题。在大数据背景下,从微观角度——海量企业数据入手进行产业分析与选择,为精确决策提供了可能。基于区间型符号数据的因子分析法可以有效针对大数据进行"打包"分析,弥补传统方法的不足。本研究阐述了区间分析在科技规划编制中的优势,介绍了区间型符号数据因子分析方法,并从海量企业基础数据出发,对天津科技规划中产业选择做了实证研究。 展开更多
关键词 数据 区间型符号数据因子分析 规划 产业选择
下载PDF
一般分布区间型符号数据的K均值聚类方法 被引量:11
6
作者 郭均鹏 陈颖 李汶华 《管理科学学报》 CSSCI 北大核心 2013年第3期21-28,共8页
对于区间型符号数据聚类分析的研究,现有方法大多假设个体在区间内服从均匀分布,这往往并不符合实际情况.针对此问题,研究一般分布的区间型符号数据K均值聚类方法,给出了一般分布区间型符号数据的定义,并基于经验分布理论研究其描述统计... 对于区间型符号数据聚类分析的研究,现有方法大多假设个体在区间内服从均匀分布,这往往并不符合实际情况.针对此问题,研究一般分布的区间型符号数据K均值聚类方法,给出了一般分布区间型符号数据的定义,并基于经验分布理论研究其描述统计.基于Hausdorff距离,考虑区间数所包含个体的分布信息,提出了一种新的区间型符号数据距离度量.给出了一般分布的区间型符号数据K均值聚类算法.通过随机模拟试验对该方法进行了有效性评价,结论表明,在各种实验设计的条件下,考虑一般分布的K均值聚类算法有效性均优于均匀分布假设下的K均值聚类算法.最后将文中方法应用于汽车的聚类分析,进一步体现了文中方法在解决实际问题中的优势. 展开更多
关键词 区间数 一般分布 符号数据分析 聚类分析
下载PDF
基于区间型符号数据的群组推荐算法研究 被引量:7
7
作者 郭均鹏 宁静 史志奇 《计算机应用研究》 CSCD 北大核心 2013年第1期67-71,共5页
传统群组推荐算法基于点数据描述群组用户模型,存在着信息缺失、很难统筹考虑所有个体用户的需求等问题。针对该问题,对个体评分数据按照符号数据分析的思想进行"打包",将群组成员的评分信息汇总为区间型符号数据。在Hausdorf... 传统群组推荐算法基于点数据描述群组用户模型,存在着信息缺失、很难统筹考虑所有个体用户的需求等问题。针对该问题,对个体评分数据按照符号数据分析的思想进行"打包",将群组成员的评分信息汇总为区间型符号数据。在Hausdorff距离基础上,采用区间内部点数据的描述统计量,提出了一种全新的区间数距离度量方法,并利用这种距离对区间型符号数据描述的群组实施K-均值聚类,由此确定相似群组,最后通过最近邻的评分预测目标群组的评分。将这种全新的群组推荐算法与传统方法进行推荐精度与效率的对比实验,结果表明,在各种实验条件下,基于区间型符号数据的群组推荐算法均优于传统点数据的群组推荐算法。 展开更多
关键词 群组推荐 符号数据分析 聚类分析
下载PDF
一种基于符号数据的群体推荐算法 被引量:6
8
作者 郭均鹏 高成菊 赵旻昊 《系统工程学报》 CSCD 北大核心 2015年第1期127-134,共8页
基于符号数据分析所具有的能够有效地对海量数据进行降维并从整体上把握样本属性的优势,设计了基于区间型和分布式符号数据的模型建立方法,分别建立符号数据描述的目标群体用户模型和目标项目模型,并将目标项目模型分解为积极子模型和... 基于符号数据分析所具有的能够有效地对海量数据进行降维并从整体上把握样本属性的优势,设计了基于区间型和分布式符号数据的模型建立方法,分别建立符号数据描述的目标群体用户模型和目标项目模型,并将目标项目模型分解为积极子模型和消极子模型来表示.进而计算目标群体模型与目标项目积极子模型、消极子模型之间的相似度,最终产生推荐.选取为群体用户推荐美食作为实例,通过大众点评网收集用户评分数据,对文中算法进行评价,结果表明该算法能取得良好的推荐精度,且在群体较小及数据稀疏时,推荐质量明显优于传统基于点数据描述群体用户模型的协同过滤算法. 展开更多
关键词 符号数据分析 群体推荐 区间型符号数据 分布式符号数据
下载PDF
改进的基于符号数据的协同过滤推荐算法 被引量:3
9
作者 郭均鹏 陈莹莹 《计算机应用》 CSCD 北大核心 2011年第11期3060-3062,3067,共4页
随着用户和资源种类的不断增加,评价矩阵的稀疏性问题越来越突出,严重影响了推荐系统的推荐质量。奇异值分解(SVD)是一种对数据进行降维处理的方法,符号数据分析(SDA)是一种处理海量数据的全新数据分析思路。提出一种改进的基于符号数... 随着用户和资源种类的不断增加,评价矩阵的稀疏性问题越来越突出,严重影响了推荐系统的推荐质量。奇异值分解(SVD)是一种对数据进行降维处理的方法,符号数据分析(SDA)是一种处理海量数据的全新数据分析思路。提出一种改进的基于符号数据的协同过滤推荐算法,即将奇异值分解和符号数据分析方法结合起来运用到推荐系统中。在EachMovie数据库集上的实验结果表明该算法在数据稀疏时的推荐质量明显优于传统的推荐算法。 展开更多
关键词 协同过滤 符号数据分析 奇异值分解 稀疏性 推荐系统
下载PDF
两种区间数据主成分分析方法的比较研究 被引量:2
10
作者 王惠文 李岩 关蓉 《北京航空航天大学学报(社会科学版)》 CSSCI 2011年第4期86-89,共4页
针对顶点主成分分析算法(VPCA)计算量会随着变量个数的增加而按指数速度增长的问题,Cazes P提出一种简化算法,通过直接计算VPCA的相关系数矩阵,可以消除大量的冗余计算,解决VPCA的维数灾难问题。文章通过对这两种方法的计算过程和计算... 针对顶点主成分分析算法(VPCA)计算量会随着变量个数的增加而按指数速度增长的问题,Cazes P提出一种简化算法,通过直接计算VPCA的相关系数矩阵,可以消除大量的冗余计算,解决VPCA的维数灾难问题。文章通过对这两种方法的计算过程和计算结果进行比较,说明这两种方法在计算结果上是完全等价的,但是,Cazes P提出的简化算法的计算过程更简单、所占据的存储空间更小、计算速度更快,实验分析进一步验证了理论分析的相关结论。 展开更多
关键词 符号数据分析 区间数据 主成分分析 VPCA 相关系数矩阵
下载PDF
区间型符号数据的特征选择方法 被引量:2
11
作者 郭崇慧 刘永超 《运筹与管理》 CSSCI CSCD 北大核心 2015年第1期67-74,共8页
对区间型符号数据进行特征选择,可以降低数据的维数,提取数据的关键特征。针对区间型符号数据的特征选择问题,本文提出了一种新的特征选择方法。首先,该方法使用区间数Hausdorff距离和区间数欧氏距离度量区间数的相似性,通过建立使得样... 对区间型符号数据进行特征选择,可以降低数据的维数,提取数据的关键特征。针对区间型符号数据的特征选择问题,本文提出了一种新的特征选择方法。首先,该方法使用区间数Hausdorff距离和区间数欧氏距离度量区间数的相似性,通过建立使得样本点与样本类中心相似性最大的优化模型来估计区间型符号数据的特征权重。其次,基于特征权重构建相应的分类器来评价所估计特征权重的优劣。最后,为了验证本文方法的有效性,分别在人工生成数据集和真实数据集上进行了数值实验,数值实验结果表明,本文方法可以有效地去除无关特征,识别出与类标号有关的特征。 展开更多
关键词 符号数据分析 特征选择 最近邻分类器 区间型数据
下载PDF
数据挖掘中区间数据模糊聚类研究——基于Wasserstein测度 被引量:2
12
作者 李红 孙秋碧 《计算机工程与应用》 CSCD 2012年第12期24-28,37,共6页
针对目前区间数据模糊聚类研究中区间距离定义存在的局限性,引入能够考虑区间数值分布特征的Wasserstein距离测度,提出基于Wasserstein距离测度的单指标和双指标自适应模糊聚类算法及迭代模型。通过仿真实验和CR指数,证实了该类模型的... 针对目前区间数据模糊聚类研究中区间距离定义存在的局限性,引入能够考虑区间数值分布特征的Wasserstein距离测度,提出基于Wasserstein距离测度的单指标和双指标自适应模糊聚类算法及迭代模型。通过仿真实验和CR指数,证实了该类模型的优势。该算法在海量、堆积如山的数据挖掘中有着重要的实践意义。 展开更多
关键词 模糊聚类 区间数据 符号数据分析 自适应
下载PDF
一般分布区间型符号数据的描述统计与分析 被引量:15
13
作者 郭均鹏 李汶华 高峰 《系统工程理论与实践》 EI CSSCI CSCD 北大核心 2011年第12期2367-2372,共6页
以对大规模个体数据通过打包形成的区间型符号数据为研究对象,针对个体在区间内往往不服从均匀分布的实际情况,研究一般分布的区间型符号数据的描述统计和分析方法.对符号数据分析进行了概述,并定义了一般分布的区间变量.研究了一般分... 以对大规模个体数据通过打包形成的区间型符号数据为研究对象,针对个体在区间内往往不服从均匀分布的实际情况,研究一般分布的区间型符号数据的描述统计和分析方法.对符号数据分析进行了概述,并定义了一般分布的区间变量.研究了一般分布的区间变量的经验分布函数和经验联合分布函数.在此基础上,讨论了一般分布区间变量的描述统计量的求解.最后给出了算例,运用一般分布区间型符号数据的因子分析方法.以中国股市为背景进行了应用研究.结论表明:以往研究基于均匀分布假设所给出的描述统计量的计算,可看作文中所给求解公式的特例.另外,研究方法基于经验分布理论,无需知道个体在区间内服从分布函数的具体表达式,且在计算过程中充分利用了区间内的个体信息. 展开更多
关键词 符号数据分析 区间数据 描述统计 一般分布
原文传递
一般分布区间型符号数据的SOM聚类方法 被引量:2
14
作者 郭均鹏 汪伟立 +2 位作者 王明璐 刘荣荣 李汶华 《数理统计与管理》 CSSCI 北大核心 2016年第6期1002-1015,共14页
区间型符号数据是一种重要的符号数据类型,现有文献往往假设区间内的点数据服从均匀分布,导致其应用的局限性。本文基于一般分布的假设,给出了一般分布区间型符号数据的扩展的Hausdorff距离度量,基于此提出了一般分布的区间型符号数据的... 区间型符号数据是一种重要的符号数据类型,现有文献往往假设区间内的点数据服从均匀分布,导致其应用的局限性。本文基于一般分布的假设,给出了一般分布区间型符号数据的扩展的Hausdorff距离度量,基于此提出了一般分布的区间型符号数据的SOM聚类算法。随机模拟试验的结果表明,基于本文提出的基于扩展的Hausdorff距离度量的SOM聚类算法的有效性优于基于传统Hausdorff距离度量的SOM聚类算法和基于μσ距离度量的SOM聚类算法。最后将文中方法应用于气象数据的聚类分析,示例文中方法的应用步骤与可操作性,并进一步评价文中方法在解决实际问题中的有效性。 展开更多
关键词 区间数 一般分布 符号数据分析 聚类分析 自组织映射
原文传递
区间数据典型相关分析技术及其在股市分析中的应用 被引量:3
15
作者 王立元 胡艳 王惠文 《系统工程理论与实践》 EI CSCD 北大核心 2005年第1期128-133,共6页
 采用一种针对大规模复杂数据的分析技术——符号数据分析方法(SymbolicDataAnalysis简称SDA),以中信证券风格指数作为研究对象,对2002年中国股票市场的财务指标与市场表现进行典型相关分析.研究结果表明,中国股市财务状况与市场表现...  采用一种针对大规模复杂数据的分析技术——符号数据分析方法(SymbolicDataAnalysis简称SDA),以中信证券风格指数作为研究对象,对2002年中国股票市场的财务指标与市场表现进行典型相关分析.研究结果表明,中国股市财务状况与市场表现相关性明显,上市公司的收益状况、偿债能力、资金管理能力及价值/成长因素决定股票的运行状况,不同风格股票在财务-市场关系方面差异性显著,行业特征明显.通过分析可以看到,运用符号数据对中国股市运行特征进行的分析结论与客观现实非常吻合,从而证明使用符号数据的典型相关分析技术对大规模多维动态数据系统进行统计分析是十分有效的. 展开更多
关键词 符号数据分析(SDA) 典型相关分析 股票市场 风格指数
原文传递
股票综合评价的符号数据PCA方法 被引量:2
16
作者 李汶华 郭均鹏 《数理统计与管理》 CSSCI 北大核心 2009年第4期730-735,共6页
符号数据分析是一种新兴的数据挖掘技术,区间数是最常用的一种符号数据。研究应用区间型符号数据的PCA方法来评价股票的市场综合表现问题。首先介绍了符号数据分析的基本理论。接下来研究了区间数据样本的经验描述统计量的计算,并基于... 符号数据分析是一种新兴的数据挖掘技术,区间数是最常用的一种符号数据。研究应用区间型符号数据的PCA方法来评价股票的市场综合表现问题。首先介绍了符号数据分析的基本理论。接下来研究了区间数据样本的经验描述统计量的计算,并基于经验相关矩阵,给出了区间主成分分析的算法,该算法最终得到区间数表达形式的主成分取值。最后选取上海证券交易市场20支股票在某一周上的交易数据,进行了实证研究,基于区间主成分得分的矩形图表示,将20支股票按其市场综合表现分成了四类。 展开更多
关键词 符号数据分析 主成分分析 区间数 股票
原文传递
基于符号数据的黑启动方案评估 被引量:8
17
作者 冷亚军 赵文会 《系统工程理论与实践》 EI CSSCI CSCD 北大核心 2019年第7期1744-1751,共8页
黑启动方案的优选对快速恢复系统供电、减少停电损失具有重要意义.已有研究均是在指标值完全获取的理想条件下进行,本文针对不完全信息下的电力系统黑启动方案评价问题展开研究,提出一种基于符号数据的评价模型.首先建立评价等级,将存... 黑启动方案的优选对快速恢复系统供电、减少停电损失具有重要意义.已有研究均是在指标值完全获取的理想条件下进行,本文针对不完全信息下的电力系统黑启动方案评价问题展开研究,提出一种基于符号数据的评价模型.首先建立评价等级,将存在缺失数据的原始黑启动方案评价矩阵转换为符号数据评价矩阵;然后对符号数据矩阵进行打包处理,得到指标评价等级频率矩阵,进而计算指标权重;最后根据符号数据矩阵和指标权重构造加权评价矩阵,采用拙劣点法实现黑启动方案的优劣排序.基于天津电网的黑启动方案数据对所提方法进行了验证,验证结果表明本文方法可以有效辅助于黑启动方案优选实践. 展开更多
关键词 电力系统 黑启动 不完全信息 符号数据分析
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部