-
题名基于gcForest的多因子量化选股策略
被引量:8
- 1
-
-
作者
王伦
李路
-
机构
上海工程技术大学数理与统计学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2020年第15期86-91,共6页
-
基金
国家自然科学基金(No.11501055,No.11801362)。
-
文摘
为了获取股票市场更高的超额收益,提高股票涨跌预测准确率,将gcForest(深度森林)算法引入了股票投资市场,建立基于gcForest多因子量化投资策略,每月月末在沪深300成分股中买入gcForest算法预测上涨的前30支股票,并进行回测。研究结果表明,gcForest算法的年化收益率为29.2%,远超基准年化收益率15.0%,并且获得了15.8%的超额收益。同时还将gcForest算法同随机森林和支持向量机算法进行了比较,从各项技术指标综合分析来看,gcForest算法在股市行情平稳和上涨时期都较其他算法有着明显的优势。
-
关键词
多因子选股
多粒度扫描
gcforest算法
-
Keywords
multi-factor stock selection
multi-granularity scanning
gcforest algorithm
-
分类号
F832.51
[经济管理—金融学]
F224
[经济管理—国民经济]
-
-
题名基于深度森林和DNA甲基化的癌症分类研究
被引量:8
- 2
-
-
作者
刘超
吴申
郑一超
侯维岩
-
机构
郑州大学信息工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2020年第13期189-193,共5页
-
基金
国家自然科学基金(No.81602961)。
-
文摘
作为人类基因组重要的表观遗传现象,DNA甲基化对基因的表达发挥着重要的调控作用,与癌症的关系密切。针对癌症基因组图谱(TCGA)庞大数据的类不平衡和高维度,致使假阴率大幅增加的问题,提出了一种混合采样的不平衡数据集成分类算法,使用合成少数过采样(SMOTE)算法生成新的少数类样本,得到扩充后的数据集,通过Tomek Link算法剔除样本扩充过程中引入的噪声,得到相对平衡的数据集。在此基础上,利用深度森林(gcForest)算法的级联森林结构,每一层选取两种随机森林结构,以增强模型的泛化能力,得到最终的分类模型。对6种癌症的DNA甲基化数据实验表明混合采样的不平衡数据集成分类算法在保证多数类分类精度的前提下,有效地提高了对于少数类的灵敏度。
-
关键词
DNA甲基化
癌症基因组图谱(TCGA)
合成少数类采样技术(SMOTE)
Tomek
Link算法
gcforest算法
-
Keywords
DNA methylation
The Cancer Genome Atlas(TCGA)
Synthetic Minority Oversampling Technique(SMOTE)
Tomek Link algorithm
gcforest algorithm
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
TP391
[自动化与计算机技术—计算机应用技术]
-