一种面向非平衡生物医学数据的自训练半监督方法

A Self-training Semi-supervised Method for imbalanced Biomedical Data Sets

下载PDF

导出

摘要生物医学复杂关系提取已经成为文本挖掘领域的焦点,而用于训练预测模型的注释语料库高度非平衡,且大多是针对单个注释语料库训练的监督模型,极大地限制了系统性能。因此,提出一种显著空间SVM自训练半监督学习方法,通过平衡初始模型诱导未标签训练数据,将领域知识纳入事件提取模型,识别多数类子集,构建预测模型。通过设计实验评估证明了训练语料库的有效性。

作者王凯杨枢张钰

机构地区蚌埠医学院卫生管理系合肥工业大学计算机科学与信息学院

出处《大庆师范学院学报》 2017年第6期75-79,共5页 Journal of Daqing Normal University

基金安徽省高校自然科学研究项目(KJ2015B023by)

关键词自训练半监督非平衡数据生物医学领域

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1黎隽男,吕佳.结合主动学习与置信度投票的集成自训练方法[J].计算机工程与应用,2016,52(20):167-171. 被引量：8
2闫紫飞,姬东鸿.基于CRF和半监督学习的中文时间信息抽取[J].计算机工程与设计,2015,36(6):1642-1646. 被引量：9
3赵芳,马玉磊.自训练半监督加权球结构支持向量机多分类方法[J].重庆邮电大学学报（自然科学版）,2014,26(3):404-408. 被引量：10
4刘初,陈锦秀.基于组合特征的自训练隐式篇章关系的识别技术[J].厦门大学学报（自然科学版）,2014,53(2):182-189. 被引量：4
5李秋林.基于ν-最大间隔超球体支持向量机的非平衡数据分类[J].重庆理工大学学报（自然科学）,2012,26(12):93-98. 被引量：3

二级参考文献53

1Pitler E, Raghupathy M, Mehta H, et al.Easily identifiable discourse relations [R]. Philadelphia.. University of Penn- sylvania, 2008 : 884.
2Zhou Z M,Lan M,Niu Z Y,et al.The effects of discourse connectives prediction on implicit discourse relation rec- ognition[C]//Proceedings of the llth Annual Meeting of the Special Interest Group on Discourse and Dialogue. Stroudsburg, PA, USA: Association for Computational Linguistics, 2010 : 139-146.
3Pitler E,Louis A,Nenkova A.Automatic sense prediction for implicit discourse relations in text[C]//Proceedings of the Joint Conference of the 47th Annual Meeting of the ACL and the 4th International Joint Conference on Natural Language Processing of the AFNLP. Stroudshurg, PA, USA: Association for Computational Linguistics, 2009 : 683-691.
4Lin Z, Kan M Y, Ng H T. Recognizingimpl.icit discourse relations in the Penn Discourse Trcebank [C] // Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing. Stroudsburg, PA, USA: Association for Computational Linguistics, 2009:343-351.
5Hernault H, Bollegala D, Ishizuka M. A semi-supervised approach to improve classification of infrequent discourse relations using feature vector extension[C]//Proceedings of the 2010 Conference on Empirical Methods in Natural Language Processing. Stroudsburg, PA, USA : Association for Computational Linguistics, 2010 : 399-409.
6Hernault H, Bollegala D, Ishizuka M.Semi-supervised dis- course relation classification with structural learning[C] //Computational Linguistics and Intelligent Text Pro- cessing.Berlin Heidelberg : Springer, 2011 : 340-352.
7Xu Y, Lan M, Lu Y, et al.Connective prediction using ma- chine learning for implicit discourse relation classification [C] // Neural Networks (IJCNN),the 2012 International Joint Conference on. New York : IEEE, 2012 : 1-8.
8Park J, Cardie C. Improving implicit discourse relation recognition through feature set optimization[C] // Pro- ceedings of the 13th Annual Meeting of the Special Interest Group on Discourse and Dialogue. Stroudsburg, PA, USA: Association for Computational IAnguistics, 2012:108-112.
9Klein D, Manning C D.Accurate unlexicalized parsing[C] //Proceedings of the 41st Meeting of the Association for Computational Linguistics. Stroudsburg, PA, USA : Asso- ciation for Computational Linguistics, 2003 : 423-430.
10Pawel Mazur, Robert Dale. A rule based approach to temporal expression tagging [C] //Proceeding of the International Mul- tieonference on Computer Science and Information Teehnology, 2007.. 293-303.

共引文献29

1陈平,匡尧,陈婧.基于BERT-wwm-ext多特征文本表示的经济事件主体抽取方法研究[J].武汉电力职业技术学院学报,2020(2):45-50. 被引量：1
2赵芳,马玉磊.自训练半监督加权球结构支持向量机多分类方法[J].重庆邮电大学学报（自然科学版）,2014,26(3):404-408. 被引量：10
3杨丽,高美婷.支持向量机无损测量组织光学参数的研究[J].激光杂志,2014,35(11):68-71. 被引量：4
4周建成,吴铤,王荣波,常若愚.基于LIBSVM的“就是”句句间关系判别方法[J].计算机应用,2015,35(7):1950-1954.
5尚耐丽,王骁力,沈鹍霄,卢玉领,马晓普,兰义华.半监督分类方法的研究[J].计算机应用与软件,2015,32(11):162-166. 被引量：4
6张辉荣,唐雁,何荧,石教开,徐平安.面向分类数据的重叠子空间聚类算法SCCAT[J].西南大学学报（自然科学版）,2016,38(3):171-176. 被引量：2
7贺惠新,刘丽娟.主动学习的科技文献研究对象标引体系研究[J].现代图书情报技术,2016(3):67-73. 被引量：1
8周炳海,徐佳惠.基于支持向量机的多载量小车实时调度[J].吉林大学学报（工学版）,2016,46(6):2027-2033. 被引量：5
9郑江龙,陈锦秀.基于混合树结构神经网络的隐式篇章关系识别[J].厦门大学学报（自然科学版）,2017,56(4):576-583.
10李智成,李文婷,梅术正,徐敏锐.基于机器视觉的高压计量数显表自动校对系统[J].电测与仪表,2017,54(20):105-109. 被引量：13

1郭方.城市商业银行经营绩效、业务多元化与资产规模关系研究[J].中国物价,2017(10):45-47. 被引量：1
2蒋长鸿,范钢龙.先验信息优化的S3VM算法模型研究[J].西北工业大学学报,2017,35(5):786-792. 被引量：1
3孙舒鑫,焦体峰,张乐欣.载银纳米颗粒多响应性复合水凝胶研究进展[J].材料导报,2017,31(21):62-68. 被引量：2
4吕鹏飞,王春宁,周峰,朱月琴.基于文献的知识发现在成矿预测领域的应用研究[J].中国矿业,2017,26(9):85-91. 被引量：2
5陈跃军.创新发挥银行监事会的作用[J].中国金融,2017(23):14-15. 被引量：1
6崔丽娜.基于聚类的非平衡K-NN分类方法[J].现代计算机,2017,23(22):6-9.
7本刊编辑部.正确使用数的修约规则[J].解放军护理杂志,2017,34(18):8-8.
8敖银辉,黄晓鹏,袁敏正,陈希隽,方恩权.基于非平衡数据的车辆轮对状态集成分类方法[J].西南交通大学学报,2017,52(5):852-858.
9奚晓钰,吴飞,荆晓远.基于多视图半监督学习的图像识别[J].计算机技术与发展,2017,27(12):48-51.
10李义翠,亓琳,谭舒昆.结合PN约束在线半监督boosting目标跟踪算法[J].计算机工程与应用,2017,53(23):129-134. 被引量：4

大庆师范学院学报

2017年第6期

浏览历史

内容加载中请稍等...

一种面向非平衡生物医学数据的自训练半监督方法

参考文献5

二级参考文献53

共引文献29

相关作者

相关机构

相关主题

浏览历史