期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

基于正态分布的词频分析法高频词阈值研究被引量：60

The Research on the Threshold of High-Frequency Words Based on the Normal Distribution in Word Frequency Analysis

下载PDF

导出

摘要词频分析法高频关键词或主题词的界定是开展信息分析的重要基础。首先,在文献统计分析的基础上,总结了目前词频分析法高频词确定的四种方法:TOPN方法、WF>=M方法、%WF=P方法以及T计算方法,这些方法存在着经验性、随意性、理论基础和适用性上的问题。接着,通过实证方法,验证了关键词和主题词在文献库中的分布符合正态分布,并根据正态分布的特性,提出了词频分析法高频词阈值的F计算方法。最后,在多个数据样本基础上,将F方法与T方法进行了对比分析,认为基于正态分布的高频词阈值F计算方法在理论基础和适用性上都能达到较好的效果。 Along with the outburst of information and the developing of information analysis,word frequency analysis is becoming more and more popular in which the defining of high-frequency words serves as the cornerstone.By summarizing the precedent literature researches,this paper first concluded four methods of defining high-frequency words at present,i.e.TOPN,WF = M,% WF = P and T formula.After briefly discussing the main and obvious shortcomings of the above four methods,such as depending on experience too much,subjectivity,lack of theoretical background,inapplicability or impracticability and so on,the paper empirically tested and verified the normal distribution of high-frequency words in depositories,and accordingly proposed the F formula for threshold analysis of high-frequency words.At the final part,the paper compared and contrasted the T formula and the F formula through the analysis of many datasets,and by doing this the F formula was theoretically and applicably legitimized in the research of threshold of high-frequency words based on normal distribution.

作者安兴茹

机构地区内蒙古科技大学图书馆

出处《情报杂志》 CSSCI 北大核心 2014年第10期129-136,共8页 Journal of Intelligence

关键词词频分析法正态分布高频词齐普夫定律 word frequency analysis normal distribution High-frequency Words Zipf＇s Law

分类号 G350 [文化科学—情报学]

引文网络
相关文献

参考文献36

1林金山,谢怀生.基于集成Office技术的可视化词频分析[J].山东轻工业学院学报（自然科学版）,2006,20(4):39-40. 被引量：1
2熊燕.2008—2010年《现代情报》论文关键词统计分析[J].农业图书情报学刊,2012,24(3):69-72. 被引量：7
3邱均平,丁敬达,周春雷.1999—2008年我国图书馆学研究的实证分析(上)[J].中国图书馆学报,2009,35(5):72-79. 被引量：78
4张克菊,韩毅.基于博硕士学位论文统计分析的国内参考咨询研究[J].图书馆学研究,2009(12):67-72. 被引量：7
5杨晓君,魏向辉,贺培风,于琦,吕艳华.信息素养调查问卷的文献计量分析[J].中华医学图书情报杂志,2012,21(8):73-75. 被引量：4
6王知津,李赞梅,谢丽娜.国外图书馆学研究生学位论文关键词分析[J].中国图书馆学报,2010,36(6):116-123. 被引量：55
7陈永国.政府意识:从“革命”到“改革”的嬗变[J].上海行政学院学报,2012,13(5):36-42. 被引量：2
8邓珞华.词频分析[J].武汉大学学报（人文科学版）,1987,41(1):113-120. 被引量：27
9叶然,徐桂华,陈璇,杜世正.近三年国外护理教育研究热点的共词聚类分析[J].解放军护理杂志,2012,29(20):26-29. 被引量：24
10陈文林.1999-2008年我国电子商务定价研究发展趋势分析[J].财政研究,2009,25(8):72-75. 被引量：4

二级参考文献235

1苍宏宇,谭宗颖.国内外信息检索研究热点分析——基于Z-Score标准化的词频[J].图书馆建设,2009(1):93-98. 被引量：14
2邓珞华.词频分析[J].武汉大学学报（人文科学版）,1987,41(1):113-120. 被引量：27
3邓珞华.词频分析——一种新的情报分析研究方法[J].大学图书馆通讯,1988,6(2):18-25. 被引量：40
4沈关龙.齐普夫定律与专题文献标题词频的研究及应用[J].情报理论与实践,1988,11(2):58-64. 被引量：8
5许文霞.齐普夫定律与中文词频分布机理[J].情报科学,1986,7(1):29-36. 被引量：17
6卢绍君.用户情报查寻行为的数学模型[J].情报科学,1985,6(1):23-29. 被引量：5
7邓珞华,汪剑平.书目信息统计和情报分析[J].情报科学,1984,5(2):9-18. 被引量：4
8王永成,周智佑.关于情报检索效率的若干理论探讨[J].情报科学,1983,4(3):11-15. 被引量：11
9冯志伟.齐普夫定律的来龙去脉[J].情报科学,1983,4(2):37-42. 被引量：21
10王洵.最小努力原则与齐夫定律[J].情报科学,1981,2(2):32-36. 被引量：11

共引文献1521

1饶斌,谢勇旗.近20年我国职业院校教师培训研究可视化分析——研究现状、热点主题与前沿趋势[J].教育科学论坛,2024(15):64-71. 被引量：1
2郑嘉玲.知识图谱镜像下我国高职院校课程思政研究[J].教育科学论坛,2020(36):12-21. 被引量：2
3王瑜,张希宁,胡宝贵.基于文献计量法的西瓜价格研究进展[J].中国农学通报,2020,0(8):134-138.
4张荣俊,陈涛,阮敏.基于共词分析法的国内精准营销研究热点探析[J].中国发展,2021,21(3):58-65. 被引量：2
5刘天佐,廖湘莲.我国基本公共服务均等化研究主题演进可视化分析[J].行政与法,2020(11):19-30.
6郭婉然,陶梦欣.基于CiteSpace分析近23年间来华留学生跨文化心理适应的研究现状及热点[J].心理月刊,2024(10):87-89.
7薛明珠.基于语料库的《京华烟云》中文化负载词翻译策略研究[J].现代英语,2021(4):59-61. 被引量：1
8杨鹏.中文科技论文泛选关键词问题探讨——以化工领域为例[J].学报编辑论丛,2023(1):583-587.
9汪斯斯,董佳雨.国内外融合教育课程研究热点比较研究:基于知识图谱可视化分析[J].绥化学院学报,2023,43(7):1-9.
10赵蓉英,陈必坤.知识地图与知识图谱研究进展[J].情报学进展,2014(1):350-387. 被引量：1

同被引文献875

1刘惠梅,吴蔚,王彬,汪伟,张立春,来薛,李珊,高峰.五音呼吸操康复训练对慢性阻塞性肺疾病稳定期患者肺功能及生活质量的影响[J].中医杂志,2020,0(3):222-225. 被引量：67
2吴林海,黄锦贵.完善新时代中国食品安全检验检测体系[J].中国食品安全治理评论,2019,0(2):3-18. 被引量：8
3柳元丰.新形势下少数民族学生语文核心素养培养路径思考[J].语言与翻译,2020(2):82-86. 被引量：3
4田学军.努力开创新时代语言文字事业发展新局面[J].语言与翻译,2020(2):5-6. 被引量：9
5刘海英,董宇婧.中国中医药政策变迁的阶段历程与演进逻辑——基于1949-2020年政策文本的实证研究[J].亚太传统医药,2021,17(12):3-12. 被引量：8
6丁磊.中国电影明星的海外角色塑造(1990-2018)[J].艺术广角,2020(1):21-27. 被引量：1
7唐琳,郭崇慧,陈静锋.中文分词技术研究综述[J].数据分析与知识发现,2020,4(2):1-17. 被引量：43
8黄鹏宇,钟华,夏凡.家属参与肺康复引导式教育训练对COPD患者肺功能、心理健康及生活质量的影响[J].中国全科医学,2021,24(S01):59-61. 被引量：15
9徐红,张斯婷,李凌方.基于LDA模型与共词分析法的农村阅读推广主题发现与热点分析[J].情报科学,2022,40(10):67-73. 被引量：16
10鞠玉梅.危机语境下对外传播媒体话语的国家身份构建研究——基于《中国日报》新冠疫情社论的隐喻分析[J].话语研究论丛,2022(2):1-18. 被引量：2

引证文献60

1黎倩伶,张新平.我国抗菌药物耐药性研究热点分析[J].医学信息学杂志,2019,40(12):58-61.
2杨兴艺,包玉,王志泰,陈信同,方周怡.喀斯特区城市遗存山体野境自然野性评价——以贵阳为例[J].生态学报,2022,42(24):9995-10010. 被引量：2
3杨金庆,吴乐艳,魏雨晗,陆伟,罗威.科技文献新兴话题识别研究进展[J].情报学进展,2020(1):202-234. 被引量：3
4李文星,唐军,邹蓉,曾燕,岳艳,邱霞,屈艺,母得志.干细胞移植治疗新生儿缺氧缺血性脑病研究现状的可视化分析[J].中国当代儿科杂志,2018,20(12):1002-1007. 被引量：6
5廖晓,李志宏,席运江.基于加权知识网络的企业社区用户创新知识建模及分析方法[J].系统工程理论与实践,2016,36(1):94-105. 被引量：18
6安兴茹.我国词频分析法的方法论研究(I)——统计分析要素的界定、分类及问题[J].情报杂志,2016,35(2):75-80. 被引量：52
7田甜,张永,王朝晖.通过关键词词频分析看2009-2013年内科学综合期刊研究热点和发展方向[J].中华医学科研管理杂志,2016,0(1):32-37. 被引量：5
8廖晓,李志宏,席运江.基于加权知识网络分析的企业社区创新用户专家知识发现方法[J].系统工程理论与实践,2016,36(5):1268-1279. 被引量：9
9张秋,杨玲.国外图书馆战略规划调研分析及其启示[J].图书情报工作,2016,60(9):28-37. 被引量：27
10赵一鸣,郝建江,王海燕,乔星峰.虚拟现实技术教育应用研究演进的可视化分析[J].电化教育研究,2016,37(12):26-33. 被引量：78

二级引证文献586

1聂薇,何展宁,吴妍.国内外语教学批判性思维研究进展考察[J].中国ESP研究,2023(1):9-18. 被引量：1
2黄俊又,努尔古丽·阿不都苏力.基于抖音短视频的重庆洪崖洞文旅IP分析[J].新媒体研究,2022,8(23):67-72. 被引量：1
3卢翔宇,尚东旭,王霜霜,王鑫鑫,郭玉芳.基于CiteSpace的国内外心理资本研究现状与趋势分析[J].心理月刊,2021(21):5-9. 被引量：3
4李雅倩,孙玉玲(指导),赵婉雨.基于主题模型和时间序列分析的新兴主题识别与特征关联研究[J].知识管理论坛,2022(3):229-247. 被引量：3
5王莲玉,钟文婷,颜莹,杨京华.基于文献计量和知识图谱的儿童中医体质学说可视化分析[J].世界科学技术-中医药现代化,2022,24(9):3303-3314. 被引量：1
6郭冬梅.“双一流”建设背景下草学和畜牧学学科发展态势分析[J].内蒙古农业大学学报（社会科学版）,2019,21(6):21-28. 被引量：3
7段瑞云.《煤炭高等教育》载文计量学分析(1984—2021)[J].煤炭高等教育,2022,40(4):127-136. 被引量：1
8张博,康奥.基于UGC文本挖掘的山地旅游体验优化研究——以河北省白石山为例[J].旅游与摄影,2020(24):34-35.
9刘含,李花珍,叶晓冰.虚拟仿真技术在中职临床检验教学中的应用——以血涂片的瑞特染色为例[J].科教导刊,2023(32):61-63.
10申立银,吴莹,张羽,舒天衡,何虹熳,孟聪会.大数据在我国城市可持续发展中应用的研究综述——基于文献计量学和信息可视化的方法[J].建设管理研究,2022(1):79-94.

1胡兆芹.大学图书馆“图书深、浅阅读”的实证研究[J].现代情报,2011,31(8):126-129. 被引量：2
2贾聪聪.二八定律和正态分布对档案文献利用率的贡献[J].山西档案,2014,0(4):87-89. 被引量：2
3紧抓机遇求突破迎接挑战创一流让档案伴随新农村建设共同发展[J].北京档案,2014(10):8-8.
4许伟达.布赖特福分布在情报资料统计中的分析和应用[J].情报科学,1983,4(2):14-19. 被引量：2
5Q-分类法[J].浙江医学教育,2006,0(3):51-51.
6霍叔牛.情报需求定量化研究初探[J].情报学报,1982,1(2):153-162. 被引量：5
7刘贵伟,彭彩红,赵福荣.基于数据正态化处理的期刊学术影响力研究[J].编辑学报,2009,21(4):369-370. 被引量：3
8袁兴兴.论都市报发行量对广告收入的影响[J].现代经济信息,2013(19):406-406.
9陈晓文.“黄山巧石”与新闻之美——浅析新闻角度把握的四种方法[J].新闻实践,2008(9):46-46.
10王合喜.收集新闻素材的四种方法[J].新闻爱好者,2005(9):28-28.

情报杂志

2014年第10期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部