-
题名一种基于海量语料的网络热点新词识别方法
被引量:6
- 1
-
-
作者
张海军
李勇
闫琪琪
-
机构
新疆师范大学初等教育学院
新疆师范大学计算机科学技术学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2015年第5期208-213,共6页
-
基金
国家自然科学基金(No.61163045)
新疆维吾尔自治区自然科学基金(No.2012211A057)
+1 种基金
新疆师范大学重点学科招标课题(No.12XSXZ0601)
新疆师范大学研究生创新基金项目(No.20131201)
-
文摘
基于海量语料的热点新词识别是汉语自动处理领域的一项基础性课题,因要求快速处理大规模语料,且在新词检测中需要更多智力因素,在研究中存在较多困难。构建了一个基于海量语料的网络热点新词识别框架,整合了所提出的基于逐层剪枝算法的重复模式提取,基于统计学习模型的新词检测及基于组合特征的新词词性猜测等3个重要算法,用以提高新词识别的处理能力和识别效果。实验和数据分析表明,该框架能高效可靠地从大规模语料中提取重复模式,构造候选新词集合,并能有效实施新词检测和新词属性识别任务,处理效果达到了目前的较好水平。
-
关键词
海量语料
重复模式
逐层剪枝算法
新词检测
组合特征
-
Keywords
large scale corpora
repeat
hierarchical pruning algorithm
new words detection
combined features
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名中文领域术语自动抽取方法进展研究
被引量:6
- 2
-
-
作者
闫琪琪
张海军
-
机构
新疆师范大学计算机科学技术学院
-
出处
《电脑知识与技术》
2014年第10期6716-6718,共3页
-
基金
基金项目:国家自然科学基金项目(NO.61163045,61263044)
新疆维吾尔自治区自然科学基金(No.2012211A057)
+1 种基金
新疆师范大学重点学科招标课题(N0.12XSXZ0601)
新疆师范大学研究生创新金项目(N0.20131201)
-
文摘
论文梳理总结了目前术语自动抽取的研究现状,分析讨论了术语自动抽取的研究方法,通过对术语抽取方法剖析和比较,提出了目前研究中存在的问题和发展趋势,这对后续的中文领域术语自动抽取的研究具有一定的指导意义。
-
关键词
术语自动抽取
中文信息处理
研究现状
-
Keywords
Automatic Term Extraction
Chinese Information Processing
Research Statu
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名一种混合策略的领域术语自动抽取方法
被引量:1
- 3
-
-
作者
闫琪琪
张海军
-
机构
新疆师范大学计算机科学技术学院
-
出处
《电子制作》
2015年第8Z期50-51,共2页
-
基金
国家自然科学基金项目(NO.61163045
61263044)
+2 种基金
新疆维吾尔自治区自然科学基金(NO.2012211A057)
新疆师范大学重点学科招标课题(NO.12XSXZ0601)
新疆师范大学研究生创新基金项目(No.20131201)
-
文摘
本文提出了一种规则与统计相结合的方法,针对计算机领域术语综合其领域术语特征和统计特征。算法在语料词性标注基础上,在原有词串扩展算法上糅合领域术语部件和领域术语特征获取候选术语。综合统计特征G-MI实现候选术语过滤。实验证明,算法能有效提高术语抽取的正确率和抽取效率。
-
关键词
术语部件
术语自动抽取
本体
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名教师信息技术与课程整合能力培养研究
被引量:1
- 4
-
-
作者
闫琪琪
张海军
-
机构
新疆师范大学
新疆师范大学计算机科学技术学院
-
出处
《科教文汇》
2014年第2期31-32,共2页
-
文摘
随着教育信息化的持续推进,教师信息素养逐渐受到社会各界的关注。目前教师信息素养培养片面关注信息技术及操作能力的提升,导致教师信息技术与课程整合能力的缺失,造成实际教学中教师对信息化教育理解的偏差。探讨教师信息技术与课程整合能力的培养对提升教师信息素养、推动教育信息化进程具有重要的意义。
-
关键词
教师信息素养
信息技术
课程整合能力
-
Keywords
teachers' information literacy
information technology
ability of curriculum integration
-
分类号
G451.2
[文化科学—教育技术学]
-
-
题名从《枪火》浅谈杜琪峰的暴力美学
被引量:2
- 5
-
-
作者
闫琪琪
-
机构
山西师范大学戏剧与影视学院
-
出处
《电影评介》
北大核心
2015年第10期35-36,共2页
-
文摘
暴力,是人类与生俱来的本性。康拉德·洛伦兹认为:"人的侵略性承继于他的动物祖先,是在大脑中先天产生的。如果没有发泄的渠道,就会越积越多,最后爆发出来。这样,人每过一段时间就会表现出侵略性,以释放自身积累的能量。"[1]人类为了排解和宣泄这种本能的欲望,便找到了最好的代替品和宣泄渠道——电影。把攻击、破坏、毁灭的本能投射到银幕上,人类安全地坐在黑暗的电影院里,集体无意识在这里得到充分的释放。
-
关键词
杜琪峰
暴力美学
枪火
侵略性
黑帮片
吴宇森
康拉德
洛伦兹
阿来
张彻
-
分类号
J905
[艺术—电影电视艺术]
-
-
题名基于HydroInfo的溃坝数值模拟研究与应用
被引量:1
- 6
-
-
作者
闫琪琪
金生
-
机构
大连理工大学建设工程学部
-
出处
《水利技术监督》
2020年第2期58-61,共4页
-
文摘
为模拟水库溃坝洪水推进,利用HydroInfo建立溃坝三维数值模型,以某水库工程为例,建立坝体上下游整体水动力模型,根据实际调洪过程验证模型适用性。模拟瞬间全溃、半溃工况洪水演进过程,获得下游淹没时间、范围、历时、淹没水深等重要的水情信息,通过下游特征点列出洪水特征信息,为下游防洪决策提供依据。
-
关键词
溃坝
HydroInfo软件
洪水模拟
淹没范围
淹没流量
-
分类号
TV122
[水利工程—水文学及水资源]
-
-
题名基于统计方法的教育术语特征分析研究
- 7
-
-
作者
闫琪琪
张海军
-
机构
新疆师范大学计算机科学技术学院
-
出处
《计算机光盘软件与应用》
2014年第24期109-110,共2页
-
基金
国家自然科学基金项目(NO.61163045
61263044)
+2 种基金
新疆维吾尔自治区自然科学基金(NO.2012211A057)
新疆师范大学重点学科招标课题(NO.12XSXZ0601)
新疆师范大学研究生创新金项目(NO.20131201)
-
文摘
领域术语特征研究是领域术语自动抽取的基础。研究抽取词典词条和领域高频术语集构建教育术语库,使用中科院分词软件和统计方法对教育术语的特征进行分析。分析结果表明教育术语字长为2-11,词长为1-6词,单词术语占教育术语库28%。对比教育、科技和法律的术语特征发现其具有显著区别,对领域术语自动抽取及信息处理相关研究具有重要理论意义。
-
关键词
教育术语
术语自动抽取
教育术语特征
-
分类号
G434
[文化科学—教育技术学]
-