期刊文献+
共找到60篇文章
< 1 2 3 >
每页显示 20 50 100
基于m×2正则化交叉验证的神经网络超参数调优方法
1
作者 曹学飞 杨帆 +2 位作者 李济洪 王瑞波 牛倩 《计算机技术与发展》 2024年第4期168-173,共6页
超参数调优是神经网络建模的关键问题。针对传统的超参数调优方法存在的问题,该文提出了一种基于m×2正则化交叉验证的超参数调优方法。目的是给出一种适用于复杂模型、大数据集背景下的计算开销较小且稳健的超参数调优方法。该方... 超参数调优是神经网络建模的关键问题。针对传统的超参数调优方法存在的问题,该文提出了一种基于m×2正则化交叉验证的超参数调优方法。目的是给出一种适用于复杂模型、大数据集背景下的计算开销较小且稳健的超参数调优方法。该方法的思想是从完整的数据集上选取少部分数据进行调优,避免模型在数据集较大时非常耗时的超参数调优难题;在m×2交叉验证的基础上设置正则化条件均衡训练集与验证集之间的分布差异,从而减少分布不一致带来的性能波动;使用信噪比作为调优的优化目标,从而可以综合考虑模型性能评价指标的均值和方差;并采用正交设计选择相关性较低的超参数组合以提高调优效率。以命名实体任务为例进行实验,在CoNLL 2003数据集上的实验结果显示,提出的调优方法能够选到和网格搜索性能上没有显著差异的超参数组合,且调优时间可显著降低约66%。 展开更多
关键词 m×2交叉验证 正则化 神经网络 超参数调优 信噪比
下载PDF
汉语框架语义角色的自动标注 被引量:40
2
作者 李济洪 王瑞波 +1 位作者 王蔚林 李国臣 《软件学报》 EI CSCD 北大核心 2010年第4期597-611,共15页
基于山西大学自主开发的汉语框架语义知识库(CFN),将语义角色标注问题通过IOB策略转化为词序列标注问题,采用条件随机场模型,研究了汉语框架语义角色的自动标注.模型以词为基本标注单元,选择词、词性、词相对于目标词的位置、目标词及... 基于山西大学自主开发的汉语框架语义知识库(CFN),将语义角色标注问题通过IOB策略转化为词序列标注问题,采用条件随机场模型,研究了汉语框架语义角色的自动标注.模型以词为基本标注单元,选择词、词性、词相对于目标词的位置、目标词及其组合为特征.针对每个特征设定若干可选的窗口,组合构成模型的各种特征模板,基于统计学中的正交表,给出一种较优模板选择方法.全部实验在选出的25个框架的6692个例句的语料上进行.对每一个框架,分别按照其例句训练一个模型,同时进行语义角色的边界识别与分类,进行2-fold交叉验证.在给定句子中的目标词以及目标词所属的框架情况下,25个框架交叉验证的实验结果的准确率、召回率、F1-值分别达到74.16%,52.70%和61.62%. 展开更多
关键词 汉语框架语义知识库 语义角色标注 正交表 特征选择 条件随机场
下载PDF
汉语框架自动识别中的歧义消解 被引量:10
3
作者 李济洪 高亚慧 +1 位作者 王瑞波 李国臣 《中文信息学报》 CSCD 北大核心 2011年第3期38-44,共7页
该文研究了汉语框架自动识别中的歧义消解问题,即对给定句子中的目标词,基于其上下文环境,从现有的框架库中,为该目标词自动标注一个合适的框架。该文将此任务看作分类问题,使用最大熵建模,选用词、词性、基本块、依存句法树上的若干特... 该文研究了汉语框架自动识别中的歧义消解问题,即对给定句子中的目标词,基于其上下文环境,从现有的框架库中,为该目标词自动标注一个合适的框架。该文将此任务看作分类问题,使用最大熵建模,选用词、词性、基本块、依存句法树上的若干特征,并使用开窗口技术和BOW策略,以目前汉语框架语义知识库中的88个词元的2 077条例句为训练、测试语料,进行了3-fold交叉验证实验,最好结果取得69.28%的精确率(Accuracy)。 展开更多
关键词 汉语框架语义知识库 框架语义 框架消歧 最大熵模型
下载PDF
基于最大熵模型的中文阅读理解问题回答技术研究 被引量:6
4
作者 李济洪 王瑞波 +1 位作者 王凯华 李国臣 《中文信息学报》 CSCD 北大核心 2008年第6期55-62,共8页
该文基于山西大学自主开发的中文阅读理解语料库CRCC v1.1版,根据问句和候选答案句的对应关系,构建了词层面以及句法层面共计35个特征,基于最大熵模型对中文阅读理解问题回答进行了建模,在35个特征全部加入最大熵模型的情况下,测试集上... 该文基于山西大学自主开发的中文阅读理解语料库CRCC v1.1版,根据问句和候选答案句的对应关系,构建了词层面以及句法层面共计35个特征,基于最大熵模型对中文阅读理解问题回答进行了建模,在35个特征全部加入最大熵模型的情况下,测试集上得到了75.46%的HumSent准确率。考虑到特征取值之间的相关性对权重估计的影响,笔者先对35个特征观测值矩阵进行主成分降维,选择适当的主成分个数重构特征,然后再使用最大熵模型进行建模,在测试集上的HumSent准确率达到80.18%.实验结果表明,在阅读理解问答系统中,采用特征的主成分降维方法,能有效融合全部特征信息,回避了最大熵模型中特征筛选的过程,并且提高了阅读理解系统的准确率。 展开更多
关键词 计算机应用 中文信息处理 阅读理解 问答系统 最大熵模型 主成分
下载PDF
两水平无重复因析试验散度效应BH估计的性质 被引量:3
5
作者 李济洪 任改仙 王钰 《应用概率统计》 CSCD 北大核心 2010年第2期179-189,共11页
本文研究了两水平无重复因析试验散度效应BH估计的性质,给出了BH估计无偏性的充分必要条件,求得了它的近似方差.并在多个模型下对BH与MH估计进行了模拟比较.
关键词 散度效应 BH估计 无重复因析试验
下载PDF
基于规则的中文阅读理解问题回答技术研究 被引量:1
6
作者 李济洪 杨杏丽 +2 位作者 王瑞波 张娜 李国臣 《中文信息学报》 CSCD 北大核心 2009年第4期3-9,共7页
该文针对中文阅读理解问答中的时间、人物、地点、数值、实体、描述六类问题,制定了各类问题回答的启发式规则集。对规则集中每条规则赋予一个相应权值,利用正交表对各规则所对应的权值进行了调优选取,给出了各候选答案句基于相应规则... 该文针对中文阅读理解问答中的时间、人物、地点、数值、实体、描述六类问题,制定了各类问题回答的启发式规则集。对规则集中每条规则赋予一个相应权值,利用正交表对各规则所对应的权值进行了调优选取,给出了各候选答案句基于相应规则的得分计算方法。该文方法在山西大学自主开发的中文阅读理解语料库CRCC v1.1上进行了实验,在整个语料库上得到了83.09%的HumSent准确率。为了与文献[10]中的最大熵方法比较,该文在与文献[10]中完全相同的训练集上调优规则的权值,在相同的测试集上测试,最终得到HumSent准确率81.13%,比最大熵的方法高大约1%,且在全部的六类问题上,该文方法的HumSent准确率都不低于最大熵方法。 展开更多
关键词 计算机应用 中文信息处理 阅读理解 问答系统 规则 正交表
下载PDF
构建高可用的数字校园公共服务平台 被引量:2
7
作者 李济洪 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2015年第B03期289-292,共4页
本文阐述了高可用数字校园公共服务平台的基本内涵,并从数字校园运行、维护层面论述了构建高可用的数字校园公共服务平台所应考虑的几个问题.
关键词 高可用性 数字校园 公共服务平台
下载PDF
高维回归中基于组块3×2交叉验证的调节参数选择
8
作者 李济洪 陈萌萌 杨杏丽 《云南师范大学学报(自然科学版)》 2015年第3期27-32,共6页
将组块3×2交叉验证方法用于高维回归中的调节参数选择.首先通过ISIS方法把模型的维数降低到样本个数以内,然后使用AENET方法对降维后的模型进行进一步的降维和参数估计,使用组块3×2交叉验证方法选择最佳的调节参数.综合考虑... 将组块3×2交叉验证方法用于高维回归中的调节参数选择.首先通过ISIS方法把模型的维数降低到样本个数以内,然后使用AENET方法对降维后的模型进行进一步的降维和参数估计,使用组块3×2交叉验证方法选择最佳的调节参数.综合考虑模拟实验中各种调节参数选择方法(AIC、BIC、EBIC、HBIC、5折交叉验证、组块3×2交叉验证)的EMSE值、方差以及计算复杂度,结果表明基于组块3×2交叉验证的方法是有其优势的. 展开更多
关键词 调节参数选择 组块3×2交叉验证 EMSE准则
下载PDF
基于Dropout正则化的汉语框架语义角色识别 被引量:14
9
作者 王瑞波 李济洪 +1 位作者 李国臣 杨耀文 《中文信息学报》 CSCD 北大核心 2017年第1期147-154,共8页
汉语框架语义角色识别是汉语框架语义分析的重要任务之一。该文基于汉语词语、词性等特征的分布式表示,使用一种多特征融合的神经网络结构来构建汉语框架语义角色识别模型。鉴于可用的训练语料规模有限,该文采用了Dropout正则化技术来... 汉语框架语义角色识别是汉语框架语义分析的重要任务之一。该文基于汉语词语、词性等特征的分布式表示,使用一种多特征融合的神经网络结构来构建汉语框架语义角色识别模型。鉴于可用的训练语料规模有限,该文采用了Dropout正则化技术来改进神经网络的训练过程。实验结果表明,Dropout正则化的加入有效地缓解了模型的过拟合现象,使得模型的F值有了近7%的提高。该文进一步优化了学习率以及分布式表示的初始值,最终的汉语框架语义角色识别的F值达到70.54%,较原有的最优结果提升2%左右。 展开更多
关键词 汉语框架网络 语义角色识别 Dropout正则化
下载PDF
基于同义词词林信息特征的语义角色自动标注 被引量:7
10
作者 李国臣 吕雷 +2 位作者 王瑞波 李济洪 李茹 《中文信息学报》 CSCD 北大核心 2016年第1期101-107 114,共8页
该文使用同义词词林语义资源库,以词林中编码信息为基础构建新的特征,使用条件随机场模型,研究了汉语框架语义角色的自动标注。该文在先前的基于词、词性、位置、目标词特征的基础上,在模型中加入不同的词林信息特征,以山西大学的汉语... 该文使用同义词词林语义资源库,以词林中编码信息为基础构建新的特征,使用条件随机场模型,研究了汉语框架语义角色的自动标注。该文在先前的基于词、词性、位置、目标词特征的基础上,在模型中加入不同的词林信息特征,以山西大学的汉语框架语义知识库为实验语料,研究了各词林信息特征分别对语义角色边界识别与分类的影响。实验结果表明,词林信息特征可以显著提高语义角色标注的性能,并且主要作用在语义角色分类上。 展开更多
关键词 语义角色标注 同义词词林 条件随机场 正交表
下载PDF
基于条件随机场模型的汉语功能块自动标注 被引量:7
11
作者 李国臣 王瑞波 李济洪 《计算机研究与发展》 EI CSCD 北大核心 2010年第2期336-343,共8页
汉语组块分析是将汉语句子中的词首先组合成基本块,进一步组合形成句子的功能块,最终形成一个具有层次组合结构的汉语句法描述结构.将汉语功能块的自动标注问题看作序列标注任务,并使用词和基本块作为标注单元分别建立标注模型.针对不... 汉语组块分析是将汉语句子中的词首先组合成基本块,进一步组合形成句子的功能块,最终形成一个具有层次组合结构的汉语句法描述结构.将汉语功能块的自动标注问题看作序列标注任务,并使用词和基本块作为标注单元分别建立标注模型.针对不同的标注模型,分别构建基本块层面的特征集合,并使用条件随机场模型进行汉语功能块的自动标注.实验数据来自清华大学TCT语料库,并且按照8∶2的比例切分形成训练集和测试集.实验结果表明,与仅使用词层面信息的标注模型相比,基本块特征信息的适当加入可以显著提高功能块标注性能.当使用人工标注的基本块信息时,汉语功能块自动标注的准确率达到88.47%,召回率达到89.93%,F值达到89.19%.当使用自动标注的基本块信息时,汉语功能块的标注的准确率为84.27%,召回率为85.57%,F值为84.92%. 展开更多
关键词 汉语基本块 汉语功能块 条件随机场模型 句法分析 序列标注
下载PDF
基于条件随机场的汉语框架语义角色自动标注 被引量:7
12
作者 宋毅君 王瑞波 +1 位作者 李济洪 李国臣 《中文信息学报》 CSCD 北大核心 2014年第3期36-47,共12页
在给定目标词及其所属框架的条件下,汉语框架语义角色标注可以分为语义角色识别和角色分类两个步骤。该文将此任务通过IOB2标记策略形式化为词序列标注问题,以词为基本标注单元,采用条件随机场模型进行自动标注实验。先对语料使用清华... 在给定目标词及其所属框架的条件下,汉语框架语义角色标注可以分为语义角色识别和角色分类两个步骤。该文将此任务通过IOB2标记策略形式化为词序列标注问题,以词为基本标注单元,采用条件随机场模型进行自动标注实验。先对语料使用清华大学的基本块自动分析器进行分析,提取出15个块层面的新特征,并将这些特征标记形式化到词序列上。以文献[20]已有的12个词层面特征以及15个块层面特征共同构成候选特征集,采用正交表方法来选择模型的最优特征模板。在与文献[20]相同的语料上,相同的3组2折交叉验证实验下,语义角色标注的总性能的F1-值比文献[20]的F1-值提高了近1%,且在显著水平0.05的t-检验下显著。实验结果表明:(1)基于词序列模型,新加入的15个块层面特征可以显著提高标注模型的性能,但这类特征主要对角色分类有显著作用,对角色识别作用不显著;(2)基于词序列的标注模型显著好于以基本块为标注单元以及以句法成分为标注单元的标注模型。 展开更多
关键词 汉语框架语义知识库 语义角色标注 条件随机场模型 基本块
下载PDF
综合教务系统在教务管理中的应用 被引量:13
13
作者 王玉莲 李济洪 《计算机工程与设计》 CSCD 2004年第10期1681-1684,共4页
高校教务管理是一项复杂而重要的工作。高校转入学分制后,面临着许多问题,集中表现为教务管理信息急增和工作难度加大。为提高工作效率,必须利用计算机和网络技术,对与学分制相关的环节和要素进行整合,即构造教务综合管理体系。在构建... 高校教务管理是一项复杂而重要的工作。高校转入学分制后,面临着许多问题,集中表现为教务管理信息急增和工作难度加大。为提高工作效率,必须利用计算机和网络技术,对与学分制相关的环节和要素进行整合,即构造教务综合管理体系。在构建该体系的指导思想、制度依据的基础上,提出了构建步骤和体系框架,综合解决教务管理工作中的几个紧迫问题。 展开更多
关键词 教务管理 学分制 教务系统 高校 入学 构建 难度 综合管理体系 问题 制度
下载PDF
基于COSA算法的中文文本聚类 被引量:9
14
作者 谷波 李济洪 刘开瑛 《中文信息学报》 CSCD 北大核心 2007年第6期65-70,共6页
传统聚类算法在计算两个对象间的距离时,每个属性对距离的贡献相同。COSA(Clustering On Subsets of Attributes)算法[1]认为在不同的分组中,每个属性对计算距离所起的作用可能并不相等,因为不同分组中的对象可能在不同的属性子集上聚... 传统聚类算法在计算两个对象间的距离时,每个属性对距离的贡献相同。COSA(Clustering On Subsets of Attributes)算法[1]认为在不同的分组中,每个属性对计算距离所起的作用可能并不相等,因为不同分组中的对象可能在不同的属性子集上聚集。文献[1]在此基础上定义了新的距离,并提出了两种COSA算法:COSA1算法是一种分割的聚类算法;COSA2算法是一种层次聚类算法。为了对比COSA距离和传统的欧氏距离在文本聚类中的表现,本文对中文文本进行了分割聚类和层次聚类的实验。实验结果显示出COSA算法较基于欧氏距离的聚类算法有更好的性能,而且对于属性数的变化,COSA算法更加稳定。 展开更多
关键词 计算机应用 中文信息处理 文本聚类 COSA算法 K—means算法
下载PDF
带有不完全信息随机截尾试验下最大似然估计的重对数律 被引量:11
15
作者 宋毅君 李补喜 李济洪 《应用概率统计》 CSCD 北大核心 2009年第2期113-125,共13页
本文在条件(Φ)下,证明了带有不完全信息随机截尾试验下最大似然估计的收敛速度符合重对数律,并验证了Weibull分布、对数正态分布满足条件(Φ).
关键词 带有不完全信息随机截尾试验 最大似然估计 重对数律
下载PDF
中文阅读理解语料库构建技术研究 被引量:3
16
作者 郝晓燕 李济洪 +1 位作者 由丽萍 刘开瑛 《中文信息学报》 CSCD 北大核心 2007年第6期29-35,共7页
阅读理解问答系统指的是能够自动分析一个自然语言文章,并且根据文中的信息为每个问题生成一个答案的系统,具有很高的研究价值。然而,缺乏中文阅读理解语料库已经成为制约汉语阅读理解问答系统发展的主要障碍。本文对于中文阅读理解语... 阅读理解问答系统指的是能够自动分析一个自然语言文章,并且根据文中的信息为每个问题生成一个答案的系统,具有很高的研究价值。然而,缺乏中文阅读理解语料库已经成为制约汉语阅读理解问答系统发展的主要障碍。本文对于中文阅读理解语料库的构建过程进行了详细的介绍,包括语料选材、编写问句,标注答案句、语料加工和评测机制,尤其是基于汉语框架语义知识库对语料进行了框架元素、短语类型和句法功能三个层面标注的深加工技术。 展开更多
关键词 计算机应用 中文信息处理 阅读理解问答系统 中文阅读理解语料库 汉语框架语义知识库
下载PDF
基于字的分布表征的汉语基本块识别 被引量:5
17
作者 李国臣 党帅兵 +1 位作者 王瑞波 李济洪 《中文信息学报》 CSCD 北大核心 2014年第6期18-25,55,共9页
汉语的基本块识别是汉语句法语义自动分析中的重要任务之一。传统的方法大多数直接将汉语基本块识别任务转化成词层面的一个序列标注问题,采用CRF模型来处理。虽然,在许多评测中得到最好的结果,但基于词为标注单位,在实用中受限于自动... 汉语的基本块识别是汉语句法语义自动分析中的重要任务之一。传统的方法大多数直接将汉语基本块识别任务转化成词层面的一个序列标注问题,采用CRF模型来处理。虽然,在许多评测中得到最好的结果,但基于词为标注单位,在实用中受限于自动分词系统以及汉语词特征的稀疏性。为此,该文给出了一种以字为标注单位,以字为原始输入层,来构建汉语的基本块识别的深层神经网络模型,并通过无监督方法,学习到字的C&W和word2vec两种分布表征,将其作为深层神经网络模型的字的表示层的初始输入参数来强化模型参数的训练。实验结果表明,使用五层神经网络模型,以[-3,3]窗口的字的word2vec分布表征,其准确率、召回率和F值分别达到80.74%,73.80%和77.12%,这比基于字的CRF高出约5%。这表明深层神经网络模型在汉语的基本块识别中是有作用的。 展开更多
关键词 汉语基本块 分布表征 深层神经网络 序列标注
下载PDF
现代教育技术中心CAI机房管理与维护措施 被引量:5
18
作者 王玉莲 李济洪 《计算机工程与应用》 CSCD 北大核心 2005年第5期207-210,共4页
利用计算机技术和网络技术来解决机房管理问题,使计算机用户群的管理逐步达到网络化、信息化、自动化是一件非常有意义的事情。通过对多所大学的机房管理的现状进行了调查研究和分析,提出了基于智能IC卡与多层C/S结构的多功能机房管理... 利用计算机技术和网络技术来解决机房管理问题,使计算机用户群的管理逐步达到网络化、信息化、自动化是一件非常有意义的事情。通过对多所大学的机房管理的现状进行了调查研究和分析,提出了基于智能IC卡与多层C/S结构的多功能机房管理系统应具有的功能和需要的技术以及系统的设计方法,并结合一个大学的机房管理系统的开发工作,介绍了该多功能机房管理系统的特点和实现的关键技术。经过三年多的运行实践表明,系统运行稳定。 展开更多
关键词 IC卡 机房自动管理系统 多层C/S结构
下载PDF
一种均衡的RHS交叉验证 被引量:2
19
作者 杨静 王瑞波 李济洪 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2015年第4期842-849,共8页
在统计机器学习中,交叉验证方法利用对一个数据集的多次切分,来构造多次重复实验,并以此估计机器学习模型的预测误差.然而交叉验证估计的稳定性与数据集的切分方式有着密切的关系.也就是说,不同的切分方式会导致训练集中所含共同样本的... 在统计机器学习中,交叉验证方法利用对一个数据集的多次切分,来构造多次重复实验,并以此估计机器学习模型的预测误差.然而交叉验证估计的稳定性与数据集的切分方式有着密切的关系.也就是说,不同的切分方式会导致训练集中所含共同样本的个数不同,当共同样本较多时,交叉验证估计具有较大的方差.为此构造了一种均衡的RHS(Repeated Half-sampling)交叉验证,使得训练集所含共同样本的个数的总和最小,并且任意两个切分之间的共同样本个数保持均衡,进而降低泛化误差估计的方差,进而有效地提高泛化误差估计的稳定性.从理论上证明了6次均衡的RHS交叉验证估计的方差小于组块3×2交叉验证,并且进一步通过模拟实验验证这一结论.同时,从实验结果可以说明6次均衡的RHS交叉验证估计的方差小于随机RHS交叉验证估计的方差.进一步,在真实数据集上大量的实验验证了这些结论. 展开更多
关键词 交叉验证 泛化误差 组块3×2交叉验证 RHS交叉验证
下载PDF
基于组块3×2交叉验证的预测误差估计的方差 被引量:1
20
作者 杨杏丽 王钰 +1 位作者 王瑞波 李济洪 《应用概率统计》 CSCD 北大核心 2014年第4期372-380,共9页
本文对文献中新提出的预测误差的组块3×2交叉验证估计的方差进行了研究,给出了其方差的更为精细的表达式,且从理论上证明了不存在其方差的通用(对所有分布都适用的)无偏估计.
关键词 组块3×2交叉验证 无偏估计 预测误差估计的方差
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部