期刊文献+
共找到39篇文章
< 1 2 >
每页显示 20 50 100
汉语语句主题语义倾向分析方法的研究 被引量:78
1
作者 姚天昉 娄德成 《中文信息学报》 CSCD 北大核心 2007年第5期73-79,共7页
本文介绍了如何识别汉语语句主题和主题与情感描述项之间的关系以及如何计算主题的语义倾向(极性)。我们利用领域本体来抽取语句主题以及它的属性,然后在句法分析的基础上,识别主题和情感描述项之间的关系,从而最终决定语句中每个主题... 本文介绍了如何识别汉语语句主题和主题与情感描述项之间的关系以及如何计算主题的语义倾向(极性)。我们利用领域本体来抽取语句主题以及它的属性,然后在句法分析的基础上,识别主题和情感描述项之间的关系,从而最终决定语句中每个主题的极性。实验结果显示,与手工标注的语料作为金标准进行比较,用于识别主题和主题极性的改进后的SBV极性传递算法的F度量达到了72.41%。它比原来的SBV极性传递算法和VOB极性传递算法的F度量分别提高了7.6%和2.09%。因此,所建议的改进的SBV极性传递算法是合理和有效的。 展开更多
关键词 计算机应用 中文信息处理 意见挖掘 主题 语义倾向
下载PDF
文本意见挖掘综述 被引量:106
2
作者 姚天昉 程希文 +2 位作者 徐飞玉 汉思·乌思克尔特 王睿 《中文信息学报》 CSCD 北大核心 2008年第3期71-80,共10页
意见挖掘是针对主观性文本自动获取有用的意见信息和知识,它是一个新颖而且十分重要的研究课题。这种技术可以应用于现实生活中的许多方面,如电子商务、商业智能、信息监控、民意调查、电子学习、报刊编辑、企业管理等。本文首先对意见... 意见挖掘是针对主观性文本自动获取有用的意见信息和知识,它是一个新颖而且十分重要的研究课题。这种技术可以应用于现实生活中的许多方面,如电子商务、商业智能、信息监控、民意调查、电子学习、报刊编辑、企业管理等。本文首先对意见挖掘进行了定义,然后阐述了意见挖掘研究的目的,接着从主题的识别、意见持有者的识别、陈述的选择和情感的分析四个方面对意见挖掘的研究现状进行了综述,并介绍了几个成型的系统。此外,我们针对汉语的意见挖掘做了特别的分析。最后对整个领域的研究进行了总结。 展开更多
关键词 计算机应用 中文信息处理 意见挖掘 主观性文本 综述
下载PDF
在程序设计课程中引入“计算思维”的实践 被引量:49
3
作者 姚天昉 《中国大学教学》 CSSCI 北大核心 2012年第2期61-62,76,共3页
介绍了"计算思维"提出的背景,并针对国内高校讲解程序设计的教学方法,提出了把"计算思维"引入"程序设计思想与方法"课程,对课程内容、实践环节等进行了全方位改革与试验。通过与同行交流,取长补短,不断... 介绍了"计算思维"提出的背景,并针对国内高校讲解程序设计的教学方法,提出了把"计算思维"引入"程序设计思想与方法"课程,对课程内容、实践环节等进行了全方位改革与试验。通过与同行交流,取长补短,不断创新。 展开更多
关键词 计算思维 程序设计 课程内容 实践环节
下载PDF
基于德语语料库词性标注和统计方法的研究 被引量:1
4
作者 姚天昉 林莉 玉素甫.艾白都拉 《上海交通大学学报》 EI CAS CSCD 北大核心 1996年第6期35-40,共6页
建立了一种德语语料词性标注方法以及基于词性标注的统计方法.初步实验证明了上述方法对德语语料标注和标注后的语料进行单词、词类、短语结构和句子的统计是正确和有效的.
关键词 德语语料库 词性标注 语料统计 机器翻译
下载PDF
文本规划中焦点移动控制算法的研究 被引量:2
5
作者 姚天昉 汤学彦 《软件学报》 EI CSCD 北大核心 2000年第2期277-284,共8页
该文完善了全局焦点和局部焦点的移动规则 ,使规则适合更广泛的应用领域 .所提出的新算法以 Mck-eown的焦点算法为基础 ,将原来的栈式控制结构改进成树型控制结构 ,可以同时控制全局焦点和局部焦点的移动 .新算法改进了 Schema的扩充转... 该文完善了全局焦点和局部焦点的移动规则 ,使规则适合更广泛的应用领域 .所提出的新算法以 Mck-eown的焦点算法为基础 ,将原来的栈式控制结构改进成树型控制结构 ,可以同时控制全局焦点和局部焦点的移动 .新算法改进了 Schema的扩充转移网络表示 ,为弧增加了重复特性和优先级的信息 ,还加入了对 Schema进行递归的控制和回溯机制 ,并由知识库决定 Schema的填充和递归 .此外 ,又增加了对 Schema可交换符号的处理 .在此基础上 ,进一步介绍了实验系统的设计 ,并讨论了算法的效果 . 展开更多
关键词 文本规划 全局焦点 局部焦点 谓词 知识库
下载PDF
基于CRF算法的汉语比较句识别和关系抽取 被引量:22
6
作者 黄高辉 姚天昉 刘全升 《计算机应用研究》 CSCD 北大核心 2010年第6期2061-2064,共4页
比较句是表明事物之间关系的常见表达方式,对于文本挖掘,特别是情感分析,具有重要的价值。目前汉语比较句的研究还是一个新颖的课题,包括汉语比较句的识别和比较关系的抽取。对于汉语比较句的识别,在前人研究的基础上,以SVM为分类器,以... 比较句是表明事物之间关系的常见表达方式,对于文本挖掘,特别是情感分析,具有重要的价值。目前汉语比较句的研究还是一个新颖的课题,包括汉语比较句的识别和比较关系的抽取。对于汉语比较句的识别,在前人研究的基础上,以SVM为分类器,以特征词和CSR序列规则为特征,同时利用CRF算法抽取实体对象,并增加以实体对象的信息作为特征,显著提高了比较句识别的准确率、召回率和F-度量,最高分别达到96.55%、88.63%和92.43%。对于汉语比较关系的抽取,在CRF算法抽取实体对象的基础上,通过定义一些规则,抽取比较主体和比较基准,也取得了较好的效果,其中比较主体的抽取效果要好于比较基准。 展开更多
关键词 比较句 比较关系 CRF模型 比较主体 比较基准
下载PDF
一个嵌入式实时Linux的技术研究 被引量:10
7
作者 尹凌 费斐 +1 位作者 王晓东 姚天昉 《计算机工程》 CAS CSCD 北大核心 2001年第8期61-62,65,共3页
根据实验室项目的需求,简要介绍了将Linux嵌入化需要考虑的几个方面的问题,对Linux的实时性能作了详细的分析,提出了提高Linux的实时性的解决方案。
关键词 嵌入式操作系统 实时必一响应度 LINUX 虚拟内存 PC机
下载PDF
信息检索与信息抽取技术的研究 被引量:20
8
作者 李芳 盛焕烨 姚天昉 《计算机应用研究》 CSCD 北大核心 2002年第1期16-18,共3页
在当今信息社会 ,人们对于信息获取的要求越来越高。特别是互联网的普及 ,可以很方便地从互联网上获取信息。然而目前的信息检索技术和信息抽取技术还远远不能满足人们的要求。首先介绍信息检索和信息抽取技术 ,然后分析两者的特点和不... 在当今信息社会 ,人们对于信息获取的要求越来越高。特别是互联网的普及 ,可以很方便地从互联网上获取信息。然而目前的信息检索技术和信息抽取技术还远远不能满足人们的要求。首先介绍信息检索和信息抽取技术 ,然后分析两者的特点和不足 。 展开更多
关键词 信息检索 信息抽取 互联网 数据库
下载PDF
汉语意见型主观性文本标注语料库的构建 被引量:10
9
作者 宋鸿彦 刘军 +2 位作者 姚天昉 刘全升 黄高辉 《中文信息学报》 CSCD 北大核心 2009年第2期123-128,共6页
汉语意见型主观性文本是目前自然语言处理中的一个研究热点。该文介绍了汉语意见型主观性文本标注语料库构建方面的一些经验,讨论了设计和建设语料库方面的几个重要问题,包括语料的选取、标注、存储、检索和统计,以及语料库相关工具的... 汉语意见型主观性文本是目前自然语言处理中的一个研究热点。该文介绍了汉语意见型主观性文本标注语料库构建方面的一些经验,讨论了设计和建设语料库方面的几个重要问题,包括语料的选取、标注、存储、检索和统计,以及语料库相关工具的设计等。汉语意见型主观性文本标注语料库与普通的语料库相比,其特点在于深度标注了主观性文本的词性、句法、语义和意见元素等信息,忠实记录了主观性文本的语言现象。汉语意见型主观性文本标注语料库的构建为人们分析和研究汉语主观性文本提供了有力的资源支持。 展开更多
关键词 计算机应用 中文信息处理 主观性文本 汉语意见型主观性文本 语料库
下载PDF
基于LDA模型的论坛热点话题识别和追踪 被引量:22
10
作者 徐佳俊 杨飏 +1 位作者 姚天昉 付中阳 《中文信息学报》 CSCD 北大核心 2016年第1期43-49,共7页
在当今处于信息数量爆炸式增长的互联网时代,如何分析海量文本中的信息并从而提取出所蕴含的有利用价值的部分,是一个值得关注的问题。然而论坛语料作为网络语料,其结构和内容较一般语料相比更为复杂,文本也更加短小。该文提出的方法利... 在当今处于信息数量爆炸式增长的互联网时代,如何分析海量文本中的信息并从而提取出所蕴含的有利用价值的部分,是一个值得关注的问题。然而论坛语料作为网络语料,其结构和内容较一般语料相比更为复杂,文本也更加短小。该文提出的方法利用LDA模型对语料集进行建模,将话题从中抽取出来,根据生成的话题空间找到相应的话题支持文档,计算文档支持率作为话题强度;将话题强度反映在时间轴上,得到话题的强度趋势;通过在不同时间段上对语料重新建模,并结合全局话题,得到话题的内容演化路径。实验结果说明,上述方法是合理和有效的。 展开更多
关键词 论坛 话题模型 趋势分析 话题追踪 LDA
下载PDF
汉语句子语义极性分析和观点抽取方法的研究 被引量:64
11
作者 娄德成 姚天昉 《计算机应用》 CSCD 北大核心 2006年第11期2622-2625,共4页
利用自然语言处理技术,对中文网络评论语句进行语义极性分析和观点抽取。提出了计算词语上下文极性的算法,并且分析主题和修饰成分的匹配关系。最后与手工标注结果进行比较,通过实验证明了该算法的合理性和有效性。
关键词 语义极性 网络评论 句法分析
下载PDF
第三届中文倾向性分析评测(COAE2011)语料的构建与分析 被引量:6
12
作者 廖祥文 许洪波 +1 位作者 孙乐 姚天昉 《中文信息学报》 CSCD 北大核心 2013年第1期56-63,共8页
文本倾向性分析已成为自然语言处理领域研究的热点问题之一。为进一步推动中文倾向性分析的研究,中国中文信息学会信息检索专业委员会举办了第三届中文倾向性分析评测(COAE2011)。该次评测主要关注领域和上下文语境(Context)对中文倾向... 文本倾向性分析已成为自然语言处理领域研究的热点问题之一。为进一步推动中文倾向性分析的研究,中国中文信息学会信息检索专业委员会举办了第三届中文倾向性分析评测(COAE2011)。该次评测主要关注领域和上下文语境(Context)对中文倾向性分析的影响。该文主要介绍COAE2011评测语料的构建及其对评测的支撑:首先介绍了COAE2011语料的领域选取、媒介分布等获取过程,然后详细阐述语料的标注原则与方法,最后依据评测结果分析领域和上下文语境因素对倾向性的影响。COAE2011语料的建立将为中文倾向性分析提供强大的资源支持。 展开更多
关键词 中文信息处理 倾向性分析 倾向性语料库 文本编码规范
下载PDF
一种基于混合分析的汉语文本句法语义分析方法 被引量:4
13
作者 尹凌 姚天昉 +1 位作者 张冬茉 李芳 《中文信息学报》 CSCD 北大核心 2002年第4期45-51,共7页
本文提出了一种领域相关的汉语文本句法语义分析方法。根据领域文本的特点 ,该方法将浅层句法分析和深层句法语义分析结合在了一起。其浅层句法分析部分采用有限状态层叠的方法 ,将文本中的命名实体识别出来 ,从而大大减轻了深层分析部... 本文提出了一种领域相关的汉语文本句法语义分析方法。根据领域文本的特点 ,该方法将浅层句法分析和深层句法语义分析结合在了一起。其浅层句法分析部分采用有限状态层叠的方法 ,将文本中的命名实体识别出来 ,从而大大减轻了深层分析部分的负担。其深层句法语义分析部分将语义分析和语法分析结合起来 ,主要依靠词汇搭配信息来决定句子的结构。 展开更多
关键词 混合分析 汉语文本句法语义分析方法 浅层浅分析 深层句法分析 有限状态层叠 分语义场 句子结构
下载PDF
评价对象及其倾向性的抽取和判别 被引量:23
14
作者 顾正甲 姚天昉 《中文信息学报》 CSCD 北大核心 2012年第4期91-97,共7页
基于主观性文本的意见挖掘技术是一种在多种领域都有广泛应用的语言技术。该文把评价性语素作为研究对象,在哈尔滨工业大学的语言技术平台(LTP)对语料处理结果的基础上,利用SBV极性传递法为核心,引入指代消解、ATT链算法和互信息法对语... 基于主观性文本的意见挖掘技术是一种在多种领域都有广泛应用的语言技术。该文把评价性语素作为研究对象,在哈尔滨工业大学的语言技术平台(LTP)对语料处理结果的基础上,利用SBV极性传递法为核心,引入指代消解、ATT链算法和互信息法对语料中的评价对象进行抽取,并在对极性词进行倾向性判别时,充分考虑了不同类型的句子,以及副词、连词对极性的影响,尤其是对一般副词、贬义副词和副词"太"作了详细地探讨,最后提出了一个综合的解决方案。该方案结构层次清晰,易于理解,并且其算法复杂度较低。但由于利用的是较为浅层的句法分析结果和基于经验的语言模式方法,该文提出的方案对句法分析结果的依赖度较大。 展开更多
关键词 评价对象 倾向性 SBV极性传递法 指代消解
下载PDF
汉语意见型主观性文本类型体系的研究 被引量:3
15
作者 刘全升 姚天昉 +2 位作者 黄高辉 刘军 宋鸿彦 《中文信息学报》 CSCD 北大核心 2008年第6期63-68,共6页
主观性文本是一种描述个人想法、情感和意见等的非约束性文本。它与主要描述以事实为主的客观性文本在内容和结构上有很大的不同。意见型文本是包含有意见元素(意见持有者、意见陈述范围、意见主题和意见情感)的一种主观性文本,它大量... 主观性文本是一种描述个人想法、情感和意见等的非约束性文本。它与主要描述以事实为主的客观性文本在内容和结构上有很大的不同。意见型文本是包含有意见元素(意见持有者、意见陈述范围、意见主题和意见情感)的一种主观性文本,它大量出现在网上的电子公告板、论坛和博客等媒介中,受到广泛的关注,并成为研究意见挖掘方法和技术的语料。该文介绍了主观性文本的定义及其与客观性文本的差异,同时着重讨论了意见型文本的定义、特点、类型体系及其在意见挖掘技术中的应用。 展开更多
关键词 计算机应用 中文信息处理 主观性文本 类型体系 意见挖掘
下载PDF
基于Wikipedia的语义相关度计算 被引量:10
16
作者 刘军 姚天昉 《计算机工程》 CAS CSCD 北大核心 2010年第19期42-43,46,共3页
在意见挖掘中,为实现特殊领域知识的语义相关度计算,提出基于Wikipedia的语义相关度计算方法。在构建Wikipedia类别树的基础上,通过Wikipedia类别向量表示Wikipedia中的词汇,形成一部包含各种领域知识的Wikipedia词典,利用该词典计算语... 在意见挖掘中,为实现特殊领域知识的语义相关度计算,提出基于Wikipedia的语义相关度计算方法。在构建Wikipedia类别树的基础上,通过Wikipedia类别向量表示Wikipedia中的词汇,形成一部包含各种领域知识的Wikipedia词典,利用该词典计算语义相关度。实验结果表明,该方法的斯皮尔曼等级相关系数可达到0.77。 展开更多
关键词 语义相关度 领域知识 Wikipedia类别树 意见挖掘
下载PDF
多语种自然语言生成系统中的语言模型 被引量:3
17
作者 张冬茉 葛永 姚天昉 《上海交通大学学报》 EI CAS CSCD 北大核心 2000年第7期944-947,共4页
介绍了在多语种自然语言生成系统中如何用统一的模型来表示各语种的语言知识 .本文将语言知识分为语义资源和语法资源两个部分 .前者通过 Schema和优化规则确定文本的内容 ;后者根据句子结构类、句法规则和词典确定文本的具体形式 .该... 介绍了在多语种自然语言生成系统中如何用统一的模型来表示各语种的语言知识 .本文将语言知识分为语义资源和语法资源两个部分 .前者通过 Schema和优化规则确定文本的内容 ;后者根据句子结构类、句法规则和词典确定文本的具体形式 .该模型以复杂特征集为语言知识的载体 。 展开更多
关键词 语言模型 语义资源 多语种自然语言生成系统
下载PDF
汉语自然语言生成的句子结构优化 被引量:2
18
作者 张冬茉 李锦乾 姚天昉 《计算机工程》 CAS CSCD 北大核心 1998年第7期14-16,58,共4页
介绍汉语天气预报自动生成系统中句子结构优化的方法。该系统通过分析气象数据而生成天气预报文本,文本在计算机内部使用文本结构树表示,该结构通常具有一定的冗余性。采用一种基于语义的规则驱动方法来消除句子之间的信息冗余,从而... 介绍汉语天气预报自动生成系统中句子结构优化的方法。该系统通过分析气象数据而生成天气预报文本,文本在计算机内部使用文本结构树表示,该结构通常具有一定的冗余性。采用一种基于语义的规则驱动方法来消除句子之间的信息冗余,从而使生成的文本更加自然流畅,增加可读性。句子优化的主要类型、系统的构造以及规则的定义方法均在文中作了详细的说明。 展开更多
关键词 句子结构优化 自然语言生成 信息处理 天气预报
下载PDF
多语种自然语言生成系统中的预映射句子规划器 被引量:2
19
作者 张冬茉 葛永 姚天昉 《计算机研究与发展》 EI CSCD 北大核心 2001年第4期467-474,共8页
自然语言生成是研究如何用计算机来生成自然语言文本的研究领域 ,经典结构是宏观规划、微观规划和表层生成的流水线结构 .分析了多语种自然语言生成系统 ACNL G中的微观规划器 ,提出了“基于语言资源预映射的句子优化器”,它不仅对句子... 自然语言生成是研究如何用计算机来生成自然语言文本的研究领域 ,经典结构是宏观规划、微观规划和表层生成的流水线结构 .分析了多语种自然语言生成系统 ACNL G中的微观规划器 ,提出了“基于语言资源预映射的句子优化器”,它不仅对句子进行优化 ,而且负责将语种无关的文章内容映射到具体语种的表达方式中 .其核心思想就是将处理过程同具体语种的语言资源相分离 ,但同时又以语言资源为导向 ,既继承了现有方法的优点 ,同时也解决了多语种条件下各语种之间细微差别的处理问题 ,使句子优化能够针对目标语种的特点进行优化操作 ,从而使优化效果有实质的提高 。 展开更多
关键词 自然语言处理 多语种自然语言生成系统 预映射句子规划器 计算机
下载PDF
基于关联度模型的文本倾向性检索研究 被引量:5
20
作者 刘全升 姚天昉 《中文信息学报》 CSCD 北大核心 2011年第1期15-19,共5页
该文在研究了信息检索理论与文本倾向性分析技术等的基础上,结合国内外关于观点检索的相关研究,提出了基于关联度的文本观点检索算法。它综合考虑了主题检索过程中的查询扩展、文本检索相关度、文本倾向性强度和检索主题与文本情感的关... 该文在研究了信息检索理论与文本倾向性分析技术等的基础上,结合国内外关于观点检索的相关研究,提出了基于关联度的文本观点检索算法。它综合考虑了主题检索过程中的查询扩展、文本检索相关度、文本倾向性强度和检索主题与文本情感的关联度等对观点检索最后结果的影响。该算法从理论上考虑了观点检索不同因素之间的相互影响问题。通过对COAE2008观点检索子任务的实验数据进行实验,结果表明:该文提出的基于关联度的观点检索算法可以取得较好的效果。 展开更多
关键词 观点检索 关联度 文本挖掘
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部