期刊文献+
共找到44篇文章
< 1 2 3 >
每页显示 20 50 100
基于多策略的乌孜别克语名词词干识别研究 被引量:3
1
作者 海尔江 祖力克尔江 +1 位作者 艾孜尔古丽 玉素甫.白都拉 《中文信息学报》 CSCD 北大核心 2018年第9期35-40,共6页
乌孜别克语名词词干识别是自然语言处理领域的基础研究,主要方法是从句子中提取名词词干,提高名词标注效率和准确性。该文首先陈述形态分析、形态特征对识别其词性的作用,然后讨论乌孜别克语的词类划分标准、名词的形态特征,乌孜别克语... 乌孜别克语名词词干识别是自然语言处理领域的基础研究,主要方法是从句子中提取名词词干,提高名词标注效率和准确性。该文首先陈述形态分析、形态特征对识别其词性的作用,然后讨论乌孜别克语的词类划分标准、名词的形态特征,乌孜别克语西尔里文转换拉丁文,乌孜别克语词汇翻译、标注技术,总结词缀歧义及消解规则。该文提出利用形态规则、词典、最大熵融合策略,设计现代乌孜别克语新词中名词词干识别算法,其中包括特征选择及参数估计、词内部特征、前后依存词特征等。最后以乌孜别克语网站文本作为验证对象,对名词词干进行统计与分析。 展开更多
关键词 乌孜别克语 形态分析 多策略 名词词干识别
下载PDF
基于多头注意力的电网调度领域命名实体识别 被引量:3
2
作者 毛宏亮 艾孜尔古丽 陈德刚 《计算机技术与发展》 2023年第2期181-186,194,共7页
针对电网调度领域实体识别准确率较低的问题,提出一种融合多头注意力机制和双向长短时记忆网络的电网调度领域中文命名实体识别方法。利用词向量表示电网调度语音识别后语句,并将生成的词向量序列输入双向长短时记忆网络(BiLSTM)挖掘其... 针对电网调度领域实体识别准确率较低的问题,提出一种融合多头注意力机制和双向长短时记忆网络的电网调度领域中文命名实体识别方法。利用词向量表示电网调度语音识别后语句,并将生成的词向量序列输入双向长短时记忆网络(BiLSTM)挖掘其上下文语义特征,引入多头注意力机制重点关注文本中的实体词,挖掘其隐藏特征,同时通过条件随机场(CRF)计算序列标签的联合概率标注出实体识别结果。根据电网调度语音识别后文本特点自建标注数据集,并将电网调度语音识别文本中的命名实体细粒度划分为参数、设备、操作、系统、组织5个类别进行实验。其结果表明,该方法对电网调度领域实体识别具有更高的准确率和召回率,且F1值可达到93.63%,切实解决了电网调度领域实体识别任务中标注数据稀少和精度较低的问题,有助于电网调度领域知识图谱的构建。 展开更多
关键词 实体识别 电网调度 多头注意力 双向长短时记忆 联合概率 知识图谱
下载PDF
乌兹别克语命名实体数据集构建研究
3
作者 海尔江·玉素甫 姬东鸿 +2 位作者 李霏 滕冲 艾孜尔古丽 《中文信息学报》 CSCD 北大核心 2023年第9期83-91,共9页
命名实体识别(NER)是自然语言处理领域的一个重要任务,用于在文本中识别实体并将其分类为预定义的类型。乌兹别克语(简称乌语)命名实体识别在国内外相关研究中处于初级阶段,目前为止尚没有公开、通用的乌语命名实体识别数据集,导致了乌... 命名实体识别(NER)是自然语言处理领域的一个重要任务,用于在文本中识别实体并将其分类为预定义的类型。乌兹别克语(简称乌语)命名实体识别在国内外相关研究中处于初级阶段,目前为止尚没有公开、通用的乌语命名实体识别数据集,导致了乌语命名实体识别的进展受到了限制。该文旨在构建一个基于乌兹别克语新闻文本的NER数据集,收集了500篇乌兹别克语新闻文章,并人工标注了其中的人名、地名和组织机构名。随后,利用实体命名识别的主流深度学习模型在该数据集上进行了实验与比较分析。实验结果表明,主流深度学习模型的F 1值均在90%以上,证明了该文构建的数据集的有效性和可用性。该文旨在推动乌语命名实体识别领域的研究发展,为该领域提供数据集和基线模型,以扩展相关研究。 展开更多
关键词 自然语言处理 乌兹别克语 实体命名识别
下载PDF
基于网站用词调查的现代维吾尔语词干提取和应用研究 被引量:11
4
作者 艾孜尔古丽 齐向卫 玉素甫.白都拉 《计算机应用与软件》 CSCD 北大核心 2012年第3期32-34,97,共4页
通过对维吾尔文网站的词干应用状况调查,进而对现代维吾尔文词干的提取和应用进行研究。陈述调查使用的语料媒体来源、应用领域、采集的语料时间跨度与统计方法;介绍词干概念;讨论现代维吾尔语词干提取系统;研究词干在网络媒体语料中应... 通过对维吾尔文网站的词干应用状况调查,进而对现代维吾尔文词干的提取和应用进行研究。陈述调查使用的语料媒体来源、应用领域、采集的语料时间跨度与统计方法;介绍词干概念;讨论现代维吾尔语词干提取系统;研究词干在网络媒体语料中应用形式;介绍和讨论词干分布结果,最后总结以上内容。 展开更多
关键词 现代维吾尔语 网站 词干 提取
下载PDF
中小学维吾尔语文教材用词数据分析方法研究 被引量:3
5
作者 艾孜尔古丽 李晓 玉素甫.白都拉 《计算机工程与应用》 CSCD 2014年第3期108-111,共4页
随着社会的发展变化,语言生活也在不断地发展变化。为了切实掌握中小学维吾尔语文教材中用词情况,以中小学维吾尔语文教材作为研究对象,对用词概况进行研究。陈述研究使用的语料;介绍统计系统研究概况;中小学维吾尔语文教材用词研究包... 随着社会的发展变化,语言生活也在不断地发展变化。为了切实掌握中小学维吾尔语文教材中用词情况,以中小学维吾尔语文教材作为研究对象,对用词概况进行研究。陈述研究使用的语料;介绍统计系统研究概况;中小学维吾尔语文教材用词研究包括研究总词次、总词种数、总词干种数;讨论与分析词频与词种、词种覆盖率、词种。 展开更多
关键词 维吾尔语文 中小学维吾尔语文教材 词语 数据分析
下载PDF
现代维吾尔语语言资源监测中数据分析技术研究 被引量:3
6
作者 艾孜尔古丽 阿里木.木拉提 苏国平 《计算机应用与软件》 CSCD 北大核心 2013年第4期36-39,共4页
随着社会的发展变化,语言生活也在不断地发展变化。语言监测是客观描写语言、掌握语言发展动态、进行语言规划的必要手段。以现代维吾尔语数据分析技术为手段,小学、初中维吾尔语文教材词频表作为研究对象,对用词分布情况进行研究,切实... 随着社会的发展变化,语言生活也在不断地发展变化。语言监测是客观描写语言、掌握语言发展动态、进行语言规划的必要手段。以现代维吾尔语数据分析技术为手段,小学、初中维吾尔语文教材词频表作为研究对象,对用词分布情况进行研究,切实掌握小学初中维吾尔语文教材中用词情况。首先陈述现代维吾尔语语言监测的研究概况;其次介绍数据分析系统的组成;最后阐述小学、初中维吾尔语文教材用词研究状况包括研究频次与词种的关系、词种覆盖率、词种分布分析等项目并讨论与分析自动形成词频与词种、词种覆盖率、词种分布等方面的结果。 展开更多
关键词 维吾尔语语言监测 数据分析技术 用词分布概况
下载PDF
现代维吾尔语词干词类标注标记集验证性研究 被引量:2
7
作者 艾孜尔古丽 米尔夏提 玉素甫.白都拉 《计算机工程与科学》 CSCD 北大核心 2015年第12期2318-2323,共6页
以维吾尔语小学语文教材语料为验证对象,利用从语法语义相结合角度制定的《现代维吾尔语词干词类标注标记集》,对维吾尔语小学语文教材词干进行了词性标注,验证该标记集规范的可行性、适应性和可靠性。首先介绍小学语文教材电子语料库;... 以维吾尔语小学语文教材语料为验证对象,利用从语法语义相结合角度制定的《现代维吾尔语词干词类标注标记集》,对维吾尔语小学语文教材词干进行了词性标注,验证该标记集规范的可行性、适应性和可靠性。首先介绍小学语文教材电子语料库;其次讨论《信息处理用现代维吾尔语词干词类标注标记集》的基本情况和多策略现代维吾尔语词干标注系统模型设计与算法;最后分析现代维吾尔语词性标注标记集验证结果,并验证《信息处理用现代维吾尔语词干词类标注标记集》的科学性,补充和改正部分词类的语义分类及标注代码,提出了规范的扩充建议。 展开更多
关键词 现代维吾尔语词干 词类标注 标记集 验证
下载PDF
现代维吾尔语常用词统计关键技术研究 被引量:8
8
作者 艾孜尔古丽 努尔合买提 玉素甫.白都拉 《中文信息学报》 CSCD 北大核心 2014年第5期192-197,共6页
本文研究了构建现代维吾尔语语料库的关键技术与方法,特别是现代维吾尔语语料库的构建,并对现代维吾尔语语料预处理技术,现代维吾尔语语料统计技术,现代维吾尔语词干提取技术,现代维吾尔语数据分析技术进行了研究;研制了现代维吾尔语常... 本文研究了构建现代维吾尔语语料库的关键技术与方法,特别是现代维吾尔语语料库的构建,并对现代维吾尔语语料预处理技术,现代维吾尔语语料统计技术,现代维吾尔语词干提取技术,现代维吾尔语数据分析技术进行了研究;研制了现代维吾尔语常用词候选表,从词语的使用频度和词语的分布两方面对词语进行了基本考察,将维吾尔语词语的"词种数、频次、频率、文本数、词长"作为常用词候选表的依据。 展开更多
关键词 现代维吾尔语 语料库 常用词候选表 计量分析
下载PDF
现代维吾尔文网络媒体用词研究 被引量:7
9
作者 艾孜尔古丽 山江.阿不力 玉素甫.白都拉 《计算机应用与软件》 CSCD 北大核心 2012年第2期67-68,121,共3页
随着社会的发展,语言也在不断地发展变化。为了切实掌握维吾尔语当前使用情况,及时把握维吾尔语年度用词的第一手资料,对网络媒体的现代维吾尔语用词进行研究。首先对现代维吾尔语词语的结构进行分析,并给出描述现代维吾尔语词法的结构... 随着社会的发展,语言也在不断地发展变化。为了切实掌握维吾尔语当前使用情况,及时把握维吾尔语年度用词的第一手资料,对网络媒体的现代维吾尔语用词进行研究。首先对现代维吾尔语词语的结构进行分析,并给出描述现代维吾尔语词法的结构模型;然后介绍调查使用的语料媒体来源、应用领域、采集的语料时间跨度与统计方法以及统计结果讨论。 展开更多
关键词 现代维吾尔文 网站 词语 统计
下载PDF
维吾尔文初中数学教材词干分析研究 被引量:1
10
作者 艾孜尔古丽 海尔江 +2 位作者 玉素甫.白都拉 祖力克尔江 米尔夏提 《中文信息学报》 CSCD 北大核心 2017年第5期108-113,共6页
该文将初中数学维吾尔文教材作为研究对象,根据维吾尔语的特点和统计学原理理论,从计算语言学角度调查初中数学维吾尔文教材用词干情况。该文主要研究维吾尔语词干、教材概貌、数据处理技术相关概念及其算法及现代维吾尔语语料处理工具... 该文将初中数学维吾尔文教材作为研究对象,根据维吾尔语的特点和统计学原理理论,从计算语言学角度调查初中数学维吾尔文教材用词干情况。该文主要研究维吾尔语词干、教材概貌、数据处理技术相关概念及其算法及现代维吾尔语语料处理工具,获取教材中词干基本情况、新增词干、初中数学教材高频词干,开展了初中数学维吾尔文教材词干调查,为维吾尔语研究、维吾尔文数学教学与教材编纂等提供参考依据,从而更加积极有效地促进维吾尔语语言本身研究及其信息处理的发展。 展开更多
关键词 现代维吾尔语 词干 分析 方法
下载PDF
基于形态分析的现代维吾尔语名词词干识别研究 被引量:4
11
作者 艾孜尔古丽 阿力木.木拉提 玉素甫.白都拉 《中文信息学报》 CSCD 北大核心 2015年第6期208-212,共5页
现代维吾尔语名词词干识别是自然语言处理领域的重要基础性研究,主要目的是从句子中提取名词词干,提高名词识别效率。首先陈述形态分析概念,通过这些形态特征可以准确地识别其词性的意义;其次讨论维吾尔语的词类划分标准、名词的形态特... 现代维吾尔语名词词干识别是自然语言处理领域的重要基础性研究,主要目的是从句子中提取名词词干,提高名词识别效率。首先陈述形态分析概念,通过这些形态特征可以准确地识别其词性的意义;其次讨论维吾尔语的词类划分标准、名词的形态特征分析,总结词缀歧义及消解规则;该文提出研究总体思路,设计现代维吾尔语新词中名词识别算法,其中包括特征选择及参数估计、词内部特征、前后依存词特征等;最后将初中、高中物理维吾尔语教材作为验证对象,对名词词干进行统计与分析。 展开更多
关键词 现代维吾尔语 形态分析 名词词干识别
下载PDF
新疆小学信息技术双语教学资源构建研究
12
作者 艾孜尔古丽 克然木 玉素甫·白都拉 《电脑知识与技术》 2015年第6期113-115,共3页
目前在新疆地区信息技术双语教育资源匮乏,仅通过远程手段难以继续学习。该文主要介绍了使培训教师所学的教学方法进行巩固的必要性;同时描述加强双语教育资源检索应用服务平台建设;提出小学信息技术双语教学资源建设内容和手段、模式;... 目前在新疆地区信息技术双语教育资源匮乏,仅通过远程手段难以继续学习。该文主要介绍了使培训教师所学的教学方法进行巩固的必要性;同时描述加强双语教育资源检索应用服务平台建设;提出小学信息技术双语教学资源建设内容和手段、模式;陈述双语信息技术远程教学共享服务平台建设内容、知识库建设、双语教学资源存储、管理等内容和远程双语教学平台应用、推广建议。 展开更多
关键词 小学 信息技术 双语教学 资源建设
下载PDF
汉维双语计算机操作学习系统的开发与应用
13
作者 艾孜尔古丽 努尔合买提 玉素甫·白都拉 《电脑知识与技术》 2015年第6期53-54,共2页
以现有的学校课程中心为主的远程教学平台作为基础,本文主要研究基于客户端的汉维双语计算机操作学习系统,实现对计算机信息技术操作的自动取词、翻译、朗读、解释功能,分别可以将汉语翻译成维吾尔语,维吾尔语翻译成汉语。对Windows系... 以现有的学校课程中心为主的远程教学平台作为基础,本文主要研究基于客户端的汉维双语计算机操作学习系统,实现对计算机信息技术操作的自动取词、翻译、朗读、解释功能,分别可以将汉语翻译成维吾尔语,维吾尔语翻译成汉语。对Windows系列操作系统、Office系列办公软件以及其他软件的基本操作进行翻译,辅助中小学双语教师和学生学习信息技术和汉语的信息技术专业术语。 展开更多
关键词 自然语言处理 屏幕取词 测试
下载PDF
维吾尔文手写体基础数据库的构建与在线识别研究 被引量:1
14
作者 齐向伟 艾孜尔古丽 玉素甫 《新媒体研究》 2015年第13期12-14,共3页
维吾尔语是新疆维吾尔自治区的官方语言之一,目前其手写技术的发展仍然滞后,本文以中英文、阿拉伯文等一些辨别手段为出发点,根据维吾尔语言的构成规律和输入习惯等特征,研究建立维吾尔文联机手写体样本基础数据库的方法和样本集的获取... 维吾尔语是新疆维吾尔自治区的官方语言之一,目前其手写技术的发展仍然滞后,本文以中英文、阿拉伯文等一些辨别手段为出发点,根据维吾尔语言的构成规律和输入习惯等特征,研究建立维吾尔文联机手写体样本基础数据库的方法和样本集的获取及数据组织形式,并研究黏着性语言对手写输入识别的影响,提出一种有效的维吾尔文书写形式辨别方法。 展开更多
关键词 维吾尔文 样本数据库 手写识别
下载PDF
维吾尔语方言调查中的依据和方法选择 被引量:1
15
作者 玉素甫 白都拉 +1 位作者 齐向伟 艾孜尔古丽 《管理观察》 2013年第29期161-162,共2页
一、引言 关于现代维吾尔语方言的划分问题,国内外的一些学者,如马洛夫、雅林、巴斯卡科夫、捷尼舍夫、李森、阿米娜·阿帕鲁娃、米尔苏里唐·乌斯曼诺夫、高士杰等都曾对方言及土语的划分提出了不同的划分标准和见解。最后... 一、引言 关于现代维吾尔语方言的划分问题,国内外的一些学者,如马洛夫、雅林、巴斯卡科夫、捷尼舍夫、李森、阿米娜·阿帕鲁娃、米尔苏里唐·乌斯曼诺夫、高士杰等都曾对方言及土语的划分提出了不同的划分标准和见解。最后,以“三方言论”,即中心方言、和田方言和罗布方言为多数学者,尤其为我国的学者所普遍接受。目前,在这方面最具权威性的论著,要算米尔苏里唐·乌斯曼诺夫的《现代维吾尔语方言》一书(新疆青少年出版社,1989年,维吾尔文)。 展开更多
关键词 现代维吾尔语 方言调查 维吾尔文 学者 国内外 出版社 青少年 标准
下载PDF
基于语言资源理念的维吾尔语有声数据库构建研究 被引量:1
16
作者 齐向伟 玉素甫.白都拉 艾孜尔古丽 《数字技术与应用》 2011年第7期48-49,共2页
本文主要阐述了维吾尔语言资源有声数据库构建的目的和方法,以新疆维吾尔语言和方言有声资源为研究对象,研究整理有限区域维吾尔语言分布情况以及方言分布情况,绘制详细、准确、可传至后代的多媒体语言地图,开发维吾尔语有声数据库资源... 本文主要阐述了维吾尔语言资源有声数据库构建的目的和方法,以新疆维吾尔语言和方言有声资源为研究对象,研究整理有限区域维吾尔语言分布情况以及方言分布情况,绘制详细、准确、可传至后代的多媒体语言地图,开发维吾尔语有声数据库资源管理平台,为维吾尔语动态流通有声语言数据库打下良好基础。 展开更多
关键词 维吾尔文 有声数据库 语言资源
下载PDF
基于Android的维吾尔文笔式输入识别技术研究
17
作者 齐向伟 玉素甫.白都拉 +1 位作者 麦麦提 艾孜尔古丽 《新疆师范大学学报(自然科学版)》 2011年第2期82-84,共3页
随着手机与互联网技术的日趋成熟,人们越来越多地将目光从个人电脑转移到了移动智能设备,同时,随着计算机识别技术的成熟,国内外的手写输入技术的研究已经全面展开,基于PC、手机、PDA等设备的手写输入软件已经从发展逐渐走向成熟。然而... 随着手机与互联网技术的日趋成熟,人们越来越多地将目光从个人电脑转移到了移动智能设备,同时,随着计算机识别技术的成熟,国内外的手写输入技术的研究已经全面展开,基于PC、手机、PDA等设备的手写输入软件已经从发展逐渐走向成熟。然而,目前新疆市场上尚没有商品化的手写维吾尔文新界面软件产品问世,在前期工作的基础上,本文阐述了基于An-droid平台的维吾尔文笔式输入系统研究的背景和意义,针对Android平台的特征,阐述了目前基于Android的维吾尔文笔式输入系统的研究状况。 展开更多
关键词 维吾尔文 笔式输入识别 移动应用 ANDROID平台
下载PDF
维吾尔语手写体在线计算机识别技术研究
18
作者 齐向伟 艾孜尔古丽 玉素甫 《数字技术与应用》 2015年第12期118-119,共2页
维吾尔语是以单词为基本单位的黏连语,字母因在单词中位置的不同而具有不同的书写变形,目前手写技术的发展仍然落后于汉语、英语等语种。本文在分析维吾尔语言文字的结构、构词特点和输入习惯等特征的基础上,总结了黏着性语言对手写输... 维吾尔语是以单词为基本单位的黏连语,字母因在单词中位置的不同而具有不同的书写变形,目前手写技术的发展仍然落后于汉语、英语等语种。本文在分析维吾尔语言文字的结构、构词特点和输入习惯等特征的基础上,总结了黏着性语言对手写输入识别的影响,主要探讨了实现维吾尔文手写识别系统的过程和相关关键技术,以期通过对这些技术的分析、验证,实现维吾尔文手写识别系统。 展开更多
关键词 维吾尔文 手写体 在线识别
下载PDF
基于网站用词调查的现代维吾尔语词长研究 被引量:9
19
作者 玉素甫.白都拉 艾孜尔古丽 祖丽皮亚 《计算机应用与软件》 CSCD 北大核心 2012年第5期32-34,共3页
首先陈述调查使用的语料媒体来源、应用领域、采集的语料时间跨度与统计方法;其次按词长排序的前20个最长的词情况,介绍词语长度分布;在此基础上分析词干长度分布、常用纯词干长度分布及常用去尾词干长度分布;最后介绍平均词干、词长统... 首先陈述调查使用的语料媒体来源、应用领域、采集的语料时间跨度与统计方法;其次按词长排序的前20个最长的词情况,介绍词语长度分布;在此基础上分析词干长度分布、常用纯词干长度分布及常用去尾词干长度分布;最后介绍平均词干、词长统计与分析结果。 展开更多
关键词 现代维吾尔文 网络媒体 词长 研究
下载PDF
基于网站用词调查的现代维吾尔语词尾切分和应用研究 被引量:6
20
作者 玉素甫.白都拉 艾孜尔古丽 《计算机应用与软件》 CSCD 北大核心 2012年第4期13-15,共3页
首先对现代维吾尔语词尾或词缀进行描述和定义;其次陈述调查使用的网络媒体语料来源、语料说明、词法结构、词语还原方法、语料应用领域、采集的语料时间跨度与统计方法;最后介绍词尾的使用情况,包括频次超过万次以上的词尾、词尾频次... 首先对现代维吾尔语词尾或词缀进行描述和定义;其次陈述调查使用的网络媒体语料来源、语料说明、词法结构、词语还原方法、语料应用领域、采集的语料时间跨度与统计方法;最后介绍词尾的使用情况,包括频次超过万次以上的词尾、词尾频次分段分析、词尾长分段分析结果。 展开更多
关键词 现代维吾尔文 网站 词尾 切分
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部