期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
我国低资源语言大规模数据建构及语言田野实践的数据转向 被引量:3
1
作者 范俊军 沐华 《云南师范大学学报(哲学社会科学版)》 CSSCI 北大核心 2023年第6期25-35,共11页
低资源语言是指缺乏可用于自然语言处理任务和语言学计量分析所需足够基础数据的语言。低资源语言数据稀缺,是当前语言科学和自然语言处理共同面临的问题。语言数据资源最基础的部分是单语或双语词汇、语句的语音和文本数据。我国普通... 低资源语言是指缺乏可用于自然语言处理任务和语言学计量分析所需足够基础数据的语言。低资源语言数据稀缺,是当前语言科学和自然语言处理共同面临的问题。语言数据资源最基础的部分是单语或双语词汇、语句的语音和文本数据。我国普通话、粤方言、藏语、维吾尔语、蒙古语、壮语总体属于高资源语言,其他语言都属于低资源语言,其中县乡语言和方言属零资源语言。建构我国低资源语言的大规模数据,有助于强化我们掌握自己国家语言资源的控制权,发挥我国自然语言处理领域在语言模型技术创新中的独特作用,推动语言田野工作的数据转向,创新田野语言学理论和实践,促进基于数据计量的语言学广域研究。建构我国低资源语言数据,主要有四项任务:一是建构大规模词语数据集,二是建构知识语义词网,三是建构大规模句子数据集,四是现有语言资料的数据化。 展开更多
关键词 低资源语言 少数民族语言 自然语言处理(NLP) 田野语言学
下载PDF
我国少数民族语言田野调查记录的伦理问题 被引量:2
2
作者 范俊军 马海布吉 《西北民族大学学报(哲学社会科学版)》 CSSCI 2014年第4期70-75,共6页
当代少数民族语言田野调查记录已经不是单纯的耳听手记收集字、词、句材料,而要充分记录语言族群生活中的言语事件和言语实践。记录手段、内容、成果形式和传播途径也多样化。田野调查记录活动涉及族群文化敏感、社区禁忌、族群内务、... 当代少数民族语言田野调查记录已经不是单纯的耳听手记收集字、词、句材料,而要充分记录语言族群生活中的言语事件和言语实践。记录手段、内容、成果形式和传播途径也多样化。田野调查记录活动涉及族群文化敏感、社区禁忌、族群内务、说话人隐私、相关权益等伦理问题。当前我国少数民族语言田野调查记录的伦理缺失主要表现在:触犯族群文化敏感和行为禁忌,对语言社区资源缺乏珍惜,忽视发音人和说话人的知识产权,语言报告中泄露和传播语言族群个人和群体隐私信息,未经许可采用暗访、暗记、偷录和偷拍获取语言材料,不当支付酬金等等。当前应尽快建立少数民族语言田野调查记录的伦理准则,推动少数民族语言调查研究的健康发展。 展开更多
关键词 田野语言学 少数民族语言 语言田野调查伦理
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部