期刊导航
期刊开放获取
重庆大学
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
我国低资源语言大规模数据建构及语言田野实践的数据转向
被引量:
3
1
作者
范俊军
沐华
《云南师范大学学报(哲学社会科学版)》
CSSCI
北大核心
2023年第6期25-35,共11页
低资源语言是指缺乏可用于自然语言处理任务和语言学计量分析所需足够基础数据的语言。低资源语言数据稀缺,是当前语言科学和自然语言处理共同面临的问题。语言数据资源最基础的部分是单语或双语词汇、语句的语音和文本数据。我国普通...
低资源语言是指缺乏可用于自然语言处理任务和语言学计量分析所需足够基础数据的语言。低资源语言数据稀缺,是当前语言科学和自然语言处理共同面临的问题。语言数据资源最基础的部分是单语或双语词汇、语句的语音和文本数据。我国普通话、粤方言、藏语、维吾尔语、蒙古语、壮语总体属于高资源语言,其他语言都属于低资源语言,其中县乡语言和方言属零资源语言。建构我国低资源语言的大规模数据,有助于强化我们掌握自己国家语言资源的控制权,发挥我国自然语言处理领域在语言模型技术创新中的独特作用,推动语言田野工作的数据转向,创新田野语言学理论和实践,促进基于数据计量的语言学广域研究。建构我国低资源语言数据,主要有四项任务:一是建构大规模词语数据集,二是建构知识语义词网,三是建构大规模句子数据集,四是现有语言资料的数据化。
展开更多
关键词
低资源
语言
少数民族
语言
自然
语言
处理(NLP)
田野语言学
下载PDF
职称材料
我国少数民族语言田野调查记录的伦理问题
被引量:
2
2
作者
范俊军
马海布吉
《西北民族大学学报(哲学社会科学版)》
CSSCI
2014年第4期70-75,共6页
当代少数民族语言田野调查记录已经不是单纯的耳听手记收集字、词、句材料,而要充分记录语言族群生活中的言语事件和言语实践。记录手段、内容、成果形式和传播途径也多样化。田野调查记录活动涉及族群文化敏感、社区禁忌、族群内务、...
当代少数民族语言田野调查记录已经不是单纯的耳听手记收集字、词、句材料,而要充分记录语言族群生活中的言语事件和言语实践。记录手段、内容、成果形式和传播途径也多样化。田野调查记录活动涉及族群文化敏感、社区禁忌、族群内务、说话人隐私、相关权益等伦理问题。当前我国少数民族语言田野调查记录的伦理缺失主要表现在:触犯族群文化敏感和行为禁忌,对语言社区资源缺乏珍惜,忽视发音人和说话人的知识产权,语言报告中泄露和传播语言族群个人和群体隐私信息,未经许可采用暗访、暗记、偷录和偷拍获取语言材料,不当支付酬金等等。当前应尽快建立少数民族语言田野调查记录的伦理准则,推动少数民族语言调查研究的健康发展。
展开更多
关键词
田野语言学
少数民族
语言
语言
田野
调查伦理
下载PDF
职称材料
题名
我国低资源语言大规模数据建构及语言田野实践的数据转向
被引量:
3
1
作者
范俊军
沐华
机构
暨南大学文学院
楚雄师范学院语言文化学院
出处
《云南师范大学学报(哲学社会科学版)》
CSSCI
北大核心
2023年第6期25-35,共11页
基金
国家社会科学基金重大项目“濒危语言数字博物馆建设的理论与实践研究”(2014ZDB106)。
文摘
低资源语言是指缺乏可用于自然语言处理任务和语言学计量分析所需足够基础数据的语言。低资源语言数据稀缺,是当前语言科学和自然语言处理共同面临的问题。语言数据资源最基础的部分是单语或双语词汇、语句的语音和文本数据。我国普通话、粤方言、藏语、维吾尔语、蒙古语、壮语总体属于高资源语言,其他语言都属于低资源语言,其中县乡语言和方言属零资源语言。建构我国低资源语言的大规模数据,有助于强化我们掌握自己国家语言资源的控制权,发挥我国自然语言处理领域在语言模型技术创新中的独特作用,推动语言田野工作的数据转向,创新田野语言学理论和实践,促进基于数据计量的语言学广域研究。建构我国低资源语言数据,主要有四项任务:一是建构大规模词语数据集,二是建构知识语义词网,三是建构大规模句子数据集,四是现有语言资料的数据化。
关键词
低资源
语言
少数民族
语言
自然
语言
处理(NLP)
田野语言学
Keywords
low-resource languages
minority languages
NLP
field linguistics
分类号
H0-0 [语言文字—语言学]
H003 [语言文字—语言学]
下载PDF
职称材料
题名
我国少数民族语言田野调查记录的伦理问题
被引量:
2
2
作者
范俊军
马海布吉
机构
暨南大学文学院
出处
《西北民族大学学报(哲学社会科学版)》
CSSCI
2014年第4期70-75,共6页
基金
国家社科基金重点项目"中国濒危语言有声语档建设的理论体系
实践规程及技术准则研究"(项目批准号:12AYY002)的阶段性成果
文摘
当代少数民族语言田野调查记录已经不是单纯的耳听手记收集字、词、句材料,而要充分记录语言族群生活中的言语事件和言语实践。记录手段、内容、成果形式和传播途径也多样化。田野调查记录活动涉及族群文化敏感、社区禁忌、族群内务、说话人隐私、相关权益等伦理问题。当前我国少数民族语言田野调查记录的伦理缺失主要表现在:触犯族群文化敏感和行为禁忌,对语言社区资源缺乏珍惜,忽视发音人和说话人的知识产权,语言报告中泄露和传播语言族群个人和群体隐私信息,未经许可采用暗访、暗记、偷录和偷拍获取语言材料,不当支付酬金等等。当前应尽快建立少数民族语言田野调查记录的伦理准则,推动少数民族语言调查研究的健康发展。
关键词
田野语言学
少数民族
语言
语言
田野
调查伦理
Keywords
field linguistics
ethnic minority languages
morality for field survey of languages
分类号
H2 [语言文字—少数民族语言]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
我国低资源语言大规模数据建构及语言田野实践的数据转向
范俊军
沐华
《云南师范大学学报(哲学社会科学版)》
CSSCI
北大核心
2023
3
下载PDF
职称材料
2
我国少数民族语言田野调查记录的伦理问题
范俊军
马海布吉
《西北民族大学学报(哲学社会科学版)》
CSSCI
2014
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部