-
题名论民国有声电影资料中方言口语的语料价值及整理
被引量:1
- 1
-
-
作者
欧阳国亮
-
机构
中国刑事警察学院刑事科学技术学院
-
出处
《山西大同大学学报(社会科学版)》
2021年第5期90-93,共4页
-
基金
辽宁省社会科学规划基金2020年度重点项目(L20AYY005)。
-
文摘
民国时期流传至今有大量的有声电影资料,主要是纪录片、故事片。从语言学视角看,这些有声影像资料中有很多都记录了那个年代某些地方的方言口语,具有自然口语语料的基本属性,它们为研究当时的方言情况提供了"活化石",同时也为窥视近代以来地方方言的演变提供了真实而丰富的语料,因此它们是一笔珍贵的语言遗产。在国家推进语言资源保护和开发利用的大背景下,要重视对这类语料的数字化整理、转写和研究,主张利用现代技术建立民国时期汉语方言口语语料库,使其焕发出历史的光彩。
-
关键词
民国电影
有声语料
方言口语
语料价值
语料整理
-
Keywords
film of the Republic of China
audio corpus
spoken dialect
corpus value
corpus arrangement
-
分类号
H07
[语言文字—语言学]
-
-
题名基于限定领域的平行语料库的设计
被引量:1
- 2
-
-
作者
毕雪华
吐尔根.依布拉音
-
机构
新疆大学信息科学与工程学院
-
出处
《电脑知识与技术》
2005年第9期77-78,共2页
-
文摘
作为一项重要的基础资源,双语平行语料库在人工智能领域的研究起着举足轻重的作用。我国涉及少数民族语言的双语语料库的探索工作相对较少,本文介绍了汉维双语语料库的建立过程,并对语料的收集整理和组织做了初步的设想。
-
关键词
双语语料库
语料整理
语料标注
语料对齐
-
Keywords
Bilingual Corpus, Corpus Collection, Corpus Annotation, Corpus Alignment
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名珍贵的有声语料:民国电影资料中的东北方言口语
- 3
-
-
作者
欧阳国亮
-
机构
中国刑事警察学院文件检验技术系
-
出处
《绥化学院学报》
2021年第6期68-70,共3页
-
基金
辽宁省社会科学规划基金2020年度重点项目“民国时期有声影像资料中东北方言口语语料的数字化整理与研究”(L20AYY005)。
-
文摘
民国时期流传至今的若干有声电影资料如故事片、纪录片,记录有大量的东北方言口语语料。统计分析发现,这些语料能覆盖大部分常用字词,由此可以透视民国时期东北方言的基本面貌,同时也为研究民国以来东北方言若干演变提供了较为丰富的口语语料,因此具有很高的语料价值。对这些语料进行整理,应当遵循整理研究并举、开发利用相继的基本原则,使它们既能为学术研究所用,也能为服务社会文化生活所取,真正实现其多维利用价值。
-
关键词
民国电影
东北方言
口语语料
语料价值
语料整理
-
分类号
H172.1
[语言文字—汉语]
-
-
题名正则表达式在对外汉语教学与研究中的应用
- 4
-
-
作者
卢达威
-
机构
中国人民大学文学院
-
出处
《国际汉语》
2024年第1期128-137,167,共11页
-
文摘
本文首先介绍正则表达式的概念、原理和匹配规则,并结合对外汉语教学和研究的需求,阐述正则表达式的使用环境,以及利用正则表达式进行语料检索和语料整理的方法,包括离合词、日期表达、“X来X去”、“动词+了”的检索方法和句号句换行、去除行首空格、去除空行等语料整理方法,以及辅助语料标注方法。
-
关键词
正则表达式
语料检索
语料整理
语料库
-
Keywords
regular expressions
retrieval
data cleaning
corpus
-
分类号
H195
[语言文字—汉语]
-