期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
乌兹别克语命名实体数据集构建研究
1
作者 艾孜海尔江·玉素甫 姬东鸿 +2 位作者 李霏 滕冲 艾孜尔古丽 《中文信息学报》 CSCD 北大核心 2023年第9期83-91,共9页
命名实体识别(NER)是自然语言处理领域的一个重要任务,用于在文本中识别实体并将其分类为预定义的类型。乌兹别克语(简称乌语)命名实体识别在国内外相关研究中处于初级阶段,目前为止尚没有公开、通用的乌语命名实体识别数据集,导致了乌... 命名实体识别(NER)是自然语言处理领域的一个重要任务,用于在文本中识别实体并将其分类为预定义的类型。乌兹别克语(简称乌语)命名实体识别在国内外相关研究中处于初级阶段,目前为止尚没有公开、通用的乌语命名实体识别数据集,导致了乌语命名实体识别的进展受到了限制。该文旨在构建一个基于乌兹别克语新闻文本的NER数据集,收集了500篇乌兹别克语新闻文章,并人工标注了其中的人名、地名和组织机构名。随后,利用实体命名识别的主流深度学习模型在该数据集上进行了实验与比较分析。实验结果表明,主流深度学习模型的F 1值均在90%以上,证明了该文构建的数据集的有效性和可用性。该文旨在推动乌语命名实体识别领域的研究发展,为该领域提供数据集和基线模型,以扩展相关研究。 展开更多
关键词 自然语言处理 乌兹别克语 实体命名识别
下载PDF
乌兹别克语文字拉丁化评析
2
作者 刘正江 江秋丽 《新疆大学学报(哲学社会科学版)》 CSSCI 2022年第5期40-47,共8页
1993年,乌兹别克斯坦开始实施乌兹别克语文字由西里尔字母向拉丁字母过渡,目的是希望通过文字改革消解俄罗斯的影响,实现民族独立,加速融入世界发展进程。但是乌兹别克语文字拉丁化的历程艰难而曲折,由于没有进行充分的科学论证,同时缺... 1993年,乌兹别克斯坦开始实施乌兹别克语文字由西里尔字母向拉丁字母过渡,目的是希望通过文字改革消解俄罗斯的影响,实现民族独立,加速融入世界发展进程。但是乌兹别克语文字拉丁化的历程艰难而曲折,由于没有进行充分的科学论证,同时缺乏足够的资金和民众支持,文字拉丁化历经近三十年仍未完成最终目标。乌兹别克语文字拉丁化是自上而下进行,糅杂了复杂的政治因素,其进程任重而道远,除需要投入大量的人力、物力、财力外,还需要进行行之有效的宣传,让乌国民众了解文字拉丁化的重要意义,真正认同和接受文字拉丁化方案。 展开更多
关键词 乌兹别克语 西里尔字母 文字拉丁化
下载PDF
乌兹别克语学习者习得副词“再”“又”的偏误分析
3
作者 邓淑兰 《现代语文》 2020年第6期117-123,共7页
汉语重复义副词“再”和“又”对应乌兹别克语中的“yana”,是乌语学习者的习得难点之一。对塔什干东方语言学院和塔什干国立高中母语为乌语的学习者,进行了“再”“又”的语言测试,并就测试语料中出现的偏误类型进行分析。乌语学习者... 汉语重复义副词“再”和“又”对应乌兹别克语中的“yana”,是乌语学习者的习得难点之一。对塔什干东方语言学院和塔什干国立高中母语为乌语的学习者,进行了“再”“又”的语言测试,并就测试语料中出现的偏误类型进行分析。乌语学习者在使用“再”“又”时,主要出现了误代和错序偏误。其偏误成因主要是受母语负迁移的影响,同时,目的语知识不足也导致偏误的产生。 展开更多
关键词 “再” “又” 乌语“yana 偏误类型 偏误原因
下载PDF
乌兹别克语词干提取算法的比较研究 被引量:2
4
作者 吾买尔江·买买提明 古丽尼格尔·阿不都外力 +2 位作者 买合木提·买买提 卡哈尔江·阿比的热西提 吐尔根·依布拉音 《中文信息学报》 CSCD 北大核心 2020年第1期45-50,共6页
黏着语的自然语言处理中,词干提取作为一项基础的预处理任务,对其他任务的性能影响较大。现有的乌兹别克语词干提取任务仍依赖基于规则的方法,且实验效果不太理想。该文将乌兹别克语词干提取任务视为序列标注问题进行处理,以字符为最小... 黏着语的自然语言处理中,词干提取作为一项基础的预处理任务,对其他任务的性能影响较大。现有的乌兹别克语词干提取任务仍依赖基于规则的方法,且实验效果不太理想。该文将乌兹别克语词干提取任务视为序列标注问题进行处理,以字符为最小单位进行切分,分别构建了基于条件随机场(CRF)和门控循环单元网络(Bi-GRU)的乌兹别克语词干提取模型。实验结果表明,基于序列标注的乌兹别克语词干提取模型与基于规则的方法相比不仅降低了人工成本,而且在性能方面有较为显著的提升。 展开更多
关键词 乌兹别克语 词干提取 序列标注
下载PDF
基于多策略的乌孜别克语名词词干识别研究 被引量:3
5
作者 艾孜海尔江 祖力克尔江 +1 位作者 艾孜尔古丽 玉素甫.艾白都拉 《中文信息学报》 CSCD 北大核心 2018年第9期35-40,共6页
乌孜别克语名词词干识别是自然语言处理领域的基础研究,主要方法是从句子中提取名词词干,提高名词标注效率和准确性。该文首先陈述形态分析、形态特征对识别其词性的作用,然后讨论乌孜别克语的词类划分标准、名词的形态特征,乌孜别克语... 乌孜别克语名词词干识别是自然语言处理领域的基础研究,主要方法是从句子中提取名词词干,提高名词标注效率和准确性。该文首先陈述形态分析、形态特征对识别其词性的作用,然后讨论乌孜别克语的词类划分标准、名词的形态特征,乌孜别克语西尔里文转换拉丁文,乌孜别克语词汇翻译、标注技术,总结词缀歧义及消解规则。该文提出利用形态规则、词典、最大熵融合策略,设计现代乌孜别克语新词中名词词干识别算法,其中包括特征选择及参数估计、词内部特征、前后依存词特征等。最后以乌孜别克语网站文本作为验证对象,对名词词干进行统计与分析。 展开更多
关键词 乌孜别克语 形态分析 多策略 名词词干识别
下载PDF
基于情感词典和标注语料库的乌兹别克语短文本情感分析 被引量:1
6
作者 原伟 《中央民族大学学报(自然科学版)》 2022年第2期5-12,共8页
本文以中亚跨境民族语言乌兹别克语为研究对象,搭建了包含形容词、名词、动词、程度及否定副词、否定词、转折及递进连接词、复杂短语在内的情感词典(共6 451条);设计了情感标注体系,对包含6 000条网络评论的语料库进行情感类别、表达... 本文以中亚跨境民族语言乌兹别克语为研究对象,搭建了包含形容词、名词、动词、程度及否定副词、否定词、转折及递进连接词、复杂短语在内的情感词典(共6 451条);设计了情感标注体系,对包含6 000条网络评论的语料库进行情感类别、表达手段和情感倾向等信息的人工标注。针对乌兹别克语普通句、副词修饰句、非动词否定句、双重否定句、转折句、递进句设计了情感分析算法,使用情感语料库和软件应用网评作为测试集开展了短文本情感分析实验。结果表明了情感词典、情感语料库和情感分析算法的有效性,但也暴露出情感词典在数据规模、覆盖面、精细度以及文本预加工手段方面的弱点和不足。 展开更多
关键词 乌兹别克语 情感分析 情感词典
下载PDF
初谈维吾尔语与乌兹别克语元音区别 被引量:3
7
作者 艾尼瓦尔.艾合买提江 《科技信息》 2013年第11期222-222,249,共2页
本文主要从比较语言学的理论和研究方法去研究和比较维吾尔语和乌兹别克语中元音的不同,两种语言元音较突的特点和区别。
关键词 维吾尔语 乌兹别克语 元音对比
下载PDF
乌孜别克语亲属称谓的历时演变
8
作者 阿达来提 《民族语文》 CSSCI 北大核心 2020年第5期104-112,F0003,共10页
本文根据田野调查资料,探讨中国乌孜别克族的亲属称谓系统。通过与察哈台语和维吾尔语进行比较,分析乌孜别克语亲属称谓的特点及其演变轨迹。
关键词 乌孜别克语 亲属称谓 比较分析
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部