期刊文献+
共找到202篇文章
< 1 2 11 >
每页显示 20 50 100
藏文PDF文档转换为Word文档方法
1
作者 赞拉公 贡保加 +1 位作者 完玛道吉 安见才让 《长江信息通信》 2023年第11期117-120,共4页
各类办公软件中PDF、Word格式的文档在文字处理和保存等方面的使用率极高,而在藏文PDF文档转换成Word文档中存在乱码和漏读的问题。因此,文章针对此类问题作了相关研究并提出了基于藏文乱码字典的PDF文档转换方法,有效地提高了文本文件... 各类办公软件中PDF、Word格式的文档在文字处理和保存等方面的使用率极高,而在藏文PDF文档转换成Word文档中存在乱码和漏读的问题。因此,文章针对此类问题作了相关研究并提出了基于藏文乱码字典的PDF文档转换方法,有效地提高了文本文件转换的正确率。 展开更多
关键词 藏文PDF 藏文乱码 word文档 纠错
下载PDF
一种基于八词位标签的BiLSTM_CRF藏文分词方法
2
作者 常芳玉 才智杰 《中文信息学报》 CSCD 北大核心 2024年第10期64-70,79,共8页
藏文分词是藏语自然语言处理的一项基础性任务,其性能影响藏文自动摘要、自动分类以及搜索引擎等多个方面。基于词位标注的藏文分词方法通常使用四词位标签集,为了更全面地提取特征信息和更深层次的语义信息,该文提出了一种八词位标签集... 藏文分词是藏语自然语言处理的一项基础性任务,其性能影响藏文自动摘要、自动分类以及搜索引擎等多个方面。基于词位标注的藏文分词方法通常使用四词位标签集,为了更全面地提取特征信息和更深层次的语义信息,该文提出了一种八词位标签集,采用BiLSTM_CRF模型得到一种基于八词位标签的BiLSTM_CRF藏文分词方法。实验结果表明,该方法取得较好的分词效果,在测试数据集上的准确率、召回率和F1值分别达95.07%、95.57%和95.32%。 展开更多
关键词 自然语言处理 藏文分词 BiLSTM_CRF 八词位标签
下载PDF
藏文情感词典构建的现状分析
3
作者 才让东知 杨杰 尼玛扎西 《计算机技术与发展》 2024年第3期9-14,共6页
近年来,许多研究者证实,基于深度学习的多特征融合情感分析方法比纯深度学习方法更能挖掘文本的情感信息,其中情感词特征是最重要的特征之一。目前,藏文虽然有少量的情感词典,但基本上没有公开,想要使用藏文情感词典资源,只能自行构建... 近年来,许多研究者证实,基于深度学习的多特征融合情感分析方法比纯深度学习方法更能挖掘文本的情感信息,其中情感词特征是最重要的特征之一。目前,藏文虽然有少量的情感词典,但基本上没有公开,想要使用藏文情感词典资源,只能自行构建。研究藏文情感词典的构建现状能对后续藏文情感词典的构建提供帮助。为了解藏文情感词典的词汇分类方法、常用词典构建方法以及已有藏文情感词典的词汇量与词汇构成等方面的研究现状,文中通过对比和统计等方法分析了近10年藏文情感词典构建相关的文献(以CHKI为主),总结出了藏文情感词典构建方面的研究状况。经研究发现,情感词的分类方法中,主要有7大类21小类、12大类20小类、2大类18小类等。藏文情感词典的构建方法包括词典匹配、机器翻译、SO-PMI扩充、基于word2vec或BERT的相似度扩充方法等。已有藏文情感词典的词汇量大致在5000至28000之间,接近中文情感词典的水平,词汇构成主要包含情感词、程度副词、否定词、双重否定词、表情词等。希望为相关研究人员提供参考。 展开更多
关键词 藏文情感词典 情感词分类 词典构建方法 词汇量 词汇构成
下载PDF
面向藏文文本的人物关系抽取语料库的构建
4
作者 德吉措 安见才让 《青海科技》 2024年第1期81-86,107,共7页
作为实体关系抽取研究的重要基础,构建高质量、标准化的语料库能够提高实体关系抽取任务的精确度和召回率。目前,藏文关系抽取语料库构建大多依靠传统人工标注方法且局限于特定领域,存在标注效率低且人物关系语料库相对缺乏的问题。文... 作为实体关系抽取研究的重要基础,构建高质量、标准化的语料库能够提高实体关系抽取任务的精确度和召回率。目前,藏文关系抽取语料库构建大多依靠传统人工标注方法且局限于特定领域,存在标注效率低且人物关系语料库相对缺乏的问题。文章构建了藏文人名实体识别语料库;通过分析人物关系特征和实体关系类别及其标注规范,构建触发词词典进行语料回标,生成15400条实体识别和8000条藏文人物关系抽取标注语料。为验证语料库的可用性,利用命名实体识别和关系抽取实验进行统计分析,其实体识别F1值达到67.2%,关系抽取F1值达到66.2%,结果表明该语料库的构建对后续面向藏文人物关系抽取研究提供了数据基础。 展开更多
关键词 语料库 人物关系抽取 藏文文本 触发词
下载PDF
体认翻译学视野下的汉语藏族文化负载词翻译——以《尘埃落定》英译本为例
5
作者 于海艳 邓忠 《河北科技师范学院学报(社会科学版)》 2024年第1期107-111,共5页
借助体认翻译学的体认观对《尘埃落定》的英译本《Red Poppies》中的78个藏族文化负载词进行了计量分析。文化图式缺省和“体”与“认”的失联导致了部分藏族文化负载词翻译的偏离和歪曲。未来译者应在体验现实的基础上,调动认知机制,... 借助体认翻译学的体认观对《尘埃落定》的英译本《Red Poppies》中的78个藏族文化负载词进行了计量分析。文化图式缺省和“体”与“认”的失联导致了部分藏族文化负载词翻译的偏离和歪曲。未来译者应在体验现实的基础上,调动认知机制,将“体”与“认”紧密结合翻译文化负载词,推动中国文化走出去。 展开更多
关键词 体认翻译学 藏族文化负载词 《尘埃落定》 英译本
下载PDF
藏文虚词知识融合的藏汉机器翻译方法研究
6
作者 严松思 珠杰 +3 位作者 汪超 刘亚姗 许泽洲 徐泽辉 《中央民族大学学报(自然科学版)》 2024年第1期20-27,共8页
针对藏文虚词的文法特点,设计了基于藏文虚词知识融合的方法,该方法能够提高藏汉翻译的效果。首先通过全部藏文虚词知识融合、过滤兼类虚词知识融合、单音节虚词知识融合和多音节虚词知识融合,得到四种对应语料,其次将其在Transformer... 针对藏文虚词的文法特点,设计了基于藏文虚词知识融合的方法,该方法能够提高藏汉翻译的效果。首先通过全部藏文虚词知识融合、过滤兼类虚词知识融合、单音节虚词知识融合和多音节虚词知识融合,得到四种对应语料,其次将其在Transformer模型和mBART模型上进行了实验,使用轮数集成和不同网络结构集成来提高最终模型的泛化能力。对比实验证明,藏文虚词知识融合算法与模型集成策略可以提升藏汉机器翻译的翻译效果,最高可以达到38.05个BLEU。 展开更多
关键词 藏文虚词知识融合 机器翻译 模型集成
下载PDF
藏语“酒”类词语的文化探讨
7
作者 杨洁 《高原文化研究》 2024年第1期152-160,共9页
在藏族1300多年的文明发展史中,酒已经成为人们思想、文化、道德、伦理的综合载体。藏语“酒”类词语作为藏族语言与文化的一个重要组成部分,其表现形式丰富多彩,从藏语酒的种类、器具等物质方面,上升到酒的礼俗、饮趣等精神方面。藏语... 在藏族1300多年的文明发展史中,酒已经成为人们思想、文化、道德、伦理的综合载体。藏语“酒”类词语作为藏族语言与文化的一个重要组成部分,其表现形式丰富多彩,从藏语酒的种类、器具等物质方面,上升到酒的礼俗、饮趣等精神方面。藏语“酒”类词语几乎涉及藏族社会生活的方方面面,它们的形成和发展,反映了语言与文化的相互影响和相互渗透,传递和表达着藏民族用酒的习俗和心理,反映出藏族的人生观、道德观以及人们相应的价值取向、认知方式、行为模式等文化心态。藏语“酒”类词语极其丰富,文化内涵博大精深,这些词语不仅反映了藏族所创造的物质文化、精神文化和心理特征,而且美化了藏族的社会生活,丰富了藏族人民的文化与精神世界。文章运用民族学及社会语言学的研究方法,对藏语“酒”类词语进行收集、整理和语义解析,从中梳理出藏族重礼仪、重饮食文化的价值观,重伦理道德、重和谐的意识取向和民族思维方式及心理特征。通过对藏语酒类词语的记录和释义,进而探讨其蕴含的文化语义、文化形式、文化特征和文化作用。 展开更多
关键词 藏族语言 酒类词语 文化探讨
下载PDF
词切分对藏-汉读者汉语阅读的影响:语言水平的调节作用
8
作者 高蕾 李天贽 +2 位作者 窦浩天 陈雯月 陈成 《辽宁师范大学学报(社会科学版)》 2024年第4期60-68,共9页
采用EyeLink 1000 Plus型眼动仪,以40名藏族大学生为被试,以汉语句子为阅读材料,探讨词切分对藏-汉读者汉语阅读的影响及语言水平的调节作用。实验采用空格词切分方式,设置了四种呈现条件:正常句子、字间空格、词间空格和非词空格,并操... 采用EyeLink 1000 Plus型眼动仪,以40名藏族大学生为被试,以汉语句子为阅读材料,探讨词切分对藏-汉读者汉语阅读的影响及语言水平的调节作用。实验采用空格词切分方式,设置了四种呈现条件:正常句子、字间空格、词间空格和非词空格,并操纵了读者的汉语水平。实验结果表明:词间空格对藏-汉读者的汉语阅读起到了一定的促进作用,不同汉语水平藏-汉读者阅读汉语时的眼动模式存在差异。 展开更多
关键词 词切分 藏-汉读者 汉语阅读 眼动
下载PDF
基于Android的“藏语帮”APP设计与实现
9
作者 杨丽洁 群诺 尼洛琼达 《现代计算机》 2024年第1期116-120,共5页
基于Android移动终端的“藏语帮”APP是一款藏语言单词记忆学习软件。为了满足藏语言爱好者热切的学习需要,使得藏语言学习摆脱传统面试教育的桎梏,更加适应现代社会,采用模块化的设计理念,运用Android与Java技术,成功开发出了一款基于... 基于Android移动终端的“藏语帮”APP是一款藏语言单词记忆学习软件。为了满足藏语言爱好者热切的学习需要,使得藏语言学习摆脱传统面试教育的桎梏,更加适应现代社会,采用模块化的设计理念,运用Android与Java技术,成功开发出了一款基于安卓移动终端,前后端分离的藏语言单词记忆学习软件,使得藏语学习更加便捷,让用户可以轻松掌握基础单词。 展开更多
关键词 ANDROID 藏语 单词记忆学习APP
下载PDF
汉藏新闻翻译中引语词译法——以“强调”和“指出”为例
10
作者 桑斗加 《攀登(藏文版)》 2024年第2期139-147,共9页
引语词是汉藏新闻翻译中经常出现的词汇类型,它在引用他人话语时起到连接与突出语言的作用。然而,汉藏新闻翻译中对于引语词的翻译,至今未能形成统一规范的译法。以“强调”和“指出”为例,普遍译为“nan gyis bstan don”和“bstan don... 引语词是汉藏新闻翻译中经常出现的词汇类型,它在引用他人话语时起到连接与突出语言的作用。然而,汉藏新闻翻译中对于引语词的翻译,至今未能形成统一规范的译法。以“强调”和“指出”为例,普遍译为“nan gyis bstan don”和“bstan don”,这种把动词误译为名词或表示原因之连词的做法,不符合藏语引语语法规则和语言逻辑。因此,应该按照藏语语法规则进行翻译。规范翻译模式是汉藏翻译标准化的有效途径,能够为汉藏新闻翻译理论化建设提供借鉴意义。 展开更多
关键词 汉藏新闻翻译 引语词 译法 语法
下载PDF
吐蕃碑文虚词运用特征研究
11
作者 李加东周 《青海师范大学学报(藏文版)》 2024年第1期129-146,共18页
虚词是藏文的重要组成部分,了解不同时代的虚词运用及其变化,对了解藏文发展历史及其规律尤为重要。吐蕃碑文从文献来源及年代都为最“原始”的吐蕃文献之一,其内容至今没有任何篡改。依据吐蕃碑文研究当时藏文的虚词运用特征,能够管窥... 虚词是藏文的重要组成部分,了解不同时代的虚词运用及其变化,对了解藏文发展历史及其规律尤为重要。吐蕃碑文从文献来源及年代都为最“原始”的吐蕃文献之一,其内容至今没有任何篡改。依据吐蕃碑文研究当时藏文的虚词运用特征,能够管窥吐蕃时期藏文虚词的语法特征及其演变过程,从而能够探究藏文发展历史及其演变规律。本文在前人研究的成果基础上,以目前遗存的吐蕃三代赞普时期13篇碑文,研究了吐蕃时期藏文虚词的运用及其特征并加以分析。把这13篇碑文中出现的虚词分为“格虚词”和“非格虚词”两大类,运用统计法和比较法对这些虚词进行了详细的统计和梳理,并运用其特征与吞米桑布扎所著的《三十颂》及其后面形成的各类藏文语法书中讲述的虚词运用特征进行了详细的比较,从而找出演变规律。发现《三十颂》中没有出现的个别虚词在以上碑文中有使用,而如今使用的有些虚词在吐蕃碑文中没有出现,如年代越早,虚词“■gyi kyis”代替虚词“■(kyi和kyis)”的频率越高,各类后吐蕃时期藏文语法书中出现且如今使用的虚词“■(yi和yis)”在吐蕃时期的碑文及敦煌文献、钟铭文中均未出现;《三十颂》中未出现的虚词“■(te和de)”不仅在吐蕃碑文中出现的频率很高,而且用法跟后期藏文语法书中出现的基本吻合。综上,笔者认为《三十颂》中未出现,但已在碑文中出现的虚词是吞米桑布扎时期未出现的虚词;而碑文和《三十颂》中均出现但如今不使用的虚词是因为后期不再使用而导致的。因此虚词运用的特征可以作为研究古藏文文献年代的衡量标准之一。 展开更多
关键词 吐蕃时期碑文 虚词运用特征 格虚词 非格虚词
下载PDF
敦煌藏文文献P.T1291《春秋后语》藏译对比研究
12
作者 闹吾才让 《攀登(藏文版)》 2024年第1期109-121,共13页
法藏敦煌藏文文献中P.T1291是为数不多的汉译藏文文献,学术界对原文没有统一的认定,对比分析《春秋后语》《战国策》及法藏敦煌藏文文献P.T1291,可以确系该文本为《春秋后语》之译本。在P.T1291中,译者灵活运用多种译法,侧重于归化的翻... 法藏敦煌藏文文献中P.T1291是为数不多的汉译藏文文献,学术界对原文没有统一的认定,对比分析《春秋后语》《战国策》及法藏敦煌藏文文献P.T1291,可以确系该文本为《春秋后语》之译本。在P.T1291中,译者灵活运用多种译法,侧重于归化的翻译策略,对原文理解准确,表达清晰流畅,展现了吐蕃时期较为成熟的汉藏翻译水平。同时,《春秋后语》的藏译是古代汉藏文化交流的重要标志,对汉藏民族进一步交流交往交融,加强民族文化认同具有重要意义。 展开更多
关键词 P.T1291 《春秋后语》 藏译本 译法
下载PDF
基于格助词和接续特征的藏文自动分词方案 被引量:49
13
作者 陈玉忠 李保利 +1 位作者 俞士汶 兰措吉 《语言文字应用》 CSSCI 北大核心 2003年第1期75-82,共8页
本文结合藏文各类形态特征 ,首次提出了一种基于格助词和接续特征(BCCF ,BasedonCase auxiliarywordandContinuousFeature)的书面藏文自动分词方案。其总体技术特点是 :在格助词、接续特征、字性知识库以及词典支持下 ,进行逐级定位的... 本文结合藏文各类形态特征 ,首次提出了一种基于格助词和接续特征(BCCF ,BasedonCase auxiliarywordandContinuousFeature)的书面藏文自动分词方案。其总体技术特点是 :在格助词、接续特征、字性知识库以及词典支持下 ,进行逐级定位的确定性分词。初步测试表明 :这一方案在发现和消除切分歧义、解决未登录词问题 ,进而在提高藏文分词精度方面具有很高的实用价值。 展开更多
关键词 格助词 接续特征 藏文分词
下载PDF
SegT:一个实用的藏文分词系统 被引量:25
14
作者 刘汇丹 诺明花 +2 位作者 赵维纳 吴健 贺也平 《中文信息学报》 CSCD 北大核心 2012年第1期97-103,共7页
在分析现有藏文分词方法的基础上,该文重点研究了藏文分词中的格助词分块、临界词识别、词频统计、交集型歧义检测和消歧等问题并提出了相应的方法。应用这些方法,设计实现了一个藏文分词系统SegT。该系统采用格助词分块并识别临界词,... 在分析现有藏文分词方法的基础上,该文重点研究了藏文分词中的格助词分块、临界词识别、词频统计、交集型歧义检测和消歧等问题并提出了相应的方法。应用这些方法,设计实现了一个藏文分词系统SegT。该系统采用格助词分块并识别临界词,然后采用最大匹配方法分词,并进行紧缩词识别。系统采用双向切分检测交集型歧义字段并使用预先统计的词频信息进行消歧。实验结果表明,该文设计的格助词分块和临界词识别方法可以将分词速度提高15%左右,但格助词分块对分词效果没有明显提高或降低。系统最终分词正确率为96.98%,基本达到了实用的水平。 展开更多
关键词 藏文分词 格助词 临界词识别 词频统计 藏文信息处理 中文信息处理
下载PDF
TIP-LAS:一个开源的藏文分词词性标注系统 被引量:28
15
作者 李亚超 江静 +1 位作者 加羊吉 于洪志 《中文信息学报》 CSCD 北大核心 2015年第6期203-207,共5页
TIP-LAS是一个开源的藏文分词词性标注系统,提供藏文分词、词性标注功能。该系统基于条件随机场模型实现基于音节标注的藏文分词系统,采用最大熵模型,并融合音节特征,实现藏文词性标注系统。经过试验及对比分析,藏文分词系统和词性标注... TIP-LAS是一个开源的藏文分词词性标注系统,提供藏文分词、词性标注功能。该系统基于条件随机场模型实现基于音节标注的藏文分词系统,采用最大熵模型,并融合音节特征,实现藏文词性标注系统。经过试验及对比分析,藏文分词系统和词性标注系统取得了较好的实验效果,系统的源代码可以从网上获取。希望该研究可以推动藏文分词、词性标注等基础工作的发展,提供一个可以比较、共享的研究平台。 展开更多
关键词 藏文 分词 词性标注 条件随机场 最大熵
下载PDF
藏文音节规则库的建立与应用分析 被引量:14
16
作者 珠杰 欧珠 +2 位作者 格桑多吉 扎西加 高红梅 《中文信息学报》 CSCD 北大核心 2013年第2期103-111,共9页
藏文音节具有独特的构造方法,不同的构造位上有不同的藏文字符,根据不同的组合,构成了千变万化的藏文音节,由于字符的语音特性,藏文组合形式上有很多的限制。该文借助藏文文法规则和藏汉大词典,建立了现代藏文音节规则库,并分析了可能... 藏文音节具有独特的构造方法,不同的构造位上有不同的藏文字符,根据不同的组合,构成了千变万化的藏文音节,由于字符的语音特性,藏文组合形式上有很多的限制。该文借助藏文文法规则和藏汉大词典,建立了现代藏文音节规则库,并分析了可能的应用领域。 展开更多
关键词 藏文 藏文规则 词频
下载PDF
藏文自动分词系统的设计与实现 被引量:51
17
作者 陈玉忠 李保利 俞士汶 《中文信息学报》 CSCD 北大核心 2003年第3期15-20,65,共7页
藏文自动分词系统的研制目前在国内仍是空白。本文从四个方面详细报告了书面藏文自动分词系统的具体实现过程 ,内容包括系统结构、分词知识库的组织与实现以及分词策略、算法设计及其详细的自动分词过程实例。文章最后给出了实验结果 ,... 藏文自动分词系统的研制目前在国内仍是空白。本文从四个方面详细报告了书面藏文自动分词系统的具体实现过程 ,内容包括系统结构、分词知识库的组织与实现以及分词策略、算法设计及其详细的自动分词过程实例。文章最后给出了实验结果 ,结果表明系统具有较高的切分精度和较好的通用性。 展开更多
关键词 计算机应用 中文信息处理 格助词 接续特征 藏文 自动分词
下载PDF
融合无监督特征的藏文分词方法研究 被引量:9
18
作者 李亚超 加羊吉 +2 位作者 江静 何向真 于洪志 《中文信息学报》 CSCD 北大核心 2017年第2期71-75,85,共6页
藏文分词是藏文信息处理的基础性关键问题,目前基于序列标注的藏文分词方法大都采用音节位置特征和类别特征等。该文从无标注语料中抽取边界熵特征、邻接变化数特征、无监督间隔标注等无监督特征,并将之融合到基于序列标注的分词系统中... 藏文分词是藏文信息处理的基础性关键问题,目前基于序列标注的藏文分词方法大都采用音节位置特征和类别特征等。该文从无标注语料中抽取边界熵特征、邻接变化数特征、无监督间隔标注等无监督特征,并将之融合到基于序列标注的分词系统中。从实验结果可以看出,与基线藏文分词系统相比,分词F值提高了0.97%,并且未登录词识别结果也有较大的提高。说明,该文从无标注数据中提取出的无监督特征较为有效,和有监督的分词模型融合到一起显著提高了基线分词系统的效果。 展开更多
关键词 藏文 分词 序列标注
下载PDF
基于判别式分类和重排序技术的藏文分词 被引量:9
19
作者 孙萌 华却才让 +3 位作者 才智杰 姜文斌 吕雅娟 刘群 《中文信息学报》 CSCD 北大核心 2014年第2期61-65,90,共6页
本文提出一种基于判别式模型的藏文分词方法,重点研究最小构词粒度和分词结果重排序对藏文分词效果的影响。在构词粒度方面,分别考察了以基本字丁、基本字丁-音节点、音节为最小构词粒度对分词效果的影响,实验结果表明选定音节为最小构... 本文提出一种基于判别式模型的藏文分词方法,重点研究最小构词粒度和分词结果重排序对藏文分词效果的影响。在构词粒度方面,分别考察了以基本字丁、基本字丁-音节点、音节为最小构词粒度对分词效果的影响,实验结果表明选定音节为最小构词粒度分词的F值最高,为91.21%;在分词结果重排序方面,提出一种基于词图的最短路径重排序策略,将判别式解码生成的切分结果压缩为加权有向图,图中节点表示音节间隔,而边所覆盖的音节作为候选切分并赋予不同权重,选择一条最短路径从而实现整句切分,最终分词结果的F值达到96.25%。 展开更多
关键词 判别式 藏文分词 构词粒度 重排序
下载PDF
多级索引的藏语分词词典设计 被引量:6
20
作者 姚徐 郭淑妮 +1 位作者 李永宏 于洪志 《计算机应用》 CSCD 北大核心 2009年第B06期178-180,共3页
藏语分词词典是藏语自动分词系统的重要基础,词典规模大小和算法设计的优劣直接影响着分词的效率。本项目首先收集了多部藏语字、词典的所有词条及藏语标点符号,形成了约10万词条的大型藏语分词词库;根据藏字不同长度的特点,建立了藏语... 藏语分词词典是藏语自动分词系统的重要基础,词典规模大小和算法设计的优劣直接影响着分词的效率。本项目首先收集了多部藏语字、词典的所有词条及藏语标点符号,形成了约10万词条的大型藏语分词词库;根据藏字不同长度的特点,建立了藏语特有的多级索引分词词典机制,分析设计藏语整词二分法进行藏语分词。实验结果表明该藏语分词词典具有结构简单,分词速度快和查询性能高等优点。 展开更多
关键词 藏语分词 分词词典 藏语整词二分法 多级索引
下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部