期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
面向藏文信息处理的藏语短语分类体系研究
1
作者 才藏太 索南才让 《青海民族大学学报(藏文版)》 2023年第3期99-110,共12页
藏语短语分类体系研究是藏语语言信息处理的重要组成部分,是关键的技术难题。该项技术研究将直接运用于藏文通用大型语料库的建设,在藏文文字识别、自动分词、自动校对、信息检索、文本分类、机器翻译等方面有重要的应用价值,是未来藏... 藏语短语分类体系研究是藏语语言信息处理的重要组成部分,是关键的技术难题。该项技术研究将直接运用于藏文通用大型语料库的建设,在藏文文字识别、自动分词、自动校对、信息检索、文本分类、机器翻译等方面有重要的应用价值,是未来藏文信息传播、交换、藏语智能化研究的动力和基础。藏语短语是藏语语法的一个重要特征和主要内容,藏语短语也像其它语言一样具有一定的语法规则,由实词和虚词搭配而成。藏语短语中词与词的关系、词与虚词的关系是藏语短语研究的重点,也是藏语短语结构中值得关注的研究方向之一。藏语短语分类体系的研究是自然语言处理的基础性任务之一,是近年来研究者持续关注的重要研究课题。该文在从大型藏语语料库中抽取大量的藏语短语的基础上,对其内部结构、语法功能等进行深入的分析,参考语言学文献中藏语短语的分类体系,遵循计算机便于自动分析和处理的原则对藏语短语进行了分类,并规定了信息处理中藏语短语类别单位的标记代码。 展开更多
关键词 藏文信息 短语 分类
下载PDF
基于协同注意力与特征融合的无人机小目标检测
2
作者 韩晶 王伟宇 +3 位作者 吕学强 陈玉忠 赵海兴 才藏太 《北京信息科技大学学报(自然科学版)》 2023年第3期1-8,共8页
针对现有无人机检测领域存在小目标检测困难以及特征提取效果不佳的问题,提出了一种基于协同注意力模块与双向特征融合结构的无人机小目标检测网络。通过设计协同注意力单元,与骨干网络形成协同注意力模块,显著提升模型特征表达能力;同... 针对现有无人机检测领域存在小目标检测困难以及特征提取效果不佳的问题,提出了一种基于协同注意力模块与双向特征融合结构的无人机小目标检测网络。通过设计协同注意力单元,与骨干网络形成协同注意力模块,显著提升模型特征表达能力;同时借鉴路径聚合网络的思想,设计双向特征融合结构,引入自底向上的特征融合路径,实现浅层特征与深层特征的深度融合,提高小目标检测精度。实验结果表明,所提算法在无人机小目标数据集上的平均精度优于其他网络,显著提升了无人机场景下小目标的检测性能。 展开更多
关键词 无人机图像 小目标检测 协同注意力模块 双向特征融合
下载PDF
面向语言信息处理的藏语短语及其分类方法研究 被引量:5
3
作者 才藏太 索南才让 才让加 《中文信息学报》 CSCD 北大核心 2018年第9期41-46,共6页
短语作为语言分析的一个层次,占有十分重要的位置。有效的短语分析对降低其后句法分析的难度,缩小句法分析器的搜索空间,提高机器翻译的翻译正确率是很有帮助的。而目前面向信息处理的藏语短语的研究刚刚起步,有待于进一步发展。该文在... 短语作为语言分析的一个层次,占有十分重要的位置。有效的短语分析对降低其后句法分析的难度,缩小句法分析器的搜索空间,提高机器翻译的翻译正确率是很有帮助的。而目前面向信息处理的藏语短语的研究刚刚起步,有待于进一步发展。该文在藏语短语与藏语句子的界线研究的基础上,根据藏语信息处理的特点和要求,按照语法功能和便于计算机自动分析和处理的原则对短语进行分类,并规定了信息处理中藏语短语类别单位的标记代码。 展开更多
关键词 藏语 短语 分类 标记
下载PDF
网络版班智达藏汉英电子词典的设计 被引量:6
4
作者 才藏太 李毛措 《计算机工程与应用》 CSCD 北大核心 2005年第17期126-128,共3页
近年来,随着计算机技术的发展,电子词典作为一种移动学习和翻译的数码工具,在国内外开始广泛地普及,其经济效益和社会效益也随之得到广大用户的关注。论文结合《班智达汉藏机器翻译系统》(国家863计划项目,编号为863-306-ZT04-05-2)的... 近年来,随着计算机技术的发展,电子词典作为一种移动学习和翻译的数码工具,在国内外开始广泛地普及,其经济效益和社会效益也随之得到广大用户的关注。论文结合《班智达汉藏机器翻译系统》(国家863计划项目,编号为863-306-ZT04-05-2)的后续项目《班智达藏汉英电子词典》(国家自然科学基金,编号为69663001)的研发实践,论述了该电子词典在网络上的设计方案,重点讨论了电子词典的内容建设和结构描述以及网络中的开发模式和应用技术,最后对系统所选的平台进行了详细描述并给出了该电子词典的使用方法。 展开更多
关键词 电子词典 C/S模式 B/S模式 客户端 B+树
下载PDF
班智达汉藏公文翻译系统中基于二分法的句法分析方法研究 被引量:10
5
作者 才藏太 华关加 《中文信息学报》 CSCD 北大核心 2005年第6期7-12,共6页
机器翻译系统是一种典型的自然语言处理系统,语言技术是机器翻译系统中居于核心地位的技术。本文结合863项目《班智达汉藏公文机器翻译系统》的研制实践,论述了词项信息同语法规则相结合的原则,提出了以动词为中心的句法分析二分法,从... 机器翻译系统是一种典型的自然语言处理系统,语言技术是机器翻译系统中居于核心地位的技术。本文结合863项目《班智达汉藏公文机器翻译系统》的研制实践,论述了词项信息同语法规则相结合的原则,提出了以动词为中心的句法分析二分法,从而在受限语言的范围内,为建立有较大适应性的机器翻译规则系统,有效地提高机器翻译语法分析的效率提供了有益的方法。 展开更多
关键词 人工智能 机器翻译 二分法 语句结构 句法分析
下载PDF
基于最大熵分类器的藏文句子边界自动识别方法研究 被引量:10
6
作者 才藏太 《计算机工程与科学》 CSCD 北大核心 2012年第6期187-190,共4页
藏文句子的边界识别是藏文文本分析的基础性研究,是藏文与其他语种之间建立句子级平行语料库的必要工作,也是进一步进行藏汉机器翻译的基础。本文通过分析藏文句子的结束形式,研究藏文句子边界规则,提出了一种藏文句子的边界识别方法。... 藏文句子的边界识别是藏文文本分析的基础性研究,是藏文与其他语种之间建立句子级平行语料库的必要工作,也是进一步进行藏汉机器翻译的基础。本文通过分析藏文句子的结束形式,研究藏文句子边界规则,提出了一种藏文句子的边界识别方法。该方法首先利用特殊规则和词表对藏文句子进行识别,然后利用最大熵模型对有歧义的句子进一步识别。从而提高藏文句子的边界识别率。 展开更多
关键词 藏文句子 边界识别 最大熵模型
下载PDF
班智达藏文语料切分词典的建立与算法研究 被引量:4
7
作者 才藏太 《计算机应用》 CSCD 北大核心 2009年第7期2019-2021,共3页
随着自然语言信息处理的不断发展和完善,大规模语料文本处理已经成为计算语言学界的一个热门话题。一个重要的原因是从大规模的语料库中能够提取出所需要的知识。而语料文本的处理与加工以语法信息词典作基础。结合藏文语料库切分标注规... 随着自然语言信息处理的不断发展和完善,大规模语料文本处理已经成为计算语言学界的一个热门话题。一个重要的原因是从大规模的语料库中能够提取出所需要的知识。而语料文本的处理与加工以语法信息词典作基础。结合藏文语料库切分标注规范,论述了对藏文语料库切分与标注用的藏文语法信息词典的建立和设计,重点讨论了该词典的内容建设、语法信息的标注、索引结构及查找算法。 展开更多
关键词 藏文语料库 切分 标注 索引
下载PDF
藏文语料库深加工方法研究 被引量:2
8
作者 才藏太 《计算机工程与应用》 CSCD 2012年第26期127-130,147,共5页
随着自然语言信息处理的不断发展和完善,大规模语料文本处理已经成为计算语言学界的一个热门话题。一个重要的原因是从大规模的语料库中能够提取出所需要的知识。结合973前期项目《藏文语料库分词标注规范研究》的开发经验,论述了班智... 随着自然语言信息处理的不断发展和完善,大规模语料文本处理已经成为计算语言学界的一个热门话题。一个重要的原因是从大规模的语料库中能够提取出所需要的知识。结合973前期项目《藏文语料库分词标注规范研究》的开发经验,论述了班智达大型藏文语料库的建设,分词标注词典库和分词标注软件的设计与实现,重点讨论了词典库的索引结构及查找算法、分词标注软件的格词分块匹配算法和还原算法。 展开更多
关键词 藏文语料库 分词标注 分词词典 还原算法
下载PDF
基于锚点信息和句子长度相结合的汉藏句子对齐方法研究 被引量:2
9
作者 才藏太 索南才让 《青海师范大学民族师范学院学报》 2016年第1期91-93,共3页
语料库资源对于自然语言处理研究的巨大价值已经得到社会各界越来越多的认可。特别是句子级对齐的双语平行语料库,已经成为机器翻译、翻译知识获取以及双语词典编纂研究不可或缺的重要资源。本文结合青海省科技厅项目《汉藏句子自动对... 语料库资源对于自然语言处理研究的巨大价值已经得到社会各界越来越多的认可。特别是句子级对齐的双语平行语料库,已经成为机器翻译、翻译知识获取以及双语词典编纂研究不可或缺的重要资源。本文结合青海省科技厅项目《汉藏句子自动对齐技术研究》的研究经验,提出了一种利用句子长度和锚点信息相结合的汉藏双语句子对齐方法,该方法利用(1:1)型的句珠作为候选锚点,用锚点将双语文本分割成几个分块,在对应双语分块中用基于长度的对齐实现句子的对齐。 展开更多
关键词 藏文句子 句子对齐 锚点 双语文本图
下载PDF
基于网络的教务管理信息系统的设计与实现 被引量:6
10
作者 才藏太 《青海师范大学学报(自然科学版)》 2005年第1期51-55,共5页
随着校园网的普及,建立一个具有通用性、开放性、实用性和灵活性的网络教学管理体系成为可能和必然趋势.本文结合笔者的硕士毕业设计项目《西北工业大学软件学院教务管理信息系统》的研发实践,论述了本系统的设计方案,包括网络拓扑结构... 随着校园网的普及,建立一个具有通用性、开放性、实用性和灵活性的网络教学管理体系成为可能和必然趋势.本文结合笔者的硕士毕业设计项目《西北工业大学软件学院教务管理信息系统》的研发实践,论述了本系统的设计方案,包括网络拓扑结构、系统模块和数据库结构,介绍了系统所采用的软件平台和基本技术,最后说明了系统的特色所在. 展开更多
关键词 C/S模式 B/S模式 客户端 数据库
下载PDF
汉藏句子自动对齐技术研究
11
作者 才藏太 赵海兴 才让加 《青海师范大学学报(自然科学版)》 2022年第1期1-3,共3页
我国现有近600万藏族人口,主要居住在西藏自治区和青海、四川、甘肃、云南等省.作为藏文化最主要和最基本的载体,藏文已有近1400年的历史,用藏文书写的经典文献、古籍著述和译作浩如烟海,所以大力发展以藏汉机器翻译为核心的藏文信息处... 我国现有近600万藏族人口,主要居住在西藏自治区和青海、四川、甘肃、云南等省.作为藏文化最主要和最基本的载体,藏文已有近1400年的历史,用藏文书写的经典文献、古籍著述和译作浩如烟海,所以大力发展以藏汉机器翻译为核心的藏文信息处理技术有利于促进涉藏地区政治、经济、科技、教育、文化的建设.目前西藏大学、西北民族大学、中央民族大学、中央翻译局等单位从事藏文信息处理技术研究. 展开更多
关键词 藏文信息处理技术 西北民族大学 藏族人口 西藏大学 机器翻译 中央民族大学 经典文献 自动对齐
下载PDF
教务管理信息系统中客户端的设计与实现
12
作者 才藏太 曹玉兰 《青海师范大学民族师范学院学报》 2006年第2期71-74,共4页
随着校园网的普及,建立一个具有通用性、开放性、实用性和灵活性的网络教学管理体系成为可能和必然趋势。本文结合西北工业大学软件学院教务管理信息系统的研发实践,论述了本系统的设计方案、功能模块划分、操作功能和安全策略的实现。
关键词 C/S模式 B/S模式 客户端 安全策略 校园网
下载PDF
《班智达藏文谜语系统》的设计与实现
13
作者 才藏太 《青海师范大学民族师范学院学报》 2010年第2期78-80,共3页
《班智达藏文谜语系统》是为开发藏族儿童的智力,使他们在寓教于乐的快乐环境中掌握母语知识而精心研制的智力游戏,也是藏语语言知识资源的组成部分。目前在谜语数据库中收录了1120个谜语,并设计和开发了一个游戏界面,供孩子们玩猜谜语... 《班智达藏文谜语系统》是为开发藏族儿童的智力,使他们在寓教于乐的快乐环境中掌握母语知识而精心研制的智力游戏,也是藏语语言知识资源的组成部分。目前在谜语数据库中收录了1120个谜语,并设计和开发了一个游戏界面,供孩子们玩猜谜语游戏,同时可以学习母语中丰富词语和优美的表达方式。本文主要介绍了该系统所涉及的工作及意义、设计宗旨、具体实现过程和准确答案选项位置的确定等内容。 展开更多
关键词 藏文谜语 游戏 知识库 智力开发
下载PDF
基于角色的访问控制及其在SCIMS中的应用
14
作者 才藏太 武君胜 《西北民族大学学报(自然科学版)》 2004年第4期56-59,共4页
数据库技术、网络技术的不断发展,很多企事业单位为自己开发了管理信息系统 随着越来越多的数据信息保存在数据库系统中,数据库应用系统的安全性问题越来越突出 文章就基于角色的访问控制的基本原理,并结合西北工业大学软件学院教务管... 数据库技术、网络技术的不断发展,很多企事业单位为自己开发了管理信息系统 随着越来越多的数据信息保存在数据库系统中,数据库应用系统的安全性问题越来越突出 文章就基于角色的访问控制的基本原理,并结合西北工业大学软件学院教务管理信息系统(SCIMS)的研发实践,分析了系统的安全需求。 展开更多
关键词 角色 权限 访问控制 教务管理
下载PDF
最大熵和规则相结合的藏文句子边界识别方法 被引量:17
15
作者 李响 才藏太 +2 位作者 姜文斌 吕雅娟 刘群 《中文信息学报》 CSCD 北大核心 2011年第4期39-44,共6页
句子边界识别是藏文信息处理领域中一项重要的基础性工作,该文提出了一种基于最大熵和规则相结合的方法识别藏语句子边界。首先,利用藏语边界词表识别歧义的句子边界,最后采用最大熵模型识别规则无法识别的歧义句子边界。该方法有效利... 句子边界识别是藏文信息处理领域中一项重要的基础性工作,该文提出了一种基于最大熵和规则相结合的方法识别藏语句子边界。首先,利用藏语边界词表识别歧义的句子边界,最后采用最大熵模型识别规则无法识别的歧义句子边界。该方法有效利用藏语句子边界规则减少了最大熵模型因训练语料稀疏或低劣而导致对句子边界的误判。实验表明,该文提出的方法具有较好的性能,F1值可达97.78%。 展开更多
关键词 最大熵 句子边界识别 藏文信息处理
下载PDF
融合依存句法的深度学习藏语句子分割研究
16
作者 头旦才让 仁青东主 +2 位作者 尼玛扎西 完么扎西 才藏太 《中文信息学报》 CSCD 北大核心 2022年第10期73-80,共8页
藏语句子分割是藏语自然语言处理中的一项重要且基础性的研究工作。该文根据藏语句子结构特征,在分析藏语句子分割规则与难点的基础上,提出一种融合依存句法的藏语句子分割模型。该模型首先通过词嵌入和藏语依存句法信息嵌入将输入序列... 藏语句子分割是藏语自然语言处理中的一项重要且基础性的研究工作。该文根据藏语句子结构特征,在分析藏语句子分割规则与难点的基础上,提出一种融合依存句法的藏语句子分割模型。该模型首先通过词嵌入和藏语依存句法信息嵌入将输入序列映射成实值向量;然后构建融合藏语依存句法的双向LSTM,拼接词语和句法信息特征,提高上下文时序特征的学习能力;最后利用CRF预测出最佳句子分割点。通过对比实验,验证了该模型对藏语句子分割的有效性。实验结果表明,该模型的F_(1)值为99.4%。 展开更多
关键词 藏语 依存句法 双向LSTM+CRF 句子分割
下载PDF
基于Vague相似性的文献推荐研究
17
作者 刘永志 吴刚 才藏太 《贵州大学学报(自然科学版)》 2023年第1期70-74,共5页
为提高文献综合推荐效率,提出一种基于Vague相似性的文献推荐方法。该方法首先利用文献数据库检索用户感兴趣文献,作为待推荐文献集;然后,对文献中的关键词依据提出的方法重新排序、计算关键词的模糊隶属度和关键词转换为Vague值;最后,... 为提高文献综合推荐效率,提出一种基于Vague相似性的文献推荐方法。该方法首先利用文献数据库检索用户感兴趣文献,作为待推荐文献集;然后,对文献中的关键词依据提出的方法重新排序、计算关键词的模糊隶属度和关键词转换为Vague值;最后,利用Vague相似性度量文献的相关性,并结合年均下载量和年均引用,对进入推荐集的文献进行推荐排序供用户选择使用。实验表明,该算法不仅利用关键词相似度,还融入了对文献有重要意义的引用数和下载量参数作为推荐参数,综合推荐效果明显。 展开更多
关键词 文献 相似性 推荐 Vague技术
下载PDF
基于Vague相似性的藏文文本推荐方法
18
作者 刘永志 才华 +1 位作者 才藏太 林峰 《高原科学研究》 CSCD 2021年第4期99-103,共5页
随着数字信息技术的发展,藏文在移动终端和互联网中得到广泛的应用。文章收集了豆瓣网上的藏文书籍,利用藏文内容属性特征按重要性对书籍进行排序,再对特征排序进行模糊隶属度转换,并对模糊隶属度进行Vague函数值转换,求出藏文内容的Va... 随着数字信息技术的发展,藏文在移动终端和互联网中得到广泛的应用。文章收集了豆瓣网上的藏文书籍,利用藏文内容属性特征按重要性对书籍进行排序,再对特征排序进行模糊隶属度转换,并对模糊隶属度进行Vague函数值转换,求出藏文内容的Vague相似性;在相似性基础上利用推荐值和推荐度对待推荐藏文文本内容进行了推荐排序。经过实验验证文章提出的算法对藏文文本内容推荐效果较好。 展开更多
关键词 藏文文本 VAGUE 相似性 推荐算法
下载PDF
融合多特征和注意力机制的多模态情感分析模型
19
作者 吕学强 田驰 +3 位作者 张乐 杜一凡 张旭 才藏太 《数据分析与知识发现》 EI CSCD 北大核心 2024年第5期91-101,共11页
【目的】针对当前多模态情感分析中多模态特征提取不充分,模态内部信息和模态间交互信息结合不充分的问题,提出一种融合多特征和注意力机制的多模态情感分析模型。【方法】在多模态特征提取方面,增加视频模态中人物的肢体动作、性别和... 【目的】针对当前多模态情感分析中多模态特征提取不充分,模态内部信息和模态间交互信息结合不充分的问题,提出一种融合多特征和注意力机制的多模态情感分析模型。【方法】在多模态特征提取方面,增加视频模态中人物的肢体动作、性别和年龄特征;对于文本模态,融合基于BERT的字粒度语义向量和融合义原信息的词粒度语义向量,丰富了多模态数据的低层特征。利用自注意力机制和跨模态注意力机制以实现模态内部信息和模态间信息的充分结合。将各模态特征进行拼接,通过软注意力机制为各模态特征分配注意力权重,通过全连接层输出最终的情感分类结果。【结果】在公开数据集CH-SIMS和本文构建的热点舆情评论视频数据集HPOC上与Self-MM模型对比,实验结果表明,本文模型在CH-SIMS数据集上的二分类准确率、三分类准确率和F1值分别提升1.83、1.74和0.69个百分点,在HPOC数据集上分别提升1.03、0.94和0.79个百分点。【局限】视频中人物所处的场景可能不断变化,不同的场景可能蕴含不同的情感信息,模型未考虑融合人物所处的场景信息。【结论】本文模型丰富了多模态数据的低层特征,充分结合模态内部信息和模态间信息,能够有效提升情感分析的效果。 展开更多
关键词 多特征 多模态 情感分析 注意力机制
原文传递
支持舆情服务的藏汉机器翻译关键技术及应用
20
作者 赵海兴 才让加 +8 位作者 才藏太 才智杰 华却才让 黄鹤鸣 吉太加 柔特 索南才让 头旦才让 周毛先 《中国科技成果》 2020年第6期65-65,共1页
课题主要通过建设藏文语料库、藏汉平行语料库、藏文情感词词典等基础资源,研究主流藏文编码的识别与转换技术、藏文信息处理的规范化和标准化、藏文自动分析技术、藏语语料库处理技术、藏汉平行语料库处理技术、藏文字符排序及藏语舆... 课题主要通过建设藏文语料库、藏汉平行语料库、藏文情感词词典等基础资源,研究主流藏文编码的识别与转换技术、藏文信息处理的规范化和标准化、藏文自动分析技术、藏语语料库处理技术、藏汉平行语料库处理技术、藏文字符排序及藏语舆情分析技术,设计基于统计的藏汉机器翻译模型与藏语倾向性分析模型,解决藏语舆情分析与机器翻译系统的无缝链接技术问题,开发支持舆情服务的藏汉机器翻译系统,利用该系统将藏文网络舆情信息即时翻译成汉文,为藏文网络舆情的可控性提供技术支持和理论依据. 展开更多
关键词 机器翻译系统 平行语料库 藏文信息处理 倾向性分析 无缝链接 转换技术 情感词 网络舆情
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部