-
题名藏语句子主干成分省略现象刍议
- 1
-
-
作者
航尖才让
多拉
王维兰
-
机构
西北民族大学中国语言文学学部
青海师范大学藏语智能信息处理及应用国家重点实验室
-
出处
《青海民族大学学报(藏文版)》
CSSCI
2024年第1期77-93,共17页
-
基金
国家社科基金冷门绝学研究专项“基于语料的《藏文大字典》(藏汉对照)编篡研究”(项目编号:21VJXT013)
国家自然科学基金项目“基于大规模语料库的藏语预训练语言模型研究”(项目编号:62266037)阶段性成果。
-
文摘
现代语言学认为,一个完整的句子由六种基本成分构成,这些成分可以根据其功能分为主干成分和枝叶成分两大类。文章聚焦藏语句子主谓宾三种主干成分的省略现象,通过对古今藏文多种文体的梳理和分析,发现主干成分的省略可以归类为对话省、偈颂体省、谚语省、自述省,以及上下文省略等五种类型。通过归纳藏语句子主干成分省略现象的特征和规律,阐述了句子成分的省略不仅是藏语特有的一种语言现象,而且它作为一种有效的语法策略,既简化了语言结构,又增强了语言表达中信息的凸显性。研究藏语中的句子主干成分省略现象对避免语言冗长、实现语句简洁、优化语言流畅性和美感、提升写作技巧和表达效果、增强文学鉴赏能力等都具有重要意义。此外,进一步阐明了这一研究对于解决藏语自然语言处理中的句法分析、语义分析、篇章分析等关键问题的重要性。提出了准确掌握句子成分省略的规律和机制,可以帮助翻译系统更准确地捕捉和再现藏语文本的语义细节,避免由于主干成分省略而产生的歧义或误解,提高翻译的准确率和精确度的观点。
-
关键词
句子成分
主语
宾语
谓语
-
Keywords
Sentence component
subject
object
predicate
-
分类号
H214
[语言文字—少数民族语言]
-
-
题名印刷体现代藏文识别研究
被引量:23
- 2
-
-
作者
王维兰
丁晓青
陈力
王华
-
机构
西北民族学院信息所
清华大学电子工程系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2003年第3期37-38,94,共3页
-
基金
国家自然科学基金项目60073058
-
文摘
以印刷体现代藏文白体、黑体、圆体、长体、竹体为字体样张,通过预处理、文 本行字切分、特征选择和分类识别的初步研究,获得对5种字体文本的平均识别率为89.582 % ,对其他字体的文本平均识别率为93.867%。
-
关键词
印刷体藏文
预处理
特征选择
分类识别
模式识别
藏文识别
-
Keywords
Printed Tibetn character
Preprocessing
Features selection
Patte rn classification
-
分类号
TP391.43
[自动化与计算机技术—计算机应用技术]
-
-
题名面向文本检测的藏文古籍文档图像超分辨率重建
- 3
-
-
作者
郝玉胜
李健伟
王维兰
王筱娟
林强
-
机构
西北民族大学数学与计算机科学学院
西北民族大学计算核医学实验室
-
出处
《中文信息学报》
CSCD
北大核心
2024年第10期54-63,共10页
-
基金
国家自然科学基金(62166036)
中央高校基本科研业务费(31920220132)
+3 种基金
甘肃省高等学校创新基金(2021B-067)
教学部产学合作协同育人项目(202102383034)
甘肃省科技计划项目(22JR5RA187)
西北民族大学教育教学改革研究一般项目(2023XJYBJG-43)。
-
文摘
针对藏文古籍文档图像普遍因低质、视觉效果不佳严重影响图像中文本区域的检测和识别问题,该文构建了一个藏文古籍文档图像超分辨率数据集TAMSRD,同时提出了一种基于卷积神经网络的超分辨率重建方法,为领域内藏文古籍文档图像的超分辨率重建问题提供了有意义的参考。该文所提模型在ICDAR 2013/2015/2017,MSRA_TD500和TAMSRD共5个数据集上的实验结果表明:①该文所设计的超分辨率网络模型能够有效提高低质藏文古籍文档图像的视觉质量,重建图像的峰值信噪比(PSNR)、结果相似性指标(SSIM)以及自然图像质量评估指标(NIQE)都有明显的改善;②超分辨率网络模型对低质藏文古籍文档图像的重建,能够大幅改善各类场景图像文本检测模型的性能。在各个数据集上,MSER方法的召回率和F值提升区间为[16.3%,32.5%]和[13.3%,41.9%],CTPN方法的召回率和F值提升区间为[4.1%,39.8%]和[2.1%,32.7%],DB方法的召回率和F值提升区间为[8.4%,56.5%]和[7.7%,58.7%]。
-
关键词
超分辨率
藏文古籍
文档图像
图像质量评价
-
Keywords
super resolution
Tibetan ancient scripts
document image
image quality assessment
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于频率谱变化量的唐卡图像特征提取与表示
被引量:8
- 4
-
-
作者
王维兰
钱建军
杨旦春
王念一
-
机构
西北民族大学计算机科学与信息工程学院
西北民族大学中国民族信息技术研究院
西北民族大学美术学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2011年第22期183-187,共5页
-
基金
国家自然科学基金No.60875006~~
-
文摘
提出了一种在频域空间内用频率谱变化量来表示图像轮廓特征的方法,并在宗教类唐卡图像的头饰分类中得到了成功的应用。标注图像的头饰区域,应用基本全局门限和用户观察直方图选择阈值相结合的方法分割标注区域;将图像中的像素点转换成直角坐标系下的坐标点,并提取典型轮廓点;通过傅里叶变换将典型轮廓点转换到频域空间,应用频率谱值较小的那部分的变化量作为轮廓特征,提取轮廓内部的颜色特征。实验证明,应用所提取的头饰特征可以有效地对唐卡图像进行分类。
-
关键词
频率谱
傅里叶变换
轮廓特征提取
唐卡图像
分类
-
Keywords
frequency spectral
Fourier transform
contour feature extraction
Thangka image
classification
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名藏文识别中相似字丁的区分研究
被引量:15
- 5
-
-
作者
王维兰
丁晓青
祁坤钰
-
机构
西北民族学院信息所
清华大学电子工程系
-
出处
《中文信息学报》
CSCD
北大核心
2002年第4期60-65,共6页
-
基金
国家自然科学基金 (6 0 0 730 5 8)
甘肃省自然科学基金 (ZS991-A2 5 - 0 2 4 - 6 )
-
文摘
相似字丁多是藏文识别中的一大难点。本文通过对相似字丁类型的研究 ,以及印刷体藏文识别结果的统计分析 ,得到图形结构的分析与识别结果相吻合的结论。说明必须根据藏文字丁的结构特点 ,在字符归一化、特征选择方面进行特殊的处理 ,以实现藏文识别中相似字丁的区分。
-
关键词
区分研究
藏文识别
相似字丁
归一化
特征选择
字符图形
相似形
-
Keywords
tibetan character recognition
similitude characters
normalization
features selection
-
分类号
TP391.43
[自动化与计算机技术—计算机应用技术]
-
-
题名唐卡图像复杂破损区域的修复
被引量:11
- 6
-
-
作者
王维兰
唐仕喜
-
机构
西北民族大学中国民族信息研究院
-
出处
《计算机工程与设计》
CSCD
北大核心
2007年第3期703-705,共3页
-
基金
国家民委基金项目(民委2003-A13)
-
文摘
为了解决唐卡图像复杂破损区域修复的一类实际工程问题,从唐卡图像复杂破损区域的检测分割、误检测破损区域的屏蔽、各破损区域的定位惟一化、修复块修复优先级的确定、样本块的检索,到各破损区域中既定修复块的修复等一系列的过程与工程技术,详细地介绍了该类唐卡灰度图像与彩色图像复杂破损区域的修复技术,并给出了相应的修复结果。
-
关键词
藏族唐卡
图像修复
同色线强度
最佳样本块
基于内容的图像检索
-
Keywords
Tibetan TangKa
image inpainting
isophote intensity
optimum exemplar block
content-based image retrieval
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名基于部件组合的联机手写“藏文—梵文”样本生成
被引量:3
- 7
-
-
作者
王维兰
卢小宝
蔡正琦
沈文韬
付吉
才科扎西
-
机构
西北民族大学数学与计算机科学学院
中国人民银行白银中心支行
-
出处
《中文信息学报》
CSCD
北大核心
2017年第5期64-73,共10页
-
基金
国家自然科学基金(61375029)
国家民委领军人才计划
西北民族大学中央高校基本科研业务费专项资金(31920170142)
-
文摘
"藏文—梵文"包括500多个现代藏文、6 000多个梵音藏文,在文字识别领域属于大类别的字符集,所以联机手写样本采集是庞大而复杂的工程。鉴于此,提供了一种基于部件组合的"藏文—梵文"手写样本生成方法,主要包括:(1)确定"藏文—梵文"字符集和部件集;(2)获取"藏文—梵文"字丁的部件位置信息;(3)采集联机手写"藏文—梵文"部件的样本;(4)生成联机手写"藏文—梵文"字符集样本库。该文为联机手写"藏文—梵文"识别的研究提供字符训练样本库和测试样本库,提高了手写梵音藏文样本采集效率,解决了样本数量及多样性问题,降低了样本采集成本,为进一步联机手写梵音藏文识别的研究与系统开发奠定了基础。
-
关键词
联机手写
藏文—梵文
字符集
部件组合
样本生成
-
Keywords
online handwritten
Tibetan-Sanskrit
character set
component combination
sample generation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于笔划特征和MCLRNN模型的联机手写藏文识别
被引量:7
- 8
-
-
作者
王维兰
陈万军
-
机构
西北民族大学中国民族信息技术研究院
西安理工大学信息科学系
-
出处
《计算机工程与应用》
CSCD
北大核心
2008年第14期91-93,194,共4页
-
基金
甘肃省科技攻关项目(the Key Technologies R&D Program of Gansu(Province),China under Grant No.2GS064-A52-035-04)
国家人事部2007年度留学人员科技活动项目择优资助(No.国人厅发[2007]170号)
-
文摘
提出了一种新的多层联系子层递归神经网络(MCLRNN)模型并融合藏文字丁的空间结构特征来进行联机手写藏文识别。改进后的网络结构具有多层联系子层来保留若干时刻的网络内部状态,从而可以更好地表征藏文字的各笔划特征以及笔划间的空间结构关系,同时,采用更适用于模式分类的交叉熵准则和改进的梯度下降算法来训练网络,加快了网络的收敛速度并增强其分类能力。仿真实验取得了令人满意的结果。
-
关键词
递归神经网络
联机手写藏文识别
交叉熵
-
Keywords
recurrent neural network
online handwritten Tibetan character recognition
cross entropy
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名现代藏文语言单位频率和频级关系的统计分析
被引量:14
- 9
-
-
作者
王维兰
-
机构
西北民族大学中国民族信息技术研究院
-
出处
《科学技术与工程》
2004年第5期413-417,共5页
-
基金
国家自然科学基金 ( 60 2 73 0 93 )资助
-
文摘
Zipf定律是反映英文单词词频分布的普遍适应性的统计规律 ,对藏文语料做了相关语言单位频率与频级的统计与分析。试验表明 ,现代藏文的字丁、音节等语言单位上 ,其频率和频级之间也近似服从Zipf定律 ,并计算了各自的参数 ,对建立藏文基于统计的语言模型具有一定意义。
-
关键词
藏文语言单位
Zipf定律
频率
频级
词频分布
语言模型
-
Keywords
language unit in modern Tibetan Zipf's law frequency frequency-rank
-
分类号
H214
[语言文字—少数民族语言]
H087
[语言文字—语言学]
-
-
题名藏文识别后处理研究
被引量:10
- 10
-
-
作者
王维兰
丁晓青
戴玉刚
-
机构
西北民族学院
清华大学
-
出处
《术语标准化与信息技术》
2002年第2期30-34,共5页
-
文摘
介绍了基于统计的Markov模型和藏文音节拼写规则的方法用于藏文识别后处理所获得了一些实验结果;针对藏文的特点,提出了继续深入研究的内容。
-
关键词
后处理
MARKOV模型
藏文识别
文本识别
-
Keywords
post-processing, markov model, rule, Tibet character recognition
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
H08
[语言文字—语言学]
-
-
题名集音节、梵文和词汇于一体的藏文智能输入系统
被引量:2
- 11
-
-
作者
王维兰
-
机构
西北民族大学中国民族信息技术研究院
-
出处
《计算机应用研究》
CSCD
北大核心
2006年第11期170-172,共3页
-
基金
国家自然科学基金资助项目(60273090)
-
文摘
研究和设计了以音节、词汇为输入单位的基于藏文拉丁转写的编码输入方案,设计了音节和词汇基字编码快速输入法,实现了集音节、梵文和词汇输入于一体的藏文智能输入系统,从而解决了藏文输入长期以来没有快速输入或智能输入法的问题。实验表明其新组词和智能词汇记忆使藏文输入更加快捷和高效。
-
关键词
藏文
音节
基字编码
智能输入
-
Keywords
Tibetan
Syuable
Etymon Coding
Intelligent Input
-
分类号
TP317.2
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于内容的唐卡图像数据库检索系统
被引量:8
- 12
-
-
作者
王维兰
唐仕喜
钱建军
粱弼
-
机构
西北民族大学中国民族信息技术研究院
-
出处
《湛江师范学院学报》
2008年第3期91-95,共5页
-
基金
甘肃省科技攻关项目(2GS064-A52-035-04)
国家人事部2007年度留学人员科技活动项目择优资助(国人厅发[2007]170号)
-
文摘
为了解决藏族唐卡数据库分类检索问题,根据唐卡图像的特点,提出了基于块划分的结合小波帧包分解、匹配对与累计直方图为一体的新方法.该方法有效地结合了颜色、纹理、空间信息等视觉特征,实现了基于内容的唐卡图像检索,并且在查准率和查全率上都取得了好的效果.
-
关键词
唐卡
图像数据库
基于内容的图像检索
-
Keywords
Tibetan Thangka
image database
content-based image retrieval
-
分类号
TP311.132
[自动化与计算机技术—计算机软件与理论]
-
-
题名藏文字丁、音节频度及其信息熵
被引量:17
- 13
-
-
作者
王维兰
陈万军
-
机构
中国民族信息技术研究院
-
出处
《术语标准化与信息技术》
2004年第2期27-31,共5页
-
文摘
本文对两千万字的藏文语料做字频、音节频度的统计,以及字丁熵值、音节的相对熵值和绝对熵值的计算。统计结果表明(1)藏文标准音节5334个,其中单字音节475个,双字音节3061个,三字音节902个,四字音节896个;(2)藏文字丁或音节的频度分布极不均匀,覆盖统计文本90%、95%的音节分别是703个和1140个。
-
关键词
藏文
字丁频度
音节频度
信息熵
-
Keywords
Tibetan, frequency of character, frequency of syllables, entropy
-
分类号
H214
[语言文字—少数民族语言]
H087
[语言文字—语言学]
-
-
题名藏文基本字符识别算法研究
被引量:17
- 14
-
-
作者
王维兰
-
机构
西北民族学院数学系
-
出处
《西北民族学院学报(自然科学版)》
1999年第3期20-23,51,共5页
-
基金
甘肃省自然科学基金!项目代号:ZS991 - A25- 024 - 6
-
文摘
对藏文基本字符用投影法:垂直、水平、两对角线四个方向五个子特征进行研究,并给出了特征抽取、模式匹配、字符分类的算法.
-
关键词
藏文识别
特征抽取
算法
藏文基本字符
字符分类
-
Keywords
Tibetan character recognition
feature extracting
algorithm
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名拟Lagrange插值多项式
被引量:4
- 15
-
-
作者
王维兰
-
机构
西北民族学院数学系
-
出处
《西北民族学院学报(自然科学版)》
1999年第4期15-23,共9页
-
文摘
构造了拟Lagrange插值多项式的三种形式 ,有效地控制了Lagrange插值多项式表示的曲线随多项式次数的增高所出现的“龙格”
-
关键词
拟Lagrange插值多项式
构造
稳定性
插值法
曲线
-
分类号
O241.3
[理学—计算数学]
-
-
题名藏文编码输入及其规范研究
被引量:3
- 16
-
-
作者
王维兰
-
机构
西北民族大学中国民族信息技术研究院
-
出处
《西北民族大学学报(自然科学版)》
2005年第3期25-28,43,共5页
-
基金
国家自然基金项目(60273090)
-
文摘
研究科学、合理的藏文输入方案,使输入法易学、易用、快速和规范是至关重要的.文章强调藏文不“编码”的编码输入表明一种思想:我们不能孤立地讨论编码.藏文拉丁字母转写是一种自然的编码方式,拉丁字母转写转换为藏文的输入不仅在易学、易记、快打、规范以及四者的统一方面有潜力可挖,而且对信息时代的语言规范性研究也有重要意义.
-
关键词
藏文
拉丁字母转写
编码输入
规范
-
Keywords
Tibetan
latin conversion
coding input
criterion
-
分类号
TP319
[自动化与计算机技术—计算机软件与理论]
-
-
题名联机手写藏文字符笔划的分类统计与分析
- 17
-
-
作者
王维兰
柳洪轶
-
机构
西北民族大学中国民族信息技术研究院
东营职业学院
-
出处
《科技创新导报》
2008年第6期146-147,共2页
-
文摘
根据藏文字丁的笔划特性,将笔划分解成笔段,对笔段合成的笔划进行分类处理,通过对32套样本,每套107个基本字符,共50832个笔段的统计,依据笔段出现频率,揭示出藏文字丁笔划的内在本质规律,得到手写藏文字丁的16类基本笔划,定义其为联机手写藏文识别的基本笔划类型,将更加精确、完整,更具科学性。
-
关键词
手写藏文
字符
笔段
笔划
分类统计
-
分类号
H02
[语言文字—语言学]
-
-
题名以音节为输入单位的藏文输入模型研究
- 18
-
-
作者
王维兰
-
机构
西北民族大学中国民族信息技术研究院
-
出处
《电子技术应用》
北大核心
2006年第2期41-42,61,共3页
-
基金
国家自然基金项目(项目号:60273090)
-
文摘
以藏文音节作为输入的基本单位,建立了音节与词的编码模型以及音节输入、词汇输入和联想输入的模型并实现了藏文输入方案。试验结果表明,该方案科学、合理。输入方法简单、方便、快速。
-
关键词
藏文输入
编码模型
输入系统模型
-
分类号
TN919.8
[电子电信—通信与信息系统]
-
-
题名数学的教育功能
- 19
-
-
作者
王维兰
-
机构
西北民族学院数学系
-
出处
《甘肃教育》
北大核心
1996年第Z1期35-35,共1页
-
文摘
数学的教育功能西北民族学院数学系王维兰数学,使人形成正确的思维数学是思维的工具,数学教育不光是指学习一定的数学知识,必须涉及基本的数学思维方式──抽象化、运用符号、建立模型、逻辑分析、推理计算、从数据进行判断等等。不同于其它学科,数学的抽象是舍弃事物...
-
关键词
数学思维方式
数学教育
数学美
教育功能
西北民族学院
数学符号
思维进程
简单美
辩证的思维方式
建立模型
-
分类号
G633.6
[文化科学—教育学]
-
-
题名自发性脑室出血(附105例报告)
被引量:3
- 20
-
-
作者
王维兰
张楷文
秦洁
张赛
陈荷红
周忐才
-
机构
天津市脑系科中心医院
-
出处
《天津医药》
CAS
1996年第3期158-159,共2页
-
文摘
对105例自发性脑室出血分别行脑室外引流和脑室外引流加脑室内灌注尿激酶治疗。脑室外引流治疗56例,死亡21例(37.5%),脑室外引流加脑室内灌注尿激酶治疗49例,死亡7例(14.29%)。后组治疗可以早期清除脑室内积血,打通脑脊液循环通路,间接引流脑实质内血肿,减轻血肿对周围脑组织压迫,降低颅内压,降低病死率,减少致残率,疗效优于脑室外引流组。
-
关键词
脑室出血
脑室外引流
尿激酶
-
Keywords
ventricular hemorrhage ventricular drainage urokinase
-
分类号
R743.34
[医药卫生—神经病学与精神病学]
-