期刊文献+
共找到118篇文章
< 1 2 6 >
每页显示 20 50 100
中国民族语言大规模标注文本的检索技术实现及其价值 被引量:1
1
作者 江荻 龙从军 《云南师范大学学报(哲学社会科学版)》 北大核心 2023年第6期36-44,共9页
《中国民族语言语法标注文本》丛书是国内第一套大规模真实文本资源,涵盖十余种低资源中国民族语言,又具有语法标注精深学术价值,因此引起学界广泛的兴趣和关注。鉴于该套丛书大规模标注文检索技术实现的重要价值,本文通过介绍该项目的... 《中国民族语言语法标注文本》丛书是国内第一套大规模真实文本资源,涵盖十余种低资源中国民族语言,又具有语法标注精深学术价值,因此引起学界广泛的兴趣和关注。鉴于该套丛书大规模标注文检索技术实现的重要价值,本文通过介绍该项目的内容、技术实现过程和可期的检索功能,特别对国际通行隔行对照化对齐文本的实现技术加以详释,使读者在项目上线之前就对丛书电子化和检索技术的实现有客观而清晰的认识。 展开更多
关键词 民族语 标注文本 语料数据 检索技术
下载PDF
论藏文的序性及排序方法 被引量:33
2
作者 江荻 周季文 《中文信息学报》 CSCD 北大核心 2000年第1期56-64,共9页
为解决藏文排序问题,本文提出藏文的构造序和字符序概念,并在此基础上提出解决藏文词典序的计算机方案。文章对各类藏文构造及字符进行了分析和赋值。
关键词 藏文 词典序 构造序 字符序 计算机排序
下载PDF
《元朝秘史》电子文本检索系统的研制 被引量:3
3
作者 江荻 严海林 +2 位作者 孙伯君 斯钦朝克图 孟达来 《中文信息学报》 CSCD 北大核心 2006年第3期36-42,共7页
本文概要地介绍了13世纪《元朝秘史》的文献背景及原文所独有的复杂文本形式,通过对文本的内涵分析和版面分析,设计了关于《元朝秘史》电子检索系统的研制方案。其中主要解决了原文三行一体显示格式的还原问题,而且系统可以分别对原文... 本文概要地介绍了13世纪《元朝秘史》的文献背景及原文所独有的复杂文本形式,通过对文本的内涵分析和版面分析,设计了关于《元朝秘史》电子检索系统的研制方案。其中主要解决了原文三行一体显示格式的还原问题,而且系统可以分别对原文汉字音写、汉语译文、汉字旁译、语音语法标注等不同部分进行检索和统计。检索输出结果包括研究者最重视的传统学术章节号、卷页码、在电子文本出现的具体位置。另外,系统对检索词采用了上下文检索技术,输出文本包括检索词的部分上下文内容。本系统基本满足历史、文学和语言研究的应用需求。 展开更多
关键词 计算机应用 中文信息处理 元朝秘史 复杂文本 电子检索系统
下载PDF
藏文信息处理属性统计研究 被引量:19
4
作者 江荻 董颖红 《中文信息学报》 CSCD 1995年第2期37-44,共8页
本文统计分析:1、藏字的字长和构调频度;2、藏字的声母和韵母结构方式及频度;3、藏字的位置字符及结构方式。通过统计分析,从藏字结构方式的量和位置字符的量的度量揭示其质的面貌,为藏文研究和藏字信息处理应用提供基础数据。
关键词 藏文信息处理 属性 统计分析 字形 结构方式
下载PDF
书面藏语排序的数学模型及算法 被引量:25
5
作者 江荻 康才晙 《计算机学报》 EI CSCD 北大核心 2004年第4期524-529,共6页
针对中国国家标准及ISO藏文编码字符集提出书面藏语字词的排序涉及藏字结构序、构造级和字符序概念 ,是不同于中文、英文序性而性质独特的一种排序 .文章详尽分析了藏字字形、结构形态、传统字符顺序以及藏字字长和层高等特征 ,构建出... 针对中国国家标准及ISO藏文编码字符集提出书面藏语字词的排序涉及藏字结构序、构造级和字符序概念 ,是不同于中文、英文序性而性质独特的一种排序 .文章详尽分析了藏字字形、结构形态、传统字符顺序以及藏字字长和层高等特征 ,构建出藏语排序的数学模型 .然后依据模型要求为每类藏文符号进行数字赋值 ,通过算法逐步确定字符位置并识别字符 ,最后按照抽取字符的对应数值组合排序 ,完成了藏语字词的排序 .该模型现已在Win dows平台上实现 . 展开更多
关键词 藏字 结构序 构造级 字符序 计算机排序 数学模型
下载PDF
藏语拉萨话的体貌、示证及自我中心范畴 被引量:29
6
作者 江荻 《语言科学》 2005年第1期70-88,共19页
本文主要讨论藏语拉萨话动词的体貌范畴以及句法标记。然而,藏语体貌范畴总是与示证性和自我中心趋向范畴共享形式标记。藏语示证性评估说话人所出示的证据,自我中心趋向表明说话人以自我为中心的行为特征。因此,本文同时描述了藏语拉... 本文主要讨论藏语拉萨话动词的体貌范畴以及句法标记。然而,藏语体貌范畴总是与示证性和自我中心趋向范畴共享形式标记。藏语示证性评估说话人所出示的证据,自我中心趋向表明说话人以自我为中心的行为特征。因此,本文同时描述了藏语拉萨话的体貌类型、示证类型、自我中心趋向类型,以及它们的句法形式。拉萨话有9类动词体,分别是:将行体、即行体、待行体、实现体、持续体、结果体、方过体、已行体、与境体;4类示证性,分别是自知示证、亲知示证、新知示证和推知示证。自我中心范畴表现为动作趋向自我还是趋向他人,或者说话人获益还是受损等等。另外,本文还讨论了句法上动词体与人称、意愿、情态以及时空认知的相互制约关系。 展开更多
关键词 藏语 说话人 动词体 句法形式 持续体 形式标记 情态 文同 自我中心 趋向
下载PDF
现代藏语动词的句法语义分类及相关语法句式 被引量:16
7
作者 江荻 《中文信息学报》 CSCD 北大核心 2006年第1期37-43,共7页
本文突破了传统藏文文法关于动词分类的简单描述,建立起以句法语义为纲要的动词类别和相关句法规则。本文区分了藏语12大类动词,各类动词都有不同论元数量和不同句法性质的要求。因此,动词的句法语义类别划分能够较细致和全面反映各种... 本文突破了传统藏文文法关于动词分类的简单描述,建立起以句法语义为纲要的动词类别和相关句法规则。本文区分了藏语12大类动词,各类动词都有不同论元数量和不同句法性质的要求。因此,动词的句法语义类别划分能够较细致和全面反映各种类型藏语句式的语法结构框架,包括句子的语序、词格标记和句法助词。动词的句法语义分类结果可以直接应用于藏语语法信息词典的构建,是藏语计算处理的重要基础。 展开更多
关键词 计算机应用 中文信息处理 藏语 动词句法语义分类 句法结构 句法标记
下载PDF
现代藏语形容词谓语的构造及识别方法(英文) 被引量:3
8
作者 江荻 胡鸿雁 《语言研究》 CSSCI 北大核心 2005年第2期115-122,共8页
现代藏语形容词谓语在句法结构形式上较为独特,一类是形容词后附存在动词转化来的谓语词缀,形式是:形容词+(副词+)谓语词缀(+表语气谓语词缀/语气词),一类是形容词词根后附典型的动词体貌-示证标记,形式是:形容词词根+(副词+)体貌-示证... 现代藏语形容词谓语在句法结构形式上较为独特,一类是形容词后附存在动词转化来的谓语词缀,形式是:形容词+(副词+)谓语词缀(+表语气谓语词缀/语气词),一类是形容词词根后附典型的动词体貌-示证标记,形式是:形容词词根+(副词+)体貌-示证标记。在详细描述形容词谓语结构和形式标记基础上,对形容词谓语组块进行识别实验,通过文本与形容词词表、副词词表、谓语词缀表和续连规则表的匹配,基本实现形容词谓语的识别,并对误识现象进行了分析。 展开更多
关键词 现代藏语 形容词谓词 谓语词缀 自动识别
下载PDF
藏文字符的分类与功能描述 被引量:2
9
作者 江荻 燕海雄 《西藏研究》 CSSCI 北大核心 2010年第5期75-85,共11页
藏文字符除了字母类符号,尚有大量其他文本符号,这些符号的名称、性质与功能历来未作勘定,积疑甚多。藏文文本符号总体上可以分为三大类:藏文(本体)字符、梵源藏文字符、其他文本图形符号。藏文字符专指藏文创制时期以及藏文历史应用中... 藏文字符除了字母类符号,尚有大量其他文本符号,这些符号的名称、性质与功能历来未作勘定,积疑甚多。藏文文本符号总体上可以分为三大类:藏文(本体)字符、梵源藏文字符、其他文本图形符号。藏文字符专指藏文创制时期以及藏文历史应用中依据语言变化所创制的符号,通常所说的30个辅音字母和4个元音符号以及相应变体都在此列。除此外,藏文数字符和标点符号也可归入此类。梵源藏文字符是通过新创藏文字形表示藏语中没有的梵文读音形式和文字形式的字符,形成了所谓的藏(文)化梵文字符。其他文本图形符号包括藏族自身创造的图形以及来源于梵文文本的图形,其基本特点是不表达语言声音,仅表示某种文本形式意义,或者以图形方式指示事物的意义。这类符号有吟诵示意符、吟诵会意符、占星符、装饰符,等等。以上藏文字符大多已收入ISO/IEC国际标准藏文字符基本集,对字符的分类有助于进一步展开藏文计算机处理研究。 展开更多
关键词 藏文字符 分类 功能 来源 应用领域
下载PDF
国际音标输入软件的设计与实现 被引量:1
10
作者 江荻 刘汇丹 吴兵 《中文信息学报》 CSCD 北大核心 2011年第2期111-116,共6页
文章以蓝蝶国际音标(形类)输入法为对象论述了国际音标输入系统的编码思想、算法设计和字体制作。输入编码的基本原则是字形的分类,合理的分类能产生适合用户的键盘操作习惯;算法设计提出了高频优先的动态连续输入效果;字体制作能及时... 文章以蓝蝶国际音标(形类)输入法为对象论述了国际音标输入系统的编码思想、算法设计和字体制作。输入编码的基本原则是字形的分类,合理的分类能产生适合用户的键盘操作习惯;算法设计提出了高频优先的动态连续输入效果;字体制作能及时添加所需字符,并完善字句行距等多文种混排版面质量。 展开更多
关键词 国际音标 输入编码 动态键盘 连续输入 字库设计
下载PDF
藏语述说动词小句宾语及其标记 被引量:6
11
作者 江荻 《中文信息学报》 CSCD 北大核心 2007年第4期111-115,共5页
本文讨论藏语述说动词管控的句子性小句宾语。藏语述说动词包括“说”类动词、认知动词、思考动词、询问动词及其他语义相关的动词。从小句自身结构看,可以是完整的句子,带主语、谓语以及句末动词体貌标记和语气词,也可能只是单一的谓... 本文讨论藏语述说动词管控的句子性小句宾语。藏语述说动词包括“说”类动词、认知动词、思考动词、询问动词及其他语义相关的动词。从小句自身结构看,可以是完整的句子,带主语、谓语以及句末动词体貌标记和语气词,也可能只是单一的谓语动词。小句宾语自身具有谓词性,通常通过添加名词化标记使之名词化。小句宾语的标记来自古代述说类动词的类典型zer的语法化,而在现代藏语中作为小句标记语音和书写形式上都有多个变体。小句宾语内部也有复杂的关系和层次,类似于英语的直接引语与间接引语。小句缺省主语的情况下,动作发出者可通过表示体貌、情态的语法词以及上下文来确定。小句的句类包括陈述、疑问、祈使和感叹,可带不同的句类语气词。最后应该指出,有一部分述说动词小句宾语经常不带名词化标记,这种现象会给句法处理算法带来一定的麻烦,相关原因和解决办法还须进一步研究。 展开更多
关键词 计算机应用 中文信息处理 藏语 述说动词小句宾语 标记 语法化
下载PDF
藏语复杂声母系统及复杂演化行为 被引量:6
12
作者 江荻 《中国藏学》 CSSCI 1996年第4期140-152,共13页
亲属语言或方言之间虽然有相当严整的语音对应关系,但实际读音的差别之大往往又超乎可能的音变设想。所以我们经常很难解释共时平面上语言或方言的差异现象、语言研究中曾探索过各种音变模型,如同化、异化、换位等等,然而这些模型有... 亲属语言或方言之间虽然有相当严整的语音对应关系,但实际读音的差别之大往往又超乎可能的音变设想。所以我们经常很难解释共时平面上语言或方言的差异现象、语言研究中曾探索过各种音变模型,如同化、异化、换位等等,然而这些模型有一定的局限性,难以解释行为复杂的历史音变现象。从汉藏语言来看,包括汉语在内的各种语言的原始形式都呈复杂的声韵结构形式。 展开更多
关键词 历史音变 方言 声母系统 亲属语言 汉藏语 差异现象 语言研究 复杂 实际 读音
下载PDF
王念孙的联绵词“天籁”说证 被引量:4
13
作者 江荻 《语言科学》 CSSCI 北大核心 2013年第5期469-476,共8页
文章指出在众多的联绵词产生和形成学说中,唯清代大学者王念孙提出的联绵词"天籁"说准确刻画了联绵词的起源性质。具体论证上以扬雄《方言》联绵词为例说明汉语并非自古就是单音节词语言,然后用抑扬格词模式演化定律以及达让... 文章指出在众多的联绵词产生和形成学说中,唯清代大学者王念孙提出的联绵词"天籁"说准确刻画了联绵词的起源性质。具体论证上以扬雄《方言》联绵词为例说明汉语并非自古就是单音节词语言,然后用抑扬格词模式演化定律以及达让语案例阐述了多音节词演化为单音节词的演变机制。文章认为甲金文之前的汉语经历了这样的演化过程,多音节的联绵词就是这个演化过程的遗存。 展开更多
关键词 联绵词 抑扬格词模式 多音节词 单音节化
下载PDF
中国不同族群对核心词认知的实验 被引量:1
14
作者 江荻 尹巧云 《语言文字应用》 CSSCI 北大核心 2016年第1期55-64,共10页
本实验通过不同语言族群和不同词汇集,考察被试在不同条件下的图片命名反应时间,证明心理词库在语义、概念本体性质上不太可能是层级结构,认为任何具体词集(包括Swadesh词表)都是根据某种应用目的从心理词库整体词汇中抽取出来的,必然... 本实验通过不同语言族群和不同词汇集,考察被试在不同条件下的图片命名反应时间,证明心理词库在语义、概念本体性质上不太可能是层级结构,认为任何具体词集(包括Swadesh词表)都是根据某种应用目的从心理词库整体词汇中抽取出来的,必然映射人类认知世界的文化、语用等层次性特征。本文结论对理解心理词库、Swadesh词表的深化应用和核心词的构建研究带来新的思路。 展开更多
关键词 图画词汇命名反应时 Swadesh词表 词库层级性 本体属性
下载PDF
汉语方言自动聚类与分区及相关计算方法 被引量:4
15
作者 江荻 《暨南学报(哲学社会科学版)》 CSSCI 北大核心 2022年第3期10-23,共14页
本文回顾了学界对汉语方言之间相互关系的三种计量方法:特征统计、词源统计和词汇相似度计量,指出这三种计量方法采用的是非整体的、语音和词汇上受限的考察方法。文章阐述了一种更适用的计算模型,即Levenshtein Distance算法(莱文斯坦... 本文回顾了学界对汉语方言之间相互关系的三种计量方法:特征统计、词源统计和词汇相似度计量,指出这三种计量方法采用的是非整体的、语音和词汇上受限的考察方法。文章阐述了一种更适用的计算模型,即Levenshtein Distance算法(莱文斯坦距离,或称编辑距离),该方法对语言或方言之间线性字符串的语音相似性和词汇对应性具有协调功能,并蕴含特征比对和词源概率效用。本文自动分区实验汇集了南方吴、闽、粤、湘、客、赣、徽、淮8个分区的78个方言,官话方言有东北、北京、冀鲁、胶辽、中原、兰银、西南108个方言,共计186个汉语方言点。每个方言收集了斯瓦迪士100个基本词,并对方言之间展开相似性计算。计算结果与传统分区基本一致,但更为精准。 展开更多
关键词 汉语方言 聚类算法 莱文斯坦距离 自动分区
下载PDF
语音材料与语音表达方式的演变 被引量:3
16
作者 江荻 《语言科学》 2003年第3期3-12,共10页
本文全面讨论了元、辅音音素,声调,轻、重音等语音材料与嗓音发声的关系,以及它们在历史发展过程中的组织方式和表达作用。文章用表征性、调控性、普遍性方式全面理清了音素、韵律特征和嗓音特征三类语音材料之间的复杂关系,通过汉藏语... 本文全面讨论了元、辅音音素,声调,轻、重音等语音材料与嗓音发声的关系,以及它们在历史发展过程中的组织方式和表达作用。文章用表征性、调控性、普遍性方式全面理清了音素、韵律特征和嗓音特征三类语音材料之间的复杂关系,通过汉藏语言和印欧语言事实,阐明了声调、轻重音、长短音以及各类韵律特征产生的原因和过程,指出人类语言的表达需求与韵律节奏是各种语言语音材料和组织方式发生发展的源泉。同时也指出,由于语音材料的有限性和相互制约性,各种语言在语音材料的选择和组织方式上必然经历全然不同的复杂过程。 展开更多
关键词 语音材料 语音表达组织方式 表达需求
下载PDF
东亚语言语音词汇数据检索系统的设计与功能概述 被引量:2
17
作者 江荻 《云南师范大学学报(哲学社会科学版)》 CSSCI 2011年第2期15-20,共6页
文章从技术设计和数据应用两方面介绍了"东亚语言语音词汇数据检索系统"的设计思想和软件功能,包括语言数量、数据规模和其他相关内容。
关键词 藏缅语 侗台语 苗瑶语 南亚语 南岛语 词汇 计算机检索
下载PDF
藏字叠加结构线性处理统计分析 被引量:11
18
作者 江荻 董颖红 《中文信息》 1994年第4期44-46,54,共4页
由于藏字书写是非线性的二维阵列方式,因此藏文信息处理出现两种不同的技术处理方法。一种将藏文字母符号作为信息处理基本单位,所需设计的藏文字库空间极小;另一种将纵向二维构造的一律处理为线性结构,即藏字的基字、上加字、甚至无音... 由于藏字书写是非线性的二维阵列方式,因此藏文信息处理出现两种不同的技术处理方法。一种将藏文字母符号作为信息处理基本单位,所需设计的藏文字库空间极小;另一种将纵向二维构造的一律处理为线性结构,即藏字的基字、上加字、甚至无音的各种组合都设计到字库中,因此字库所需容量成百倍地猛增,字库容量最高达到2300多字符。 由于这个问题涉及藏文字库建设、藏字编码输入方法、藏文打印输出和藏文识别等诸多方面,因此有必要完善技术处理的理论建设。 本文以现代藏语常用字为统计对象,对藏字纵向叠加结构进行统计分析,取得有实用参考价值的结果。 本文所收材料为《藏汉拉萨口语词典》,《拉萨口语读本》词汇表,《藏语简索》词汇表, 展开更多
关键词 信息处理 藏文编码 线性处理 统计
下载PDF
西藏洛扎吐蕃摩崖石刻的语法特征及翻译 被引量:4
19
作者 江荻 《民族翻译》 2014年第4期36-43,共8页
本文通过逐行逐字分析洛扎吐蕃摩崖石刻盟誓文本,归纳出古藏语的部分语法特征和书写特征,并在语法分析的基础上,重新释读摩崖文本的内容,校正了前贤翻译中的不足,提出了新的中文译文。
关键词 摩崖石刻 吐蕃 语法分析 汉译文
下载PDF
基于条件随机场的藏文人名识别研究 被引量:10
20
作者 康才畯 龙从军 江荻 《计算机工程与应用》 CSCD 北大核心 2015年第3期109-111,185,共4页
基于条件随机场模型在字粒度上识别并切分藏文人名,其优势是可以较好地利用藏文人名在文本中出现的基本特征和上下文特征来确定藏文人名在文本序列中的边界。根据藏文人名自身的特点设定特征标签集,利用条件随机场模型作为标注建模工具... 基于条件随机场模型在字粒度上识别并切分藏文人名,其优势是可以较好地利用藏文人名在文本中出现的基本特征和上下文特征来确定藏文人名在文本序列中的边界。根据藏文人名自身的特点设定特征标签集,利用条件随机场模型作为标注建模工具来进行训练和测试。从实验结果来看,该方法有较高的识别正确率,具有进一步研究的价值。下一步的改进需要扩充训练语料,并针对人名与一般词语同形现象进行特征标签集的优化。 展开更多
关键词 藏文人名 条件随机场 特征标签集
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部