期刊文献+

西藏的语言多样性及其分类 被引量:2

The Linguistic Diversity in Tibet and Its Classification
原文传递
导出
摘要 文章一方面叙述西藏的多样性语言现象,另一方面尝试用一种计算机自动聚类方法对西藏的语言进行分类。文章采用编辑距离计算方法的编码和赋值,以及聚类算法和树形图呈现。实验采集了西藏的藏语及其方言,还有门巴、珞巴、僜人等族群的非藏语语言共计49种,包括目前尚未识别的一些地方话。实验结果表明:西藏地区分布着藏语和非藏语的藏缅语,藏语包括传统分类的卫藏和康方言,卫藏又可分为前藏、后藏、阿里和南部次方言;非藏语的藏缅语有门巴族语言、珞巴族语言、义都系语言,以及藏东和藏东南语言系属不明的地方话。与传统分类相比,文章中所用机器语言或方言自动分类相当合理,可信度很高。 This article describes the linguistic phenomenon of diversity in Tibet and attempts to classify languages in Tibet through an automatic computer clustering method,using the coding and assignment method of editing distance calculation,as well as the clustering algorithm and tree graphic presentation.This paper collects the Tibetan language and dialects in Tibet,as well as the non-Tibetan languages of Monpa,Lhoba,Deng and other ethnic groups,including some local languages that are not yet identified,with a total of 49categories.The experimental results are as follows:there are Tibetan and non-Tibetan(Tibeto-Burman)languages in Tibet Autonomous Region.Tibetan language includes the traditionally classified dialects,namely,the dBus-gtsang and Khams dialects,and the dBus-gtsang dialect can be subdivided into dBus,gTsang,mNgav-ris and southern subdialects.The Tibeto-Burman language includes the Monpa and Lhoba languages,the Yidu-family languages,and the local languages of unknown origin in eastern and south-eastern Tibet.Compared with the traditional classification,the machine-automated classification in this paper is quite refine and reasonable,and the reliability is very high.
作者 江荻 JIANG Di
出处 《中国藏学》 CSSCI 北大核心 2022年第6期150-160,219,共12页 China Tibetology
基金 国家社科基金重大项目“中国民族语言大规模语法标注文本在线检索系统研制与建设研究”(项目编号:21&ZD304)阶段性成果
关键词 西藏 语言多样性 编辑距离 自动分类 Tibet Linguistic diversity Edit distance Automatic classification
  • 相关文献

参考文献9

二级参考文献14

  • 1胡嘉.有关文成公主的几件文物[J].文物,1959(7):5-8. 被引量:4
  • 2江荻.论汉藏语言历史比较词表的确定[J].民族语文,2000(3):33-40. 被引量:6
  • 3根据1982年的人口调查,中国国内的藏族人口是3,847,875人.具体说,西藏是1,765,600人、青海省是753,897人、甘肃省是304,573人、四川省是921,984人、云南省是95,925人.其他省、自治区的藏族人口不超过2000人.另外.根据尼泊尔1981年的人口调查,夏尔巴人以外的藏族,包括全部的称之为博提阿(Bhote=Bhotia)人的居民,二者合并总共是73,589人.但是,这个博提阿是包含有边境山丘地带的藏缅语族系统的居民的称呼,并不是仅仅限于藏族人.根据印度的人口调查,按照母语区别(藏语、巴尔底语、拉达克语、拉霍尔语《Lahul》等)来分类,整体上可以划分为博提阿语群(Bhotia Group)或藏语群(Tibtan Group).根据1961年的调查,其总人口为207,353人.其中,尚未确定的博提阿(Bhotia Unspecihed)人有29,873人.关于巴基斯坦和不丹的藏族人口没有详细的统计.
  • 4藏文的转写方式与本书其他章节是不同的,这是因为它涉及到方言的关系,所以不得不这样做,这也是把古语形式解释为大致的诸方言之共通形式的需要.另外,对地名之外的古语形式或古语音都加上了"*"号.还有就是方言名(所有的地名),一共有3种:1、藏文名同缀字在一起才明白的方言名;2、仅有藏文名的汉字记音就明白的方言名;3、仅有中国名就明白的方言名.
  • 5这个材料是昭和39年北村甫教授到了东京外国语大学亚非语言文化研究所后,作为东洋文库的客座研究员,与当时在日本的藏族学者一起研究的成果,并不断地修订、补充刊行.在北村甫教授的门下学习藏语的星实千代、长野泰彦等都曾承担过其中一些章节的执笔任务.
  • 6该计划现在已经有所改变,但还在继续实施.
  • 7白达克(Benedict,1972)首先划分了支那--藏大语族和藏--卡愣语族(Tibetan-Karen),而藏--卡愣语族进一步划分为卡愣语和藏缅诸语.藏缅语诸语包括藏--卡拉瓦里语群等7个核心语群,这些语群之间的关系不能用谱系树的姊妹关系来表示,景颇语(Kachin)是藏缅语族诸语的分歧焦点,往往被置于"语言是十字路口",人们要从三个层次来考虑其他语言同它的远近关系或语群间的亲疏关系.西田龙雄曾把景颇语看作一种"媒介语言".
  • 8西田龙雄在1978年,将景颇语系从藏语群中划了出去,景颇语无论在词汇、形态结构上都与藏缅语族诸语的4个语群有一定程度的相似点,所以可以称为"媒介语言"以作为语言的代表.不用说这又回到了西田龙雄以前的立场上.
  • 9"代名词化"(verb《pronominalization》)这个用语,是由包括语言在内的喜玛拉雅地域研究的先驱哈德森(B.H.Hodhson)在1955年的论文中首次使用提出来的.在科隆(S.Konow)的文章中(收集在格尼尔森《Grierson》编辑的《印度藏语概观》《Linguistic Survey of India=LSI》)把喜玛拉雅地区的藏缅语族诸语言分无"代名词化"语言和"非代名词化"语言,
  • 10西田龙雄在1983年,从历史的角度把藏族(恐怕还有嘉绒族)同中国古代的殷王朝相抗衡的古代羌族人联系在一起.他认为藏族是其中一个具有相当势力的部族.另外西田龙雄在1978年针对嘉绒语和羌语说道,"虽然可以发现两者若干个共同的现象,但是,与直接与体系整体相关的问题则很复杂,还存在覆盖成为了核心部分的藏语层和上述问题的别的语层.这个别的语层也许与博多--拉噶语系(长野泰彦所说的卡玛卢帕恩诸(カマルパン)语的一部分)的语言有关联."

共引文献563

同被引文献34

引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部