四邑方言词汇相似度比较分析被引量：5

On the lexical similarity of the Siyi dialects

导出

摘要本文从分析现有的方言词汇相似度计算方法入手,指出王沈计量法和加权平均法均存在不足之处。在此基础上,提出一种新的算法——语素加权法。语素加权法将每个词目权重设定为1,并根据词中语素的重要程度为每个语素加权;在语素加权的基础上,将构词法纳入考虑,计算其相似度。运用语素加权法,统计了普通话、广州话及七个四邑方言点的词汇相似度,并在此基础上为四邑方言做了聚类分析。 With a review of the existing measurements of lexical similarity among dialects, this study demonstrates the shortcomings of the Wang-Shen measurements and the weighted average method, and proposes a new measurement, i.e. morpheme weighting. Morpheme weighting assigns the invariable weight 1 to each word, and morphemes are weighted according to their importance as well as word-formation. By adopting this method, the paper calculates the lexical similarity of Mandarin, the Guangzhou dialect and the Siyi dialects, and conducts a clustering analysis for the Siyi dialects. It is found that the relations among the Siyi dialects are a reflection of their geographical positions in relation to one another and that lexical similarity reflects a synchronic rather than diachronic relation.

作者郑伟娜

机构地区香港中文大学(深圳)人文学院

出处《中国语文》 CSSCI 北大核心 2017年第6期693-703,共11页 Studies of the Chinese Language

基金广东省创新强校特色创新类项目"五邑侨乡方言与地方文化研究"(项目号:2015WTSCX105)资助

关键词词汇相似度语素加权法四邑方言 lexical similarity morpheme weighting Siyi dialects

分类号 H178 [语言文字—汉语]

引文网络
相关文献

参考文献10

1汪锋,王士元.语义创新与方言的亲缘关系[J].方言,2005,27(2):157-167. 被引量：13
2牛永洁,张成.多种字符串相似度算法的比较研究[J].计算机与数字工程,2012,40(3):14-17. 被引量：38
3沈榕秋.谈汉语方言的定量研究[J].语文研究,1994(2):45-52. 被引量：9
4詹伯慧,张日昇.珠江三角洲粤方言的常用词[J].方言,1989(4):262-266. 被引量：5
5邵慧君,秦绿叶.廉江市粤客词汇相似度的计量分析[J].中国语文,2008(2):154-167. 被引量：9
6陈海伦.论方言相关度、相似度、沟通度指标问题[J].中国语文,1996(5):361-368. 被引量：9
7程传鹏,吴志刚.一种基于知网的句子相似度计算方法[J].计算机工程与科学,2012,34(2):172-175. 被引量：27
8郑锦全.汉语方言沟通度的计算[J].中国语文,1994(1):35-43. 被引量：25
9王育德.中国五大方言分裂年代的语言年代学试探[J].当代语言学,1962(8):14-16. 被引量：8
10张树铮.关于方言沟通度和方音理解的几个问题[J].中国语文,1998(3):201-207. 被引量：3

二级参考文献52

1陈朝珠.北海白话词汇与周边方言词汇关系的计量分析比较[J].广西广播电视大学学报,2003,14(1):60-64. 被引量：4
2李荣.官话方言的分区[J].方言,1985,7(1):2-5. 被引量：354
3王士元.语言关系综述[J].中南民族学院学报（哲学社会科学版）,1985,7(3):106-112. 被引量：2
4陈瑞端,汤志祥.九十年代汉语词汇地域分布的定量研究[J].语言文字应用,1999(3):10-18. 被引量：23
5陆致极.汉语方言间亲疏关系的计量描写[J].中国社会科学,1987(1):155-166. 被引量：24
6沈榕秋.谈汉语方言的定量研究[J].语文研究,1994(2):45-52. 被引量：9
7杨鼎夫.计算机计量研究汉语方言分区的探索[J].语文研究,1994(3):42-47. 被引量：3
8张家騄,齐士钤,吕士楠.汉语辅音知觉结构初探[J].心理学报,1981,13(1):76-85. 被引量：17
9郑锦全.汉语方言沟通度的计算[J].中国语文,1994(1):35-43. 被引量：25
10陈海伦.计量语言学说略[J].玉林师范学院学报,1996,0(1):37-41. 被引量：2

共引文献123

1熊子瑜.基于汉语方言字音系统实验研究工具的合肥话与北京话声母系统对比分析[J].中国语音学报,2021(1):25-43.
2崔萌.语言多样性、语言距离与经济发展研究述略[J].制度经济学研究,2020(2):254-266. 被引量：1
3汪锋,殷玥.茶的别称“蔎”的起源与消亡——兼论汉字的过滤机制[J].民族语文,2021(1):107-113. 被引量：3
4孫凱,杜小鈺.漢語方言"脖子"義詞形的地理分布及其解釋——兼論語素"脖"的來源問題[J].汉语史学报,2022(1):252-277.
5黄行.语言识别与语言群体认同[J].民族翻译,2009(2):3-11. 被引量：8
6许培新.汉语方言分区的现状与存在的问题[J].山东科技大学学报（社会科学版）,2000,2(4):77-81. 被引量：1
7陈海伦.方言间韵母系统相似度测度研究[J].中国语文,2000(2):139-145. 被引量：8
8郑锦全.语言学——结合人文关怀与科技应用的学科[J].暨南学报（哲学社会科学版）,2005,27(5):94-98. 被引量：6
9李小凡.汉语方言分区方法再认识[J].方言,2005,27(4):356-363. 被引量：30
10陈海伦.方音系统的相似关系计算[J].语言科学,2006,5(1):23-31. 被引量：6

同被引文献29

1索伦·维希曼,冉启斌.语言与方言的区分层级——ASJP模式的核心词汇距离计算再分析[J].南开语言学刊,2019(2):126-135. 被引量：7
2庄初升.论闽南方言岛[J].韶关学院学报,2001,22(11):5-13. 被引量：9
3李如龙.闽语的“囝”及其语法化[J].南开语言学刊,2005(2):1-8. 被引量：23
4王育德.中国五大方言分裂年代的语言年代学试探[J].当代语言学,1962(8):14-16. 被引量：8
5孙宏开,郑玉玲.计算机进行藏缅语语音相关分析的尝试[J].语言研究,1994,14(2):168-180. 被引量：3
6陆致极.汉语方言间亲疏关系的计量描写[J].中国社会科学,1987(1):155-166. 被引量：24
7梁猷刚.广东省海南岛汉语方言的分类[J].方言,1984,6(4):264-267. 被引量：23
8孙宏开,郑玉玲.藏缅语亲疏关系的计量分析方法[J].语言研究,1993(2):155-163. 被引量：2
9杨鼎夫,夏应存.闽方言分区的计量研究[J].暨南学报（哲学社会科学版）,1994,16(1):139-151. 被引量：2
10郑锦全.汉语方言沟通度的计算[J].中国语文,1994(1):35-43. 被引量：25

引证文献5

1索伦·维希曼,冉启斌.语言与方言的区分层级——ASJP模式的核心词汇距离计算再分析[J].南开语言学刊,2019(2):126-135. 被引量：7
2江荻.汉语方言自动聚类与分区及相关计算方法[J].暨南学报（哲学社会科学版）,2022,44(3):10-23. 被引量：4
3原新梅,丁俊,冉启斌.方言相似度计算与影响因素的量化--以辽宁胶辽官话为例[J].语言科学,2022,21(4):400-413. 被引量：7
4林天送,范莹.基于编辑距离的七个闽南方言点词汇比较研究[J].闽台文化研究,2022(3):84-93.
5江荻.汉语方言自动聚类与分区及相关计算方法[J].复印报刊资料（语言文字学）,2022(8):97-110.

二级引证文献14

1冉启斌,丁俊,原新梅,赵建军.语言距离与地理距离的复杂性——以辽宁境内的胶辽官话与东北官话为例[J].南开语言学刊,2022(1):133-144. 被引量：1
2于爽,冉启斌,史晴琳.基于编辑距离的汉语中介语语音计算分类[J].现代语文,2020(11):4-11.
3黄玮,冉启斌.考虑词汇替换的汉语古音构拟检测[J].现代语文,2022(7):54-61.
4原新梅,丁俊,冉启斌.方言相似度计算与影响因素的量化--以辽宁胶辽官话为例[J].语言科学,2022,21(4):400-413. 被引量：7
5黄玮,冉启斌,龙国治,原新梅.基于词汇声学距离的语言分类再探[J].南开语言学刊,2021(2):30-38. 被引量：3
6冉启斌,丁俊.汉语方言的相似度与差异--基于ASJP模式语言距离计算的考察[J].语文研究,2023(2):17-26. 被引量：3
7王继红,马楷惠.清代《满汉成语对待》作者考辨与方言基础[J].语言科学,2023,22(3):324-336. 被引量：5
8王士元,陈保亚,孔江平,汪锋.“民族语言学的新视野”笔谈[J].贵州民族大学学报（哲学社会科学版）,2023(4):1-30. 被引量：4
9行久红.基于智能优化算法的自然语言语义相关度计算模型[J].信息记录材料,2023,24(8):77-79.
10张海媚.“饺子”名称的共时分布和历时演变[J].语言科学,2023,22(5):535-547. 被引量：1

1陆娟.如何提高小学英语阅读教学的有效性[J].学子（理论版）,2017(8):82-82.
2麦耘.广州话歪斜义的[~■mε]本字考[J].方言,2017,0(4):503-503.
3钱文俊.声调同声母、韵母的关系[J].上饶师范学院学报,1982,8(4):51-55. 被引量：5
4江有生.往事的回忆[J].美术,1981(12):23-24. 被引量：1
5汪顺彪.谈材料帐存赤字的审计及处理[J].武汉财会,1988(8).
6陈二静,姜恩波.文本相似度计算方法研究综述[J].数据分析与知识发现,2017,1(6):1-11. 被引量：77
7徐焕洲.南方大厦的职业道德规范[J].思想政治工作研究,1985,0(5):44-45.
8汪家祐.管理会计讲座第七讲销售预测(下)[J].武汉财会,1985(7):37-39.
9杨群.热学教学补遗[J].楚雄师范学院学报,1987,0(4):61-66.
10吴玉秀,喜炜.关于新疆农业水利工程专业高职本科联合人才培养模式的思考[J].新课程研究（中旬）,2017,0(10):40-41. 被引量：1

中国语文

2017年第6期

浏览历史

内容加载中请稍等...

四邑方言词汇相似度比较分析被引量：5

参考文献10

二级参考文献52

共引文献123

同被引文献29

引证文献5

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

四邑方言词汇相似度比较分析 被引量：5

参考文献10

二级参考文献52

共引文献123

同被引文献29

引证文献5

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

四邑方言词汇相似度比较分析被引量：5