基于偏向相似性的自然语言关联和聚类研究被引量：3

Cluster and Association Analysis of Natural Languages Based on Inclined Similarity Measures

下载PDF

导出

摘要聚类按关联进行分类,关联和聚类分析的基础是相似性计算。通常相似性是指绝对相似性,具有对称性。但自然语言研究中发现大部分规律都是偏向的,具有不对称性,需要用偏向的思路来考察不对称的关联和聚类策略:以类似条件概率的概率蕴涵指标来描写特征间的不对称关联,并在此基础上定义优势关系、紧密关系、控制中心、中途岛等关联特性;基于偏向相似性的聚类策略,从而能更好地处理语言本体研究中的"假性孤立点"、数据稀疏问题和家族象似性类型的聚类。 Cluster analysis is the task of grouping a set of objects by associations of these objects. The diameters of cluster and association analysis are similarity measures, which often involves the absolute similarity of the symmetry property. But most rules found in natural languages are inclined and have asymmetrical forms. We describes the asymmetrical associationby a parameter of Probability Entailment, i.e. the conditional probability, to represent the asymmetrical associations among features. And then we define the Domination Relation, the Tight Relation, the Control Center, and the Midway island. A strategy for cluster based on inclined similarity measures is presented to deal with issues likethe false isolated points, data sparsity and family iconicity.

作者陈振宁陈振宇

机构地区浙江大学人文学院复旦大学中国语言文学系

出处《中文信息学报》 CSCD 北大核心 2017年第1期205-211,220,共8页 Journal of Chinese Information Processing

基金教育部人文社会科学规划基金(13YJA740005)

关键词不对称性条件概率关联聚类 asymmetry, conditional probability, association, cluster

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1陈振宁,陈振宇.用语图分析揭示语言系统中的隐性规律——赢家通吃和赢多输少算法[J].中文信息学报,2015,29(5):20-30. 被引量：5

二级参考文献12

1郭锐.汉语动词的过程结构[J],中国语文,1993(6).
2郭锐.语义地图概念的最小关联原则和关联度.李小凡,张敏,郭锐.汉语多功能语法形式的语义地图研究[C].北京:商务印书馆,2015,152-172.
3H.Martin,The geometry of grammatical meaning:semantic maps and cross-linguistic comparison[C]//Proceedings of the New Psychology of Language:Cognitive and Functional Approaches to Language Structure.Mahwah,NJ.Erlbaum.2003:211-242.
4Reinhard Diestel,于青林,王涛译.图论(第四版)[M].北京:高等教育出版社,2013.
5Nooy, Mrvar, Batagelj,等. 蜘蛛: 社会网络分析技术(第二版)[M].北京:世界图书出版公司,2012.
6H Martin.Indefinite Pronouns[M].Oxford:Clarendon,1997.
7C Michael.Building Semantic Maps:the Case of Person Marking[M].M Miestamo & B Walchli.New Challenges in typology:Broadening the horizons and redefining the foundations.Berlin:Mouton,2007:225-248.
8Ferdinand de Haan. On Representing Semantic Maps[EB/OL]. URL:http://emeld.org/workshop/2004/deHaan-paper.doc.2004.
9陆丙甫,屈正林.语义投射连续性假说:原理和引申——兼论定语标记的不同功能基础[M].语言学论丛(第四十二辑).北京:商务印书馆,2010:112-128.
10吴福祥.从“得”义动词到补语标记--东南亚语言的一种语法化区域[J].中国语文,2009(3):195-211. 被引量：72

共引文献4

1陈玉洁,吴越.显赫语义和语义扩张——以吴语间接题元标记为例[J].当代语言学,2019,21(3):364-384. 被引量：2
2陈振宇,王梦颖,陈振宁.汉语主观副词与客观副词的分野[J].语言科学,2020,19(4):395-410. 被引量：6
3陈振宁,陈振宇.基于语义地图的北京话和成都话意外类语气词类型比较[J].常熟理工学院学报,2020,34(6):52-68.
4陈振宁,王梦颖.基于多维特征聚类和关联的语气研究——以北京话语气成分“啊”为例[J].语言研究集刊,2018,0(1):161-180. 被引量：2

同被引文献32

1储诚志.语气词语气意义的分析问题──以“啊”为例[J].语言教学与研究,1994(4):39-51. 被引量：59
2陆俭明.说量度形容词[J].语言教学与研究,1989(3):46-59. 被引量：107
3黄国营.“吗”字句用法初探[J].语言研究,1986,6(2):131-135. 被引量：45
4方梅.北京话句中语气词的功能研究[J].中国语文,1994(2):129-138. 被引量：136
5张谊生.现代汉语副词的性质、范围与分类[J].语言研究,2000,20(1):51-63. 被引量：156
6沈家煊.语言的“主观性”和“主观化”[J].外语教学与研究,2001,33(4):268-275. 被引量：2282
7马真.表加强否定语气的副词“并”和“又”——兼谈词语使用的语义背景[J].世界汉语教学,2001,15(3):12-18. 被引量：97
8孙汝建.句末语气词的四种语用功能[J].南通大学学报（哲学社会科学版）,2005,21(2):76-80. 被引量：38
9徐以中,杨亦鸣.副词“都”的主观性、客观性及语用歧义[J].语言研究,2005,25(3):24-29. 被引量：34
10史金生.“又”、“也”的辩驳语气用法及其语法化[J].世界汉语教学,2005,19(4):52-60. 被引量：49

引证文献3

1陈振宇,王梦颖,陈振宁.汉语主观副词与客观副词的分野[J].语言科学,2020,19(4):395-410. 被引量：6
2陈振宁,陈振宇.基于语义地图的北京话和成都话意外类语气词类型比较[J].常熟理工学院学报,2020,34(6):52-68.
3陈振宁,王梦颖.基于多维特征聚类和关联的语气研究——以北京话语气成分“啊”为例[J].语言研究集刊,2018,0(1):161-180. 被引量：2

二级引证文献8

1陈振宁,陈振宇.基于语义地图的北京话和成都话意外类语气词类型比较[J].常熟理工学院学报,2020,34(6):52-68.
2赵敏.叹词“啊”的预期性感叹表达[J].宁夏大学学报（人文社会科学版）,2021,43(2):24-28. 被引量：4
3张妍.小量否定和大量否定的接口研究——以“丝毫”和“万万”为例[J].湖北文理学院学报,2021,42(9):68-73.
4郭光.从“否定—存在循环”视角看“不”和“没”的中和[J].中国语文,2022(3):324-338. 被引量：4
5杨旭.频数、相对频数、频率与概率——“常常/往往/总(是)/老(是)”辨析[J].长江学术,2022(3):121-128. 被引量：1
6马威艳.基于《红楼梦》双语平行语料库的汉语“反”“竟”“偏”反预期标记深层语义分析[J].辽宁工业大学学报（社会科学版）,2022,24(5):67-70.
7陈禹.从“无非”看范围副词的认知理据及其语用系统[J].世界汉语教学,2023,37(2):185-196. 被引量：2
8朱磊.现代汉语补语位置新兴极量程度副词的演变分析——以含有“爆”“哭”的语言成分为例[J].台州学院学报,2024,46(2):40-49.

1MIDWAY MID中途岛从彩色电子书谈起[J].电脑爱好者（普及版）,2011(4):102-103.
2寒清.古代密码战[J].我们爱科学,2015,0(24):46-48.

中文信息学报

2017年第1期

浏览历史

内容加载中请稍等...

基于偏向相似性的自然语言关联和聚类研究被引量：3

参考文献1

二级参考文献12

共引文献4

同被引文献32

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于偏向相似性的自然语言关联和聚类研究 被引量：3

参考文献1

二级参考文献12

共引文献4

同被引文献32

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于偏向相似性的自然语言关联和聚类研究被引量：3