期刊文献+

基于偏向相似性的自然语言关联和聚类研究 被引量:3

Cluster and Association Analysis of Natural Languages Based on Inclined Similarity Measures
下载PDF
导出
摘要 聚类按关联进行分类,关联和聚类分析的基础是相似性计算。通常相似性是指绝对相似性,具有对称性。但自然语言研究中发现大部分规律都是偏向的,具有不对称性,需要用偏向的思路来考察不对称的关联和聚类策略:以类似条件概率的概率蕴涵指标来描写特征间的不对称关联,并在此基础上定义优势关系、紧密关系、控制中心、中途岛等关联特性;基于偏向相似性的聚类策略,从而能更好地处理语言本体研究中的"假性孤立点"、数据稀疏问题和家族象似性类型的聚类。 Cluster analysis is the task of grouping a set of objects by associations of these objects. The diameters of cluster and association analysis are similarity measures, which often involves the absolute similarity of the symmetry property. But most rules found in natural languages are inclined and have asymmetrical forms. We describes the asymmetrical associationby a parameter of Probability Entailment, i.e. the conditional probability, to represent the asymmetrical associations among features. And then we define the Domination Relation, the Tight Relation, the Control Center, and the Midway island. A strategy for cluster based on inclined similarity measures is presented to deal with issues likethe false isolated points, data sparsity and family iconicity.
出处 《中文信息学报》 CSCD 北大核心 2017年第1期205-211,220,共8页 Journal of Chinese Information Processing
基金 教育部人文社会科学规划基金(13YJA740005)
关键词 不对称性 条件概率 关联 聚类 asymmetry, conditional probability, association, cluster
  • 相关文献

参考文献1

二级参考文献12

  • 1郭锐.汉语动词的过程结构[J],中国语文,1993(6).
  • 2郭锐.语义地图概念的最小关联原则和关联度.李小凡,张敏,郭锐.汉语多功能语法形式的语义地图研究[C].北京:商务印书馆,2015,152-172.
  • 3H.Martin,The geometry of grammatical meaning:semantic maps and cross-linguistic comparison[C]//Proceedings of the New Psychology of Language:Cognitive and Functional Approaches to Language Structure.Mahwah,NJ.Erlbaum.2003:211-242.
  • 4Reinhard Diestel,于青林,王涛译.图论(第四版)[M].北京:高等教育出版社,2013.
  • 5Nooy, Mrvar, Batagelj,等. 蜘蛛: 社会网络分析技术(第二版)[M].北京:世界图书出版公司,2012.
  • 6H Martin.Indefinite Pronouns[M].Oxford:Clarendon,1997.
  • 7C Michael.Building Semantic Maps:the Case of Person Marking[M].M Miestamo & B Walchli.New Challenges in typology:Broadening the horizons and redefining the foundations.Berlin:Mouton,2007:225-248.
  • 8Ferdinand de Haan. On Representing Semantic Maps[EB/OL]. URL:http://emeld.org/workshop/2004/deHaan-paper.doc.2004.
  • 9陆丙甫,屈正林.语义投射连续性假说:原理和引申——兼论定语标记的不同功能基础[M].语言学论丛(第四十二辑).北京:商务印书馆,2010:112-128.
  • 10吴福祥.从“得”义动词到补语标记--东南亚语言的一种语法化区域[J].中国语文,2009(3):195-211. 被引量:72

共引文献4

同被引文献32

引证文献3

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部