-
题名基于文本分类中特征提取的领域词语聚类
被引量:22
- 1
-
-
作者
刘华
-
机构
暨南大学华文学院
-
出处
《语言文字应用》
CSSCI
北大核心
2007年第1期139-144,共6页
-
文摘
本文以领域特征明显的词和短语作为聚类对象,在分类系统的大规模语料库中,利用文本分类的特征提取方法进行词语的领域聚类,从而获得大规模的领域知识,用于文本分类和主题分析。
-
关键词
特征提取
领域词语
聚类
-
Keywords
character extraction
domainial words
clustering
-
分类号
H08
[语言文字—语言学]
-
-
题名基于语料库的领域词语聚类C#实现
被引量:3
- 2
-
-
作者
刘华
-
机构
暨南大学华文学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2005年第36期167-169,共3页
-
基金
教育部知识创新工程资助(项目号:L2004-01-01-04)
-
文摘
文章介绍了一个领域词语自动聚类的C#系统,系统以词和短语作为聚类对象,在分类系统的大规模语料库中,利用文本分类的特征提取方法进行词语的领域聚类,从而获得大规模的领域知识,用于主题分析。
-
关键词
特征提取
领域词语
聚类
-
Keywords
character extraction,domanial words,clustering
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名词典编撰的领域词语自动获取与选择
被引量:2
- 3
-
-
作者
刘华
-
机构
暨南大学华文学院/海外华语研究中心
-
出处
《计算机工程与应用》
CSCD
北大核心
2006年第24期176-178,共3页
-
基金
国家语言资源监测项目资助(编号:L2004-01-01-04)
-
文摘
针对专科词典编撰中学科词条的自动获取和选择问题,利用文本分类聚类中特征提取方法进行领域词语聚类和选择,从而达到辅助词典编撰的目的。
-
关键词
分类词典
文本分类
特征提取
词语聚类
-
Keywords
lexicography,text classing, character extraction,words clustering
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-