-
题名基于微观点的产品评论微摘要研究
被引量:1
- 1
-
-
作者
刘柏嵩
赵福青
-
机构
宁波大学图书馆与信息中心
宁波大学信息科学与工程学院
-
出处
《情报学报》
CSSCI
北大核心
2015年第9期970-977,共8页
-
基金
浙江省教育厅(文)/科研计划“基于Web2.0的图书馆服务模式研究”,项目编号:20071008
省部级实验室/开放基金“数字图书馆知识组织与标引标准规范研究”,项目编号:B2014
-
文摘
移动互联网和社交网络带来了大量的产品评论信息,本文在基于微观点的微结构化定义的基础上,提出了一种基于微观点的产品评论微的生成方法。利用基于改进依存句法分析的文本挖掘方法来抽取候选微观点;采用改进的基于近邻传播算法的K—means聚类算法对微观点聚类;选取微观点簇中的高频微观点组成微观点集合,从而得到满足条件的微。实验结果表明本文提出的微生成方法准确率和召回率有明显提高,生成的微具有较好的代表性和可读性。
-
关键词
产品评论
微观点
微摘要
依存句法分析
近邻传播算法
-
Keywords
product reviews, micropinion, microsummary, dependency parsing, affinity propagation algorithm
-
分类号
G350
[文化科学—情报学]
-
-
题名一种新型的中文产品评论微摘要方法研究
被引量:1
- 2
-
-
作者
赵福青
刘柏嵩
葛文镇
-
机构
宁波大学信息科学与工程学院
宁波大学图书馆
-
出处
《宁波大学学报(理工版)》
CAS
2014年第4期38-41,共4页
-
基金
浙江省部级实验室开放基金(B2014)
-
文摘
提出一种新的无监督的方法,对网络上存在的大量中文产品评论信息进行处理,生成简洁的非结构化的可读性强且具有代表性、简洁性的理解式评论微摘要.用N-gram语言模型来衡量可读性,用改进的点间互信息函数来衡量代表性,用同义词词林来计算词语相似度;将这种产品评论微摘要问题归结为优化问题,试图寻找具有可读性和代表性的简洁、低冗余的词组,并提出了一个启发式算法来解决这个优化问题.
-
关键词
产品评论挖掘
无监督学习
微摘要
WEB
N-GRAM
-
Keywords
product reviews mining
unsupervised approach
micro-abstract
web N-gram
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于层级类别信息的标题自动分类研究
被引量:6
- 3
-
-
作者
葛文镇
刘柏嵩
王洋洋
赵福青
-
机构
宁波大学信息科学与工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2016年第7期2030-2033,共4页
-
基金
省部级实验室/开放基金资助项目(B2014)
-
文摘
针对标题文本特征少、特征维度高和分布不均匀导致分类性能不佳的问题,提出了一种利用分类体系结构信息的双向特征选择算法,并在该算法的基础上实现标题分类。该方法以具有严格层级关系的分类体系为应用前提,利用类别与词的同现及分布关系进行特征词和候选类别的双向选择,构建类别向量空间;通过分析标题文本特征词在层级类别向量空间的分布所表现出的类别语义信息,确定文本所在层级以及所在层级的候选类别;之后利用分类器对未能成功分类的标题进行分类。在人工标引数据集上的实验结果表明,该方法在不进行语料扩展和外部知识库添加的基础上仍可有效地确定文本所在层级,实现多级学科的分类;并可在识别类别语义信息的基础上,降低候选类别数目,提高分类效率。
-
关键词
标题分类
特征选择
层级结构分类体系
同现分析
向量空间
-
Keywords
headlines classification
feature selection
hierarchical classification system
co-occurrence analysis
vector space
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-