-
题名基于弱监督学习的产品特征抽取
被引量:10
- 1
-
-
作者
伍星
何中市
黄永文
-
机构
重庆大学计算机学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第13期199-201,共3页
-
文摘
产品评论挖掘是从自然语言描述的用户评论中获取信息的过程,产品特征抽取是产品评论挖掘的第1个阶段,产品特征的好坏决定了产品评论挖掘中后续阶段的质量。采用弱监督的学习方法,只需要提供少量的产品特征作为种子,从这些种子出现的语句中抽取文本模式,利用文本模式来发现新的产品特征。实验结果表明,从英文文本中自动抽取产品特征的实验系统,取得了较好的效果。
-
关键词
BootStrapping算法
文本模式抽取
产品评论挖掘
-
Keywords
BootStrapping algorithm
text pattern extraction
product review mining
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名产品特征的层次关系获取
被引量:5
- 2
-
-
作者
黄永文
何中市
伍星
-
机构
重庆大学计算机学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2009年第22期236-240,共5页
-
基金
重庆市自然科学基金No.CSCT
2007BB2134
重庆市高等教育教学改革研究项目(No.0635207)~~
-
文摘
产品评论挖掘用来对用户发表到网络上的众多评论内容进行信息提取,从而获得用户对产品的部件或功能的褒贬评价。现有的产品评论挖掘研究中没有对上下位的特征、同一特征的不同词语表达进行处理。首先对厂家规格说明文档的结构化表示进行挖掘获得厂家规格特征及其关系,再使用Bootstrapping弱监督方法从网站编辑评测文章中抽取出用户的描述特征及与规格特征之间的层次关系。应用该方法在手机领域的产品特征关系进行了抽取,实验结果显示获得的产品特征之间的层次关系很好的效果。
-
关键词
数据挖掘
评论挖掘
BOOTSTRAPPING
文本模式抽取
-
Keywords
data mining
reviews mining
Bootstrapping
textual pattern extraction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-