期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于上下文特征分类的评论长句切分方法 被引量:2
1
作者 陈鸿 金培权 +2 位作者 岳丽华 胡玉娟 殷凤梅 《计算机工程》 CAS CSCD 北大核心 2015年第9期233-237,244,共6页
商品评论文本对消费者和商家的决策都有重要参考价值。用户在评论中使用的语言较为随意,语法结构不规则,给文本分析带来很大难度。正确的句子切分是文本信息抽取和挖掘工作的基础。为解决商品评论中用户省略标点情况下的句子切分问题,... 商品评论文本对消费者和商家的决策都有重要参考价值。用户在评论中使用的语言较为随意,语法结构不规则,给文本分析带来很大难度。正确的句子切分是文本信息抽取和挖掘工作的基础。为解决商品评论中用户省略标点情况下的句子切分问题,基于上下文特征,提出使用机器学习的方法对评论长句进行切分。根据大规模评论语料的统计特征选取候选句子切分点,对每一个候选句子切分点提取其上下文特征,并根据语料的统计特征,使用逻辑回归对候选切分点进行分类。实验结果表明,该方法能够有效解决商品评论中用户省略标点情况下的句子切分问题。 展开更多
关键词 句子切分 标点省略 机器学习 上下文特征 N元文法 逻辑回归
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部