期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于多特征融合的中文文本分类研究
被引量:
5
1
作者
王艳
王胡燕
余本功
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2021年第10期1-14,共14页
【目的】通过结合拼音字符特征、汉字字符特征、词级别语义特征和词性特征,缓解文本所呈现出的弱结构化、拼写错误及其同音词较多的问题,丰富语义特征,提高模型的分类能力。【方法】多特征融合的文本分类方法,在词级别特征的基础上进行...
【目的】通过结合拼音字符特征、汉字字符特征、词级别语义特征和词性特征,缓解文本所呈现出的弱结构化、拼写错误及其同音词较多的问题,丰富语义特征,提高模型的分类能力。【方法】多特征融合的文本分类方法,在词级别特征的基础上进行词性特征、汉字字符特征和拼音字符特征构建多特征语义表示,然后将特征输入BiGRU中获取上下文语义特征,输入CNN中获取局部语义特征,最终将特征进行融合并输入Softmax中进行分类,预测需要的类别标签。【结果】在两个不同的数据集下,多特征融合的模型的准确率分别达到83.3%和91.1%,比其他分类模型准确率至少提升了7个百分点。【局限】实验数据数量较少,未在更多的数据集上进行验证。【结论】所提方法提升了模型的语义表征能力,是一种有效的文本分类模型,为企业进行高效文本分类提供了有效支持。
展开更多
关键词
词性标记
词级别
特征
文本分类
拼音字符特征
汉字
字符
特征
原文传递
题名
基于多特征融合的中文文本分类研究
被引量:
5
1
作者
王艳
王胡燕
余本功
机构
安徽农业大学经济技术学院
合肥工业大学管理学院
合肥工业大学过程优化与智能决策教育部重点实验室
出处
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2021年第10期1-14,共14页
基金
国家自然科学基金项目(项目编号:71671057)的研究成果之一。
文摘
【目的】通过结合拼音字符特征、汉字字符特征、词级别语义特征和词性特征,缓解文本所呈现出的弱结构化、拼写错误及其同音词较多的问题,丰富语义特征,提高模型的分类能力。【方法】多特征融合的文本分类方法,在词级别特征的基础上进行词性特征、汉字字符特征和拼音字符特征构建多特征语义表示,然后将特征输入BiGRU中获取上下文语义特征,输入CNN中获取局部语义特征,最终将特征进行融合并输入Softmax中进行分类,预测需要的类别标签。【结果】在两个不同的数据集下,多特征融合的模型的准确率分别达到83.3%和91.1%,比其他分类模型准确率至少提升了7个百分点。【局限】实验数据数量较少,未在更多的数据集上进行验证。【结论】所提方法提升了模型的语义表征能力,是一种有效的文本分类模型,为企业进行高效文本分类提供了有效支持。
关键词
词性标记
词级别
特征
文本分类
拼音字符特征
汉字
字符
特征
Keywords
Part of Speech Tag
Word Level Characteristics
Text Classification
Pinyin Character Features
Chinese Character Features
分类号
G350 [文化科学—情报学]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于多特征融合的中文文本分类研究
王艳
王胡燕
余本功
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2021
5
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部