-
题名基于FastText和关键句提取的中文长文本分类
被引量:5
- 1
-
-
作者
汪家成
薛涛
-
机构
西安工程大学计算机科学学院
-
出处
《计算机系统应用》
2021年第8期213-218,共6页
-
基金
陕西省2020年技术创新引导专项(基金)(2020CGXNG-012)。
-
文摘
FastText是一种准确高效的文本分类模型,但直接应用在中文长文本分类领域存在准确度不高的问题.针对该问题,提出一种融合TextRank关键子句提取和词频-逆文本频率(Term Frequency-Inverse Document Frequency,TF-IDF)的FastText中文长文本分类方法.该方法在FastText模型输入阶段使用TextRank算法提取文本的关键子句输入训练模型,同时采用TF-IDF提取文本的关键词作为特征补充,从而在减少训练语料的同时尽可能保留文本分类的关键特征.实验结果表明,此文本分类方法在数据集上准确率达到86.1%,比经典的FastText模型提高了约4%.
-
关键词
文本分类
FastText
TextRank
词频-逆文本频率
-
Keywords
text classification
FastText
TextRank
Term Frequency-Inverse Document Frequency(TF-IDF)
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名从促进就业的角度看我国失业保险制度的完善
- 2
-
-
作者
汪家成
-
机构
师宗县彩云镇社会保障服务中心
-
出处
《市场周刊·理论版》
2021年第53期157-158,共2页
-
文摘
文章主要分析影响失业保险制度促进就业的相关因素,并且根据实际情况,提出失业保险制度发挥促进就业作用的完善策略,旨在为失业保险制度可以得到全面完善,充分发挥促进就业的作用,提供部分参考价值。
-
关键词
促进就业
失业保险制度
完善策略
-
分类号
F840.615
[经济管理—保险]
-