期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于TF-IDF方法的文本人物群体人格分析方法 被引量:7
1
作者 蔡天鸿 邓金 +2 位作者 史国阳 朱晋 怀丽波 《计算机应用与软件》 北大核心 2019年第5期35-38,共4页
人物群体人格分析的社会需求日益迫切。提出一种基于TF-IDF方法的文本人物群体人格分析方法。通过模拟情景对志愿者做调查获取数据,再分别使用VSM技术、PCA技术、Wavelet技术提取志愿者的文本特征,得到三个特征空间。在三个空间里使用KN... 人物群体人格分析的社会需求日益迫切。提出一种基于TF-IDF方法的文本人物群体人格分析方法。通过模拟情景对志愿者做调查获取数据,再分别使用VSM技术、PCA技术、Wavelet技术提取志愿者的文本特征,得到三个特征空间。在三个空间里使用KNN分类方法获得九型人格分类的候选项,综合候选项获得志愿者们的人格判别分布。实验表明,该方法不但判别速度相较人类专家分类有了很大地提升,而且具有相当的可信度参考价值。这对未来人物群体人格分析会产生较大的影响。 展开更多
关键词 TF-IDF 模拟情景 文本特征 KNN 可信度
下载PDF
基于TF-IDF算法的唐代著名诗僧残缺诗句的填充方法研究 被引量:2
2
作者 邓金 史国阳 +2 位作者 蔡天鸿 朱晋 怀丽波 《现代计算机》 2019年第8期7-11,15,共6页
由于历史流传过程中一些不可抗因素,唐代著名诗僧部分诗句出现残缺。通过引入自然语言处理的相关技术进行填充。首先对唐代诗僧皎然、齐己、贯休的完整诗句采用中文分词系统进行分词,获得词典并利用TF-IDF方法构造特征向量;其次,采用KN... 由于历史流传过程中一些不可抗因素,唐代著名诗僧部分诗句出现残缺。通过引入自然语言处理的相关技术进行填充。首先对唐代诗僧皎然、齐己、贯休的完整诗句采用中文分词系统进行分词,获得词典并利用TF-IDF方法构造特征向量;其次,采用KNN分类算法,利用向量空间模型的余弦相似度作为度量标准,选取词库中相似度最高的词语对部分残缺诗句进行填充。最后,为了验证该算法的可行性,分别进行两组对比实验。实验结果表明,所提出的方法对填充词语提供客观的衡量标准,具有较强的可行性,对文学研究具有一定的参考价值。 展开更多
关键词 唐代诗僧 VSM TF-IDF 余弦相似度
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部