期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于混合并行遗传聚类的文本特征抽取方法研究 被引量:1
1
作者 戴文华 焦翠珍 何婷婷 《计算机科学》 CSCD 北大核心 2008年第9期183-186,共4页
同义词和近义词现象以及强关联语义信息加大了文本向量的特征维数,对文本分类的效率和精度都会带来极大影响。为了有效降低文本向量的特征维数,提出一种基于混合并行遗传聚类的文本特征抽取方法。该方法首先使用K-means聚类算法进行特... 同义词和近义词现象以及强关联语义信息加大了文本向量的特征维数,对文本分类的效率和精度都会带来极大影响。为了有效降低文本向量的特征维数,提出一种基于混合并行遗传聚类的文本特征抽取方法。该方法首先使用K-means聚类算法进行特征词粗粒度聚类,然后采用混合并行遗传算法对各类特征词进行细粒度聚类,最后对各聚类中的特征词进行分析并压缩,得到最终能反映文本类别特征和语义信息的文本特征词集合。实验证明,该方法是一种有效的文本特征抽取方法,能切实提高文本分类的效率和精度。 展开更多
关键词 并行遗传算法 K-MEANS聚类 特征抽取 文本特征词
下载PDF
我国航海教育研究热点近二十年之变迁——基于知网论文的文本分析 被引量:1
2
作者 于卫红 《航海教育研究》 2021年第2期49-56,共8页
基于从中国知网获取的1259篇2000—2020年以“航海教育”为主题的期刊论文,使用卡方检验算法进行阶段性文本特征词比较分析,使用结构性主题建模算法进行研究热点主题挖掘及主题演化趋势分析。研究发现:近20年,中国航海教育顺应国内、国... 基于从中国知网获取的1259篇2000—2020年以“航海教育”为主题的期刊论文,使用卡方检验算法进行阶段性文本特征词比较分析,使用结构性主题建模算法进行研究热点主题挖掘及主题演化趋势分析。研究发现:近20年,中国航海教育顺应国内、国际政策环境、经济环境、行业环境的变化,围绕航海类人才培养过程中教育内容、教育手段、教育途径和教育环境的改革开展了多方位的研究。其中,关于船员培训、学生思政教育、教改、课改、人才培养模式、师资建设、教育资源整合、航海文化建设的研究仍是下一阶段的研究热点。同时建议:加强航海类研究生教育的研究;加强人工智能时代航海类人才培养模式的研究;加强“双一流”政策下航海教育改革与发展的研究。 展开更多
关键词 高等航海教育 高等航海职业教育 文本特征词分析 主题建模 卡方检验 结构性主题建模
下载PDF
语义文本挖掘算法优化研究
3
作者 刘建君 《山东工业技术》 2018年第7期242-242,共1页
本文介绍了语义文本挖掘的相关理论及学术概念,阐述了文本挖掘过程及贝叶斯算法等概念,针对文本算法"贝叶斯算法"在文本分类领域的应用算法进行了优化并通过对newsgroup文档集进行了实验而给出了优化结果。探索了对朴素贝叶... 本文介绍了语义文本挖掘的相关理论及学术概念,阐述了文本挖掘过程及贝叶斯算法等概念,针对文本算法"贝叶斯算法"在文本分类领域的应用算法进行了优化并通过对newsgroup文档集进行了实验而给出了优化结果。探索了对朴素贝叶斯算法的优化。 展开更多
关键词 文本挖掘 贝叶斯算法、特征词文本分类、newsgroup文档集 优化
下载PDF
利用本体关联度改进的TF-IDF特征词提取方法 被引量:29
4
作者 徐建民 王金花 马伟瑜 《情报科学》 CSSCI 北大核心 2011年第2期279-283,共5页
针对传统TF-IDF方法提取文本特征词时未考虑词语间关系的不足,提出一种利用本体关联度改进的文本特征词提取方法。该方法首先利用传统的TF-IDF方法构建候选特征词集合和非候选特征词集合,然后根据领域本体知识在非候选特征词集合中提取... 针对传统TF-IDF方法提取文本特征词时未考虑词语间关系的不足,提出一种利用本体关联度改进的文本特征词提取方法。该方法首先利用传统的TF-IDF方法构建候选特征词集合和非候选特征词集合,然后根据领域本体知识在非候选特征词集合中提取候选特征词的本体关联词,利用候选特征词与其本体关联词之间的本体关联度以及本体关联词本身的权重调整候选特征词的权重,得到新的候选特征词权重排序。实验证明,该方法能够有效提高文本特征词提取的准确度。 展开更多
关键词 文本特征词提取 TF-IDF 本体关联词 本体关联度
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部