期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于改进Rocchio算法的短文本自动分类研究 被引量:3
1
作者 郑秋生 翟琳琳 《中原工学院学报》 CAS 2013年第1期70-73,共4页
为了利用已有的分类方法对短文本信息进行分类,选取大量长文本作为训练集,以此形成"词典",并利用改进的简单向量距离算法实现分类.理论和实验结果表明,该方法非常适用于短文本信息的分类.
关键词 短文本信息 Rocchio算法 长文本训练集
下载PDF
基于频繁模式的长尾文本聚类算法 被引量:1
2
作者 宋中山 张广凯 +1 位作者 尹帆 帖军 《计算机系统应用》 2019年第4期139-144,共6页
短文本聚类一直是信息提取领域的热门话题,大规模的短文本数据中存在"长尾现象",传统算法对其聚类时会面临特征纬度高,小类别信息丢失的问题,针对对上述问题的研究,本文提出一种频繁项协同剪枝迭代聚类算法(Frequent Itemsets... 短文本聚类一直是信息提取领域的热门话题,大规模的短文本数据中存在"长尾现象",传统算法对其聚类时会面临特征纬度高,小类别信息丢失的问题,针对对上述问题的研究,本文提出一种频繁项协同剪枝迭代聚类算法(Frequent Itemsets collaborative Pruning iteration Clustering framework, FIPC).该算法将迭代聚类框架与K中心点算法相结合,运用协同剪枝策略,实现对小类别文本聚类,实验结果证明该聚类算法能够有效的提高小类别短文本信息聚类的精确度,并能避免聚类中类簇重叠的问题. 展开更多
关键词 文本聚类 长尾现象 频繁模式 K中心点算法
下载PDF
基于语义理解注意力神经网络的多元特征融合中文文本分类 被引量:29
3
作者 谢金宝 侯永进 +2 位作者 康守强 李佰蔚 张霄 《电子与信息学报》 EI CSCD 北大核心 2018年第5期1258-1265,共8页
在中文文本分类任务中,针对重要特征在中文文本中位置分布分散、稀疏的问题,以及不同文本特征对文本类别识别贡献不同的问题,该文提出一种基于语义理解的注意力神经网络、长短期记忆网络(LSTM)与卷积神经网络(CNN)的多元特征融合中文文... 在中文文本分类任务中,针对重要特征在中文文本中位置分布分散、稀疏的问题,以及不同文本特征对文本类别识别贡献不同的问题,该文提出一种基于语义理解的注意力神经网络、长短期记忆网络(LSTM)与卷积神经网络(CNN)的多元特征融合中文文本分类模型(3CLA)。模型首先通过文本预处理将中文文本分词、向量化。然后,通过嵌入层分别经过CNN通路、LSTM通路和注意力算法模型通路以提取不同层次、具有不同特点的文本特征。最终,文本特征经融合层融合后,由softmax分类器进行分类。基于中文语料进行了文本分类实验。实验结果表明,相较于CNN结构模型与LSTM结构模型,提出的算法模型对中文文本类别的识别能力最多提升约8%。 展开更多
关键词 中文文本分类 多元特征融合 注意力算法 长短期记忆网络 卷积神经网络
下载PDF
一种基于融合递归机制的长文本机器阅读理解算法 被引量:1
4
作者 武钰智 向伟 史娜维 《西南民族大学学报(自然科学版)》 CAS 2022年第2期190-196,共7页
目前对于机器阅读理解的研究大多都使用预先训练的语言模型如BERT来编码文档和问题的联合上下文信息,相较于传统的RNN结构,BERT模型在机器阅读理解领域取得了显著的性能改进.但是当前基于BERT的机器阅读理解模型由于输入长度有限(最大... 目前对于机器阅读理解的研究大多都使用预先训练的语言模型如BERT来编码文档和问题的联合上下文信息,相较于传统的RNN结构,BERT模型在机器阅读理解领域取得了显著的性能改进.但是当前基于BERT的机器阅读理解模型由于输入长度有限(最大长度为512),在进行特征提取时,存在一定程度的语义丢失,且不具备建立长距离依赖能力.为了解决这个问题,提出了一种基于BERT-Base的长本文机器阅读理解模型BERT-FRM.通过添加重叠窗口层以更灵活的方式切割输入文本,使用两个BERT模型独立编码问题和文档,并且在模型中添加递归层来传递不同片段之间的信息,赋予模型建立更长期依赖的能力.实验结果表明,BERT-FRM模型与BERT-Base基线模型相比,在TriviaQA和CoQA两个机器阅读理解数据集上的F1值分别提升了3.1%和0.8%. 展开更多
关键词 机器阅读理解 BERT 递归机制 长文本算法
下载PDF
WEB内容推荐算法在远程教育中的应用 被引量:1
5
作者 吴梦兰 《电脑知识与技术(过刊)》 2011年第9X期6532-6533,共2页
以Web技术和文本数据挖掘为背景,针对远程教育个性化服务,提出将内容推荐算法应用于个性化学习内容推荐,并利用仿真实验验证融合后算法的有效性,然后将经过测试后的算法应用于高职课程教学网站的建设。
关键词 文本数据挖掘 远程教育 内容推荐算法
下载PDF
文本数据挖掘在远程教育中的应用
6
作者 李卫军 《电脑知识与技术》 2011年第11X期8336-8337,共2页
以Web技术和文本数据挖掘为背景,针对远程教育个性化服务,提出将内容推荐算法应用于个性化学习内容推荐,并利用仿真实验验证融合后算法的有效性,然后,将经过测试后的算法应用于高职课程教学网站的建设。
关键词 文本数据挖掘 远程教育 内容推荐算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部