期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
6
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于改进Rocchio算法的短文本自动分类研究
被引量:
3
1
作者
郑秋生
翟琳琳
《中原工学院学报》
CAS
2013年第1期70-73,共4页
为了利用已有的分类方法对短文本信息进行分类,选取大量长文本作为训练集,以此形成"词典",并利用改进的简单向量距离算法实现分类.理论和实验结果表明,该方法非常适用于短文本信息的分类.
关键词
短文本信息
Rocchio算法
长文本训练集
下载PDF
职称材料
基于频繁模式的长尾文本聚类算法
被引量:
1
2
作者
宋中山
张广凯
+1 位作者
尹帆
帖军
《计算机系统应用》
2019年第4期139-144,共6页
短文本聚类一直是信息提取领域的热门话题,大规模的短文本数据中存在"长尾现象",传统算法对其聚类时会面临特征纬度高,小类别信息丢失的问题,针对对上述问题的研究,本文提出一种频繁项协同剪枝迭代聚类算法(Frequent Itemsets...
短文本聚类一直是信息提取领域的热门话题,大规模的短文本数据中存在"长尾现象",传统算法对其聚类时会面临特征纬度高,小类别信息丢失的问题,针对对上述问题的研究,本文提出一种频繁项协同剪枝迭代聚类算法(Frequent Itemsets collaborative Pruning iteration Clustering framework, FIPC).该算法将迭代聚类框架与K中心点算法相结合,运用协同剪枝策略,实现对小类别文本聚类,实验结果证明该聚类算法能够有效的提高小类别短文本信息聚类的精确度,并能避免聚类中类簇重叠的问题.
展开更多
关键词
文本聚类
长尾现象
频繁模式
K中心点算法
下载PDF
职称材料
基于语义理解注意力神经网络的多元特征融合中文文本分类
被引量:
29
3
作者
谢金宝
侯永进
+2 位作者
康守强
李佰蔚
张霄
《电子与信息学报》
EI
CSCD
北大核心
2018年第5期1258-1265,共8页
在中文文本分类任务中,针对重要特征在中文文本中位置分布分散、稀疏的问题,以及不同文本特征对文本类别识别贡献不同的问题,该文提出一种基于语义理解的注意力神经网络、长短期记忆网络(LSTM)与卷积神经网络(CNN)的多元特征融合中文文...
在中文文本分类任务中,针对重要特征在中文文本中位置分布分散、稀疏的问题,以及不同文本特征对文本类别识别贡献不同的问题,该文提出一种基于语义理解的注意力神经网络、长短期记忆网络(LSTM)与卷积神经网络(CNN)的多元特征融合中文文本分类模型(3CLA)。模型首先通过文本预处理将中文文本分词、向量化。然后,通过嵌入层分别经过CNN通路、LSTM通路和注意力算法模型通路以提取不同层次、具有不同特点的文本特征。最终,文本特征经融合层融合后,由softmax分类器进行分类。基于中文语料进行了文本分类实验。实验结果表明,相较于CNN结构模型与LSTM结构模型,提出的算法模型对中文文本类别的识别能力最多提升约8%。
展开更多
关键词
中文文本分类
多元特征融合
注意力算法
长短期记忆网络
卷积神经网络
下载PDF
职称材料
一种基于融合递归机制的长文本机器阅读理解算法
被引量:
1
4
作者
武钰智
向伟
史娜维
《西南民族大学学报(自然科学版)》
CAS
2022年第2期190-196,共7页
目前对于机器阅读理解的研究大多都使用预先训练的语言模型如BERT来编码文档和问题的联合上下文信息,相较于传统的RNN结构,BERT模型在机器阅读理解领域取得了显著的性能改进.但是当前基于BERT的机器阅读理解模型由于输入长度有限(最大...
目前对于机器阅读理解的研究大多都使用预先训练的语言模型如BERT来编码文档和问题的联合上下文信息,相较于传统的RNN结构,BERT模型在机器阅读理解领域取得了显著的性能改进.但是当前基于BERT的机器阅读理解模型由于输入长度有限(最大长度为512),在进行特征提取时,存在一定程度的语义丢失,且不具备建立长距离依赖能力.为了解决这个问题,提出了一种基于BERT-Base的长本文机器阅读理解模型BERT-FRM.通过添加重叠窗口层以更灵活的方式切割输入文本,使用两个BERT模型独立编码问题和文档,并且在模型中添加递归层来传递不同片段之间的信息,赋予模型建立更长期依赖的能力.实验结果表明,BERT-FRM模型与BERT-Base基线模型相比,在TriviaQA和CoQA两个机器阅读理解数据集上的F1值分别提升了3.1%和0.8%.
展开更多
关键词
机器阅读理解
BERT
递归机制
长文本算法
下载PDF
职称材料
WEB内容推荐算法在远程教育中的应用
被引量:
1
5
作者
吴梦兰
《电脑知识与技术(过刊)》
2011年第9X期6532-6533,共2页
以Web技术和文本数据挖掘为背景,针对远程教育个性化服务,提出将内容推荐算法应用于个性化学习内容推荐,并利用仿真实验验证融合后算法的有效性,然后将经过测试后的算法应用于高职课程教学网站的建设。
关键词
文本数据挖掘
远程教育
内容推荐算法
下载PDF
职称材料
文本数据挖掘在远程教育中的应用
6
作者
李卫军
《电脑知识与技术》
2011年第11X期8336-8337,共2页
以Web技术和文本数据挖掘为背景,针对远程教育个性化服务,提出将内容推荐算法应用于个性化学习内容推荐,并利用仿真实验验证融合后算法的有效性,然后,将经过测试后的算法应用于高职课程教学网站的建设。
关键词
文本数据挖掘
远程教育
内容推荐算法
下载PDF
职称材料
题名
基于改进Rocchio算法的短文本自动分类研究
被引量:
3
1
作者
郑秋生
翟琳琳
机构
中原工学院
出处
《中原工学院学报》
CAS
2013年第1期70-73,共4页
文摘
为了利用已有的分类方法对短文本信息进行分类,选取大量长文本作为训练集,以此形成"词典",并利用改进的简单向量距离算法实现分类.理论和实验结果表明,该方法非常适用于短文本信息的分类.
关键词
短文本信息
Rocchio算法
长文本训练集
Keywords
short
text
information
Rocchio
algorithm
long
text
s trainings
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于频繁模式的长尾文本聚类算法
被引量:
1
2
作者
宋中山
张广凯
尹帆
帖军
机构
中南民族大学计算机科学学院
出处
《计算机系统应用》
2019年第4期139-144,共6页
基金
国家科技支撑计划项目子课题(2015BAD29B01)
农业部软科学研究课题(D201721)
中央高校基本科研业务费专项资金(CZY18016)~~
文摘
短文本聚类一直是信息提取领域的热门话题,大规模的短文本数据中存在"长尾现象",传统算法对其聚类时会面临特征纬度高,小类别信息丢失的问题,针对对上述问题的研究,本文提出一种频繁项协同剪枝迭代聚类算法(Frequent Itemsets collaborative Pruning iteration Clustering framework, FIPC).该算法将迭代聚类框架与K中心点算法相结合,运用协同剪枝策略,实现对小类别文本聚类,实验结果证明该聚类算法能够有效的提高小类别短文本信息聚类的精确度,并能避免聚类中类簇重叠的问题.
关键词
文本聚类
长尾现象
频繁模式
K中心点算法
Keywords
text
clustering
long
tail phenomenon
frequent mode
K-mediods
algorithm
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于语义理解注意力神经网络的多元特征融合中文文本分类
被引量:
29
3
作者
谢金宝
侯永进
康守强
李佰蔚
张霄
机构
哈尔滨理工大学电气与电子工程学院
出处
《电子与信息学报》
EI
CSCD
北大核心
2018年第5期1258-1265,共8页
基金
黑龙江省海外学人基金(1253HQ019)~~
文摘
在中文文本分类任务中,针对重要特征在中文文本中位置分布分散、稀疏的问题,以及不同文本特征对文本类别识别贡献不同的问题,该文提出一种基于语义理解的注意力神经网络、长短期记忆网络(LSTM)与卷积神经网络(CNN)的多元特征融合中文文本分类模型(3CLA)。模型首先通过文本预处理将中文文本分词、向量化。然后,通过嵌入层分别经过CNN通路、LSTM通路和注意力算法模型通路以提取不同层次、具有不同特点的文本特征。最终,文本特征经融合层融合后,由softmax分类器进行分类。基于中文语料进行了文本分类实验。实验结果表明,相较于CNN结构模型与LSTM结构模型,提出的算法模型对中文文本类别的识别能力最多提升约8%。
关键词
中文文本分类
多元特征融合
注意力算法
长短期记忆网络
卷积神经网络
Keywords
Chinese
text
categorization
Multi-feature fusion
Attention
algorithm
long
Short Term Memory (LSTM) network
Convolutional Neural Network (CNN)
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种基于融合递归机制的长文本机器阅读理解算法
被引量:
1
4
作者
武钰智
向伟
史娜维
机构
西南民族大学电子信息工程国家民委重点实验室
西南民族大学电气工程学院
出处
《西南民族大学学报(自然科学版)》
CAS
2022年第2期190-196,共7页
基金
西南民族大学研究生创新型科研项目(CX2021SZ48)。
文摘
目前对于机器阅读理解的研究大多都使用预先训练的语言模型如BERT来编码文档和问题的联合上下文信息,相较于传统的RNN结构,BERT模型在机器阅读理解领域取得了显著的性能改进.但是当前基于BERT的机器阅读理解模型由于输入长度有限(最大长度为512),在进行特征提取时,存在一定程度的语义丢失,且不具备建立长距离依赖能力.为了解决这个问题,提出了一种基于BERT-Base的长本文机器阅读理解模型BERT-FRM.通过添加重叠窗口层以更灵活的方式切割输入文本,使用两个BERT模型独立编码问题和文档,并且在模型中添加递归层来传递不同片段之间的信息,赋予模型建立更长期依赖的能力.实验结果表明,BERT-FRM模型与BERT-Base基线模型相比,在TriviaQA和CoQA两个机器阅读理解数据集上的F1值分别提升了3.1%和0.8%.
关键词
机器阅读理解
BERT
递归机制
长文本算法
Keywords
machine reading comprehension
BERT
recurrent mechanism
long text algorithm
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
WEB内容推荐算法在远程教育中的应用
被引量:
1
5
作者
吴梦兰
机构
湖南科技职业学院电子信息系
出处
《电脑知识与技术(过刊)》
2011年第9X期6532-6533,共2页
文摘
以Web技术和文本数据挖掘为背景,针对远程教育个性化服务,提出将内容推荐算法应用于个性化学习内容推荐,并利用仿真实验验证融合后算法的有效性,然后将经过测试后的算法应用于高职课程教学网站的建设。
关键词
文本数据挖掘
远程教育
内容推荐算法
Keywords
text
data mining
long
-distance education
content mining
algorithm
分类号
TP393.09 [自动化与计算机技术—计算机应用技术]
TP391.6 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
文本数据挖掘在远程教育中的应用
6
作者
李卫军
机构
湖南科技职业学院
出处
《电脑知识与技术》
2011年第11X期8336-8337,共2页
文摘
以Web技术和文本数据挖掘为背景,针对远程教育个性化服务,提出将内容推荐算法应用于个性化学习内容推荐,并利用仿真实验验证融合后算法的有效性,然后,将经过测试后的算法应用于高职课程教学网站的建设。
关键词
文本数据挖掘
远程教育
内容推荐算法
Keywords
text
data mining
long
-distance education
content mining
algorithm
分类号
G434 [文化科学—教育技术学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于改进Rocchio算法的短文本自动分类研究
郑秋生
翟琳琳
《中原工学院学报》
CAS
2013
3
下载PDF
职称材料
2
基于频繁模式的长尾文本聚类算法
宋中山
张广凯
尹帆
帖军
《计算机系统应用》
2019
1
下载PDF
职称材料
3
基于语义理解注意力神经网络的多元特征融合中文文本分类
谢金宝
侯永进
康守强
李佰蔚
张霄
《电子与信息学报》
EI
CSCD
北大核心
2018
29
下载PDF
职称材料
4
一种基于融合递归机制的长文本机器阅读理解算法
武钰智
向伟
史娜维
《西南民族大学学报(自然科学版)》
CAS
2022
1
下载PDF
职称材料
5
WEB内容推荐算法在远程教育中的应用
吴梦兰
《电脑知识与技术(过刊)》
2011
1
下载PDF
职称材料
6
文本数据挖掘在远程教育中的应用
李卫军
《电脑知识与技术》
2011
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部