期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于LSTM网络的中文地址分词法的设计与实现 被引量:6
1
作者 张文豪 卢山 程光 《计算机应用研究》 CSCD 北大核心 2018年第12期3652-3654,共3页
当前中文地址的分词法主要采用基于规则和传统机器学习的方法。这些方法需要人工长期维护词典和提取特征。为避免特征工程和减少人工维护,提出了将长短时记忆(long short-term memory,LSTM)网络和双向长短时记忆(bi-directional long sh... 当前中文地址的分词法主要采用基于规则和传统机器学习的方法。这些方法需要人工长期维护词典和提取特征。为避免特征工程和减少人工维护,提出了将长短时记忆(long short-term memory,LSTM)网络和双向长短时记忆(bi-directional long short-term memory,Bi-LSTM)网络分别应用在中文地址分词任务中,并采用四词位标注法以及增加未标记数据集的方法提升分词性能。在自建数据集上的实验结果表明,中文地址分词任务应用Bi-LSTM网络结构能得到较好的性能,在增加未标记数据集的情况下,可以有效提升模型的性能。 展开更多
关键词 中文地址 分词 卡短时记忆 未标记数据集
下载PDF
“无师自通”机器学习方法的核心算法分析
2
作者 周欣 《电脑知识与技术》 2011年第4期2335-2338,共4页
机器学习的发展趋势,就是不断地使用易获得的、廉价的数据作为样本数据,来辅助训练数据进行学习。“无师自通”学习是迁移学习的一种改进,它使用未标记的数据集作为样本数据集,且并不假设未标记数据集和标记数据集有着同样的数据分... 机器学习的发展趋势,就是不断地使用易获得的、廉价的数据作为样本数据,来辅助训练数据进行学习。“无师自通”学习是迁移学习的一种改进,它使用未标记的数据集作为样本数据集,且并不假设未标记数据集和标记数据集有着同样的数据分布,它运用稀疏编码方法来对未标记数据集得到一个更高层次的表示。然后,再使用经典的监督学习方法如SVM方法来对得到的新的数据集进行机器学习。该文将介绍“无师自通”学习法的主要原理,并对其核心算法一稀疏编码算法进行深入分析并通过实验给出具体的实例。 展开更多
关键词 机器学习 无师自通 未标记数据集 稀疏编码 监督学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部