针对目前最先进的临床命名实体识别(Cinical Named Entity Recognition,CNER)模型未能充分挖掘文本的全局信息和语义特征,以及未能解决文本中的字符替换等问题,改进了传统的单词嵌入模型,并在此基础上提出了一种结合深度卷积神经网络和...针对目前最先进的临床命名实体识别(Cinical Named Entity Recognition,CNER)模型未能充分挖掘文本的全局信息和语义特征,以及未能解决文本中的字符替换等问题,改进了传统的单词嵌入模型,并在此基础上提出了一种结合深度卷积神经网络和双向短时记忆条件随机场(DCNN-BiLSTM-CRF)的临床文本命名实体识别方法。改进的单词嵌入模型融合词根、拼音和字符本身意义,使用了来自Transformers的双向编码器表示,使单词嵌入向量具有汉字和临床文本的特点,该方法通过在临床命名实体识别任务中引入深度卷积神经网络(Deep Convolutional Neural Networks,DCNN),解决了CNN预测时丢失部分信息无法找回的问题。通过使用DCNN,本文模型能够更有效地捕获全局信息、获取字符之间的权重关系和多层次语义特征信息,从而提高了临床命名实体识别的准确性。在数据集CCKS2017和CCKS2018上分别进行实验,实验结果表明,与基准模型相比,该模型F1值分别改善了0.48%,0.68%,0.6%,0.58%,0.04%和1.43%,2.36%,3.31%,1.11%,0.17%。为了进一步验证本文的模型,进行了两种消融实验。结果表明,在两个数据集CCKS2017和CCKS2018上本文模型对比变体模型M1,F1值分别改善了0.79%和0.84%;对比变体模型M2,F1值分别改善了0.53%和0.64%。这些实验结果证明了本文所提算法的可行性。展开更多
在机器学习领域,半监督学习作为一种有力工具吸引了越来越多的关注,其利用少量带标签数据和大量无标签数据进行有效学习,其中基于图的半监督学习方法因其优雅的数学形式和良好的学习性能而引起更广泛的研究.针对现有基于图的半监督学习...在机器学习领域,半监督学习作为一种有力工具吸引了越来越多的关注,其利用少量带标签数据和大量无标签数据进行有效学习,其中基于图的半监督学习方法因其优雅的数学形式和良好的学习性能而引起更广泛的研究.针对现有基于图的半监督学习方法所存在的模型参数敏感和数据判别信息不充分等问题,提出一种稀疏特征空间嵌入正则化(Sparse Feature Space embedding Regularization,SFSR)半监督学习框架,其主要思想为:首先分别将原始数据嵌入到线性特征空间,然后利用特征空间嵌入投影点集来稀疏重构原始数据,随后在由原始数据线性张成的标签空间通过保留这种稀疏表示关系来构建一个Laplacian正则化项,或称SFSR,最后提出一个鲁棒的基于SFSR的半监督学习框架,在几个实际基准数据库上的综合实验结果证实了所提框架的鲁棒有效性.展开更多
为缓解跨域推荐中目标域数据稀疏和冷启动问题,综合增强嵌入、嵌入迁移、注意力机制调整和跨域推荐技术,提出一种融合深度特征提取和注意力机制的跨域推荐模型(cross-domain recommendation model of deep feature extraction and atten...为缓解跨域推荐中目标域数据稀疏和冷启动问题,综合增强嵌入、嵌入迁移、注意力机制调整和跨域推荐技术,提出一种融合深度特征提取和注意力机制的跨域推荐模型(cross-domain recommendation model of deep feature extraction and attention mechanism,CRDFEAM).利用潜在因子模型将类型相似度合并到矩阵分解过程,挖掘项目类型的隐性偏好.相比评分这一显性偏好,项目类型能更充分获取用户特征.在跨域迁移时,用分布对齐方式使域间差异最小化,以减少两个领域特征之间的数据分布差异.相对于直接迁移,分布对齐方式具有更强的可解释性.在特征调整过程中,引入多层感知机(multilayer perceptron,MLP)映射,并使用注意力机制进一步调整用户特征,使源域中没有出现过的目标域用户注意到源域用户的特征信息,同时也使源域中出现过的目标域用户注意到目标域中的项目特征信息.在真实数据集Movielens(M)、Netflix(N)和Douban(D)上的实验验证结果表明,引入MLP映射嵌入的CRDFEAM+模型的均方根误差(root mean square error,RMSE)值较基准模型跨域潜在特征映射(cross-domain latent feature mapping,CDLFM)平均提升9.88%,平均绝对误差(mean absolute error,MAE)值平均提升11.14%.研究验证了CRDFEAM+模型的跨域推荐效果,能够更充分地提取用户特征,有效缓解目标域信息不足问题.展开更多
文摘在机器学习领域,半监督学习作为一种有力工具吸引了越来越多的关注,其利用少量带标签数据和大量无标签数据进行有效学习,其中基于图的半监督学习方法因其优雅的数学形式和良好的学习性能而引起更广泛的研究.针对现有基于图的半监督学习方法所存在的模型参数敏感和数据判别信息不充分等问题,提出一种稀疏特征空间嵌入正则化(Sparse Feature Space embedding Regularization,SFSR)半监督学习框架,其主要思想为:首先分别将原始数据嵌入到线性特征空间,然后利用特征空间嵌入投影点集来稀疏重构原始数据,随后在由原始数据线性张成的标签空间通过保留这种稀疏表示关系来构建一个Laplacian正则化项,或称SFSR,最后提出一个鲁棒的基于SFSR的半监督学习框架,在几个实际基准数据库上的综合实验结果证实了所提框架的鲁棒有效性.
文摘为缓解跨域推荐中目标域数据稀疏和冷启动问题,综合增强嵌入、嵌入迁移、注意力机制调整和跨域推荐技术,提出一种融合深度特征提取和注意力机制的跨域推荐模型(cross-domain recommendation model of deep feature extraction and attention mechanism,CRDFEAM).利用潜在因子模型将类型相似度合并到矩阵分解过程,挖掘项目类型的隐性偏好.相比评分这一显性偏好,项目类型能更充分获取用户特征.在跨域迁移时,用分布对齐方式使域间差异最小化,以减少两个领域特征之间的数据分布差异.相对于直接迁移,分布对齐方式具有更强的可解释性.在特征调整过程中,引入多层感知机(multilayer perceptron,MLP)映射,并使用注意力机制进一步调整用户特征,使源域中没有出现过的目标域用户注意到源域用户的特征信息,同时也使源域中出现过的目标域用户注意到目标域中的项目特征信息.在真实数据集Movielens(M)、Netflix(N)和Douban(D)上的实验验证结果表明,引入MLP映射嵌入的CRDFEAM+模型的均方根误差(root mean square error,RMSE)值较基准模型跨域潜在特征映射(cross-domain latent feature mapping,CDLFM)平均提升9.88%,平均绝对误差(mean absolute error,MAE)值平均提升11.14%.研究验证了CRDFEAM+模型的跨域推荐效果,能够更充分地提取用户特征,有效缓解目标域信息不足问题.