期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于标签概念的多标签文本分类方法 被引量:1
1
作者 汪乐乐 张贤坤 《天津科技大学学报》 CAS 2024年第1期73-80,共8页
多标签文本分类是自然语言处理中重要且具有挑战性的任务之一。现有的方法注重文本表示学习,关注文本内部信息预测所属标签,忽略了属于某一标签的全体实例中共享的关键信息。鉴于此,本文提出一种基于标签概念的多标签文本分类方法:利用... 多标签文本分类是自然语言处理中重要且具有挑战性的任务之一。现有的方法注重文本表示学习,关注文本内部信息预测所属标签,忽略了属于某一标签的全体实例中共享的关键信息。鉴于此,本文提出一种基于标签概念的多标签文本分类方法:利用词频和潜在狄利克雷分布(latent Dirichlet allocation,LDA)方法从训练集全体实例中抽取各标签所对应的关键词,接着采取与文本编码相同方式对关键词编码,获得标签概念表示。在训练和预测过程中,检索与文本表示最相似的标签概念辅助分类,增加标签概念表示与文本表示的对比损失,使文本编码过程中能充分学习全局的标签概念信息。将本文方法嵌套在常用的多标签文本分类模型上进行实验,结果表明该方法有效提高了相应模型的性能。 展开更多
关键词 标签概念 全局关键信息 对比损失 标签文本分类
下载PDF
大众分类体系中标签概念空间的构建研究 被引量:12
2
作者 熊回香 王学东 《情报学报》 CSSCI 北大核心 2012年第9期984-992,共9页
大众分类是Web2.0环境下产生的一种新型信息分类法,标签是其中的核心要素,但标签的多样性、模糊性、结构扁平化等缺陷严重影响了信息检索的效率。本文以“豆瓣读书”为例,通过分析标签的统计学规律,挖掘标签间的相互关系,并利用... 大众分类是Web2.0环境下产生的一种新型信息分类法,标签是其中的核心要素,但标签的多样性、模糊性、结构扁平化等缺陷严重影响了信息检索的效率。本文以“豆瓣读书”为例,通过分析标签的统计学规律,挖掘标签间的相互关系,并利用聚类算法对标签进行聚类,构建标签概念空间,从而实现对标签的重新组织,为用户提供更好地标签导航和浏览机制。实验证明,本文提出的算法模型能够较好地构建标签概念空间。 展开更多
关键词 大众分类 标签 标签概念空间
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部