-
题名基于标签概念的多标签文本分类方法
被引量:1
- 1
-
-
作者
汪乐乐
张贤坤
-
机构
天津科技大学人工智能学院
-
出处
《天津科技大学学报》
CAS
2024年第1期73-80,共8页
-
基金
天津市科技计划项目(21ZYQCSY00050)。
-
文摘
多标签文本分类是自然语言处理中重要且具有挑战性的任务之一。现有的方法注重文本表示学习,关注文本内部信息预测所属标签,忽略了属于某一标签的全体实例中共享的关键信息。鉴于此,本文提出一种基于标签概念的多标签文本分类方法:利用词频和潜在狄利克雷分布(latent Dirichlet allocation,LDA)方法从训练集全体实例中抽取各标签所对应的关键词,接着采取与文本编码相同方式对关键词编码,获得标签概念表示。在训练和预测过程中,检索与文本表示最相似的标签概念辅助分类,增加标签概念表示与文本表示的对比损失,使文本编码过程中能充分学习全局的标签概念信息。将本文方法嵌套在常用的多标签文本分类模型上进行实验,结果表明该方法有效提高了相应模型的性能。
-
关键词
标签概念
全局关键信息
对比损失
多标签文本分类
-
Keywords
label concept
global key information
contrast loss
multi-label text classification
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名大众分类体系中标签概念空间的构建研究
被引量:12
- 2
-
-
作者
熊回香
王学东
-
机构
华中师范大学信息管理系
-
出处
《情报学报》
CSSCI
北大核心
2012年第9期984-992,共9页
-
基金
本文系教育部规划基金项目“面向Web3.0的大众分类研究”(编号:10YJA870026)和国家社会科学基金项目“大众分类中标签间语义关系挖掘研究”(批准号:12BTQ038)的研究论文.
-
文摘
大众分类是Web2.0环境下产生的一种新型信息分类法,标签是其中的核心要素,但标签的多样性、模糊性、结构扁平化等缺陷严重影响了信息检索的效率。本文以“豆瓣读书”为例,通过分析标签的统计学规律,挖掘标签间的相互关系,并利用聚类算法对标签进行聚类,构建标签概念空间,从而实现对标签的重新组织,为用户提供更好地标签导航和浏览机制。实验证明,本文提出的算法模型能够较好地构建标签概念空间。
-
关键词
大众分类
标签
标签概念空间
-
Keywords
folksonomy, tag, tag concept space
-
分类号
G254.11
[文化科学—图书馆学]
-