-
题名泛娱乐情报主题的感知研究
被引量:2
- 1
-
-
作者
于汝意
刘秀磊
刘旭红
张良
王延飞
-
机构
北京信息科技大学网络文化与数字传播北京市重点实验室
北京信息科技大学数据与科学情报分析实验室
北京大学信息管理系
-
出处
《北京信息科技大学学报(自然科学版)》
2020年第2期58-61,共4页
-
基金
国家重点研发计划资助(2017YFB1400402)
北京市教育委员会科技计划面上项目(KM201811232018)
+2 种基金
网络文化与数字传播北京市重点实验室开放课题资助(ICDDXN006)
北京信息科技大学“勤信人才”培育计划资助
北大方正集团有限公司数字出版技术国家重点实验室专项课题资助。
-
文摘
针对泛娱乐情报存在繁杂、异构、信息量较少的特点以及传统主题发现方法感知结果准确率低等问题,提出了一种基于潜在语义索引结合常识知识库的泛娱乐情报主题感知方法。根据泛娱乐情报的语料特征,首先在预处理阶段采用HowNet知识库进行语义去重、同义词合并,形成文本向量作为潜在语义索引模型的输入;然后通过潜在语义索引模型,对泛娱乐情报进行主题感知。该方法是主题模型在泛娱乐领域情报分析中的一次尝试,具有一定的实践意义。
-
关键词
情报感知
潜在语义索引
HOWNET
文本挖掘
-
Keywords
information awareness
latent semantic index
HowNet
text mining
-
分类号
TP273
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名面向泛娱乐文本的层次多标签分类方法
- 2
-
-
作者
陈若愚
刘秀磊
于汝意
-
机构
北京信息科技大学网络文化与数字传播北京市重点实验室
北京信息科技大学数据与科学情报分析实验室
-
出处
《计算机应用与软件》
北大核心
2023年第1期60-65,共6页
-
基金
北京市教育委员会科技计划面上项目(KM201811232018)
网络文化与数字传播北京市重点实验室(ICDDXN006)
北京信息科技大学“勤信人才”培育计划项目(QXTCP C202111)。
-
文摘
针对泛娱乐领域文本情报预测类别标签具备有向无环图(DAG)结构的特点,提出一种考虑标签层次结构的基于最优路径层次多标签分类方法。根据现有标签构建DAG结构并将其转化为较易处理的树形结构;采用局部策略为树形结构中每个节点分别训练基分类器,同时为每个节点设置贡献值,贡献值由分类器输出概率与层次权重组合而成,贡献值大于阈值时该节点设置为1,否则为0;对树形结构进行深度优先遍历生成路径,计算各路径得分,选择满足层次约束并得分最高的路径作为最终预测集合。在泛娱乐公开文本信息数据集上进行了4组实验,结果表明该方法相较于分类器链、二元分析、SVM多标签分类和MLKNN算法,分类效果更优。
-
关键词
层次多标签分类
最优路径
有向无环图结构
树形结构
-
Keywords
Hierarchical multi-label classification
Optimal path
Directed acyclic graph structure
Tree structure
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
TP273
[自动化与计算机技术—检测技术与自动化装置]
-