期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于问题—方法矩阵的文献新颖性评估方法 被引量:10
1
作者 王艳艳 张均胜 +1 位作者 乔晓东 魏家泽 《情报理论与实践》 CSSCI 北大核心 2021年第2期90-95,共6页
[目的/意义]基于科技文献构建问题—方法矩阵,探索科技文献研究内容新颖性评估方法,辅助科技查新应用。[方法/过程]对科技文献内容进行信息抽取,提取研究问题和方法内容文本并构建问题—方法矩阵。利用LDA模型对科技文献采用的问题与方... [目的/意义]基于科技文献构建问题—方法矩阵,探索科技文献研究内容新颖性评估方法,辅助科技查新应用。[方法/过程]对科技文献内容进行信息抽取,提取研究问题和方法内容文本并构建问题—方法矩阵。利用LDA模型对科技文献采用的问题与方法进行分类,将科技文献在问题—方法矩阵中定位并可视化。通过设定阈值划分区域,确定待评估科技文献研究问题和方法所在区域,进行新颖性评估分析,并通过实验验证该方法的有效性。[结果/结论]提出的基于问题—方法矩阵的文献新颖性评估方法通过可视化方式不仅有利于辅助科技查新判断,还可服务于创新选题。[局限]基于科技文献的研究问题与方法信息抽取和新颖性评估计算的自动化方法有待进一步研究。 展开更多
关键词 科技文献 科技查新 问题—方法矩阵 新颖性评估 评估方法
下载PDF
多模态内容资源编目及知识表示研究
2
作者 刘沛鹞 罗卓然 +1 位作者 魏家泽 程齐凯 《数字图书馆论坛》 CSSCI 2022年第11期26-33,共8页
在多模态信息资源体量快速增长的环境下,为更有效地对内容资源开展编目及知识表示工作,本文从多模态的角度出发,探讨在“实体-属性-关系”结构下多模态资源编目可行性,提出一种适用于多模态资源的编目框架M-RDA、梳理内容资源模态归一... 在多模态信息资源体量快速增长的环境下,为更有效地对内容资源开展编目及知识表示工作,本文从多模态的角度出发,探讨在“实体-属性-关系”结构下多模态资源编目可行性,提出一种适用于多模态资源的编目框架M-RDA、梳理内容资源模态归一化方法。本文重点扩展编目框架中的多模态属性与关系类目,从4个模态维度出发,挖掘多种资源间的描述补充关系,在著录资源的同时对其模态特征及关系进行标注。此外,为实现编目规则下知识的组织和表达过程,本文从事件描述的原因、对象、地点、时间、人员、方法6个方面提出一种基于5W1H的多模态知识表示方法,实现多模态资源从标签获取、编目到知识表示的完整过程,为多模态资源的编目自动化提供理论参考和实践案例。 展开更多
关键词 多模态资源 编目 RDA 知识表示
下载PDF
基于均衡段落和分话题向量的新闻热点话题检测研究 被引量:1
3
作者 魏家泽 董诚 +2 位作者 何彦青 刘志辉 彭柯芸 《数据分析与知识发现》 CSSCI CSCD 北大核心 2020年第10期70-79,共10页
【目的】通过新闻热点话题检测技术提取热点新闻话题,减轻用户的新闻阅读压力。【方法】在TF-IDF方法基础上,通过均衡段落的位置加权方式(WTF-IDF)进行关键词提取;将K-means聚类作为基方法,在分层聚类中引入分话题向量完成话题聚类;提... 【目的】通过新闻热点话题检测技术提取热点新闻话题,减轻用户的新闻阅读压力。【方法】在TF-IDF方法基础上,通过均衡段落的位置加权方式(WTF-IDF)进行关键词提取;将K-means聚类作为基方法,在分层聚类中引入分话题向量完成话题聚类;提取标题高频词实现话题描述。【结果】WTF-IDF方法在关键词抽取数为3时与TF-IDF方法相比F1值提升5.4%;基于WTF-IDF与分话题向量的分层聚类与分层TF-IDF的K-means聚类相比准确提升3.1%。【局限】关键词抽取未考虑短语形式;分层聚类方法增加了算法时间复杂度。【结论】本文提出的关键词抽取和分层聚类方法可以改善新闻热点话题检测效果,话题描述得到的话题短语也达到一定的代表性与可读性。 展开更多
关键词 均衡段落 分话题向量 热点话题检测 分层聚类
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部