期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于知识图谱的中药材新闻推荐方法研究
1
作者 郭崇慧 朱虓 吴卓青 《工程管理科技前沿》 CSSCI 北大核心 2024年第2期38-47,共10页
中药材新闻推荐是典型的垂直领域新闻推荐问题。为了有效运用领域知识,本文提出一种基于知识图谱的中药材新闻推荐方法。首先,从中药典籍中抽取实体和关系,构建中药材知识图谱;其次,从新闻标题中匹配实体,结合词嵌入和实体嵌入,通过基... 中药材新闻推荐是典型的垂直领域新闻推荐问题。为了有效运用领域知识,本文提出一种基于知识图谱的中药材新闻推荐方法。首先,从中药典籍中抽取实体和关系,构建中药材知识图谱;其次,从新闻标题中匹配实体,结合词嵌入和实体嵌入,通过基于注意力机制的知识感知卷积神经网络得到新闻嵌入表示;再次,基于用户历史点击新闻及侧面信息,运用基于知识图谱和注意力网络的中药材新闻推荐模型,生成Top-K推荐列表。在2个真实数据集上的实验表明,本文方法的HR@10指标(0.750、0.788)和MAP@10指标(0.468、0.471)均优于基线方法。本文将知识图谱引入中药材新闻推荐,提升了推荐质量,且具有一定的可解释性。 展开更多
关键词 新闻推荐 知识图谱 注意力机制 中药材
下载PDF
非酒精性脂肪肝风险人群分层健康管理框架及多维代谢指标数据挖掘方法
2
作者 吴卓青 郭崇慧 +2 位作者 陈静锋 郑云超 丁素英 《系统管理学报》 CSSCI CSCD 北大核心 2024年第4期959-972,共14页
非酒精性脂肪肝病(NAFLD)是最常见的慢性肝病,近年来其患病率不断增加。目前临床上针对NAFLD风险人群健康管理策略采用“一体适用”的方法,忽视了不同危险分层患者之间的差异性,为此,提出NAFLD风险人群分层健康管理框架及多维代谢数据... 非酒精性脂肪肝病(NAFLD)是最常见的慢性肝病,近年来其患病率不断增加。目前临床上针对NAFLD风险人群健康管理策略采用“一体适用”的方法,忽视了不同危险分层患者之间的差异性,为此,提出NAFLD风险人群分层健康管理框架及多维代谢数据挖掘方法。首先,使用动态时间扭曲算法对受检者的多维代谢指标时间序列数据进行相似性度量,并使用相似性网络融合算法对多维代谢指标时间序列相似度矩阵进行融合;其次,构建受检者多维代谢指标社交网络,通过Leiden社区发现算法进行危险分层;再次,基于各个子社区的结构化数值型数据与非结构化文本型数据进行知识发现,挖掘典型模式与TOP-N主题词及健康建议;最后,将该框架应用于真实世界数据集并开发原型系统。实验结果表明,本文提出的NAFLD风险人群分层健康管理框架及方法能够使临床医生更好地了解受检者危险层级及相应特征,从而以分层医学思想实施更精细化的健康管理。 展开更多
关键词 非酒精性脂肪肝 多维代谢指标 分层健康管理 社区发现
下载PDF
国务院政府工作报告(1954—2017)文本挖掘及社会变迁研究 被引量:25
3
作者 魏伟 郭崇慧 陈静锋 《情报学报》 CSSCI CSCD 北大核心 2018年第4期406-421,共16页
国务院政府工作报告是一类具有施政纲领性质的综合政策性文本。采用文本挖掘技术对历年工作报告进行多粒度、多层次的综合定量分析,对快速理解领域内容的发展变化以及发现社会变迁规律具有重要的指导意义。首先,利用中文文本分词工具并... 国务院政府工作报告是一类具有施政纲领性质的综合政策性文本。采用文本挖掘技术对历年工作报告进行多粒度、多层次的综合定量分析,对快速理解领域内容的发展变化以及发现社会变迁规律具有重要的指导意义。首先,利用中文文本分词工具并结合构建的三个词典对工作报告进行文本预处理。然后,一方面根据工作报告中的词统计信息,分别对频繁词、热词和新词进行概念上的界定并提出三种相应的特征筛选方法,基于新词提出了社会活力的计算方法,并对特征词时间序列进行聚类分析。另一方面根据文档信息,对1954—2017年整个时间段进行阶段划分,并结合特征词时间序列聚类结果进行特征词时间序列模式发现。最后,研究结果表明,抽取出的频繁词、热词以及新词能够反映出工作报告中探讨的共性问题、热点问题及其演化规律以及历年社会活力波动情况;根据特征词时间序列聚类结果和整个时间阶段合理的划分结果,发现了历年来国务院工作报告中存在的9种特征词时间序列模式。 展开更多
关键词 国务院政府工作报告 文本挖掘 社会变迁 模式发现 社会活力
下载PDF
基于中文学术文献的领域本体概念层次关系抽取研究 被引量:10
4
作者 唐琳 郭崇慧 +1 位作者 陈静锋 孙磊磊 《情报学报》 CSSCI CSCD 北大核心 2020年第4期387-398,共12页
基于学术文献构建领域本体对促进领域学科发展具有重要的意义。本文提出了一种以中文学术文献为数据源,半自动化抽取领域本体层次关系的框架方法。首先,构建了一个通用的领域本体层次关系的细粒度研究框架。其次,设计了一种新的概念表... 基于学术文献构建领域本体对促进领域学科发展具有重要的意义。本文提出了一种以中文学术文献为数据源,半自动化抽取领域本体层次关系的框架方法。首先,构建了一个通用的领域本体层次关系的细粒度研究框架。其次,设计了一种新的概念表示方法,融合了深度学习方法得到的概念语义特征和上下文的时间序列词频。进一步结合了AP聚类、Prim算法和Web搜索引擎的查询数据,提出了基于规则推理的本体概念层次关系抽取算法(RROCHE),实现了半自动化概念层次关系抽取。最后,基于中文分词领域的中文学术文献数据,通过数值实验方法讨论了方法的可行性和有效性。本文提出的框架方法也非常容易推广并应用到各领域本体层次关系任务中。 展开更多
关键词 概念层次关系 本体构建 学术文献 深度学习 时间序列
下载PDF
Adaptive spectral affinity propagation clustering 被引量:2
5
作者 TANG Lin SUN Leilei +1 位作者 guo chonghui ZHANG Zhen 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2022年第3期647-664,共18页
Affinity propagation(AP)is a classic clustering algorithm.To improve the classical AP algorithms,we propose a clustering algorithm namely,adaptive spectral affinity propagation(AdaSAP).In particular,we discuss why AP ... Affinity propagation(AP)is a classic clustering algorithm.To improve the classical AP algorithms,we propose a clustering algorithm namely,adaptive spectral affinity propagation(AdaSAP).In particular,we discuss why AP is not suitable for non-spherical clusters and present a unifying view of nine famous arbitrary-shaped clustering algorithms.We propose a strategy of extending AP in non-spherical clustering by constructing category similarity of objects.Leveraging the monotonicity that the clusters’number increases with the self-similarity in AP,we propose a model selection procedure that can determine the number of clusters adaptively.For the parameters introduced by extending AP in non-spherical clustering,we provide a grid-evolving strategy to optimize them automatically.The effectiveness of AdaSAP is evaluated by experiments on both synthetic datasets and real-world clustering tasks.Experimental results validate that the superiority of AdaSAP over benchmark algorithms like the classical AP and spectral clustering algorithms. 展开更多
关键词 affinity propagation(AP) Laplacian eigenmap(LE) arbitrary-shaped cluster model selection
下载PDF
中文分词技术研究综述 被引量:45
6
作者 唐琳 郭崇慧 陈静锋 《数据分析与知识发现》 CSSCI CSCD 北大核心 2020年第2期1-17,共17页
【目的】梳理中文分词领域的关键问题、算法和模型,为研究人员提供理论基础和实践指导。【文献范围】使用知网数据库、万方数据知识服务平台和计算机科学文献库DBLP检索中文分词相关文献,共选择109篇代表性文献进行综述。【方法】归纳... 【目的】梳理中文分词领域的关键问题、算法和模型,为研究人员提供理论基础和实践指导。【文献范围】使用知网数据库、万方数据知识服务平台和计算机科学文献库DBLP检索中文分词相关文献,共选择109篇代表性文献进行综述。【方法】归纳中文分词的发展历程及关键问题,分类总结中文分词的算法和模型,并详述近期的热点研究问题。【结果】使用多个标注数据集的多准则分词模型是中文分词的研究难点,解决中文分词和自然语言处理其他子任务的多任务联合模型是当前研究的热点。【局限】没有深入对比分析中文分词的无监督学习方法。【结论】虽然现有的中文分词方法能在一定程度上满足诸多应用的需求,但是在大数据环境下多视角、多任务和多准则的联合模型研究仍存在挑战。 展开更多
关键词 中文分词 分词算法 多准则学习 联合模型
原文传递
基于语义关联规则的试题知识点标注及试题推荐 被引量:10
7
作者 魏伟 郭崇慧 邢小宇 《数据分析与知识发现》 CSSCI CSCD 北大核心 2020年第2期182-191,共10页
【目的】在线教育资源中存在大量未标注知识点的试题,探究对试题知识点进行自动标注。【方法】通过引入文本语义概念,考虑待标注试题与学习规则之间的语义匹配程度,提出一种基于语义关联规则的试题知识点自动标注方法和基于知识点间关... 【目的】在线教育资源中存在大量未标注知识点的试题,探究对试题知识点进行自动标注。【方法】通过引入文本语义概念,考虑待标注试题与学习规则之间的语义匹配程度,提出一种基于语义关联规则的试题知识点自动标注方法和基于知识点间关联特性的个性化试题推荐方法。【结果】以部分初中数学和高中历史试题为实验语料,分别与朴素贝叶斯、K最近邻、随机森林以及支持向量机等经典分类方法进行实验对比,发现本文方法的标注准确度优于其他方法。【局限】该方法对于试题的语义理解不够深入,使得整体的准确度仍然较低,与期望的标注准确度还有一定差距。【结论】知识点自动标注方法和个性化试题推荐方法在现阶段以及未来的智能教学和自主学习方面具有一定的实际应用价值。 展开更多
关键词 知识点标注 语义关联规则 在线学习 个性化推荐
原文传递
基于文本挖掘的新型冠状病毒肺炎诊疗方案演化分析 被引量:2
8
作者 郭崇慧 徐良辰 +1 位作者 魏伟 陈静锋 《生物医学工程学杂志》 EI CAS CSCD 北大核心 2021年第2期197-209,共13页
为快速了解新型冠状病毒肺炎诊断和治疗方法的演化情况及其规律,为医务人员在实际诊疗中提供便利,本文以2020-01-16至2020-08-19期间国家卫生健康委员会相继发布的9版新型冠状病毒肺炎诊疗方案文本为研究数据,借助文本挖掘相关方法对新... 为快速了解新型冠状病毒肺炎诊断和治疗方法的演化情况及其规律,为医务人员在实际诊疗中提供便利,本文以2020-01-16至2020-08-19期间国家卫生健康委员会相继发布的9版新型冠状病毒肺炎诊疗方案文本为研究数据,借助文本挖掘相关方法对新型冠状病毒肺炎诊疗方案整体及相同模块进行表示及相似度度量,并对其进行对比性分析与可视化分析,得到不同版本诊疗方案整体及相应模块的文本相似度,归纳总结其演化规律,为临床诊疗实践及其他诊疗方案的制定提供参考。 展开更多
关键词 新型冠状病毒肺炎 诊疗方案 演化分析 文本挖掘
原文传递
基于排名聚合的古村落网络信息资源评价研究 被引量:2
9
作者 郭崇慧 李敏谦 《数据分析与知识发现》 CSSCI CSCD 北大核心 2018年第4期10-19,共10页
【目的】探究如何利用排名聚合方法科学评价古村落网络信息资源。【方法】提出评价流程框架和评价方法:选取6个考察维度,构建古村落网络信息资源评价指标体系;结合指标的主观权重和客观权重,采用一种排名聚合方法 BILPS将多种单一评价... 【目的】探究如何利用排名聚合方法科学评价古村落网络信息资源。【方法】提出评价流程框架和评价方法:选取6个考察维度,构建古村落网络信息资源评价指标体系;结合指标的主观权重和客观权重,采用一种排名聚合方法 BILPS将多种单一评价方法进行聚合,对古村落网络信息资源进行综合评价。【结果】对广东省64个古村落的网络信息资源进行评价,分析发现排名前10的古村落多位于广州市。【局限】仅应用于广东省古村落网络信息资源评价,未扩展至中国传统村落网络信息资源评价。【结论】科学地评价古村落网络信息资源能够辅助决策者、管理者和古村落居民在正确认识古村落网络传播现状和影响力状况的前提下做出决策,推动古村落的发展。 展开更多
关键词 古村落 网络信息资源 排名聚合
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部