期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
融入篇章信息的文学作品命名实体识别
1
作者 贾玉祥 晁睿 +3 位作者 昝红英 窦华溢 曹帅 徐硕 《中文信息学报》 CSCD 北大核心 2023年第11期100-109,共10页
命名实体识别是文学作品智能分析的基础性工作,当前文学领域命名实体识别的研究还较薄弱,一个主要原因是缺乏标注语料。该文从金庸小说入手,对两部小说180余万字进行了命名实体的标注,共标注4类实体,共计5万多个。针对小说文本的特点,... 命名实体识别是文学作品智能分析的基础性工作,当前文学领域命名实体识别的研究还较薄弱,一个主要原因是缺乏标注语料。该文从金庸小说入手,对两部小说180余万字进行了命名实体的标注,共标注4类实体,共计5万多个。针对小说文本的特点,该文提出融入篇章信息的命名实体识别模型,引入篇章字典保存汉字的历史状态,利用可信度计算融合BiGRU-CRF与Transformer模型。实验结果表明,利用篇章信息有效提升了命名实体识别的效果。最后,该文还探讨了命名实体识别在小说社会网络构建中的应用。 展开更多
关键词 文学作品 命名实体识别 篇章信息
下载PDF
基于多来源文本的中文医学知识图谱的构建 被引量:17
2
作者 昝红英 窦华溢 +4 位作者 贾玉祥 关同峰 奥德玛 张坤丽 穗志方 《郑州大学学报(理学版)》 CAS 北大核心 2020年第2期45-51,共7页
中文医学知识图谱(Chinese medical knowledge graph,CMeKG)是对专业医学知识的结构化描述,构建中文医学知识图谱是各类智慧医疗应用的迫切需要。通过收集多来源医疗文本,详细分析语料的结构特征,结合医学知识的语义特点,制定了医学命... 中文医学知识图谱(Chinese medical knowledge graph,CMeKG)是对专业医学知识的结构化描述,构建中文医学知识图谱是各类智慧医疗应用的迫切需要。通过收集多来源医疗文本,详细分析语料的结构特征,结合医学知识的语义特点,制定了医学命名实体和实体关系的标注体系和规范;并开发了标注工具,在医学专家的指导下,选取106种高发疾病进行人工标注,命名实体一致率达到了87.3%,实体关系一致率达到了82.9%。在人工标注的基础上,进行实体及关系自动抽取,构建出的中文医学知识图谱CMeKG1.0版共包括6310种疾病、19853种药物(西药、中成药、中草药)、1237种诊疗技术及设备,关联到的医学实体达20余万,概念关系实例及属性三元组达100余万。所构建的中文医学知识图谱为医疗问答系统和智能辅助诊疗等领域奠定了专业知识基础。 展开更多
关键词 医学知识图谱 命名实体 实体关系 标注规范 知识图谱构建
下载PDF
医学自然语言处理技术对产科病历逻辑错误的质量控制效果 被引量:3
3
作者 赵悦淑 王蕊 +2 位作者 窦华溢 张坤丽 王军 《中国生育健康杂志》 2020年第4期371-373,共3页
目的运用医学自然语言处理技术查找病历的逻辑错误,提高病历质量。方法选取2016年1月1日至2016年12月31在河南省某三甲医院的全部产科出院患者的产科首次病程记录,共计19860份。运用自然语言处理技术把归档的产科病历的产科检查抽取成Ex... 目的运用医学自然语言处理技术查找病历的逻辑错误,提高病历质量。方法选取2016年1月1日至2016年12月31在河南省某三甲医院的全部产科出院患者的产科首次病程记录,共计19860份。运用自然语言处理技术把归档的产科病历的产科检查抽取成Excel文件,然后查找可疑逻辑错误,把错误项与原始病历核对,最后由病历书写者确认错误。结果19860份中有309份除住院号、性别、年龄外,其他字段全部为"空",只有19551份包括主诉等内容。在19551份病历中,共发现通过人工质控和质控软件没有发现的存在逻辑错误的病例1246份(0.28%)。逻辑错误共23类,错误率最高的前三位分别是髂嵴间径小于髂棘间径259个(1.32%),预产期在末次月经前140个(0.72%),宫高和腹围填写颠倒120个(0.61%),极度异常值如腹围703.0 cm。结论自然语言处理技术用于文本病历的逻辑错误审核,比人工审核快速、客观、全面。 展开更多
关键词 自然语言 逻辑错误 质量控制 病历
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部