摘要
介绍病理文本数据结构和概念层次结构,以非结构化的病理文本为对象,首先对非序病理文本的结构进行分析,其次利用模式匹配对病理文本予以模式提取和泛化,最后从分词序列中抽取结构化信息,实验表明该方法能够获得较高的准确率和召回率。
The paper introduces the data structure and conceptual hierarchy of pathological texts.Based on unstructured pathological texts,at first,it analyzes the structure of pathological texts other than prefaces.Next,it conducts pattern extraction and generalization of the pathological texts by pattern matching.At last,it extracts structured information from the participle sequence.As proved by the experiment,this method can achieve a high accuracy and recall rate.
出处
《医学信息学杂志》
CAS
2016年第4期54-58,共5页
Journal of Medical Informatics
基金
上海市信息化发展专项资金项目"基于瑞金医院的临床大数据平台建设及深度应用"(项目编号:20140314)
关键词
病理文本
模式匹配
模式提取
结构化信息
Pathology text
Pattern matching
Pattern extraction
Structured information