期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
12
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
文本切分知识获取及其应用
被引量:
9
1
作者
钱揖丽
郑家恒
《计算机工程与应用》
CSCD
北大核心
2003年第2期63-64,100,共3页
文章描述了一种从熟语料中自动获取文本切分知识的机器学习的方法。该方法从已切分标注加工的熟语料中自动获取错误的文本切分形式及其相应的上下文信息,以及正确的切分形式,形成知识库,并将获取的知识再应用到新语料的加工过程,从而进...
文章描述了一种从熟语料中自动获取文本切分知识的机器学习的方法。该方法从已切分标注加工的熟语料中自动获取错误的文本切分形式及其相应的上下文信息,以及正确的切分形式,形成知识库,并将获取的知识再应用到新语料的加工过程,从而进一步提高机器切分的正确率;同时,采用滚动式的方法,建造具有较高加工质量的大规模语料库。
展开更多
关键词
文本切分
知识获取
语料库
中文信息处理
机器学习
知识库
下载PDF
职称材料
一种手写汉字文本切分的协动计算方法设计
2
作者
周昌乐
赵巍
《计算机应用与软件》
CSCD
1999年第1期30-33,F003,共5页
本文针对信封地址的识别,设计了一种手写汉字文本切分的协动计算方法。由于考虑了汉字及其左右部件搭配的语义信息,从而取得了较高的正确切分率。在1000份样本信封文本中,无连字时为100%,有连字时也有95%。
关键词
手写汉字识别
文本切分
协动算法
汉字信息处理
下载PDF
职称材料
古琴减字谱图像的文本切分与提取
被引量:
1
3
作者
潘知枭
周昌乐
《心智与计算》
2007年第2期281-290,共10页
古琴打谱是一项专业性很强又费时费力的工作,如何利用先进的人工智能技术来对古琴谱中的谱字进行自动识别解读,哪怕是辅助性的,对于古琴打谱事业的发展无疑会起到重要的促进作用,从可以间接地为保护与弘扬古琴文化作贡献。本文通过研究...
古琴打谱是一项专业性很强又费时费力的工作,如何利用先进的人工智能技术来对古琴谱中的谱字进行自动识别解读,哪怕是辅助性的,对于古琴打谱事业的发展无疑会起到重要的促进作用,从可以间接地为保护与弘扬古琴文化作贡献。本文通过研究古琴减字谱这种特殊文本的特点,提出了不同于普通OCR光学识别软件的文本切分方法,内容涉及纸质古琴谱原始扫描图的图像预处理,古琴混合谱中简字谱的行切分与提取,单行简字谱中的谱字切分与提取等算法及其实现。这样就为实现古琴谱进一步的释读提供一种前期处理方法。由于古琴谱字的特殊性,以及所提出方法的通用性,该方法对于丰富汉字文本的切分方法也有着一定的学术意义。
展开更多
关键词
古琴打谱
减字谱
图像处理
文本切分
原文传递
文本行字符基线的精确测定算法
被引量:
2
4
作者
卢达
浦炜
谢铭培
《小型微型计算机系统》
EI
CSCD
北大核心
2000年第7期726-728,共3页
本文给出了精确测定文本行字符基线的算法 ,讨论了基线检测的容差 .该算法也可用于手写字符的分析 .实验结果表明 ,我们的基线检测算法对不同大小的字符有满意的处理结果 .
关键词
字符识别
文本
行
切分
基线检测
文本
处理
下载PDF
职称材料
文本行字符基线的精确测定算法
5
作者
卢达
浦炜
《中山大学学报论丛》
1999年第4期12-16,共5页
给出了精确测定文本行字符基线的算法, 讨论了基线检测的容差。该算法也可用于手写字符的分析。实验结果表明, 该基线检测算法对不同大小的字符都有满意的处理结果。
关键词
字符识别
文本
行
切分
字符
切分
基线检测
下载PDF
职称材料
一种新颖的自然语言主题转换精确定位方法
6
作者
陈浪舟
黄泰翼
《软件学报》
EI
CSCD
北大核心
1999年第12期1246-1252,共7页
自然语言的主题转换是自然语言理解的一个重要线索 .语言处理通常是针对不同的主题有不同的数据库和处理方法 .因此 ,如何找到文本中的主题转换点是语言处理中的一个重要内容 .该技术在语言理解、文本自动索引以及语言模型的建立等方面...
自然语言的主题转换是自然语言理解的一个重要线索 .语言处理通常是针对不同的主题有不同的数据库和处理方法 .因此 ,如何找到文本中的主题转换点是语言处理中的一个重要内容 .该技术在语言理解、文本自动索引以及语言模型的建立等方面都有重要意义 .该文以文本主题转换时的词汇突变为表征 ,提出和定义了反映词汇突变的 4个参数 ,将这 4个参数作为输入 ,利用 BP网作为判决工具 ,建立了一个在不同尺度下文本词汇变化的层次结构模型 ,实现了一种精确的文本主题转换点的定位方法 ,其定位精度在一个句子左右 .
展开更多
关键词
自然语言处理
文本切分
BP算法
主题转换
下载PDF
职称材料
关于书面汉语中词链问题的分析和处理
7
作者
黄祥喜
《情报科学》
1988年第5期28-35,共8页
本文给出了词链的形式定义,分析了词链产生的原因,对词链的可切分性作了系统研究。
关键词
自动分词
汉字串
语言
文本
文本切分
分解
分词法
成词
汉语语言理解
词典
书面汉语
下载PDF
职称材料
特定领域中语义校对系统的开发
8
作者
郑逢斌
夏保胜
+1 位作者
姜保庆
乔保军
《西南交通大学学报》
EI
CSCD
北大核心
2003年第2期231-234,共4页
介绍应用于报刊书籍政治性错误校对的一个语义校对软件系统的设计原理和实现过程.本系统先把文本切分成词语,找出敏感词,合并成术语,部分术语通过短语本身或左右片段即可做出正误判断;另一部分术语则用整个句子语义与知识库进行模糊匹...
介绍应用于报刊书籍政治性错误校对的一个语义校对软件系统的设计原理和实现过程.本系统先把文本切分成词语,找出敏感词,合并成术语,部分术语通过短语本身或左右片段即可做出正误判断;另一部分术语则用整个句子语义与知识库进行模糊匹配得到它的错误隶属度.
展开更多
关键词
语义校对软件系统
系统设计
敏感词
术语
文本切分
语法错误
语义错误
下载PDF
职称材料
关于汉语语言处理的若干理论思考
9
作者
王建琦
《华中师范大学学报(人文社会科学版)》
CSSCI
北大核心
2003年第3期103-107,共5页
汉语语法检查是汉语语言处理发展中的瓶颈,涉及汉语语言处理的各个方面,与汉字拼写检查、文本切分、词性标注、汉字输入、汉字编码等问题紧密相联。语义理解是语法检查及自然语言处理的制高点。新的发展趋势是研究者越来越注重语义在语...
汉语语法检查是汉语语言处理发展中的瓶颈,涉及汉语语言处理的各个方面,与汉字拼写检查、文本切分、词性标注、汉字输入、汉字编码等问题紧密相联。语义理解是语法检查及自然语言处理的制高点。新的发展趋势是研究者越来越注重语义在语言结构和语言表达上的制约作用,试图用统计大规模语料为手段来攻克难关。这种发展趋势对自然语言处理的冲击不在于研究命题的转移,而在于研究方法和论证手段的量化。在汉语的各种制约关系中,可能有一种超越已知句法语义关系的认知心理语法,它与特定历史时期内人们对物质世界和客观社会文化关系的理解相一致,有可能是自然语言处理的最后一个堡垒。
展开更多
关键词
汉语语言处理
语义
句法
语法检查
文本切分
计算机处理汉语
下载PDF
职称材料
结合文字核心区域和扩展生长的藏文古籍文本行切分
被引量:
2
10
作者
李金成
王筱娟
+2 位作者
王维兰
林强
胡鹏飞
《激光与光电子学进展》
CSCD
北大核心
2021年第2期105-115,共11页
藏文古籍文档图像中相邻文本行之间通常存在黏连和重叠的情况,这使得文本行切分成为一项艰巨的任务。因此,提出了一种结合文字核心区域和扩展生长的藏文古籍文档图像的行切分方法。首先,根据二值藏文古籍文档图像中连通域的面积和真圆...
藏文古籍文档图像中相邻文本行之间通常存在黏连和重叠的情况,这使得文本行切分成为一项艰巨的任务。因此,提出了一种结合文字核心区域和扩展生长的藏文古籍文档图像的行切分方法。首先,根据二值藏文古籍文档图像中连通域的面积和真圆度去除非音节点,获得音节点图像。其次,通过水平投影音节点图像和垂直投影二值原图,得到文本行基线所处的范围和文本行数,生成文字核心区域;通过像素值的或运算将文字核心区域和二值原图结合,得到伪文本连通区域。最后,基于广度优先搜索算法将文字核心区域扩展为伪文本连通区域,获得伪文本行连通区域,通过去掉其中的非文字区域来获得伪文本行,利用有效的断裂笔画行归属方法获得最终的文本行。实验结果表明,所提方法取得了较好的文本行切分结果,有效解决了文本行之间的重叠、部分行黏连以及笔画断裂等藏文古籍文本行切分的问题。
展开更多
关键词
图像处理
藏文古籍文档图像
文本
行
切分
文字核心区域
扩展生长
原文传递
基于多重规则和路径评价的在线中英文手写识别方法
被引量:
1
11
作者
付鹏斌
刘鹏辉
+1 位作者
杨惠荣
董澳静
《计算机工程》
CAS
CSCD
北大核心
2022年第3期253-262,共10页
手写文本识别方法主要应用于文本输入技术,对人机交互领域的发展起关键作用。针对多数在线输入法无法识别中英文混合手写识别的问题,提出一种在线中英文混合手写文本识别方法。通过对文本笔画进行基于水平相对位置、垂直重叠率、面积重...
手写文本识别方法主要应用于文本输入技术,对人机交互领域的发展起关键作用。针对多数在线输入法无法识别中英文混合手写识别的问题,提出一种在线中英文混合手写文本识别方法。通过对文本笔画进行基于水平相对位置、垂直重叠率、面积重叠率规则的整合以及连笔切分,得到一系列字符片段,同时利用笔画个数、宽高比、中心偏离、平滑度等几何特征和识别置信度,对字符片段进行中英文分类。在此基础上,根据分类结果并结合自然语言模型的路径评价及动态规划搜索算法,分别对候选的中、英文字符片段进行合并处理,得到待识别的中、英文字符序列,并将其分别送入卷积神经网络的中、英文识别模型中,得到手写文本识别结果。实验结果表明,在线手写中英文混合文本识别正确率达93.67%,不仅能切分在线手写中文文本行,而且对包含字符连笔的在线手写中英文文本行也有较好的切分效果。
展开更多
关键词
在线手写识别
中英文混合手写
中英文分类
文本
行
切分
路径评价
下载PDF
职称材料
面向临床决策的电子病历文本潜在语义分析
被引量:
6
12
作者
李国垒
陈先来
+1 位作者
夏冬
杨荣
《现代图书情报技术》
CSSCI
2016年第3期50-57,共8页
【目的】通过对电子病历中重要文本进行语义分析,提取辅助临床治疗方案选择的决策知识,实现电子病历的临床决策支持功能。【方法】使用词典和统计相结合的分词算法,对训练样本中出院记录文本进行分词处理,从中提取临床术语及治疗方案,...
【目的】通过对电子病历中重要文本进行语义分析,提取辅助临床治疗方案选择的决策知识,实现电子病历的临床决策支持功能。【方法】使用词典和统计相结合的分词算法,对训练样本中出院记录文本进行分词处理,从中提取临床术语及治疗方案,并对其进行潜在语义分析,找出临床术语与治疗方案之间的潜在语义联系,建立胃癌治疗方案辅助选择的潜在语义模型。【结果】利用测试样本对语义模型进行测试,在三维语义空间内,发现1 000份测试样本中有605份可以从临床症状的描述准确地推算出其所对应的治疗方案,正确率为60.5%。【局限】仅以出院记录文本为研究对象,没有对其他病历文本进行分词处理。【结论】潜在语义分析方法能够有效地处理临床文本,辅助医生的临床决策,对于电子病历的开发应用具有重要意义。
展开更多
关键词
电子病历
中文
文本切分
潜在语义分析
胃癌
临床决策支持
治疗方案选择
原文传递
题名
文本切分知识获取及其应用
被引量:
9
1
作者
钱揖丽
郑家恒
机构
山西大学计算机科学系
出处
《计算机工程与应用》
CSCD
北大核心
2003年第2期63-64,100,共3页
基金
国家863高技术研究发展计划项目资助(编号:2001AA114031)
文摘
文章描述了一种从熟语料中自动获取文本切分知识的机器学习的方法。该方法从已切分标注加工的熟语料中自动获取错误的文本切分形式及其相应的上下文信息,以及正确的切分形式,形成知识库,并将获取的知识再应用到新语料的加工过程,从而进一步提高机器切分的正确率;同时,采用滚动式的方法,建造具有较高加工质量的大规模语料库。
关键词
文本切分
知识获取
语料库
中文信息处理
机器学习
知识库
Keywords
Chinese word segmentation,KA,Corpus,Qua lity ensuring
分类号
TP391.12 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种手写汉字文本切分的协动计算方法设计
2
作者
周昌乐
赵巍
机构
杭州大学计算机科学系
北京大学视觉与听觉国家实验室
出处
《计算机应用与软件》
CSCD
1999年第1期30-33,F003,共5页
文摘
本文针对信封地址的识别,设计了一种手写汉字文本切分的协动计算方法。由于考虑了汉字及其左右部件搭配的语义信息,从而取得了较高的正确切分率。在1000份样本信封文本中,无连字时为100%,有连字时也有95%。
关键词
手写汉字识别
文本切分
协动算法
汉字信息处理
Keywords
HOCR, text cutting, coaction computadon.
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
古琴减字谱图像的文本切分与提取
被引量:
1
3
作者
潘知枭
周昌乐
机构
厦门大学智能科学与技术系
出处
《心智与计算》
2007年第2期281-290,共10页
文摘
古琴打谱是一项专业性很强又费时费力的工作,如何利用先进的人工智能技术来对古琴谱中的谱字进行自动识别解读,哪怕是辅助性的,对于古琴打谱事业的发展无疑会起到重要的促进作用,从可以间接地为保护与弘扬古琴文化作贡献。本文通过研究古琴减字谱这种特殊文本的特点,提出了不同于普通OCR光学识别软件的文本切分方法,内容涉及纸质古琴谱原始扫描图的图像预处理,古琴混合谱中简字谱的行切分与提取,单行简字谱中的谱字切分与提取等算法及其实现。这样就为实现古琴谱进一步的释读提供一种前期处理方法。由于古琴谱字的特殊性,以及所提出方法的通用性,该方法对于丰富汉字文本的切分方法也有着一定的学术意义。
关键词
古琴打谱
减字谱
图像处理
文本切分
Keywords
Transcription of Guqin Jianzipu
Jianzipu
Image processing
Text Segmentation
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
原文传递
题名
文本行字符基线的精确测定算法
被引量:
2
4
作者
卢达
浦炜
谢铭培
机构
常熟高等专科学校
上海复旦大学计算机科学系
出处
《小型微型计算机系统》
EI
CSCD
北大核心
2000年第7期726-728,共3页
基金
国家自然科学基金
江苏省教委留学回国人员科研基金资助
文摘
本文给出了精确测定文本行字符基线的算法 ,讨论了基线检测的容差 .该算法也可用于手写字符的分析 .实验结果表明 ,我们的基线检测算法对不同大小的字符有满意的处理结果 .
关键词
字符识别
文本
行
切分
基线检测
文本
处理
Keywords
Character recognition
Text line segmentation
Character segmentation
Baseline detection
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
文本行字符基线的精确测定算法
5
作者
卢达
浦炜
机构
常熟高等专科学校
出处
《中山大学学报论丛》
1999年第4期12-16,共5页
基金
江苏省教委留学回国人员科研基金
文摘
给出了精确测定文本行字符基线的算法, 讨论了基线检测的容差。该算法也可用于手写字符的分析。实验结果表明, 该基线检测算法对不同大小的字符都有满意的处理结果。
关键词
字符识别
文本
行
切分
字符
切分
基线检测
分类号
G64 [文化科学—高等教育学]
下载PDF
职称材料
题名
一种新颖的自然语言主题转换精确定位方法
6
作者
陈浪舟
黄泰翼
机构
中国科学院自动化研究所模式识别实验室
出处
《软件学报》
EI
CSCD
北大核心
1999年第12期1246-1252,共7页
基金
国家自然科学基金
文摘
自然语言的主题转换是自然语言理解的一个重要线索 .语言处理通常是针对不同的主题有不同的数据库和处理方法 .因此 ,如何找到文本中的主题转换点是语言处理中的一个重要内容 .该技术在语言理解、文本自动索引以及语言模型的建立等方面都有重要意义 .该文以文本主题转换时的词汇突变为表征 ,提出和定义了反映词汇突变的 4个参数 ,将这 4个参数作为输入 ,利用 BP网作为判决工具 ,建立了一个在不同尺度下文本词汇变化的层次结构模型 ,实现了一种精确的文本主题转换点的定位方法 ,其定位精度在一个句子左右 .
关键词
自然语言处理
文本切分
BP算法
主题转换
Keywords
Natural language processing, text segmenting, text index and filter, BP algorithm.
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
关于书面汉语中词链问题的分析和处理
7
作者
黄祥喜
机构
吉林大学
出处
《情报科学》
1988年第5期28-35,共8页
文摘
本文给出了词链的形式定义,分析了词链产生的原因,对词链的可切分性作了系统研究。
关键词
自动分词
汉字串
语言
文本
文本切分
分解
分词法
成词
汉语语言理解
词典
书面汉语
分类号
G350 [文化科学—情报学]
G25 [文化科学—图书馆学]
下载PDF
职称材料
题名
特定领域中语义校对系统的开发
8
作者
郑逢斌
夏保胜
姜保庆
乔保军
机构
西南交通大学应用数学系
河南大学计算机科学学院
出处
《西南交通大学学报》
EI
CSCD
北大核心
2003年第2期231-234,共4页
基金
国家自然科学基金资助课题(60074014)
文摘
介绍应用于报刊书籍政治性错误校对的一个语义校对软件系统的设计原理和实现过程.本系统先把文本切分成词语,找出敏感词,合并成术语,部分术语通过短语本身或左右片段即可做出正误判断;另一部分术语则用整个句子语义与知识库进行模糊匹配得到它的错误隶属度.
关键词
语义校对软件系统
系统设计
敏感词
术语
文本切分
语法错误
语义错误
Keywords
systems
design
semantic collation
sensitive words
terms
分类号
TP317.2 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
关于汉语语言处理的若干理论思考
9
作者
王建琦
机构
俄亥俄州立大学东亚系
出处
《华中师范大学学报(人文社会科学版)》
CSSCI
北大核心
2003年第3期103-107,共5页
文摘
汉语语法检查是汉语语言处理发展中的瓶颈,涉及汉语语言处理的各个方面,与汉字拼写检查、文本切分、词性标注、汉字输入、汉字编码等问题紧密相联。语义理解是语法检查及自然语言处理的制高点。新的发展趋势是研究者越来越注重语义在语言结构和语言表达上的制约作用,试图用统计大规模语料为手段来攻克难关。这种发展趋势对自然语言处理的冲击不在于研究命题的转移,而在于研究方法和论证手段的量化。在汉语的各种制约关系中,可能有一种超越已知句法语义关系的认知心理语法,它与特定历史时期内人们对物质世界和客观社会文化关系的理解相一致,有可能是自然语言处理的最后一个堡垒。
关键词
汉语语言处理
语义
句法
语法检查
文本切分
计算机处理汉语
Keywords
Chinese language processing
syntax
semantics
grammar checker
text segmentation
computer processing Chinese
分类号
H085.2 [语言文字—语言学]
下载PDF
职称材料
题名
结合文字核心区域和扩展生长的藏文古籍文本行切分
被引量:
2
10
作者
李金成
王筱娟
王维兰
林强
胡鹏飞
机构
西北民族大学中国民族语言文字信息技术教育部重点实验室
西北民族大学数学与计算机科学学院
出处
《激光与光电子学进展》
CSCD
北大核心
2021年第2期105-115,共11页
基金
国家自然科学基金(61772430)
国家民委创新团队计划(〔2018〕98号)
+2 种基金
甘肃省双一流学科建设项目(11080304)
甘肃省高等学校创新能力提升项目(2019B-024)
西北民族大学中央高校基本科研业务费项目(31920180050)。
文摘
藏文古籍文档图像中相邻文本行之间通常存在黏连和重叠的情况,这使得文本行切分成为一项艰巨的任务。因此,提出了一种结合文字核心区域和扩展生长的藏文古籍文档图像的行切分方法。首先,根据二值藏文古籍文档图像中连通域的面积和真圆度去除非音节点,获得音节点图像。其次,通过水平投影音节点图像和垂直投影二值原图,得到文本行基线所处的范围和文本行数,生成文字核心区域;通过像素值的或运算将文字核心区域和二值原图结合,得到伪文本连通区域。最后,基于广度优先搜索算法将文字核心区域扩展为伪文本连通区域,获得伪文本行连通区域,通过去掉其中的非文字区域来获得伪文本行,利用有效的断裂笔画行归属方法获得最终的文本行。实验结果表明,所提方法取得了较好的文本行切分结果,有效解决了文本行之间的重叠、部分行黏连以及笔画断裂等藏文古籍文本行切分的问题。
关键词
图像处理
藏文古籍文档图像
文本
行
切分
文字核心区域
扩展生长
Keywords
image processing
Tibetan historical document image
text line segmentation
text core region
expansion growth
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
基于多重规则和路径评价的在线中英文手写识别方法
被引量:
1
11
作者
付鹏斌
刘鹏辉
杨惠荣
董澳静
机构
北京工业大学信息学部
出处
《计算机工程》
CAS
CSCD
北大核心
2022年第3期253-262,共10页
基金
国家自然科学基金(61772048)
北京市自然科学基金(4153058)。
文摘
手写文本识别方法主要应用于文本输入技术,对人机交互领域的发展起关键作用。针对多数在线输入法无法识别中英文混合手写识别的问题,提出一种在线中英文混合手写文本识别方法。通过对文本笔画进行基于水平相对位置、垂直重叠率、面积重叠率规则的整合以及连笔切分,得到一系列字符片段,同时利用笔画个数、宽高比、中心偏离、平滑度等几何特征和识别置信度,对字符片段进行中英文分类。在此基础上,根据分类结果并结合自然语言模型的路径评价及动态规划搜索算法,分别对候选的中、英文字符片段进行合并处理,得到待识别的中、英文字符序列,并将其分别送入卷积神经网络的中、英文识别模型中,得到手写文本识别结果。实验结果表明,在线手写中英文混合文本识别正确率达93.67%,不仅能切分在线手写中文文本行,而且对包含字符连笔的在线手写中英文文本行也有较好的切分效果。
关键词
在线手写识别
中英文混合手写
中英文分类
文本
行
切分
路径评价
Keywords
online handwriting recognition
mixed Chinese and English handwriting
Chinese and English classification
text line segmentation
path evaluation
分类号
TP391.43 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
面向临床决策的电子病历文本潜在语义分析
被引量:
6
12
作者
李国垒
陈先来
夏冬
杨荣
机构
中南大学信息安全与大数据研究院
医学信息研究湖南省普通高等学校重点实验室(中南大学)
湖南省高等学校医学大数据
中国科学院成都文献情报中心
中南大学湘雅医院
出处
《现代图书情报技术》
CSSCI
2016年第3期50-57,共8页
基金
国家社会科学基金项目"面向临床决策的电子病历潜在语义分析及应用研究"(项目编号:13BTQ052)的研究成果之一
文摘
【目的】通过对电子病历中重要文本进行语义分析,提取辅助临床治疗方案选择的决策知识,实现电子病历的临床决策支持功能。【方法】使用词典和统计相结合的分词算法,对训练样本中出院记录文本进行分词处理,从中提取临床术语及治疗方案,并对其进行潜在语义分析,找出临床术语与治疗方案之间的潜在语义联系,建立胃癌治疗方案辅助选择的潜在语义模型。【结果】利用测试样本对语义模型进行测试,在三维语义空间内,发现1 000份测试样本中有605份可以从临床症状的描述准确地推算出其所对应的治疗方案,正确率为60.5%。【局限】仅以出院记录文本为研究对象,没有对其他病历文本进行分词处理。【结论】潜在语义分析方法能够有效地处理临床文本,辅助医生的临床决策,对于电子病历的开发应用具有重要意义。
关键词
电子病历
中文
文本切分
潜在语义分析
胃癌
临床决策支持
治疗方案选择
Keywords
Electronic medical record Chinese text segmentation Latent Semantic Analysis Gastric cancerClinical decision support Selection of treatment plans
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
文本切分知识获取及其应用
钱揖丽
郑家恒
《计算机工程与应用》
CSCD
北大核心
2003
9
下载PDF
职称材料
2
一种手写汉字文本切分的协动计算方法设计
周昌乐
赵巍
《计算机应用与软件》
CSCD
1999
0
下载PDF
职称材料
3
古琴减字谱图像的文本切分与提取
潘知枭
周昌乐
《心智与计算》
2007
1
原文传递
4
文本行字符基线的精确测定算法
卢达
浦炜
谢铭培
《小型微型计算机系统》
EI
CSCD
北大核心
2000
2
下载PDF
职称材料
5
文本行字符基线的精确测定算法
卢达
浦炜
《中山大学学报论丛》
1999
0
下载PDF
职称材料
6
一种新颖的自然语言主题转换精确定位方法
陈浪舟
黄泰翼
《软件学报》
EI
CSCD
北大核心
1999
0
下载PDF
职称材料
7
关于书面汉语中词链问题的分析和处理
黄祥喜
《情报科学》
1988
0
下载PDF
职称材料
8
特定领域中语义校对系统的开发
郑逢斌
夏保胜
姜保庆
乔保军
《西南交通大学学报》
EI
CSCD
北大核心
2003
0
下载PDF
职称材料
9
关于汉语语言处理的若干理论思考
王建琦
《华中师范大学学报(人文社会科学版)》
CSSCI
北大核心
2003
0
下载PDF
职称材料
10
结合文字核心区域和扩展生长的藏文古籍文本行切分
李金成
王筱娟
王维兰
林强
胡鹏飞
《激光与光电子学进展》
CSCD
北大核心
2021
2
原文传递
11
基于多重规则和路径评价的在线中英文手写识别方法
付鹏斌
刘鹏辉
杨惠荣
董澳静
《计算机工程》
CAS
CSCD
北大核心
2022
1
下载PDF
职称材料
12
面向临床决策的电子病历文本潜在语义分析
李国垒
陈先来
夏冬
杨荣
《现代图书情报技术》
CSSCI
2016
6
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部