期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
脱机无约束手写体中文文本行的字符切分方法 被引量:2
1
作者 李南希 金连文 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2010年第10期74-78,共5页
提出了一种新的能对脱机无约束手写体中文文本行中的字符进行切分的方法.首先采用预切分算法产生一系列曲线候选切分路径;然后使用两个修正的二次判决分析函数对单字符的识别信息、文本行的几何信息进行融合,得到切分假设的置信度;最后... 提出了一种新的能对脱机无约束手写体中文文本行中的字符进行切分的方法.首先采用预切分算法产生一系列曲线候选切分路径;然后使用两个修正的二次判决分析函数对单字符的识别信息、文本行的几何信息进行融合,得到切分假设的置信度;最后利用动态规划算法搜索出最佳切分假设.使用哈尔滨工业大学多人手写真实文本数据库中的383个文本行对文中方法进行实验,在无语言模型的情况下,切分准确率可以达到89.70%,从而验证了所提字符切分方法的有效性. 展开更多
关键词 字符识别 中文字符切分 切分 置信度 动态规划
下载PDF
基于XML的网络课件环境中搜索引擎的实现 被引量:4
2
作者 李毅 杨善林 +1 位作者 刘业政 顾铁军 《武汉理工大学学报(信息与管理工程版)》 CAS 2003年第3期105-108,共4页
在网络课件中加入信息搜索功能有利于方便学习者快速定位欲学习内容。首先介绍了基于Java的英文全文索引引擎Lucene,然后分析了现有的中文切分技术,最后给出了针对课件文件特点改进的中英文搜索引擎的实现方法。
关键词 网络课件环境 搜索引擎 LUCENE 中文切分 XML JAVA
下载PDF
中文科技文献切分的领域适应技术研究
3
作者 石崇德 乔晓东 +1 位作者 王惠临 屈鹏 《图书情报工作》 CSSCI 北大核心 2014年第19期13-18,共6页
以生物医学文献为实例对象,研究科技文献切分中的领域适应技术,通过以词典特征、领域词汇特征、子串标注和使用词典切分的粗切分语料作为训练语料等方法,实现基于序列标注的中文切分方法由新闻领域到科技领域的适应,并取得了较好的效果... 以生物医学文献为实例对象,研究科技文献切分中的领域适应技术,通过以词典特征、领域词汇特征、子串标注和使用词典切分的粗切分语料作为训练语料等方法,实现基于序列标注的中文切分方法由新闻领域到科技领域的适应,并取得了较好的效果。研究表明,在科技文献切分中,充分利用领域知识获取领域相关特征,对于提高科技文献切分的准确率具有重要的作用。 展开更多
关键词 中文切分 领域适应 科技文献信息处理
原文传递
Feature study for improving Chinese overlapping ambiguity resolution based on SVM 被引量:1
4
作者 熊英 朱杰 《Journal of Southeast University(English Edition)》 EI CAS 2007年第2期179-184,共6页
In order to improve Chinese overlapping ambiguity resolution based on a support vector machine, statistical features are studied for representing the feature vectors. First, four statistical parameters-mutual informat... In order to improve Chinese overlapping ambiguity resolution based on a support vector machine, statistical features are studied for representing the feature vectors. First, four statistical parameters-mutual information, accessor variety, two-character word frequency and single-character word frequency are used to describe the feature vectors respectively. Then other parameters are tried to add as complementary features to the parameters which obtain the best results for further improving the classification performance. Experimental results show that features represented by mutual information, single-character word frequency and accessor variety can obtain an optimum result of 94. 39%. Compared with a commonly used word probability model, the accuracy has been improved by 6. 62%. Such comparative results confirm that the classification performance can be improved by feature selection and representation. 展开更多
关键词 support vector machine Chinese overlapping ambiguity Chinese word segmentation word probability model
下载PDF
面向临床决策的电子病历文本潜在语义分析 被引量:6
5
作者 李国垒 陈先来 +1 位作者 夏冬 杨荣 《现代图书情报技术》 CSSCI 2016年第3期50-57,共8页
【目的】通过对电子病历中重要文本进行语义分析,提取辅助临床治疗方案选择的决策知识,实现电子病历的临床决策支持功能。【方法】使用词典和统计相结合的分词算法,对训练样本中出院记录文本进行分词处理,从中提取临床术语及治疗方案,... 【目的】通过对电子病历中重要文本进行语义分析,提取辅助临床治疗方案选择的决策知识,实现电子病历的临床决策支持功能。【方法】使用词典和统计相结合的分词算法,对训练样本中出院记录文本进行分词处理,从中提取临床术语及治疗方案,并对其进行潜在语义分析,找出临床术语与治疗方案之间的潜在语义联系,建立胃癌治疗方案辅助选择的潜在语义模型。【结果】利用测试样本对语义模型进行测试,在三维语义空间内,发现1 000份测试样本中有605份可以从临床症状的描述准确地推算出其所对应的治疗方案,正确率为60.5%。【局限】仅以出院记录文本为研究对象,没有对其他病历文本进行分词处理。【结论】潜在语义分析方法能够有效地处理临床文本,辅助医生的临床决策,对于电子病历的开发应用具有重要意义。 展开更多
关键词 电子病历 中文文本切分 潜在语义分析 胃癌 临床决策支持 治疗方案选择
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部