期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
汉语自动分词系统的评价 被引量:1
1
作者 王彩荣 李晓毅 黄玉基 《微处理机》 2003年第5期28-30,共3页
汉语自动分词是中文信息处理中最基本的工作。近年来 ,已有多种自动分词软件问世 ,但尚无评价此类软件的标准、模型和方法。本文针对自动分词软件的特点 ,提出了自动分词软件的评价准则 ,并给出了定性和定量的度量方法。
关键词 中文信息处理 汉语自动分词系统 自然语言理解 评价
下载PDF
汉语自动分词系统设计
2
作者 马东坡 《黑龙江科技信息》 2004年第10期39-39,共1页
介绍了应用高级程序没计语言标准 C++,对应用于中文搜索引擎的汉语自动分词系统设计方法进行了论述。
关键词 汉语自动分词系统 C++ 中文搜索引擎 语言标准 系统设计方法 程序 对应
下载PDF
基于C程序实现汉语自动分词系统
3
作者 郭俊凤 岳金萍 王开铸 《信息与电脑(理论版)》 2012年第9期119-120,共2页
统计汉字文本文件的字、词、句的数目,是汉字文本统计的基本课题之一,本文基于C程序重点实现汉语自动分词系统。
关键词 汉语自动分词系统 正向最大匹配 逆向最大匹配
原文传递
基于规则、串频统计和上下文关系的现代汉语分词系统的实现 被引量:2
4
作者 潘大志 成琥 黄青松 《内蒙古师范大学学报(自然科学汉文版)》 CAS 2008年第1期71-74,共4页
介绍了一种集合了规则、串频统计和中文上下文关系分析的现代汉语分词系统.系统对原文进行三次扫描,首先将原文读入内存,利用规则将原文变成若干个串,构成语段十字链表;然后对每个串中的子串在上下文中重复出现的次数进行统计,把根据统... 介绍了一种集合了规则、串频统计和中文上下文关系分析的现代汉语分词系统.系统对原文进行三次扫描,首先将原文读入内存,利用规则将原文变成若干个串,构成语段十字链表;然后对每个串中的子串在上下文中重复出现的次数进行统计,把根据统计结果分析出的最有可能是词的子串作为临时词;最后利用中文语法的上下文关系并结合词典对原文进行分词处理.系统对未登录词的分词有很好的效果. 展开更多
关键词 中文分词 未登录词 现代汉语自动分词系统
下载PDF
汉语分词技术综述 被引量:26
5
作者 龚汉明 周长胜 《北京机械工业学院学报》 2004年第3期52-55,61,共5页
分词是中文信息处理的基础,在汉语文本分类、文献标引、智能检索、自然语言理解与处理等应用中,首先都要对中文文本进行分词处理。从分词的基本理论出发,对近年来的汉语分词的研究方法与成果进行了综合论述,分析了现有分词方法的特点,... 分词是中文信息处理的基础,在汉语文本分类、文献标引、智能检索、自然语言理解与处理等应用中,首先都要对中文文本进行分词处理。从分词的基本理论出发,对近年来的汉语分词的研究方法与成果进行了综合论述,分析了现有分词方法的特点,提出了把神经网络和专家系统结合起来建立集成式汉语自动分词系统的构想。 展开更多
关键词 汉语分词 中文文本 分词方法 汉语自动分词系统 汉语文本 自然语言理解 技术综述 文献标引 智能检索 成果
下载PDF
中文文本中公司名简称的识别 被引量:3
6
作者 张占英 王中立 《许昌学院学报》 CAS 2003年第2期99-101,共3页
对中文文本的公司名简称的识别提出了一种有效的识别方法 ,即在公司名第一次出现时要充分利用其给出的定义信息 ,作为以后识别此公司名的简称的基础 .经封闭测试 ,系统对公司名简称的识别准确率为98 2 % ,召回率为 93 4% .
关键词 文字识别 汉语自动分词系统 中文文本 公司名简称 歧义处理 识别规则
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部