期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
41
篇文章
<
1
2
3
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于规则、串频统计和上下文关系的现代汉语分词系统的实现
被引量:
2
1
作者
潘大志
成琥
黄青松
《内蒙古师范大学学报(自然科学汉文版)》
CAS
2008年第1期71-74,共4页
介绍了一种集合了规则、串频统计和中文上下文关系分析的现代汉语分词系统.系统对原文进行三次扫描,首先将原文读入内存,利用规则将原文变成若干个串,构成语段十字链表;然后对每个串中的子串在上下文中重复出现的次数进行统计,把根据统...
介绍了一种集合了规则、串频统计和中文上下文关系分析的现代汉语分词系统.系统对原文进行三次扫描,首先将原文读入内存,利用规则将原文变成若干个串,构成语段十字链表;然后对每个串中的子串在上下文中重复出现的次数进行统计,把根据统计结果分析出的最有可能是词的子串作为临时词;最后利用中文语法的上下文关系并结合词典对原文进行分词处理.系统对未登录词的分词有很好的效果.
展开更多
关键词
中文
分词
未登录词
现代汉语自动分词系统
下载PDF
职称材料
书面汉语自动分词专家系统设计原理
被引量:
30
2
作者
何克抗
徐辉
孙波
《中文信息学报》
CSCD
1991年第2期1-14,28,共15页
本文深入地分析了歧义切分字段产生的根源和性质,把歧义字段从性质上划分为四类,并给出了消除每一类歧义切分字段的有效方法。在对歧义字段进行统计分析的基础上提出了切分精度的“四级指标体系”,井论证了专家系统方法是实现自动分词...
本文深入地分析了歧义切分字段产生的根源和性质,把歧义字段从性质上划分为四类,并给出了消除每一类歧义切分字段的有效方法。在对歧义字段进行统计分析的基础上提出了切分精度的“四级指标体系”,井论证了专家系统方法是实现自动分词系统的最佳方案。
展开更多
关键词
汉语
自动
分词
分词
系统
歧义现象
系统
设计原理
字串
语义问题
分词
方法
语法分析
自然语言理解
句子意义
下载PDF
职称材料
书面汉语自动分词专家系统的实现
被引量:
12
3
作者
徐辉
何克抗
孙波
《中文信息学报》
CSCD
1991年第3期38-47,共10页
本文介绍了书面汉语自动分词专家系统的实现方法,着重分析了该专家系统中知识库的组织与实现,以及所用的推理机制与自动分词过程。最后给出了实验结果,该结果表明自动分词专家系统的性能极为优异(其切分精度远远高于一般的自动分词系统)。
关键词
书面
汉语
自动
分词
专家
系统
下载PDF
职称材料
现代汉语自动分词评测技术研究
被引量:
15
4
作者
刘开瑛
《语言文字应用》
CSSCI
北大核心
1997年第1期103-108,共6页
对现代汉语自动分词软件评测技术提出了理论依据和实用算法。提出了分词软件的质量评价原则;评测语料库、歧义切分、人名、地名等各项评测内容的选择依据;《分词规范》
关键词
汉语
自动
分词
现代
汉语
计算语言学
歧义切分
语料库
正确率
分词
单位
自动
辨识
软件质量
中国地名
下载PDF
职称材料
从自动分词角度看先秦与现代汉语词汇区别
被引量:
1
5
作者
徐紫云
徐雪松
《华东交通大学学报》
2009年第6期101-104,共4页
自动分词是古今汉语信息化所面临的共同课题。但古今汉语存在较大区别,现代汉语分词方法难以直接应用于古代汉语分词。为更好地借鉴现代汉语分词方法,探索符合先秦汉语的分词方法,从语言开放度、语言发展的表现及阶段、复音词的分布及...
自动分词是古今汉语信息化所面临的共同课题。但古今汉语存在较大区别,现代汉语分词方法难以直接应用于古代汉语分词。为更好地借鉴现代汉语分词方法,探索符合先秦汉语的分词方法,从语言开放度、语言发展的表现及阶段、复音词的分布及构成、高频词的分布四个方面对先秦汉语与现代汉语的词汇进行了比较。发现先秦汉语既有区别于现代汉语的分词难点,又有独特的分词优势。
展开更多
关键词
自动
分词
先秦
汉语
现代
汉语
词汇
比较
下载PDF
职称材料
汉语自动分词系统的评价
被引量:
1
6
作者
王彩荣
李晓毅
黄玉基
《微处理机》
2003年第5期28-30,共3页
汉语自动分词是中文信息处理中最基本的工作。近年来 ,已有多种自动分词软件问世 ,但尚无评价此类软件的标准、模型和方法。本文针对自动分词软件的特点 ,提出了自动分词软件的评价准则 ,并给出了定性和定量的度量方法。
关键词
中文信息处理
汉语
自动
分词
系统
自然语言理解
评价
下载PDF
职称材料
神经网络专家系统集成式汉语自动分词技术
被引量:
2
7
作者
尹锋
林亚平
《软件世界》
1996年第12期89-93,共5页
一、神经网络专家系统分词方法的基本构想 神经网络专家系统(NNES)是以人工神经网络为核心建造的一种集成式智能系统,它与传统的人工智能的关系不是简单取代而是互为补充辨证统一的关系,它不仅可以实现专家系统的基本功能,模仿人类专家...
一、神经网络专家系统分词方法的基本构想 神经网络专家系统(NNES)是以人工神经网络为核心建造的一种集成式智能系统,它与传统的人工智能的关系不是简单取代而是互为补充辨证统一的关系,它不仅可以实现专家系统的基本功能,模仿人类专家的逻辑思维方式进行推理决策和问题求解;还具有学习能力、自适应能力、并行推理和联想记忆能力。 一个神经网络专家系统可以定义为一个四元组 NNES=(KB,NN,EX,SM)
展开更多
关键词
汉语
自动
分词
中文信息处理
专家
系统
神经网络
下载PDF
职称材料
书面汉语自动分词专家系统
8
作者
何克抗
徐辉
孙波
《高技术通讯》
EI
CAS
CSCD
1991年第6期16-20,共5页
关键词
专家
系统
汉语
自动
分词
下载PDF
职称材料
汉语自动分词系统设计
9
作者
马东坡
《黑龙江科技信息》
2004年第10期39-39,共1页
介绍了应用高级程序没计语言标准 C++,对应用于中文搜索引擎的汉语自动分词系统设计方法进行了论述。
关键词
汉语
自动
分词
系统
C++
中文搜索引擎
语言标准
系统
设计方法
程序
对应
下载PDF
职称材料
基于无指导学习策略的无词表条件下的汉语自动分词
被引量:
37
10
作者
孙茂松
肖明
邹嘉彦
《计算机学报》
EI
CSCD
北大核心
2004年第6期736-742,共7页
探讨了基于无指导学习策略和无词表条件下的汉语自动分词方法 ,以期对研制开放环境下健壮的分词系统有所裨益 .全部分词知识源自从生语料库中自动获得的汉字Bigram .在字间互信息和t 测试差的基础上 ,提出了一种将两者线性叠加的新的统...
探讨了基于无指导学习策略和无词表条件下的汉语自动分词方法 ,以期对研制开放环境下健壮的分词系统有所裨益 .全部分词知识源自从生语料库中自动获得的汉字Bigram .在字间互信息和t 测试差的基础上 ,提出了一种将两者线性叠加的新的统计量md ,并引入了峰和谷的概念 ,进而设计了相应的分词算法 .大规模开放测试结果显示 ,该算法关于字间位置的分词正确率为 85 .88% ,较单独使用互信息或t 测试差分别提高了 2 4 7%和 5 6 6 % .
展开更多
关键词
无指导学习
汉语
自动
分词
汉字Bigram
互信息
t-测试差
线性叠加
统计量
中文信息处理应用
系统
下载PDF
职称材料
汉语自动分词研究中的苦干理论问题
被引量:
45
11
作者
孙茂松
邹嘉彦
《语言文字应用》
CSSCI
1995年第4期40-46,共7页
讨论了汉语自动分词研究中的若干理论问题:分词词表、歧义切分字段、生词以及全局和局部统计量,并提出了相应的处理策略。实用型汉语自动分词系统(对任意开放文本,切他精确率基本稳定在99%左右)的实现已为期不远。
关键词
汉语
自动
分词
分词
单位
语料库
歧义切分
分词
词表
《规范》
局部统计量
分词
系统
解空间
精确率
下载PDF
职称材料
图书馆检索系统及其汉语自动分词的实现
12
作者
王磊
杨学良
《计算机与通信》
1999年第9期 60-63,共4页
本文介绍了国内上图书文献检索系统的发展及其在我国的现状和所存在的问题,对汉语自动分词问题进行了阐述,并提出了一种综合的分词方法。
关键词
图书馆
情报检索
系统
汉语
自动
分词
计算机
下载PDF
职称材料
书面汉语自动分词的“生成——测试”方法
被引量:
11
13
作者
黄祥喜
《中文信息学报》
CSCD
1989年第4期42-49,共8页
词链现象是书面汉语自动分词的困难所在,本文针对词链现象的复杂性,提出了一种“生成——测试”分词法。这种方法以知识为基础,它通过词典的动态化、分词知识的分布化、分词系统和句法语义系统的协同工作等手段实现了词链的有效切分和...
词链现象是书面汉语自动分词的困难所在,本文针对词链现象的复杂性,提出了一种“生成——测试”分词法。这种方法以知识为基础,它通过词典的动态化、分词知识的分布化、分词系统和句法语义系统的协同工作等手段实现了词链的有效切分和汉语句子切分与理解(生成格结构)的并行。“生成——测试”方法反映了人的分词和理解过程。
展开更多
关键词
汉语
自动
分词
分词
系统
字串
汉语
句子
协同工作
句法语义
格结构
分词
方法
语义分析
扩充转移网络
下载PDF
职称材料
“信息处理用现代汉语分词规范”的若干问题探讨
被引量:
6
14
作者
揭春雨
《中文信息学报》
CSCD
1989年第4期33-41,共9页
汉语信息处理技术的重点已由单个字符处理过渡到词处理和句子处理,过渡的基点是分词,一个统一的分词规范国家标准对于众多信息处理系统之间的兼容性具有不言而喻的重要意义。目前,“信息处理用现代汉语分词规范(国家标准)”正在制订和...
汉语信息处理技术的重点已由单个字符处理过渡到词处理和句子处理,过渡的基点是分词,一个统一的分词规范国家标准对于众多信息处理系统之间的兼容性具有不言而喻的重要意义。目前,“信息处理用现代汉语分词规范(国家标准)”正在制订和审定。本文讨论了几个与此相关的问题,分析了汉语信息处理用词的特点,对“分词规范”和汉语拼音正词法作了比较,对“分词规范”和民族语用心理习惯的关系也进行了探讨,在此基础上,作者对“分词规范”提出了一些个人意见和建议。
展开更多
关键词
汉语
分词
分词
单位
信息处理技术
自动
分词
汉语
信息处理
信息处理
系统
语言信息处理
心理习惯
汉语
拼音正词法
语义理解
下载PDF
职称材料
汉语自动分词研究的现状与新思维
被引量:
18
15
作者
尹锋
《现代图书情报技术》
CSSCI
北大核心
1998年第4期22-26,共5页
汉语自动分词是机器翻译、文献标引、智能检索、自然语言理解与处理的基础。本文对十余年来的汉语自动分词的研究方法与成果进行了综合论述,分析了现有分词方法的特点。
关键词
汉语
自动
分词
神经网络
专家
系统
中文信息处理
下载PDF
职称材料
汉语自动分词和自动标引方法研究
被引量:
4
16
作者
苏武华
《农业图书情报学刊》
2004年第7期103-105,共3页
中文自动标引一直是学界研究的热点。本文主要研究了两个方面 :自动分词方法和自动标引方法。通过全面的比较研究 ,本文认为自动分词方法可以分为五个类型 ,自动标引的方法分为七种。
关键词
汉语
分词
自动
分词
自动
标引
字符串匹配
专家
系统
词典标引法
词频统计
语义分析
下载PDF
职称材料
一种基于概率模型的分词系统
被引量:
16
17
作者
李家福
张亚非
《系统仿真学报》
CAS
CSCD
2002年第5期544-546,550,共4页
汉语自动分词是中文信息处理中的基础课题。本文首先对汉语分词的基本概念与应用,以及汉语分词的基本方法进行了概述。接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可夫模型,并重点剖析了EM(Expectatio...
汉语自动分词是中文信息处理中的基础课题。本文首先对汉语分词的基本概念与应用,以及汉语分词的基本方法进行了概述。接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可夫模型,并重点剖析了EM(Expectation- Maximization)算法,最后给出了一个基于本模型的汉语文本处理仿真系统。
展开更多
关键词
概率模型
分词
系统
EM算法
语料库
系统
仿真
汉语
自动
分词
中文信息处理
下载PDF
职称材料
自动分词中未登录词问题的一揽子解决方案
被引量:
26
18
作者
陈小荷
《语言文字应用》
CSSCI
北大核心
1999年第3期103-109,共7页
确定未登录词边界是汉语自动分析中特有的一个问题,未登录词的种类和数量之多,是处理大规模真实文本的严重障碍。本文分析了现有的解决未登录词问题的各种方案,提出两趟分词、在“分词碎片”中计算单字成词概率和未登录词概率的一揽...
确定未登录词边界是汉语自动分析中特有的一个问题,未登录词的种类和数量之多,是处理大规模真实文本的严重障碍。本文分析了现有的解决未登录词问题的各种方案,提出两趟分词、在“分词碎片”中计算单字成词概率和未登录词概率的一揽子解决方案,并报告一个初步的、令人鼓舞的开放测试结果。
展开更多
关键词
未登录词
汉语
自动
分词
单字词
共现概率
计算语言学
语料库
一揽子解决方案
《
现代
汉语
词典》
词性标注
最大匹配法
下载PDF
职称材料
汉语分词技术综述
被引量:
26
19
作者
龚汉明
周长胜
《北京机械工业学院学报》
2004年第3期52-55,61,共5页
分词是中文信息处理的基础,在汉语文本分类、文献标引、智能检索、自然语言理解与处理等应用中,首先都要对中文文本进行分词处理。从分词的基本理论出发,对近年来的汉语分词的研究方法与成果进行了综合论述,分析了现有分词方法的特点,...
分词是中文信息处理的基础,在汉语文本分类、文献标引、智能检索、自然语言理解与处理等应用中,首先都要对中文文本进行分词处理。从分词的基本理论出发,对近年来的汉语分词的研究方法与成果进行了综合论述,分析了现有分词方法的特点,提出了把神经网络和专家系统结合起来建立集成式汉语自动分词系统的构想。
展开更多
关键词
汉语
分词
中文文本
分词
方法
汉语
自动
分词
系统
汉语
文本
自然语言理解
技术综述
文献标引
智能检索
成果
下载PDF
职称材料
构建Web自动答疑系统的关键技术分析
20
作者
贺礼智
曹丽君
尹洪武
《华北科技学院学报》
2003年第1期59-60,共2页
应用统计学方法对汉语分词过程及词表法组织全文搜索过程进行了详细分析,对Web服务整合的内容及实现方法进行了具体剖析。
关键词
汉语
分词
全文搜索
统计学方法
词表法
网上教学
Web
自动
答疑
系统
下载PDF
职称材料
题名
基于规则、串频统计和上下文关系的现代汉语分词系统的实现
被引量:
2
1
作者
潘大志
成琥
黄青松
机构
西华师范大学数学与信息学院
昆明理工大学信息与自动化学院
出处
《内蒙古师范大学学报(自然科学汉文版)》
CAS
2008年第1期71-74,共4页
基金
四川省教育厅重点科研基金资助项目(2003A105)
云南省计算机技术应用重点实验室开放基金资助项目
文摘
介绍了一种集合了规则、串频统计和中文上下文关系分析的现代汉语分词系统.系统对原文进行三次扫描,首先将原文读入内存,利用规则将原文变成若干个串,构成语段十字链表;然后对每个串中的子串在上下文中重复出现的次数进行统计,把根据统计结果分析出的最有可能是词的子串作为临时词;最后利用中文语法的上下文关系并结合词典对原文进行分词处理.系统对未登录词的分词有很好的效果.
关键词
中文
分词
未登录词
现代汉语自动分词系统
Keywords
Chinese segmentation
unknown word
modern Chinese character segmentation system
分类号
TP391.2 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
书面汉语自动分词专家系统设计原理
被引量:
30
2
作者
何克抗
徐辉
孙波
机构
北京师范大学现代教育技术研究所
出处
《中文信息学报》
CSCD
1991年第2期1-14,28,共15页
基金
国家自然科学基金
文摘
本文深入地分析了歧义切分字段产生的根源和性质,把歧义字段从性质上划分为四类,并给出了消除每一类歧义切分字段的有效方法。在对歧义字段进行统计分析的基础上提出了切分精度的“四级指标体系”,井论证了专家系统方法是实现自动分词系统的最佳方案。
关键词
汉语
自动
分词
分词
系统
歧义现象
系统
设计原理
字串
语义问题
分词
方法
语法分析
自然语言理解
句子意义
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
书面汉语自动分词专家系统的实现
被引量:
12
3
作者
徐辉
何克抗
孙波
机构
北京师范大学现代教育技术研究所
出处
《中文信息学报》
CSCD
1991年第3期38-47,共10页
基金
国家自然科学基金
文摘
本文介绍了书面汉语自动分词专家系统的实现方法,着重分析了该专家系统中知识库的组织与实现,以及所用的推理机制与自动分词过程。最后给出了实验结果,该结果表明自动分词专家系统的性能极为优异(其切分精度远远高于一般的自动分词系统)。
关键词
书面
汉语
自动
分词
专家
系统
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
现代汉语自动分词评测技术研究
被引量:
15
4
作者
刘开瑛
机构
山西大学计算机科学系
出处
《语言文字应用》
CSSCI
北大核心
1997年第1期103-108,共6页
基金
"九五"国家社会科学重点基金
国家自然科学基金
文摘
对现代汉语自动分词软件评测技术提出了理论依据和实用算法。提出了分词软件的质量评价原则;评测语料库、歧义切分、人名、地名等各项评测内容的选择依据;《分词规范》
关键词
汉语
自动
分词
现代
汉语
计算语言学
歧义切分
语料库
正确率
分词
单位
自动
辨识
软件质量
中国地名
分类号
G202 [文化科学—传播学]
下载PDF
职称材料
题名
从自动分词角度看先秦与现代汉语词汇区别
被引量:
1
5
作者
徐紫云
徐雪松
机构
华东交通大学人文社会科学学院
华东交通大学电气与电子工程学院
出处
《华东交通大学学报》
2009年第6期101-104,共4页
基金
江西省社会科学规划基金项目(06WX29)
华东交通大学校立科研基金项目(06SKRW03)
文摘
自动分词是古今汉语信息化所面临的共同课题。但古今汉语存在较大区别,现代汉语分词方法难以直接应用于古代汉语分词。为更好地借鉴现代汉语分词方法,探索符合先秦汉语的分词方法,从语言开放度、语言发展的表现及阶段、复音词的分布及构成、高频词的分布四个方面对先秦汉语与现代汉语的词汇进行了比较。发现先秦汉语既有区别于现代汉语的分词难点,又有独特的分词优势。
关键词
自动
分词
先秦
汉语
现代
汉语
词汇
比较
Keywords
word automatic segmentation
pre-Qin Chinese
contemporary Chinese
words
comparing
分类号
H0-05 [语言文字—语言学]
下载PDF
职称材料
题名
汉语自动分词系统的评价
被引量:
1
6
作者
王彩荣
李晓毅
黄玉基
机构
沈阳师范大学信息技术学院
沈阳师范大学数学系
东北大学信息学院
出处
《微处理机》
2003年第5期28-30,共3页
文摘
汉语自动分词是中文信息处理中最基本的工作。近年来 ,已有多种自动分词软件问世 ,但尚无评价此类软件的标准、模型和方法。本文针对自动分词软件的特点 ,提出了自动分词软件的评价准则 ,并给出了定性和定量的度量方法。
关键词
中文信息处理
汉语
自动
分词
系统
自然语言理解
评价
Keywords
automatic segmentation
evaluating
segment algorithm
match
分类号
TP391.12 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
神经网络专家系统集成式汉语自动分词技术
被引量:
2
7
作者
尹锋
林亚平
机构
湖南省科技信息所
湖南大学计算机系
出处
《软件世界》
1996年第12期89-93,共5页
文摘
一、神经网络专家系统分词方法的基本构想 神经网络专家系统(NNES)是以人工神经网络为核心建造的一种集成式智能系统,它与传统的人工智能的关系不是简单取代而是互为补充辨证统一的关系,它不仅可以实现专家系统的基本功能,模仿人类专家的逻辑思维方式进行推理决策和问题求解;还具有学习能力、自适应能力、并行推理和联想记忆能力。 一个神经网络专家系统可以定义为一个四元组 NNES=(KB,NN,EX,SM)
关键词
汉语
自动
分词
中文信息处理
专家
系统
神经网络
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
书面汉语自动分词专家系统
8
作者
何克抗
徐辉
孙波
机构
北京师范大学
出处
《高技术通讯》
EI
CAS
CSCD
1991年第6期16-20,共5页
关键词
专家
系统
汉语
自动
分词
Keywords
Automatic words segmentation
expert system
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
汉语自动分词系统设计
9
作者
马东坡
机构
大连铁道学院
出处
《黑龙江科技信息》
2004年第10期39-39,共1页
文摘
介绍了应用高级程序没计语言标准 C++,对应用于中文搜索引擎的汉语自动分词系统设计方法进行了论述。
关键词
汉语
自动
分词
系统
C++
中文搜索引擎
语言标准
系统
设计方法
程序
对应
分类号
G219.2 [文化科学—新闻学]
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于无指导学习策略的无词表条件下的汉语自动分词
被引量:
37
10
作者
孙茂松
肖明
邹嘉彦
机构
清华大学智能技术与系统国家重点实验室
香港城市大学语言资讯科学研究中心
出处
《计算机学报》
EI
CSCD
北大核心
2004年第6期736-742,共7页
基金
国家自然科学基金 ( 60 0 83 0 0 5 )资助
文摘
探讨了基于无指导学习策略和无词表条件下的汉语自动分词方法 ,以期对研制开放环境下健壮的分词系统有所裨益 .全部分词知识源自从生语料库中自动获得的汉字Bigram .在字间互信息和t 测试差的基础上 ,提出了一种将两者线性叠加的新的统计量md ,并引入了峰和谷的概念 ,进而设计了相应的分词算法 .大规模开放测试结果显示 ,该算法关于字间位置的分词正确率为 85 .88% ,较单独使用互信息或t 测试差分别提高了 2 4 7%和 5 6 6 % .
关键词
无指导学习
汉语
自动
分词
汉字Bigram
互信息
t-测试差
线性叠加
统计量
中文信息处理应用
系统
Keywords
Algorithms
Computer applications
分类号
TP391.12 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
汉语自动分词研究中的苦干理论问题
被引量:
45
11
作者
孙茂松
邹嘉彦
机构
清华大学计算机科学与技术系
香港城市大学
出处
《语言文字应用》
CSSCI
1995年第4期40-46,共7页
文摘
讨论了汉语自动分词研究中的若干理论问题:分词词表、歧义切分字段、生词以及全局和局部统计量,并提出了相应的处理策略。实用型汉语自动分词系统(对任意开放文本,切他精确率基本稳定在99%左右)的实现已为期不远。
关键词
汉语
自动
分词
分词
单位
语料库
歧义切分
分词
词表
《规范》
局部统计量
分词
系统
解空间
精确率
分类号
H146.2 [语言文字—汉语]
下载PDF
职称材料
题名
图书馆检索系统及其汉语自动分词的实现
12
作者
王磊
杨学良
出处
《计算机与通信》
1999年第9期 60-63,共4页
文摘
本文介绍了国内上图书文献检索系统的发展及其在我国的现状和所存在的问题,对汉语自动分词问题进行了阐述,并提出了一种综合的分词方法。
关键词
图书馆
情报检索
系统
汉语
自动
分词
计算机
分类号
G354.43 [文化科学—情报学]
G254-39
下载PDF
职称材料
题名
书面汉语自动分词的“生成——测试”方法
被引量:
11
13
作者
黄祥喜
机构
吉林大学计算机科学系
出处
《中文信息学报》
CSCD
1989年第4期42-49,共8页
文摘
词链现象是书面汉语自动分词的困难所在,本文针对词链现象的复杂性,提出了一种“生成——测试”分词法。这种方法以知识为基础,它通过词典的动态化、分词知识的分布化、分词系统和句法语义系统的协同工作等手段实现了词链的有效切分和汉语句子切分与理解(生成格结构)的并行。“生成——测试”方法反映了人的分词和理解过程。
关键词
汉语
自动
分词
分词
系统
字串
汉语
句子
协同工作
句法语义
格结构
分词
方法
语义分析
扩充转移网络
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
“信息处理用现代汉语分词规范”的若干问题探讨
被引量:
6
14
作者
揭春雨
机构
语言文字应用研究所
出处
《中文信息学报》
CSCD
1989年第4期33-41,共9页
文摘
汉语信息处理技术的重点已由单个字符处理过渡到词处理和句子处理,过渡的基点是分词,一个统一的分词规范国家标准对于众多信息处理系统之间的兼容性具有不言而喻的重要意义。目前,“信息处理用现代汉语分词规范(国家标准)”正在制订和审定。本文讨论了几个与此相关的问题,分析了汉语信息处理用词的特点,对“分词规范”和汉语拼音正词法作了比较,对“分词规范”和民族语用心理习惯的关系也进行了探讨,在此基础上,作者对“分词规范”提出了一些个人意见和建议。
关键词
汉语
分词
分词
单位
信息处理技术
自动
分词
汉语
信息处理
信息处理
系统
语言信息处理
心理习惯
汉语
拼音正词法
语义理解
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
汉语自动分词研究的现状与新思维
被引量:
18
15
作者
尹锋
机构
湖南省科技信息研究所
出处
《现代图书情报技术》
CSSCI
北大核心
1998年第4期22-26,共5页
文摘
汉语自动分词是机器翻译、文献标引、智能检索、自然语言理解与处理的基础。本文对十余年来的汉语自动分词的研究方法与成果进行了综合论述,分析了现有分词方法的特点。
关键词
汉语
自动
分词
神经网络
专家
系统
中文信息处理
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
汉语自动分词和自动标引方法研究
被引量:
4
16
作者
苏武华
机构
中国科技信息研究所
出处
《农业图书情报学刊》
2004年第7期103-105,共3页
文摘
中文自动标引一直是学界研究的热点。本文主要研究了两个方面 :自动分词方法和自动标引方法。通过全面的比较研究 ,本文认为自动分词方法可以分为五个类型 ,自动标引的方法分为七种。
关键词
汉语
分词
自动
分词
自动
标引
字符串匹配
专家
系统
词典标引法
词频统计
语义分析
Keywords
automatic separation of terms
automatic indexing
分类号
G254 [文化科学—图书馆学]
下载PDF
职称材料
题名
一种基于概率模型的分词系统
被引量:
16
17
作者
李家福
张亚非
机构
解放军理工大学通信工程学院
解放军理工大学理学院
出处
《系统仿真学报》
CAS
CSCD
2002年第5期544-546,550,共4页
基金
国家自然科学基金项目(编号: 69975024)
国家自然科学基金重点项目(编号: 69931040)
文摘
汉语自动分词是中文信息处理中的基础课题。本文首先对汉语分词的基本概念与应用,以及汉语分词的基本方法进行了概述。接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可夫模型,并重点剖析了EM(Expectation- Maximization)算法,最后给出了一个基于本模型的汉语文本处理仿真系统。
关键词
概率模型
分词
系统
EM算法
语料库
系统
仿真
汉语
自动
分词
中文信息处理
Keywords
word segmentation
EM algorithm
corpus
HMM, system simulation
分类号
TP391.12 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
自动分词中未登录词问题的一揽子解决方案
被引量:
26
18
作者
陈小荷
机构
北京语言文化大学
出处
《语言文字应用》
CSSCI
北大核心
1999年第3期103-109,共7页
文摘
确定未登录词边界是汉语自动分析中特有的一个问题,未登录词的种类和数量之多,是处理大规模真实文本的严重障碍。本文分析了现有的解决未登录词问题的各种方案,提出两趟分词、在“分词碎片”中计算单字成词概率和未登录词概率的一揽子解决方案,并报告一个初步的、令人鼓舞的开放测试结果。
关键词
未登录词
汉语
自动
分词
单字词
共现概率
计算语言学
语料库
一揽子解决方案
《
现代
汉语
词典》
词性标注
最大匹配法
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
汉语分词技术综述
被引量:
26
19
作者
龚汉明
周长胜
机构
北京机械工业学院计算机及自动化系
出处
《北京机械工业学院学报》
2004年第3期52-55,61,共5页
文摘
分词是中文信息处理的基础,在汉语文本分类、文献标引、智能检索、自然语言理解与处理等应用中,首先都要对中文文本进行分词处理。从分词的基本理论出发,对近年来的汉语分词的研究方法与成果进行了综合论述,分析了现有分词方法的特点,提出了把神经网络和专家系统结合起来建立集成式汉语自动分词系统的构想。
关键词
汉语
分词
中文文本
分词
方法
汉语
自动
分词
系统
汉语
文本
自然语言理解
技术综述
文献标引
智能检索
成果
Keywords
word segmentation
text classification
artificial neural network
expert system
分类号
TH18 [机械工程—机械制造及自动化]
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
构建Web自动答疑系统的关键技术分析
20
作者
贺礼智
曹丽君
尹洪武
机构
河北职业技术师范学院
出处
《华北科技学院学报》
2003年第1期59-60,共2页
文摘
应用统计学方法对汉语分词过程及词表法组织全文搜索过程进行了详细分析,对Web服务整合的内容及实现方法进行了具体剖析。
关键词
汉语
分词
全文搜索
统计学方法
词表法
网上教学
Web
自动
答疑
系统
分类号
G434 [文化科学—教育技术学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于规则、串频统计和上下文关系的现代汉语分词系统的实现
潘大志
成琥
黄青松
《内蒙古师范大学学报(自然科学汉文版)》
CAS
2008
2
下载PDF
职称材料
2
书面汉语自动分词专家系统设计原理
何克抗
徐辉
孙波
《中文信息学报》
CSCD
1991
30
下载PDF
职称材料
3
书面汉语自动分词专家系统的实现
徐辉
何克抗
孙波
《中文信息学报》
CSCD
1991
12
下载PDF
职称材料
4
现代汉语自动分词评测技术研究
刘开瑛
《语言文字应用》
CSSCI
北大核心
1997
15
下载PDF
职称材料
5
从自动分词角度看先秦与现代汉语词汇区别
徐紫云
徐雪松
《华东交通大学学报》
2009
1
下载PDF
职称材料
6
汉语自动分词系统的评价
王彩荣
李晓毅
黄玉基
《微处理机》
2003
1
下载PDF
职称材料
7
神经网络专家系统集成式汉语自动分词技术
尹锋
林亚平
《软件世界》
1996
2
下载PDF
职称材料
8
书面汉语自动分词专家系统
何克抗
徐辉
孙波
《高技术通讯》
EI
CAS
CSCD
1991
0
下载PDF
职称材料
9
汉语自动分词系统设计
马东坡
《黑龙江科技信息》
2004
0
下载PDF
职称材料
10
基于无指导学习策略的无词表条件下的汉语自动分词
孙茂松
肖明
邹嘉彦
《计算机学报》
EI
CSCD
北大核心
2004
37
下载PDF
职称材料
11
汉语自动分词研究中的苦干理论问题
孙茂松
邹嘉彦
《语言文字应用》
CSSCI
1995
45
下载PDF
职称材料
12
图书馆检索系统及其汉语自动分词的实现
王磊
杨学良
《计算机与通信》
1999
0
下载PDF
职称材料
13
书面汉语自动分词的“生成——测试”方法
黄祥喜
《中文信息学报》
CSCD
1989
11
下载PDF
职称材料
14
“信息处理用现代汉语分词规范”的若干问题探讨
揭春雨
《中文信息学报》
CSCD
1989
6
下载PDF
职称材料
15
汉语自动分词研究的现状与新思维
尹锋
《现代图书情报技术》
CSSCI
北大核心
1998
18
下载PDF
职称材料
16
汉语自动分词和自动标引方法研究
苏武华
《农业图书情报学刊》
2004
4
下载PDF
职称材料
17
一种基于概率模型的分词系统
李家福
张亚非
《系统仿真学报》
CAS
CSCD
2002
16
下载PDF
职称材料
18
自动分词中未登录词问题的一揽子解决方案
陈小荷
《语言文字应用》
CSSCI
北大核心
1999
26
下载PDF
职称材料
19
汉语分词技术综述
龚汉明
周长胜
《北京机械工业学院学报》
2004
26
下载PDF
职称材料
20
构建Web自动答疑系统的关键技术分析
贺礼智
曹丽君
尹洪武
《华北科技学院学报》
2003
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
3
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部