期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
一种改进的MM分词方法的算法设计 被引量:28
1
作者 骆正清 陈增武 胡上序 《中文信息学报》 CSCD 1996年第3期30-36,共7页
本文提出了一种改进的最大匹配(MM)的自动分词方法,并给出了相应的算法及词典设计。
关键词 汉语 自动分词法 最大匹配 机械分词
下载PDF
书面汉语自动分词方法的研究
2
作者 罗为 《计算机工程》 CAS CSCD 北大核心 1989年第6期30-34,共5页
本文对汉语自动分词方法进行了综述,讨论了当前存在的困难;介绍了DST自动分词方法的设计与实现,并对实验结果进行了评价。
关键词 书面汉语 分词 DST分词法
下载PDF
一种改进的中文分词算法 被引量:5
3
作者 祁文青 《黄石理工学院学报》 2007年第4期23-25,37,共4页
汉语自动分词是汉语信息处理的前提,词库是汉语自动分词的基础。文章提出了一种在对词库进行改造的基础上改进的匹配算法,突破了最大匹配分词算法分词的长度限制,提高了中文分词的速度和效率。
关键词 中文信息处理 中文分词 最大匹配分词
下载PDF
分词用法常见错误分析
4
作者 黄健美 《中学生英语(高中版)》 2003年第4期8-8,共1页
分词是非谓语动词中的一种。如果使用得当会使句子简单明了,然而由于理解有误,学生在使用中常常出错。现将学生练习中常出现的错误归纳总结如下: 一、分词做定语 1.分词作定语时,如果被修饰词是施动者,用现在分词;如果被修饰词承受动作... 分词是非谓语动词中的一种。如果使用得当会使句子简单明了,然而由于理解有误,学生在使用中常常出错。现将学生练习中常出现的错误归纳总结如下: 一、分词做定语 1.分词作定语时,如果被修饰词是施动者,用现在分词;如果被修饰词承受动作,则用过去分词。例如: 昨晚收到的信是妈妈寄来的。误:The letter receivinglast night is from mother. 展开更多
关键词 分词 常见错误 高中 英语 教学
下载PDF
一个自动分词分类系统的实现 被引量:14
5
作者 潘有能 《情报学报》 CSSCI 北大核心 2002年第1期38-41,共4页
本文介绍一个自动分词分类系统的实现过程。该系统采用“后控词表分词法” ,解决了词典分词法中词典构造困难、更新滞后的问题 ,提高了主题词标引的质量和效率 ,并通过对词表分类法的完善和优化 。
关键词 PDCS 后控词表分词法 词表分类 公安文献自动分词分类系统 主题词标引 主题词表
下载PDF
用链栈存储搜索关键字提高中文搜索引擎中分词的速度与精确度
6
作者 赵双柱 《福建电脑》 2010年第1期86-86,90,共2页
分词方法是中文搜索引擎系统中最为基础和最为重要的技术,它直接影响搜索引擎对用户搜索结果的准确性与快速性。本文采用链栈存储用户按搜索目标分割好的搜索关键字,利用链栈先进后出的操作特点,用逆向最大匹配分词法实现中文搜索引擎... 分词方法是中文搜索引擎系统中最为基础和最为重要的技术,它直接影响搜索引擎对用户搜索结果的准确性与快速性。本文采用链栈存储用户按搜索目标分割好的搜索关键字,利用链栈先进后出的操作特点,用逆向最大匹配分词法实现中文搜索引擎中搜索关键字的快速与准确分词,从而实现系统对用户搜索的快速与准确反应。 展开更多
关键词 链栈 动态操作 逆向最大匹配分词法
下载PDF
一种快速中文分词词典机制 被引量:16
7
作者 吴晶晶 荆继武 +1 位作者 聂晓峰 王平建 《中国科学院研究生院学报》 CAS CSCD 北大核心 2009年第5期703-711,共9页
通过研究目前中文分词领域各类分词机制,注意到中文快速分词机制的关键在于对单双字词的识别,在这一思想下,提出了一种快速中文分词机制:双字词-长词哈希机制,通过提高单双字词的查询效率来实现对中文分词机制的改进.实验证明,该机制提... 通过研究目前中文分词领域各类分词机制,注意到中文快速分词机制的关键在于对单双字词的识别,在这一思想下,提出了一种快速中文分词机制:双字词-长词哈希机制,通过提高单双字词的查询效率来实现对中文分词机制的改进.实验证明,该机制提高了中文文本分词的效率. 展开更多
关键词 文本实时处理 中文分词 词典分词 双字词-长词哈希机制
下载PDF
对中文自动分词机制的研究和改进 被引量:2
8
作者 郭屹 《电脑知识与技术》 2008年第3期1240-1245,1255,共7页
本文研究了中文分词技术,改进了传统的整词二分分词机制,设计了一种按照词的字数分类组织的新的词典结构,该词典的更新和添加更加方便,并根据此词典结构提出了相应的快速分词算法。通过对比实验表明,与传统的整词二分、逐字二分和T... 本文研究了中文分词技术,改进了传统的整词二分分词机制,设计了一种按照词的字数分类组织的新的词典结构,该词典的更新和添加更加方便,并根据此词典结构提出了相应的快速分词算法。通过对比实验表明,与传统的整词二分、逐字二分和TRIE索引树分词方法相比,该分词方法分词速度更快。 展开更多
关键词 自然语言处理 中文分词 词典分词
下载PDF
基于倒排表的中文全文检索研究 被引量:6
9
作者 杨安生 《情报探索》 2009年第7期77-80,共4页
对全文检索倒排表技术作了较细致的研究,对全文检索的基本原理和技术进行了深入的探讨。对中文分词方法作了重点研究和总结,并对词典分词法中的最大匹配法加以改进,使用C++设计了一个程序,真正实现了最大匹配法。
关键词 全文检索 倒排表 中文分词 词典分词法 N元索引
下载PDF
基于典故领域本体的诗词用典自动分析系统 被引量:1
10
作者 姚蕊 《软件导刊》 2011年第6期80-82,共3页
本课题填补了典故领域本体研究的空白,为开发基于典故领域本体库的各种应用奠定了基础。为加速数以万计的典故的实例化过程,本研究采用了词典法与互信息法相结合的中文分词方法协助分解典故要素,取得了很好的效果。
关键词 典故 领域本体 诗词OWL 词典分词法 互信息分词法
下载PDF
基于马尔科夫模型的智能汉字盲文转换系统设计 被引量:3
11
作者 李志鹏 王锐 +2 位作者 张天驰 徐学晨 梁鹏 《单片机与嵌入式系统应用》 2019年第10期33-36,共4页
为了满足盲人与盲校的阅读与教学需求,摆脱传统纸质盲文书籍的限制,提出并设计了基于马尔科夫模型的智能汉字盲文转换系统,应用于盲文点显示器。本设计将汉字转换成盲文,总体分为汉字转拼音和拼音转盲文两个过程。汉字到拼音的转换通过... 为了满足盲人与盲校的阅读与教学需求,摆脱传统纸质盲文书籍的限制,提出并设计了基于马尔科夫模型的智能汉字盲文转换系统,应用于盲文点显示器。本设计将汉字转换成盲文,总体分为汉字转拼音和拼音转盲文两个过程。汉字到拼音的转换通过马尔科夫模型来识别随机汉字文本语句,结合了逆向最大匹配分词法进行汉语文本的语句分词,利用词组字典与GB2312进行词组或单字的匹配,实现汉字到拼音的转换。同时,通过音码字典解决了拼音转盲文的问题。实验结果证明,该系统能够快速、精确识别汉字并将其转换为盲文。 展开更多
关键词 盲文转换 马尔科夫模型 最大匹配分词法 GB2312 ARM
下载PDF
关于书面汉语中词链问题的分析和处理
12
作者 黄祥喜 《情报科学》 1988年第5期28-35,共8页
本文给出了词链的形式定义,分析了词链产生的原因,对词链的可切分性作了系统研究。
关键词 自动分词 汉字串 语言文本 文本切分 分解 分词法 成词 汉语语言理解 词典 书面汉语
下载PDF
基于规则的英汉翻译系统的设计与实现
13
作者 张翠萍 《三明学院学报》 2011年第6期36-41,共6页
针对用计算机来实现不同语言间的自动翻译这一问题,设计了基于规则的英汉翻译系统,系统对词库中的词进行预处理,使之符合一定的规范,在此基础上根据单词语义切分句子,将特定单词划分成结点逐步形成译文,而后在查找过程中,找到匹配的译文... 针对用计算机来实现不同语言间的自动翻译这一问题,设计了基于规则的英汉翻译系统,系统对词库中的词进行预处理,使之符合一定的规范,在此基础上根据单词语义切分句子,将特定单词划分成结点逐步形成译文,而后在查找过程中,找到匹配的译文,最后对每个结点的译文按照事先设立的语法来进行重组,使之最大限度地符合自然语言语法规则,达到使用户可以认识和理解的最终目的。实验证明,系统能有效实现翻译功能,具有一定的应用性。 展开更多
关键词 翻译 规则 机械分词法
下载PDF
搜索引擎的实现与应用
14
作者 邢继军 《软件导刊》 2010年第11期150-151,共2页
搜索引擎是指根据一定的策略搜集互联网上的信息,为用户提供检索服务的系统。介绍了搜索引擎的结构、使用技术以及内容提取方法。
关键词 搜索引擎 网络蜘蛛 分词法 排序
下载PDF
俄语中是否存在“间接格主语”?
15
作者 Herbert Coats 堇政民 《外语教学》 1988年第3期94-94,共1页
近几年来,俄语语言学的研究有了很大的发展,但是主语的定义并没有过时,至今仍是适用的,即主语一定要用第一格形式来表示,不存在什么间接格主语。然而,有些学者认为,俄语中不仅名词第一格形式,而且名词旁格形式也能用作主语,即俄语中存... 近几年来,俄语语言学的研究有了很大的发展,但是主语的定义并没有过时,至今仍是适用的,即主语一定要用第一格形式来表示,不存在什么间接格主语。然而,有些学者认为,俄语中不仅名词第一格形式,而且名词旁格形式也能用作主语,即俄语中存在着间接格主语。如名词第二格形式用作主语: 还有大量带前置词的名词间接格形式用作主语的情况。如: 展开更多
关键词 主语 名词间接格形式 俄语 语言学 语义结构 形式名词 结构 前置词 存在 分词法
下载PDF
句子成分与词类的辨析
16
作者 白淑洁 《黑河教育》 1996年第3期21-21,共1页
在现代汉语语法教学中,常有同学分不清句子成分与词类这两个概念。 我们都知道语法学分词法、句法两部分,词法研究词的结构规律、词的语法类别和特征等。句法研究词组、句子的组织规律,如词组、
关键词 句子成分 词类 汉语语教学 结构规律 研究 分词法 词组 名词 特征等
下载PDF
Chinese word segmentation with local and global context representation learning 被引量:2
17
作者 李岩 Zhang Yinghua +2 位作者 Huang Xiaoping Yin Xucheng Hao Hongwei 《High Technology Letters》 EI CAS 2015年第1期71-77,共7页
A local and global context representation learning model for Chinese characters is designed and a Chinese word segmentation method based on character representations is proposed in this paper. First, the proposed Chin... A local and global context representation learning model for Chinese characters is designed and a Chinese word segmentation method based on character representations is proposed in this paper. First, the proposed Chinese character learning model uses the semanties of loeal context and global context to learn the representation of Chinese characters. Then, Chinese word segmentation model is built by a neural network, while the segmentation model is trained with the eharaeter representations as its input features. Finally, experimental results show that Chinese charaeter representations can effectively learn the semantic information. Characters with similar semantics cluster together in the visualize space. Moreover, the proposed Chinese word segmentation model also achieves a pretty good improvement on precision, recall and f-measure. 展开更多
关键词 local and global context representation learning Chinese character representa- tion Chinese word segmentation
下载PDF
SUBDIVIDING VERBS TO IMPROVE SYNTACTIC PARSING 被引量:2
18
作者 Liu Ting Ma Jinshan Zhang Huipeng Li Sheng 《Journal of Electronics(China)》 2007年第3期347-352,共6页
This paper proposes a new way to improve the performance of dependency parser: subdividing verbs according to their grammatical functions and integrating the information of verb subclasses into lexicalized parsing mod... This paper proposes a new way to improve the performance of dependency parser: subdividing verbs according to their grammatical functions and integrating the information of verb subclasses into lexicalized parsing model. Firstly,the scheme of verb subdivision is described. Secondly,a maximum entropy model is presented to distinguish verb subclasses. Finally,a statistical parser is developed to evaluate the verb subdivision. Experimental results indicate that the use of verb subclasses has a good influence on parsing performance. 展开更多
关键词 Verb subdivision Maximum entropy model Syntactic parsing Natural language processing
下载PDF
An Improved Unsupervised Approach to Word Segmentation
19
作者 WANG Hanshi HAN Xuhong +2 位作者 LIU Lizhen SONG Wei YUAN Mudan 《China Communications》 SCIE CSCD 2015年第7期82-95,共14页
ESA is an unsupervised approach to word segmentation previously proposed by Wang, which is an iterative process consisting of three phases: Evaluation, Selection and Adjustment. In this article, we propose Ex ESA, the... ESA is an unsupervised approach to word segmentation previously proposed by Wang, which is an iterative process consisting of three phases: Evaluation, Selection and Adjustment. In this article, we propose Ex ESA, the extension of ESA. In Ex ESA, the original approach is extended to a 2-pass process and the ratio of different word lengths is introduced as the third type of information combined with cohesion and separation. A maximum strategy is adopted to determine the best segmentation of a character sequence in the phrase of Selection. Besides, in Adjustment, Ex ESA re-evaluates separation information and individual information to overcome the overestimation frequencies. Additionally, a smoothing algorithm is applied to alleviate sparseness. The experiment results show that Ex ESA can further improve the performance and is time-saving by properly utilizing more information from un-annotated corpora. Moreover, the parameters of Ex ESA can be predicted by a set of empirical formulae or combined with the minimum description length principle. 展开更多
关键词 word segmentation character sequence smoothing algorithm maximum strategy
下载PDF
A Re-investigation of the Concept of Word Classes Through a Categorization Approach
20
作者 Osondu C. Unegbu 《Journal of Literature and Art Studies》 2014年第11期990-999,共10页
The concept of word classes (parts of speech) has always generated controversy among linguists. The earlier Prescriptive and Descriptive Schools might have set the pace for this controversy but the present dilemma i... The concept of word classes (parts of speech) has always generated controversy among linguists. The earlier Prescriptive and Descriptive Schools might have set the pace for this controversy but the present dilemma is much deeper. Learners and even teachers are sometimes at quandary as to how to proof that a particular word belongs to a particular class. This is because a word may sometimes belong to several classes, in context as in the word "watch" which can belong to different classes. This paper therefore tries to provide answers to the problem of word class classification by using a morphological and syntactical evidence to prove that English words follow a particular range of inflections and belong to strictly ordered particular categories and do not change their class arbitrarily. This is in line with the natural perfect order of homogeneity in creation which precludes a specie from merging effectively with another specie without having to undergo some fundamental changes. Other variables were also looked into and it was concluded that teachers and learners as well, can rely on this sub-categorization approach as a reliable paradigm for their assumptions concerning word classes. 展开更多
关键词 CATEGORIZATION SUBSTITUTION classification sub-categorization INFLECTION morpho-syntactic
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部