-
题名使用机械分词与特征扫描实现对甲骨卜辞的切分
被引量:2
- 1
-
-
作者
陆公正
开金宇
-
机构
苏州市职业大学计算机工程学院
安阳师范学院河南省甲骨文信息处理重点实验室培育基地
-
出处
《苏州市职业大学学报》
2013年第4期2-6,共5页
-
基金
国家自然科学基金资助项目(61272259)
国家自然科学基金资助项目(6087508)
苏州市云计算智能信息处理高技术研究重点实验室开放基金资助项目(SXZ201303)
-
文摘
依据甲骨文语法及甲骨文词典对甲骨卜辞进行切分,是建立甲骨文语料库实现计算机辅助甲骨文考释的前提和基础.针对甲骨卜辞的切分,采用机械分词与特征扫描相结合的中文分词技术对200条比较完整的卜辞进行切分实验,将只使用机械分词和结合了特征扫描的两种方法进行比较.结果表明,采用机械分词与特征扫描相结合,实现甲骨卜辞的切分的正确率和效率都较高.
-
关键词
甲骨卜辞
分词技术
机械分词
特征扫描
LUCENE
-
Keywords
Shang Oracle-bone Inscriptions
segmentation technology
mechanical word segmentation
characteristics scanning
Lucene
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名智能化中文机械分词组件的设计
- 2
-
-
作者
齐忠琪
-
机构
新疆师范大学教育科学学院
-
出处
《中国教育技术装备》
2009年第21期95-96,共2页
-
文摘
分词是计算机系统对自然语言处理的第一步,分词的方法与准确率将显著影响自然语言的处理效果。在分析机械分词技术的基础上,提出构建智能化机械分词组件的思想,论述构建智能化中文分词组件的基本思路与方法,指出智能化中文机械分词组件在中文信息处理领域中的应用前景。
-
关键词
中文处理
机械分词
组件设计
-
Keywords
Chinese language processing
mechanical segmentation of words
module design
-
分类号
TP391.43
[自动化与计算机技术—计算机应用技术]
-
-
题名基于Hash结构的机械统计分词系统研究
被引量:8
- 3
-
-
作者
费洪晓
胡海苗
巩燕玲
-
机构
中南大学信息科学与工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2006年第5期159-161,共3页
-
基金
国家自然科学基金资助项目(编号:60173041)
湖南省自然科学基金资助项目(编号:02JJY2094)
-
文摘
在综合比较了常用的机械分词方法和统计分词方法基础上,论文设计并实现了一种基于Hash结构的机械统计分词系统。系统突破了传统的机械分词方法和统计分词方法,结合了两者的优势,并对其做了一系列的改进。从对测试结果的分析可以看出,系统的分词速度达到了每秒一万两千个汉字以上,且具有较强的未登陆词识别能力。
-
关键词
中文分词
机械分词
统计分词
Hash结构
-
Keywords
Chinese word segmentation,mechanical Chinese word segmentation,statistical Chinese word segmentation, hash structure
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种改进的MM分词方法的算法设计
被引量:28
- 4
-
-
作者
骆正清
陈增武
胡上序
-
机构
浙江大学
-
出处
《中文信息学报》
CSCD
1996年第3期30-36,共7页
-
文摘
本文提出了一种改进的最大匹配(MM)的自动分词方法,并给出了相应的算法及词典设计。
-
关键词
汉语
自动分词法
最大匹配
机械分词
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于反序词典的中文分词技术研究
被引量:18
- 5
-
-
作者
罗桂琼
费洪晓
戴弋
-
机构
中南大学信息科学与工程学院
-
出处
《计算机技术与发展》
2008年第1期80-83,共4页
-
基金
湖南省科技计划项目(2006JT1040)
-
文摘
中文自动分词是计算机中文信息处理中的难题。在对中文分词的现有技术研究的基础上,对反序最大匹配分词方法进行了较深入的研究探讨,在此基础上对中文分词的词典结构和分词算法做了一部分改进,设计了基于反序词典的中文分词系统。实验表明,该改进算法加快了中文的分词速度,使得中文分词系统的效率有了显著提高。
-
关键词
中文分词
反序最大匹配
机械分词
反序词典
-
Keywords
Chinese segmentation
converse max matching
machine segmentat ion
converse .segmentation dictionary
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名汉语自动分词研究综述
被引量:16
- 6
-
-
作者
骆正清
陈增武
王泽兵
胡上序
-
机构
浙江大学计算与信息中心
-
出处
《浙江大学学报(自然科学版)》
EI
CSCD
1997年第3期306-312,共7页
-
文摘
本文对汉语自动分词的方法进行了概述,并在考察分词精度和分词知识的基础上。
-
关键词
汉语自动分词
分词精度
中文信息处理
机械分词
-
Keywords
chinese automatic segmentation
segmentation knowledge
segmentation accuracy
modified segmentation method.
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名对中文分词系统预处理模块算法的研究和改进
- 7
-
-
作者
刘勇
范丽辉
-
机构
青岛科技大学信息学院
-
出处
《科技信息》
2012年第8期264-265,共2页
-
文摘
中文分词技术是一项在搜索引擎中广泛应用的关键技术,也是中文信息处理中的一项关键技术。文章通过对中文分词系统中预处理模块的改进提高了分词的速度,改进了分词系统。
-
关键词
中文分词
机械分词
词典
正向最大匹配
预处理模块
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于层次分析法的中文分词算法改进
被引量:1
- 8
-
-
作者
丁洁
-
机构
陕西邮电职业技术学院
-
出处
《信息技术》
2016年第10期190-193,共4页
-
文摘
首先简要介绍了中文分词的应用领域,指出中文分词所面临的问题,歧义语句和未登录词的识别率低的现状。然后,在传统的机械分词算法基础上,改进算法,引入了多种优化技术。基于上述理论和改进算法,设计并实现了一个改进的中文分词系统,不仅能够保证快速分词,而且提高了分词的正确率,改善了歧义语句和未登录词的识别率低的问题。
-
关键词
中文分词
机械分词
自然语言处理
-
Keywords
Chinese word segmentation
machine segmentation
natural language processing
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名甲骨刻辞词性标注语料库系统设计与实现
被引量:2
- 9
-
-
作者
开金宇
刘永革
李欣
-
机构
安阳师范学院甲骨文信息处理重点实验室培育基地
-
出处
《殷都学刊》
2011年第2期32-34,共3页
-
基金
国家自然科学基金重点项目(6087508)资助
-
文摘
使用计算机辅助甲骨学研究,建设甲骨刻辞词性标注语料库是必不可少的一项基础性工程。现在还没有现成的甲骨刻辞词性标注语料库,因此,有必要设计和实现甲骨刻辞词性标注语料库系统。这个标注系统结合人工标注、机器标注和人工审核,循环作业,快速、高效地建设甲骨刻辞语料库。
-
关键词
甲骨刻辞词性标注语料库
机械分词
特征扫描
最大概率标注法
-
分类号
K877.1
[历史地理—考古学及博物馆学]
-
-
题名内容管理系统的文章关键词提取组件分析与优化
被引量:3
- 10
-
-
作者
陆钊
-
机构
玉林师范学院计算机科学与工程学院
-
出处
《玉林师范学院学报》
2015年第5期135-141,共7页
-
基金
广西高校科学技术研究资助项目(KY2015LX300)
玉林师范学院2012年度校级科研项目(2012YJQN27)
-
文摘
SEO仍是中小网站提升网站排名的主要方法,优化关键词是其中重要的环节。本文从中文分词处理的角度,通过理论和结构分析,针对Dede CMS提出了一套优化关键词提取组件的方法,经实验对比结果证明了方法的有效性.同时还提出了推广的思路.
-
关键词
分词提取
机械分词
词典编译
DEDECMS
-
Keywords
participles extraction
mechanical word segmentation
dictionary compilation
DedeCMS
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于规则的英汉翻译系统的设计与实现
- 11
-
-
作者
张翠萍
-
机构
福建中医药大学管理学院
-
出处
《三明学院学报》
2011年第6期36-41,共6页
-
文摘
针对用计算机来实现不同语言间的自动翻译这一问题,设计了基于规则的英汉翻译系统,系统对词库中的词进行预处理,使之符合一定的规范,在此基础上根据单词语义切分句子,将特定单词划分成结点逐步形成译文,而后在查找过程中,找到匹配的译文,最后对每个结点的译文按照事先设立的语法来进行重组,使之最大限度地符合自然语言语法规则,达到使用户可以认识和理解的最终目的。实验证明,系统能有效实现翻译功能,具有一定的应用性。
-
关键词
翻译
规则
机械分词法
-
Keywords
translation
rules
mechanical segmentation method
-
分类号
TP391.2
[自动化与计算机技术—计算机应用技术]
-