-
题名基于Lucene的中文分词系统设计与实现
被引量:5
- 1
-
-
作者
丁洁
-
机构
陕西邮电职业技术学院
-
出处
《自动化与仪器仪表》
2016年第5期208-210,共3页
-
文摘
随着信息技术的不断发展,中文分词的应用越来越广泛,例如搜索引擎、机器翻译等领域。论文介绍了对未识别部分采取检索词典的方法;对介词副词词典、姓氏词典和后缀词词典先检索,再处理介词、副词、姓名和后缀词等,处理完后再将剩余部分输出单字等。设计并实现了一个基于Lucene的中文分词系统,系统运行良好,能对待切分的文本进行相对正确、快速的切分,系统输出的结果基本符合预期的目标。
-
关键词
中文分词
搜索引擎
检索词典
基于lucene
-
Keywords
Chinese word segmentation
research engine
retrieving the dictionary
based on lucene
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名统一智能搜索处理技术的研究与应用
被引量:2
- 2
-
-
作者
许宇华
黄倩云
-
机构
广东电网公司珠海供电局
-
出处
《自动化与仪器仪表》
2017年第5期144-146,共3页
-
文摘
随着新的科学技术层出不穷,供电服务的远程渠道也趋向多元化。本文将探索统一智能搜索处理技术在供电企业远程服务渠道上的应用方式,为完成精益化管理供电企业远程服务渠道奠定坚实的技术根底。远程服务渠道统一智能搜索处理技术除能提供快速检索、相关度排序之外,还结合自然语言的智能处理,快速地检索出对用户而言最有价值最感兴趣的信息。通过对四大技术要点,即信息辅助抽取、词语相似度计算、分词及关键词维护以及基于Lucene搜索引擎来说明统一智能搜索处理技术在远程服务渠道统一运营管理平台上的应用。
-
关键词
统一智能搜索
信息辅助抽取
词语相似度计算
分词及关键词维护
基于lucene搜索引擎
-
Keywords
unified intelligent search
auxiliary information extraction
word similarity calculation
word segmentation andkeywords maintenance
engine based on lucene
-
分类号
TM73
[电气工程—电力系统及自动化]
-