期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
基于字典的中文切词系统在北京市精品课程平台中的设计与实现 被引量:1
1
作者 周恕义 徐晓亮 《中国教育技术装备》 2010年第9期3-5,共3页
随着信息量的不断增长,搜索引擎在网站中所起到的作用显得越来越重要,如何通过搜索引擎获得丰富的信息,成为用户关心的重要问题。通过设计实现基于字典的中文切词系统,并对不同格式的文件进行数据挖掘,改进北京市精品课程平台的搜索引擎。
关键词 LUCENE 中文切词 搜索 数据挖掘 SEO
下载PDF
具有三级索引词库结构的中文分词方法研究 被引量:16
2
作者 肖红 许少华 李欣 《计算机应用研究》 CSCD 北大核心 2006年第8期49-51,共3页
提出了一种分组并具有三级索引结构的词库组织体系,给出了合适的索引密度间隔;针对系统基本词库的扩充问题,考虑了一种基于词频统计并具有过滤功能的关键词自动抽取和小词条添加方法。大量仿真实验结果表明,采用该方法可较大提高中文文... 提出了一种分组并具有三级索引结构的词库组织体系,给出了合适的索引密度间隔;针对系统基本词库的扩充问题,考虑了一种基于词频统计并具有过滤功能的关键词自动抽取和小词条添加方法。大量仿真实验结果表明,采用该方法可较大提高中文文本的切词速度及信息的查全查准率。 展开更多
关键词 中文切词 正向最大匹配 索引密度 全文检索
下载PDF
一种基于三级索引词库结构的中文分词方法研究 被引量:5
3
作者 段小斌 林雯 +1 位作者 阮百尧 陈基漓 《计算机与数字工程》 2007年第7期47-49,共3页
提出一种分组并具有三级索引结构的词库组织体系,并就词库的扩充问题,考虑一种基于词频统计并具有过滤功能的关键词自动抽取和小词条添加方法。仿真实验结果表明,采用该方法可较大提高对中文文本的切词速度,保证系统具有较高的信息查全... 提出一种分组并具有三级索引结构的词库组织体系,并就词库的扩充问题,考虑一种基于词频统计并具有过滤功能的关键词自动抽取和小词条添加方法。仿真实验结果表明,采用该方法可较大提高对中文文本的切词速度,保证系统具有较高的信息查全和查准率。 展开更多
关键词 索引结构 中文切词 全文检索
下载PDF
歧义切分与专有名词识别软件 被引量:4
4
作者 刘开瑛 《语言文字应用》 CSSCI 北大核心 2001年第3期9-15,共7页
关键词 中文文本自动 中文信息处理 理论意义 应用价值 歧义字段 专有名识别 识别软件 汉语
下载PDF
基于POI数据的公共免租站点数字化检测策略探索与应用
5
作者 张悦 柯俊生 +2 位作者 张姣 易卓锋 李慧 《长江信息通信》 2024年第1期218-220,共3页
在5G网络大规模部署和刚性成本快速增长的局势下,为了节省基站建设场地租赁费用以及制定有效的选址策略,文章提出了一种公共免租站点智能检测的方法。该方法利用中文切词算法挖掘公共免租站点关键词并建立公共免租关键词库,引入广泛的PO... 在5G网络大规模部署和刚性成本快速增长的局势下,为了节省基站建设场地租赁费用以及制定有效的选址策略,文章提出了一种公共免租站点智能检测的方法。该方法利用中文切词算法挖掘公共免租站点关键词并建立公共免租关键词库,引入广泛的POI数据、基站数据以及合同数据进行匹配和交叉运算,实现系统化、智能化地检测现有站点是否满足公共免租条件。通过建设公共免租关键词库,辅助锁定存量租用的现网物业站点,并以公共免租谈判的手段进行推动,有效地摆脱了传统人工判断的主观性与不确定性,为基站选址决策者提供可靠的参考,从而降低基站租金成本,提高5G网络的经济效益。 展开更多
关键词 公共免租点 中文切词 公共免租关键 POI数据 基站选址
下载PDF
基于切词的受限领域智能答疑系统设计与实现 被引量:2
6
作者 田伟 马廷淮 +2 位作者 李可一 冷家昭 刘文杰 《武汉理工大学学报》 CAS CSCD 北大核心 2010年第16期148-151,180,共5页
针对目前答疑系统的现状和不足,介绍了基于切词的智能答疑系统的模型,对模型中的中文切词,文本相似度计算等关键技术进行了研究与改进,应用C#和SQL Server数据库实现智能答疑系统,在一定程度上提高了智能答疑系统的智能性和扩展性。
关键词 答疑系统 自然语言处理 中文切词 文本相似度计量 向量空间模型
原文传递
基于TRIP的全文检索系统的应用及研究 被引量:1
7
作者 杨恒宇 余嵘华 《电脑知识与技术》 2012年第9期5962-5964,共3页
介绍在对TRIP全文数据库系统和中文切词有关技术研究分析的基础上,开发J2EE架构下基于TRIP的全文检索系统。该全文检索系统在WEB环境下运行,具有跨平台性。
关键词 TRIP 中英文全文检索 中文切词 倒排文件
下载PDF
浅析基于Lucene框架的网络论坛信息分析与实现
8
作者 刘菲 《电脑知识与技术》 2008年第9期1386-1387,1397,共3页
在当今互联网的各大论坛,帖吧,个人空间,BLOG中存在着非常多的网友发布的薪水,职业,等方面的信息。如在各大高校的BBS中,每年到应届生加入求职大军时,相当一部分学生会就各公司的薪水状况,福利待遇进行询问以及讨论。而一部分... 在当今互联网的各大论坛,帖吧,个人空间,BLOG中存在着非常多的网友发布的薪水,职业,等方面的信息。如在各大高校的BBS中,每年到应届生加入求职大军时,相当一部分学生会就各公司的薪水状况,福利待遇进行询问以及讨论。而一部分得到公司职位的学生亦会在一定程度上公布公司的薪水待遇状况。这一类各公司的薪水信息,对于以后学生的求职,职业人士跳槽.具有相当的参考价值。同样,在各大论坛,互动社区中.都会有相当大的薪水信息帖。很不幸的是,这些薪水讨论帖子淹没在浩淼的互联网中,并且通过互联网在大陆近十年来发展积淀,此类信息已经达到了海量。利用成熟的Lucene框架,文本检索理论(Information Retrieve),以及相关的分词,归类,索引技术.将这些信息,按照网友提交的关键字进行抽取与分析。按网友需要搜索出具备参考价值的职业信息。为网友的求职.跳槽.提供决策支持。 展开更多
关键词 网络 数据 搜索 中文切词 公司待遇 公司评论 LUCENE
下载PDF
浅谈WEB数据库应用
9
作者 张松林 《计算机光盘软件与应用》 2010年第3期50-51,共2页
伴随着Internet的日益发展和壮大,如何在浩瀚的网络信息海洋中快速、高效地寻找特定的主题内容,成为困扰信息服务提供者的主要问题。针对该问题,基于WEB的搜索引本文从WEB搜索技术的智能化、个性化发展轨迹和应用特点及在生活中的应... 伴随着Internet的日益发展和壮大,如何在浩瀚的网络信息海洋中快速、高效地寻找特定的主题内容,成为困扰信息服务提供者的主要问题。针对该问题,基于WEB的搜索引本文从WEB搜索技术的智能化、个性化发展轨迹和应用特点及在生活中的应用开始,深入探讨了智能搜索引擎系统的结构、构建以及相关应用。旨在为WEB搜索技术的演进和完善提供参考。 展开更多
关键词 WEB搜索引擎 智能化 LUCENE 中文切词
下载PDF
浅谈WEB数据库应用
10
作者 张松林 《电子技术与软件工程》 2012年第17期30-32,共3页
伴随着Internet的日益发展和壮大,如何在浩瀚的网络信息海洋中快速、高效地寻找特定的主题内容,成为困扰信息服务提供者的主要问题。针对该问题,基于web的搜索引本文+kWeb搜索技术的智能化、个性化发展轨迹和应用特点及在生活中的... 伴随着Internet的日益发展和壮大,如何在浩瀚的网络信息海洋中快速、高效地寻找特定的主题内容,成为困扰信息服务提供者的主要问题。针对该问题,基于web的搜索引本文+kWeb搜索技术的智能化、个性化发展轨迹和应用特点及在生活中的应用开始,深入探讨了智能搜索引擎系统的结构、构建以及相关应用。旨在为Web搜索技术的演进和完善提供参考。 展开更多
关键词 WEB搜索引擎 智能化 Lucene中文切词
下载PDF
基于JAVA的搜索引擎的设计与实现
11
作者 杨烁 任晓菲 《科技创新与应用》 2015年第21期79-80,共2页
在浩瀚无边的网络资源中,特别是院校等自建网站的大型单位中,信息检索是一件很困难的工作,而建立搜索引擎显得尤为重要。文章阐述在广域网或局域网下建立信息检索的技术描述,从四个方面进行系统分析。为了使大家加深对信息检索的理解,... 在浩瀚无边的网络资源中,特别是院校等自建网站的大型单位中,信息检索是一件很困难的工作,而建立搜索引擎显得尤为重要。文章阐述在广域网或局域网下建立信息检索的技术描述,从四个方面进行系统分析。为了使大家加深对信息检索的理解,从原理上解释从指定的Web页面中按照超连接进行解析、搜索,并把搜索到的每条结果进行建立索引。然后通过Web服务器接受客户端请求后,将关键字用ICTCLAS.dll中文切词工具进行切割,将关键字列表在索引中搜索出所匹配的结果,并将其显示给客户。此外,还利用Ajax等一些技术增加了一些自动提示的效果,使得搜索界面更加人性化。 展开更多
关键词 搜索引擎 网络蜘蛛 LUCENE 中文切词
下载PDF
Feature study for improving Chinese overlapping ambiguity resolution based on SVM 被引量:1
12
作者 熊英 朱杰 《Journal of Southeast University(English Edition)》 EI CAS 2007年第2期179-184,共6页
In order to improve Chinese overlapping ambiguity resolution based on a support vector machine, statistical features are studied for representing the feature vectors. First, four statistical parameters-mutual informat... In order to improve Chinese overlapping ambiguity resolution based on a support vector machine, statistical features are studied for representing the feature vectors. First, four statistical parameters-mutual information, accessor variety, two-character word frequency and single-character word frequency are used to describe the feature vectors respectively. Then other parameters are tried to add as complementary features to the parameters which obtain the best results for further improving the classification performance. Experimental results show that features represented by mutual information, single-character word frequency and accessor variety can obtain an optimum result of 94. 39%. Compared with a commonly used word probability model, the accuracy has been improved by 6. 62%. Such comparative results confirm that the classification performance can be improved by feature selection and representation. 展开更多
关键词 support vector machine Chinese overlapping ambiguity Chinese word segmentation word probability model
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部