期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于频繁模式挖掘的维吾尔文智能组词方法 被引量:6
1
作者 吐尔地·托合提 维尼拉·木沙江 艾斯卡尔·艾木都拉 《计算机应用》 CSCD 北大核心 2012年第10期2920-2922,2926,共4页
以词间空格作为自然分隔符,非常容易获取维吾尔文中的词,但又很难获取结构完整的语义词,因此多种文本处理效果总是很不理想。提出维吾尔文组词的新概念,将数据挖掘中的频繁模式挖掘方法引入到维吾尔文组词中,再结合维吾尔文的语言文字特... 以词间空格作为自然分隔符,非常容易获取维吾尔文中的词,但又很难获取结构完整的语义词,因此多种文本处理效果总是很不理想。提出维吾尔文组词的新概念,将数据挖掘中的频繁模式挖掘方法引入到维吾尔文组词中,再结合维吾尔文的语言文字特点,将无先验知识的模式挖掘问题转化为特定模式的匹配问题,提出了一种快速高效的频繁模式挖掘算法,来获取语义完整的维吾尔文词。实验结果表明,通过该算法获取的维吾尔文词,在结构上是稳定的,语义上是完整而独立的。 展开更多
关键词 维吾尔文本 分词 组词 语义词 频繁模式
下载PDF
网页分类及其维文信息检索中的应用研究 被引量:2
2
作者 海丽且木·艾沙 维尼拉·木沙江 《电脑知识与技术》 2011年第1期192-193,共2页
研究维文信息检索中网页分类问题。在维文信息预处理,文档特征词组抽取和信息检索模型的建立等方面做了一些探讨。提出一种引入网页分类和词组抽取技术的信息检索方法。采用了基于KNN的网页分类方法,此方法符合雏文语言特点,能够提... 研究维文信息检索中网页分类问题。在维文信息预处理,文档特征词组抽取和信息检索模型的建立等方面做了一些探讨。提出一种引入网页分类和词组抽取技术的信息检索方法。采用了基于KNN的网页分类方法,此方法符合雏文语言特点,能够提高信息检索系统的查询准确率,使得返回结果更符合用户检索需求。 展开更多
关键词 维文网页 网页预处理 网页分类
下载PDF
维、哈、柯多语种搜索引擎中改进索引创建的新方法的构思
3
作者 赵丽红 维尼拉·木沙江 《现代计算机(中旬刊)》 2011年第6期10-12,16,共4页
通过对目前处于研究发展阶段的后缀数组技术与倒排索引技术的简单介绍,并对两者的优缺点进行了对比,对维、哈、柯文搜索引擎的索引创建进行改进的新方法提出了构思,以实现查询效率和查准率的提高。
关键词 索引技术 倒排索引 后缀数组
下载PDF
基于统计的维吾尔文网页自动摘要提取研究
4
作者 阿热帕提·尕依提 维尼拉·木沙江 《电脑知识与技术》 2011年第1期185-186,共2页
为让用户快速、有效的得到真正符合自己需求的信息该文首次从维吾尔文的特征出发对基于统计的自动摘要提取技术进行研究,并找到适合维吾尔文的基于统计的自动摘要提取方法。此方法用在维哈柯搜索引擎,大大提高了搜索引擎的性能。
关键词 自动摘要 维吾尔文 特征提取
下载PDF
基于后缀树的维吾尔文网页聚类算法的研究与实现
5
作者 买买提依明·哈斯木 维尼拉·木沙江 《电脑知识与技术》 2010年第9期7072-7073,7075,共3页
该论文分析维吾尔语的词法特点,选择适合维吾尔文文本聚类的特征,构造可扩展后缀树,选择基类,合并基类,把维吾尔文网页按相似度分成不同的类,并形成类标签。通过实验表明该算法的效率比其他传统的聚类算法比具有较高的性能.大大... 该论文分析维吾尔语的词法特点,选择适合维吾尔文文本聚类的特征,构造可扩展后缀树,选择基类,合并基类,把维吾尔文网页按相似度分成不同的类,并形成类标签。通过实验表明该算法的效率比其他传统的聚类算法比具有较高的性能.大大提高查找信息的命中率。 展开更多
关键词 聚类 后缀树 STC
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部