-
题名基于单汉字索引的全文检索系统的优化研究
被引量:11
- 1
-
-
作者
余海燕
张仲义
-
机构
北方交通大学自动化所
-
出处
《中文信息学报》
CSCD
北大核心
2001年第4期14-19,27,共7页
-
基金
86 3高技术资助项目!(86 3 - 30 6 -ZD - 0 7- 0 2 )
-
文摘
对于按照单汉字建立倒排索引的全文检索系统 ,最需要解决的问题是如何提高其存储效率和运算速度。本文针对此问题提出了以下优化方法 :一是利用参数化的Golomb编码对倒排文件进行压缩 ;二是对求集合交集的逻辑乘算法进行改进 ;三是运用并行计算和双缓冲技术。实验结果表明 ,经过优化后的单汉字全文检索系统已达到实用化的程度。
-
关键词
单汉字标引
倒排文件
Golomb编码
全文检索系统
倒排索引
单汉字索引
-
Keywords
full text retrieval
single Chinese character indexing
inverted file
Golomb coding
-
分类号
G354.45
[文化科学—情报学]
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名也谈单汉字标引
- 2
-
-
作者
罗雪英
-
机构
湘潭大学管理学院
-
出处
《湘潭大学社会科学学报》
2003年第B05期212-214,共3页
-
文摘
本文对单汉字标引的研究历史进行了回顾 ,对单汉字标引检索的原理进行了探讨 ,并针对如何提高单汉字标引检索的效率提出了一点看法。
-
关键词
单汉字标引
自动标引
文献标引
图书情报工作
单汉字检索
-
分类号
G254.36
[文化科学—图书馆学]
-
-
题名论单汉字检索系统
被引量:11
- 3
-
-
作者
陈光祚
-
机构
武汉大学图书情报学院
-
出处
《情报学报》
CSSCI
北大核心
1992年第1期11-18,共8页
-
-
关键词
情报检索
检索系统
单汉字检索
-
分类号
G354.4
[文化科学—情报学]
-
-
题名单汉字检索系统后控词表的改进研究
被引量:15
- 4
-
-
作者
丁蔚
-
机构
南京大学信息管理系
-
出处
《现代图书情报技术》
CSSCI
北大核心
1998年第5期25-28,39,共5页
-
文摘
通过对单汉字检索系统及其后控词表的介绍和分析,针对其在揭示隐含主题以及扩检、缩检的不足之处,提出了基于主题词表的后控词表解决方案。
-
关键词
单汉字检索
后控词表
自动标引
情报检索
-
分类号
G354.4
[文化科学—情报学]
G356.1
[文化科学—情报学]
-
-
题名单汉字检索中的集合索引方法
被引量:1
- 5
-
-
作者
范志新
施伯乐
高卫国
-
机构
复旦大学计算机系
复旦大学数学系
-
出处
《计算机工程》
CAS
CSCD
北大核心
1998年第7期5-7,49,共4页
-
文摘
根据汉字在文献中使用的频度和分布规律,利用图书分类的原则,提出了基于汉字在成组(连续索引号)文献中出现的集合索引方案。与基于单值表达的常规索引方案作了比较,并对一类短语料进行了实验,给出了部分比较结果以及索引调整的一些分析结果。模拟图书分类中汉字非均匀分布的特点,从理论上分析文献索引各参量间的关系。分析表明,集合索引法与单值表达索引相比,能够显著提高素引效率,减少索引空间,还可进行随机动态调整。
-
关键词
集合索引
文献检索
单汉字检索
-
Keywords
Set-based index
Chinese word index
Succession degree
-
分类号
G252.7
[文化科学—图书馆学]
-
-
题名单汉字全文检索研究
被引量:1
- 6
-
-
作者
刘雪芹
吴红霞
张立华
-
机构
河北理工大学经济管理学院
-
出处
《情报杂志》
CSSCI
北大核心
2007年第1期52-53,51,共3页
-
文摘
分析了当前倒排索引的不足,提出了一种基于Unicode字符串倒排索引的存储结构,并给出了相应的标引和检索算法。
-
关键词
全文检索
单汉字
倒排文件
UNICODE
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-
-
题名单汉字标引与检索技术综析
被引量:10
- 7
-
-
作者
胡盈盈
-
机构
南京大学信息管理系
-
出处
《情报理论与实践》
CSSCI
北大核心
1999年第2期137-140,共4页
-
文摘
0引言所谓单汉字标引技术,是指以单个汉字作为标引的基本单元,在检索时,对不属于停用词范畴的单个汉字进行逻辑乘运算,也即对标引字所代表的概念层面进行后组配,从而获得检索结果。作为计算机信息检索的处理对象,中文文字与西文相比,其基本语义单位———汉语词之...
-
关键词
单汉字标引
检索技术
计算机检索
-
Keywords
Indexing\ Chinese retrieval system/Single Chinese character
-
分类号
G354.4
[文化科学—情报学]
G254-39
[文化科学—图书馆学]
-
-
题名单汉字标引方法的改进研究
被引量:4
- 8
-
-
作者
李培
-
机构
南开大学信息资源管理系
-
出处
《情报学报》
CSSCI
北大核心
1999年第5期416-421,共6页
-
文摘
本文根据信息论中的交互信息,给出了相邻汉字相关度的测量方法,在此基础上提出了基于字串预分割的单汉字标引检索方法,对当前具有代表性的单汉字标引方法进行了改进研究。
-
关键词
单汉字标引
字串分割
汉字标引
标引方法
计算机
-
Keywords
single Chinese character indexing,string segmentation,correlation measurement of close Chinese characters.
-
分类号
G254.36
[文化科学—图书馆学]
-
-
题名面向自然语言查询的单汉字检索系统
被引量:4
- 9
-
-
作者
夏景峰
李必旺
-
机构
南京大学信息管理系
-
出处
《情报学报》
CSSCI
北大核心
1995年第6期410-416,473,共8页
-
文摘
单汉字检索的发展已历经三代,本文所述的SCCRS系统对第三代系统进行了一系列优化,尤其是支持自然语言查询,并为此提出了特例词典、单字匹配检索等新概念。本文叙述了有关实现算法,对SCCRS的优缺点亦作出评价。
-
关键词
单汉字检索系统
自然语言查询
情报检索
-
分类号
G354.4
[文化科学—情报学]
-
-
题名也谈单汉字标引法
被引量:1
- 10
-
-
作者
王彩芳
李月诚
-
机构
滨州医学院图书馆
-
出处
《图书馆建设》
北大核心
2002年第5期57-58,66,共3页
-
文摘
单汉字标引法是在基于汉语分词的自动标引研究遇到不可克服的困难之后 ,而产生的一种新的自动标引方法。本文集中列举了它的 9大优点 ,同时也指出了它的缺点和不足 ,呼吁学术界加强研究 ,以期使之更加完善和实用。
-
关键词
单汉字法
自动标引
汉语文献处理
优势
缺点
标引专捐度
检索语言
-
Keywords
Single Chinese character
Automatic indexing
Chinese document management
-
分类号
G254.361
[文化科学—图书馆学]
-
-
题名单汉字标引检索研究述评
- 11
-
-
作者
刘刚
-
机构
武汉大学图书情报学院
-
出处
《图书馆建设》
CSSCI
北大核心
1999年第6期43-45,77,共4页
-
文摘
文章对单汉字标引与检索的发展以及为提高单汉字检索系统的检索效率而采取的相关措施进行了回顾。
-
关键词
单汉字
自动标引
计算机检索
述评
-
分类号
G254.36
[文化科学—图书馆学]
G354.4
[文化科学—情报学]
-
-
题名单汉字标引及其检索技术的优化
- 12
-
-
作者
彭冬莲
-
机构
中南大学图书馆
-
出处
《农业图书情报学刊》
2005年第4期9-11,62,共4页
-
文摘
探讨了单汉字标引的优势和存在的不足,提出了提高单汉字标引系统检索效率的措施,并对未来前景进行了展望。
-
关键词
单汉字
自动标引
检索
-
Keywords
single Chinese character
automatic indexing
retrieval
-
分类号
G254.36
[文化科学—图书馆学]
-
-
题名单汉字和词索引机制的模式比较
- 13
-
-
作者
杨沛
-
机构
厦门集美航海学院图书馆
-
出处
《集美航海学院学报》
1996年第3期60-65,共6页
-
文摘
本文从定性和定量两方面,对汉字全文数据库中的单汉字和词两种索引机制进行了比较研究,分析了它们各自的优缺点,并提出了一些建议性的改进措施。
-
关键词
全文数据库
词索引
单汉字索引
-
Keywords
full text data base
Chinese phrase indexing
single Chinese character indexing
-
分类号
U675
[交通运输工程—船舶及航道工程]
-
-
题名单汉字标引技术的改进研究
被引量:3
- 14
-
-
作者
王淼
-
机构
复旦大学图书馆文献信息中心
-
出处
《现代图书情报技术》
CSSCI
北大核心
1997年第2期48-53,共6页
-
文摘
本文针对汉语构词的特殊性 ,提出了一种单汉字标引的改进算法。该算法在标引上采用了对非检索词词首字的剔除标引 ,在检索上 ,采取检索词首字查找 ,检索词直接匹配的算法。还提出了对检索结果的存储以及构筑后控词典 ,以逐步完善单汉字检索系统。以上算法 ,在 SCIRS(Single Chinese Character Indexing andRetrieval System)得到初步实现。
-
关键词
单汉字
自动标引
情报检索
计算机应用
-
分类号
G354.4
[文化科学—情报学]
-
-
题名单汉字机助标引和检索
被引量:4
- 15
-
-
作者
黎小林
吴骏盛
-
机构
广州市科技情报所
-
出处
《情报学报》
1988年第1期29-33,20,共6页
-
文摘
文章提出了一种利用我国汉字特点的新的机助标引和机助检索方法——以单个汉字为检索单位的方法。和主题词检索法相比,单汉字检素法有如下优点:利用标题实现了机助标引,完全不需要主题词表;适用于一切专业;简化检索策略;方便一般非情报专业人员使用。
-
关键词
机助标引
检索方法
单汉字
主题词检索
汉字特点
主题词表
检索策略
人员使用
-
分类号
G254.36
[文化科学—图书馆学]
-
-
题名单汉字检索模式下的标引问题研究
- 16
-
-
作者
陈磊
孙济庆
-
机构
华东理工大学科技信息研究所
-
出处
《上海高校图书情报工作研究》
2005年第4期14-17,共4页
-
文摘
单汉字检索,是目前全文检索系统采用较多的一种检索模式。针对单汉字检索模式对文献标引的影响进行了分析,并指出该模式下标引的无效性。最后,提出了改进方法。
-
关键词
单汉字检索
文献标引
-
分类号
G272.5
[文化科学—档案学]
-
-
题名用FOXBASE开发单汉字标引系统
- 17
-
-
作者
金巍
-
出处
《情报科学技术》
1993年第5期12-13,49,共3页
-
-
关键词
单汉字标引
自动标引
FOXBASE
-
分类号
G254-39
[文化科学—图书馆学]
-
-
题名浅析大量单汉字背“同”顺治钱的窖藏原因
- 18
-
-
作者
喻战勇
-
机构
河南
-
出处
《西部金融》
1998年第7期63-63,共1页
-
文摘
据资料记载.清顺治年间.山西省境内先后有三处钱局鼓铸制钱.顺治元年六月清军入晋.十一月全省平定.次年题准设太原府局(省局).以“原”记局,开炉10座.大同府局,以“同”字记局,设在在同城内东北隅钱局巷,开炉20座.规定每文钱重一钱二分,每十文准银一分.顺治六年清政府下令废大同城,将府治移到阳和镇.大同府局也随同迁往阳和镇,改名为阳和镇局,以“阳”记局.十三年,又将阳和镇局移回大同.这些钱局在顺治年间,铸有多种类型的“顺治通宝”.太原府局铸有背单汉字“原”、“原一厘”及满汉文“原”字钱;大同局和其基本类似,仅由于“同一厘”开铸不足一年,故较为稀少;阳和局则未铸满汉文“阳”字钱.
-
关键词
单汉字
“原”
顺治年间
山西大同
大同府钱局
清政府
开炉
古钱币
基本类
游览名胜
-
分类号
K875.6
[历史地理—考古学及博物馆学]
-
-
题名试论朝鲜语和日语谓词单音节汉字词的倾向性
- 19
-
-
作者
林成虎
-
机构
延边大学外国语学院
-
出处
《延边大学学报(社会科学版)》
2006年第4期72-75,共4页
-
文摘
汉字作为传承中华文明的载体不仅为中华文明的发展做出了贡献,而且为朝鲜、日本等汉字圈国家和民族的文化发展也做出了巨大贡献。汉字传播到周边国家和地区以后,在各民族的不同文化环境中发展变化。朝鲜语和日语在借用中国的汉语词汇时因受其固有民族语言和文化的影响而产生了不同的倾向性,它分别体现在词目、词性、词类、口语化程度等方面。
-
关键词
朝鲜语
日语
谓词
单音节汉字词
口语
-
Keywords
predicate
monosyllabic
Honji and Hansa
oral speech
-
分类号
H36
[语言文字—日语]
H55
[语言文字]
-
-
题名汉字全文检索系统的关键技术与实现
被引量:19
- 20
-
-
作者
张俭恭
陈定权
-
机构
中国科学院文献情报中心
-
出处
《现代图书情报技术》
CSSCI
北大核心
2001年第2期16-18,共3页
-
文摘
全文检索作为一种发展迅速的情报检索技术 ,在近年来已得到广泛的关注并走向市场。本文在对中西文全文检索系统进行分析比较的基础上 ,做出了新的尝试 ,提出了一种新的索引建立方式 ,并在此基础上实现了支持模糊提问的全文检索。同时独立设计了自己的数据结构和算法 ,以及利用 Visual C+ +在 Windows环境下加以实现。最后 。
-
关键词
全文检索
算法研究
数据结构
索引
单汉字索引
情报检索
-
Keywords
Full text retrieval Algorithm investigation Data structure Single Chinese characters index
-
分类号
G252.7
[文化科学—图书馆学]
-