期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于Trie树的最大长度匹配分词的Python实现
1
作者 张恒源 《电子制作》 2020年第18期56-58,共3页
基于Hash机制的Trie树在实现最大长度搜索的时候具有较高的查找效率^([1])。利用Python语言当中的字典数据结构来构建词典树^([2]),然后利用Python当中的第三方库json^([3])对建好的词典树进行存储,最后用json读入词典树,用字典数据结... 基于Hash机制的Trie树在实现最大长度搜索的时候具有较高的查找效率^([1])。利用Python语言当中的字典数据结构来构建词典树^([2]),然后利用Python当中的第三方库json^([3])对建好的词典树进行存储,最后用json读入词典树,用字典数据结构当中的Hash机制快速地进行正反向最大长度匹配分词。 展开更多
关键词 PYTHON TRIE树 HASH 最大长度匹配 中文分词
下载PDF
垂直搜索引擎中分词技术的算法研究 被引量:3
2
作者 邹嵩 赵诗阳 周新志 《计算机技术与发展》 2012年第2期131-133,137,共4页
为了提高垂直搜索引擎的检索效率,介绍了垂直搜索引擎中的分词技术。文中主要通过研究最大长度匹配算法,提出了改进后的最大长度匹配算法以提高检索效率。改进后的算法显示,分词效果得到了一定的提升,体现了相对于普通最大长度匹配算法... 为了提高垂直搜索引擎的检索效率,介绍了垂直搜索引擎中的分词技术。文中主要通过研究最大长度匹配算法,提出了改进后的最大长度匹配算法以提高检索效率。改进后的算法显示,分词效果得到了一定的提升,体现了相对于普通最大长度匹配算法的优势。且通过将改进后的方法与普通最大长度匹配算法相比较可知,改进后的算法提高了搜索的正确率,提升了检索的效率,是一种对最大长度匹配算法的有效改进,由此也体现了搜索引擎中算法合理设计可以提升搜索性能。 展开更多
关键词 垂直搜索引擎 分词技术 最大长度匹配算法
下载PDF
Maximal sequence length of exact match between members from a gene family during early evolution
3
作者 温晓 郭兴益 樊龙江 《Journal of Zhejiang University-Science B(Biomedicine & Biotechnology)》 SCIE EI CAS CSCD 2005年第6期470-476,共7页
Mutation (substitution, deletion, insertion, etc.) in nucleotide acid causes the maximal sequence lengths of exact match (MALE) between paralogous members from a duplicate event to become shorter during evolution. In ... Mutation (substitution, deletion, insertion, etc.) in nucleotide acid causes the maximal sequence lengths of exact match (MALE) between paralogous members from a duplicate event to become shorter during evolution. In this work, MALE changes between members of 26 gene families from four representative species (Arabidopsis thaliana, Oryza sativa, Mus mus- culus and Homo sapiens) were investigated. Comparative study of paralogous’ MALE and amino acid substitution rate (dA<0.5) indicated that a close relationship existed between them. The results suggested that MALE could be a sound evolutionary scale for the divergent time for paralogous genes during their early evolution. A reference table between MALE and divergent time for the four species was set up, which would be useful widely, for large-scale genome alignment and comparison. As an example, de- tection of large-scale duplication events of rice genome based on the table was illustrated. 展开更多
关键词 最大长度精确匹配 MALE 分歧时间 家族遗传 核甘酸 基因染色体
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部