-
题名基于Lucene的站内搜索设计与实现
被引量:12
- 1
-
-
作者
朱学昊
王儒敬
余锋林
唐昱
-
机构
中国科学院合肥智能机械研究所
中国科学技术大学
-
出处
《计算机应用与软件》
CSCD
北大核心
2008年第10期6-8,共3页
-
基金
国家863高科技发展研究计划资助项目(2003AA118070)
-
文摘
简述了站内全文检索的必要性,介绍了一种基于Lucene的全文检索系统模型,相对于Google的站内检索和传统的数据库检索都有较为明显的优势。该模型引入更好的中文分词技术,可自定义最终结果的排序。能够保证检索的前100条记录最符合检索者的需要。
-
关键词
全文检索
LUCENE
中文分词
信息抽取
-
Keywords
Full text search engine Lucene Chinese word segmentation Information retrieval
-
分类号
TP316
[自动化与计算机技术—计算机软件与理论]
U285.6
[交通运输工程—交通信息工程及控制]
-
-
题名隐含语义索引技术在供求信息分类中的应用
- 2
-
-
作者
朱学昊
王儒敬
-
机构
中国科学院合肥智能机械研究所
-
出处
《计算机工程与应用》
CSCD
北大核心
2007年第14期192-194,共3页
-
基金
国家高技术研究发展计划(863)(No.2003AA118070)~~
-
文摘
介绍了一种信息抽取和自动分类的新应用,分析了传统分类方法的不足,介绍了一种基于隐含语义索引技术的文本分类改进方案。该技术是一新型的检索模型,它通过奇异值分解,或增强或消减词在文档中的语义影响力,使得文档之间的语义关系更为明晰,从而能容易地剔除掉那些语义关联弱的噪声数据,提高特征值提取精度和最后的分类准确度。
-
关键词
隐含语义索引
奇异值分解
文本分类
信息抽取
-
Keywords
latent semantic indexing
singular Implementation of supply and demand information classification based on latent semantic indexing value decomposition
text classification
information retrieval
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于差别矩阵的动态约简及规则提取算法
被引量:2
- 3
-
-
作者
余锋林
王儒敬
朱学昊
王慧桥
-
机构
中国科学院合肥智能机械研究所
中国科学技术大学自动化系
-
出处
《自动化与仪表》
2007年第6期1-4,共4页
-
基金
国家863高科技发展研究计划资助项目(编号:2003AA118070)
-
文摘
属性约简与规则提取是粗集研究的重要内容。该文在分析基于差别矩阵的约简及规则提取算法的基础上提出了一种改进算法,提高了规则的挖掘效率,获得了更简单的规则集,并通过实例证明了该算法的有效性、实用性。
-
关键词
差别矩阵
属性约简
属性值约简
-
Keywords
discernibility matrix
attribute reduction
value reduction
-
分类号
TN21
[电子电信—物理电子学]
-
-
题名ELL3通过LINE-1调节小鼠细胞原始多能性
- 4
-
-
作者
常展赫
朱学昊
高绍荣
高亚威
-
机构
同济大学生命科学与技术学院
同济大学细胞干性与命运编辑前沿科学中心
-
出处
《科学通报》
EI
CAS
CSCD
北大核心
2023年第33期4433-4435,共3页
-
文摘
人类基因组中有超过50%的序列是转座子序列(transposon elements,TE).转座子又称跳跃基因,是一类可以在基因组中进行自我复制和粘贴的DNA元件[1].转座子主要分为DNA转座子和反转录转座子,其中反转录转座子会先转录产生RNA,再反转录成DNA来完成转座.长散在重复序列(long interspersed nuclear elements-1,LINE-1)是哺乳动物基因组中最丰富的转座元件家族之一,在人类基因组中占比大约为17%[2].
-
关键词
反转录转座子
人类基因组
跳跃基因
自我复制
转座元件
多能性
小鼠细胞
-
分类号
Q75
[生物学—分子生物学]
-