-
题名Web站点核心逻辑结构挖掘
被引量:1
- 1
-
-
作者
郑皎凌
王鹏
-
机构
成都信息工程学院软件工程系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第21期57-58,61,共3页
-
基金
国家自然科学基金资助项目(60702075)
-
文摘
已有Web结构挖掘研究主要是挖掘出站点的核心节点而非整个结构。为此,设计Web站点逻辑域核及其导入路径的模型,提出Web站点逻辑域核挖掘算法和逻辑域核导入路径挖掘算法。在4个大型Web站点上的实验结果表明,Web站点逻辑域核挖掘算法和导入路径挖掘算法均能够达到较高的精度和召回率。
-
关键词
Web站点核心逻辑结构
逻辑域
逻辑域核
导入路径
-
Keywords
Website kernel logical structure
logical domain
logical domain core
entry path
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名大型Web站点逻辑域挖掘算法
- 2
-
-
作者
郑皎凌
-
机构
成都信息工程学院软件工程系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2008年第9期101-102,105,共3页
-
文摘
通过进一步发展Wen-SyanLi等人提出的Web站点逻辑域理论,该文提出Web站点逻辑域核模型及建立在其上的逻辑域挖掘算法。该算法通过对Web站点超链接的图结构进行运算,得到Web站点逻辑域。与Wen-SyanLi算法对比测试,结果表明在获得相同逻辑域个数的情况下,克服了其采用启发式方法所带来的效率问题。在对4个大型Web站点的单独测试中,平均能够达到85%的逻辑域挖掘精度。
-
关键词
Web站点结构挖掘
逻辑域
逻辑域核
-
Keywords
website structure mining
logical domain
logical domain core
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-