-
题名基于合并因子的多种格式文件索引技术
被引量:2
- 1
-
-
作者
孙广路
易成岐
郎非
-
机构
清华大学信息技术研究院
哈尔滨理工大学计算机科学与技术学院信息安全与智能技术研究中心
哈尔滨理工大学外国语学院
-
出处
《哈尔滨理工大学学报》
CAS
2012年第2期1-4,共4页
-
基金
国家自然科学基金(60903083)
黑龙江省自然科学基金(F200936)
教育部人文社科项目(11YJC740048)
-
文摘
为了改进传统的文本检索技术存在检索文件格式种类单一,索引大数据量文件速度慢,甚至造成内存溢出等问题,基于Lucene系统及相关技术,研究了基于合并因子的多种格式文件索引技术,并在此基础上构建了中文文本信息检索系统.实验分析表明,本系统有效地实现了多种格式文件检索功能,通过合并因子的设定有效提高了索引速度,系统可靠性高.
-
关键词
文本检索
合并因子
多种格式文件索引
-
Keywords
text retrieval
merging factor
multiple formats file indexing.
-
分类号
TM391.3
[电气工程—电机]
-
-
题名基于混合方法的流量测量系统(英文)
被引量:5
- 2
-
-
作者
孙广路
郎非
杨明明
-
机构
哈尔滨理工大学计算机科学与技术学院
清华大学信息技术研究院
哈尔滨理工大学外国语学院
-
出处
《电机与控制学报》
EI
CSCD
北大核心
2011年第6期91-96,共6页
-
基金
国家自然科学基金(60903083)
黑龙江省自然科学基金(F200936)
黑龙江省高等学校新世纪优秀人才项目(1155-ncet-008)
-
文摘
流量测量是流量控制和管理中的关键问题。传统方法对于当今网络中大量出现的具备动态端口、加密载荷信息或未知协议载荷特征等特点的流量无法进行有效地测量。虽然基于机器学习模型的测量方法能够在一定程度上解决上述问题,但是由于现有特征的区分能力有限,该类方法单独使用时,难以在大规模的真实网络流量中准确地测量出某种特定协议的流量。为了解决流量测量问题,提出了基于混合方法的流量测量系统,融合了基于端口、基于特征串匹配、基于正则表达式匹配和基于机器学习模型的多种流量测量方法。在构建系统框架和相关模块的基础上,应用一种混合方法解决了基于安全套接层协议的流量测量和应用层协议分析问题。实验结果表明,该混合方法能够测量出超过99%的基于安全套接层协议的流量,并有效地分析其中不同应用层协议的流量,准确率达到93.76%。此外,在稳定而可行的内存占用率下,系统能够良好运行,总体测量结果优于开源软件OpenDPI的结果。
-
关键词
流量控制和管理
流量测量
混合方法
机器学习模型
-
Keywords
Traffic Control and Management
Traffic Measurement
Hybrid Methods
Machine Learning Model
-
分类号
TP274
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名秸秆资源海量存储系统的设计与实现
被引量:1
- 3
-
-
作者
孙广路
张洛什
薛一波
-
机构
清华大学信息技术研究院
哈尔滨理工大学计算机科学与技术学院信息安全与智能技术研究中心
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2011年第S1期78-83,共6页
-
基金
公益性行业(农业)科研专项经费资助(200803033
hykj200803033)
+1 种基金
黑龙江省自然科学基金项目(F200936)
哈尔滨市科技创新人才专项基金项目(2010RFQXG042)
-
文摘
海量数据资源的存储和保护是目前信息存储技术中的重要问题.采用磁盘阵列进行数据存储并保护数据安全,同时利用双机热备技术保护系统的持续运行是目前海量数据存储和管理的最佳解决方案之一.依据建立秸秆资源基础数据库的需求,分析研究了不同磁盘阵列模式的固性及特点,提出新的磁盘阵列选择方法,设计实现了磁盘阵列及双机热备系统,最终建立了合理的秸秆资源基础数据库海量存储系统,实现了"数据永不丢失,系统永不停机"的要求.同时,大规模的数据与信息资源平台的建立既满足了相关研究人员的研究需求,也为广大农民群众提供了丰富的应用信息及知识.
-
关键词
海量存储系统
磁盘阵列
双机热备
-
Keywords
mass storage system
RAID
dual computer hot-standby system
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名基于链路同质性的应用层流量分类方法
被引量:1
- 4
-
-
作者
董辉
孙广路
李丹丹
肖锋
-
机构
哈尔滨理工大学计算机科学与技术学院信息安全与智能技术研究中心
-
出处
《哈尔滨理工大学学报》
CAS
2013年第4期84-88,共5页
-
基金
黑龙江省普通高等学校新世纪优秀人才培养计划(1155-ncet-008)
教育部人文社科项目(11YJC740048)
+1 种基金
黑龙江省教育科学规划课题(GBC1211062)
黑龙江省研究生创新科研项目(YJSCX2012-125HLJ)
-
文摘
随着高速网络链路中数据量的剧增,以及越来越多的流行应用使用动态端口或使用加密流量通信,导致传统的网络流量分类方法失效.本文研究了应用层流量中存在的链路同质性,结合统计关联学习方法和流量传播图挖掘方法,提出了一种基于链路同质性的应用层流量分类方法.我们分析数据集中邻接链路之间的统计依赖关系并应用于网络协议识别,而不依赖于数据包载荷与网络流特征.实验结果表明,本文提出的方法能够实现超过80%的流量识别精度.
-
关键词
流量分类
应用层流量
链路同质性
-
Keywords
traffic classification
application layer traffic
link homophily
-
分类号
TM391
[电气工程—电机]
-