-
题名基于Bert和自适应聚类的在线日志解析方法
- 1
-
-
作者
卢家伟
卢士达
刘思思
吴承荣
-
机构
复旦大学计算机科学技术学院
复旦大学网络信息安全审计与监控教育部工程研究中心
-
出处
《计算机科学》
CSCD
北大核心
2024年第11期65-72,共8页
-
基金
复旦大学网络信息安全审计与监控教育部工程研究中心与国家电网上海数据中心合作项目(09B307-9003001-0014-1)。
-
文摘
日志解析是一种从原始日志文件中提取有效信息的技术,它可以用于系统故障诊断、性能分析、安全审计等领域。日志解析的主要挑战在于日志数据的非结构化、多样性和动态性。不同的系统和应用程序可能使用不同的日志格式,随着时间的推移,日志格式也会发生变化。文中提出一种能够自适应不同日志源和日志格式变化的在线日志解析方法BertLP,它使用预训练语言模型Bert,并结合自适应聚类算法对日志中的单词进行静动态识别,从而对日志进行分组生成日志模板。BertLP方法不需要人工定义日志模板或正则表达式,也不需要对单词进行频率统计,而是通过学习日志消息的语义和结构特征,来自动识别日志字段和类型。在多个公开日志数据集上的对比实验显示,BertLP方法在日志解析的准确率上比现有最佳方法提高了6.1%,并且在日志解析任务上表现更好。
-
关键词
日志解析
Bert
自适应聚类
语义提取
-
Keywords
Log parsing
Bert
Adaptive clustering
Semantic extraction
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名商用多媒体信息发布系统持久层设计与优化
被引量:7
- 2
-
-
作者
吉亚云
刘新
叶德建
-
机构
复旦大学软件学院
复旦大学网络信息安全审计与监控教育部工程研究中心
-
出处
《计算机工程》
CAS
CSCD
北大核心
2015年第1期261-265,共5页
-
基金
上海市科技成果转化和产业化基金资助项目"基于云计算构建的电信网络交互式电视业务系统研发"(12511503000)
-
文摘
大规模的商业多媒体信息发布系统因资源及终端数量庞大,会导致系统性能低下。为此,提出一种能优化系统数据存取操作的数据持久层设计方案。研究并分析多媒体信息发布系统的特征,选择Hibernate框架设计系统持久层,总结Hibernate框架在该类系统中合理并高效使用的方法,针对基于Web的多媒体信息发布系统,给出可以使用Servlet过滤器来管理Hibernate的Session缓存,以延长Session对象的生命周期,减少系统对Session对象的查找,并能较为充分地利用Session对象中的缓存数据。实验结果表明,综合上述多种优化方法,可大幅减少多媒体信息发布系统的资源消耗,有效提高系统的整体性能。
-
关键词
多媒体信息发布系统
数据持久性
Session缓存
过滤器
-
Keywords
Multimedia Information Publishing System(MPS)
data persistence
Session cache
filter
-
分类号
TP37
[自动化与计算机技术—计算机系统结构]
-
-
题名拟态数据库的网络攻击抵御能力评估和实证
被引量:3
- 3
-
-
作者
万仕贤
赵瑜
吴承荣
-
机构
复旦大学网络信息安全审计与监控教育部工程研究中心
-
出处
《计算机应用与软件》
北大核心
2022年第1期319-327,共9页
-
基金
国家重点研发计划项目(2017YFB0803203)。
-
文摘
在复杂的网络环境中Web数据库面临诸多威胁和挑战。在传统数据库防护技术的基础上,提出一种基于动态异构冗余体系的拟态数据库应用。针对动态异构冗余的拟态数据库模型进行攻击抵御能力实证评估。重点针对拟态数据库的表决器部分进行评估和实验,从不利用软件漏洞的基础出发,使用应用软件的字符处理特性机制来完成攻击实验。论证得出在满足"共谋攻击"的条件下或者在掌握了一定数量的异构体应用漏洞信息的情况下,针对异构体的语义识别差异构造信息输出,可以实现敏感信息从表决器的多模裁决中逃逸,削弱系统设计的理论安全性。
-
关键词
拟态数据库
动态异构冗余
SQL注入
表决器
数据库语法
防御评估
-
Keywords
Mimetic database
Dynamic heterogeneous redundancy
SQL injection
Voter
Database syntax
Defense assessment
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名基于情感模型的文本意见分类方法
被引量:4
- 4
-
-
作者
罗邦慧
曾剑平
段江娇
吴承荣
-
机构
复旦大学计算机科学技术学院
复旦大学网络信息安全审计与监控教育部工程研究中心
上海理工大学管理学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2015年第5期175-179,共5页
-
基金
国家自然科学基金资助项目(61073170)
教育部人文社会科学研究规划基金资助项目(13YJAZH019)
-
文摘
基于向量空间模型、潜在语义分析等传统文本意见分类模型将文本映射到词汇或语义空间中,侧重于词汇的辨别能力,无法对映像空间给出明确的语义说明,导致其扩展性、准确率等方面的性能受到限制。为此,在人类情感分类理论的基础上,假设文本中的意见表达与人们的情感存在较强的关联,结合词汇语义扩展、特征选择等方法构造3种情感表示模型,把表达人类情感倾向的文本转换到情感空间中,利用情感模型对国外股票论坛信息提取情感特征,构建情感模型,并设计文本意见分类方法。针对实际股票论坛的数据进行实验,结果表明,该分类方法能获得较高的分类准确率。
-
关键词
Ekman模型
意见分类
特征选择
情感模型
机器学习
-
Keywords
Ekman model
opinion classification
feature selection
emotion model
machine learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于业务云的商用VOD视频点播系统
- 5
-
-
作者
申晨
叶德建
-
机构
复旦大学软件学院
复旦大学网络信息安全审计与监控教育部工程研究中心
-
出处
《微型电脑应用》
2016年第2期14-19,共6页
-
基金
工信部电子发展基金
-
文摘
随着商用VOD视频点播系统的普及和大规模发展,传统的基于"终端—服务器"模式的商用VOD视频点播系统在运营、升级、管理和维护等方面出现了诸多问题。为了解决这些工业界现实存在的问题,提出了一种新的基于业务云的商用VOD视频点播系统的解决方案,并且进行了实现。经过实际的项目测试及性能分析,测试了该解决方案的可行性及各项性能指标,实验结果表明该系统可以很好的解决传统商用VOD视频点播系统所带来的弊端,并且性能表现良好。
-
关键词
商用视频点播系统(VOD)
业务云
云运营
云升级
云运维
-
Keywords
Commercial Video on Demand System
Industry-specific Cloud
Loud-operation
Cloud-upgrade
Cloud-maintenance
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-