摘要
互联网中存在着大量的文本信息,而对于这些文本信息的监管还存在着很大的盲区,如何从互联网的大量信息中进行相关舆情分析、预测及管控是信息安全领域中的新课题,其中文本特征的有效提取是研究内容之一。文章基于知网中语义词语语义相似度的计算方法提出一套建立在之上的语句语义相似度的计算方法,并用此方法提取出文本的特征。
There exists great text information on the internet, and there is still big unknown area in the inspection of the information. How to analyze, forecast and inspect the information will be a new issue in the field of information security. The paper, based on the calculation of semantic comparability in the how-net, proposes a series of method for calculating the semantic similarity and thus identifying the features of the text.
出处
《信息安全与通信保密》
2009年第5期89-91,共3页
Information Security and Communications Privacy
基金
上海交通大学PRP项目资助(T03613010)
国家自然科学基金项目(60772098)
教育部新世纪优秀人才支持计划项目(NCET-06-0393)
上海市曙光计划项目
863计划(2007AA012455)
关键词
离散文本
知网
语义相似度
discrete text
how-net
semantic comparability