摘要
随着专利数量的翻倍增长,技术发展日新月异。为了从浩瀚无穷的信息资源中发掘出具有巨大潜在价值的知识,文本挖掘重点技术正悄然而起,受到学术界和研究界的热切关注。文本挖掘重点技术目前尚处于初步发展阶段,技术的开发困境重重;同时,由于目前文本挖掘重点技术研究层面较浅,缺乏统一的理论总结,需要更多国内外学者参与到其中的理论研究讨论,推动文本挖掘重点技术的深入发展。在专利数量巨大和信息技术日益复杂化的时代背景下,笔者对文本挖掘的特征、文本的分类与聚类,以及文本挖掘重点技术的系统原理和体系框架作初步分析,对目前文本挖掘重点专利技术中的主题词词频、共词分析、引文聚类和文本聚类进行梳理,并深入发掘文本挖掘任务和功能,为其未来发展提供建议。
出处
《漯河职业技术学院学报》
2015年第5期48-49,共2页
Journal of Luohe Vocational Technical College