摘要
现实生活中,中文自由短文本大量出现,而短文本处理技术在话题跟踪与发现、流行语分析、舆情预警等领域都得到广泛的发展和利用。虽然信息抽取技术在一些领域已经得到了很好的研究应用,但针对中文自由短文本数据的抽取技术的研究则比较少。该文主要总结了当前中文短文本信息抽取方法的研究情况及存在的问题。提出了一种基于HNC的中文自由短文本信息抽取中的过滤、分类、聚类、模板生成等算法的开发及对其进行研究。
出处
《电脑知识与技术》
2012年第5X期3691-3692,共2页
Computer Knowledge and Technology
基金
南通市自然科学基金(BK2011070)
南通大学自然科学基金(No.03040850)
南通大学自然科学基金(No.03040846)