摘要
基于哈萨克语文本语料特点,分析名词短语构成规则,结合互信息(MI)知识,建立了哈萨克语名词短语特征模板,利用条件随机场(CRF)模型实现哈萨克语名词短语自动获取。实验表明,哈萨克语名词短语获取正确率达到95.2%,获取性能高于基于规则、基于规则与互信息结合的抽取方法。
出处
《图书馆理论与实践》
CSSCI
北大核心
2015年第8期101-105,共5页
Library Theory and Practice
基金
国家自然科学基金项目"基于网络社群的网络舆情演化分析及突发事件预警机制研究"(项目编号:71261025)
新疆财经大学社会经济统计研究中心项目"新疆互联网舆情倾向性调查与分析研究"(项目编号:050313C08)
"新疆区情民意网络调查系统设计与网络舆情调查分析"(项目编号:050312C08)
新疆财经大学校级科研基金项目"基于统计方法的新疆民文网络舆情情感倾向性分析技术研究"(项目编号:2013XYB005)阶段性成果之一