期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于CRF模型的维吾尔语分词研究
1
作者 李成华 孙雅婧 +1 位作者 张世娟 艾提日也古丽·艾尼瓦尔 《中南民族大学学报(自然科学版)》 CAS 2019年第4期596-604,共9页
条件随机场能够很好地处理序列标注问题.引入条件随机场进行维吾尔语分词方法研究,主要包括制定词性和分词单独标注与一体化标注集并建成语料库;设计不同特征模板进行训练测试,反复比较实验结果,总结优化以获取最佳的特征模板.在设计特... 条件随机场能够很好地处理序列标注问题.引入条件随机场进行维吾尔语分词方法研究,主要包括制定词性和分词单独标注与一体化标注集并建成语料库;设计不同特征模板进行训练测试,反复比较实验结果,总结优化以获取最佳的特征模板.在设计特征模板时充分结合维吾尔语语言形态特征,采用了对称特征组合非对称特征的设计方法,并将获得的最佳分词模板应用到分步预测词性和分词实验中.相比单独分词标注,分词时加入词性特征列进行分词与词性一体化标注能展现更优的分词性能. 展开更多
关键词 条件随机场 维吾尔语分词 特征模板 分词模型 分步实验
下载PDF
基于BI-LSTM-CRF模型的维吾尔语分词研究 被引量:1
2
作者 孙雅婧 李成华 +2 位作者 杨斌 江小平 艾提日也古丽·艾尼瓦尔 《青海师范大学学报(自然科学版)》 2019年第4期5-12,共8页
在充分研究维吾尔语言形态特征的基础上,制定相应的分词规则并手工标注原始语料,建成原始语料库;针对传统机器学习分词方法过度依赖背景知识和特征选取的问题,提出了一种基于长短期记忆(LSTM)神经网络改进的双向长短时记忆条件随机场(BI... 在充分研究维吾尔语言形态特征的基础上,制定相应的分词规则并手工标注原始语料,建成原始语料库;针对传统机器学习分词方法过度依赖背景知识和特征选取的问题,提出了一种基于长短期记忆(LSTM)神经网络改进的双向长短时记忆条件随机场(BI-LSTM-CRF)网络模型来进行维吾尔语分词,其能够有效地使用过去和未来的输入特征.利用该分词模型与基于传统机器学习方法的条件随机场(CRF)模型对比,实验结果表明,使用BI-LSTM-CRF模型分词性能有明显提高,且具有良好的泛化能力. 展开更多
关键词 维吾尔语分词 BI-LSTM-CRF CRF 对比实验
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部