期刊文献+

水利水电行业专用中文分词方法研究 被引量:1

A Chinese word segmentation method exclusive to water conservancy and hydropower industry
下载PDF
导出
摘要 为改善对当前水利水电行业中大量以自然语言文本形式存在的相关资料挖掘不充分和利用率偏低的现状,在分析水利水电行业文本资料数据特点的基础上,构建水利水电行业的基本词典库,并对Jieba分词器进行算法改进,生成一种水利水电行业专用中文新分词方法,并利用新分词方法对1988-2007年的全国水利工作会议报告进行分析。分析结果表明:提出的新分词方法可以准确地进行语句切分,有利于相关行业研究人员从大量现存文本资料中挖掘出更多潜在的高价值信息。 To improve the current situation of insufficient mining and low utilization of valuable materials in the form of natural language text in the water conservancy and hydropower industry,this article analyzes the characteristics of text data in the industry,builds a specific database and improves the algorithm of Jieba word segmentation,which eventually forms a specific word segmentation method for water conservancy and hydropower industry.This method is applied to the reports of the National Water Conservancy Work Conference from 1988 to 2007.Analysis results show that this method performs well in sentence and word segmentations,which has great value in uncovering more high-value information hidden in a large number of existing text materials.
作者 唐颖复 江新兰 张伟兵 王志璋 缪纶 TANG Yingfu;JIANG Xinlan;ZHANG Weibing;WANG Zhizhang;MIAO Lun(China Institute of Water Resources and Hydropower Research,Beijing 100038,China)
出处 《水利信息化》 2021年第1期20-25,79,共7页 Water Resources Informatization
基金 国家社科基金重点项目(14AZD128)。
关键词 中文分词 Jieba分词 算法改进 水利水电行业 专用 正向匹配法 水利工作会议 Chinese word segmentation Jieba word segmentation algorithm improvement water conservancy and hydropower industry exclusive use forward matching national water conservancy work conference
  • 相关文献

参考文献10

二级参考文献77

共引文献521

同被引文献13

引证文献1

二级引证文献3

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部