-
题名中文词语搭配特征提取及文本校对研究
被引量:10
- 1
-
-
作者
陶永才
海朝阳
石磊
卫琳
-
机构
郑州大学信息工程学院
郑州大学产业技术研究院
郑州大学软件技术学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2018年第11期2485-2490,共6页
-
基金
河南省高等学校重点科研项目(16A520027)资助
-
文摘
随着网络的快速发展,电子文本正在人们的生活中发挥着越来越重要的作用,但是电子文本中存在着大量的字词错误以及语法错误,亟需有效的校对方法来提高电子文本的质量.本文提出一种基于词语搭配关系的文本校对方法,包括构建语法-词语搭配双层知识库以及基于互信息和聚合度双重评价条件下的词语搭配校对算法.知识库的构建主要分为语法和词语搭配两部分:(1)从训练语料中抽取并分析语句结构成分,构建语法成分知识库;(2)从训练语料中学习词语之间的搭配关系,利用共现频数和互信息进行筛选,构建词语搭配知识库.在此基础上,综合使用互信息和聚合度评价词语关联强度,进行词语搭配关系校对.实验结果显示,本文所提出的校对模型和算法的F值与其他文献相比提高了3.9%.
-
关键词
词性关联
文本校对
正向关联
知识库
语法分析
-
Keywords
part of speech association
text proofreading
positive correlation
knowledge base
grammar analysis
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种结合LSTM和集成算法的文本校对模型
被引量:11
- 2
-
-
作者
陶永才
吴文乐
海朝阳
石磊
卫琳
-
机构
郑州大学信息工程学院
郑州大学软件技术学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2020年第5期967-971,共5页
-
基金
科技部重点研发计划项目(2018YFB1701400)资助.
-
文摘
伴随着互联网的飞速发展,各行各业产生了大量的电子文本数据,但是这些文本经常存在语义错误,数据质量良莠不齐,如何提高电子文本的质量是亟待解决的难题.本文设计一种基于集成算法和长短时记忆网络的集成模型,提高语义特征检测和校对的准确性.主要工作分为三部分:(1)使用神经网络和HowNet学习词语-义原之间的搭配关系;(2)将抽象化信息输入至长短时记忆网络集成模型,预测语义搭配关系;(3)结合模糊匹配方法,依据聚合度对预测结果投票并排序,将排名靠前的结果作为校对建议输出.实验结果显示,本文提出的校对模型和算法与其他文献相比在检错准确率和校对准确率上分别提高了1.8%和2.3%.
-
关键词
文本校对
模糊匹配
集成算法
特征检测
-
Keywords
text proofreading
fuzzy matching
integrated algorithm
feature detection
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名公路桥梁施工中高性能混凝土的作用分析
- 3
-
-
作者
海朝阳
-
机构
浙江交工国际工程有限公司
-
出处
《华东科技(综合)》
2020年第7期185-185,193,共2页
-
文摘
社会经济、科技的飞速进步,极大的推动了我国公路桥梁工程的建设速度。新时期下,普通混凝土已经很难满足公路桥梁的施工要求、工程的耐久性,以及行车行船的舒适度、安全性。在此背景下,高性能混凝土技术得到了高度关注,并且得以在公路桥梁施工中应用。由于该技术的应用时间较短,所以缺乏一定的施工经验。为了促进我国公路桥梁事业的持续发展,本文首先针对高性能混凝土的特点进行分析,继而探讨了这一技术在公路桥梁工程施工中的应用方法。
-
关键词
公路桥梁
施工技术
高性能混凝土
-
分类号
N
[自然科学总论]
-