-
题名基于决策列表的中文同音词自动识别与校对
被引量:2
- 1
-
-
作者
石敏
高尚
-
机构
江苏科技大学计算机科学与工程学院
-
出处
《电子设计工程》
2015年第9期39-41,共3页
-
基金
人工智能四川省重点实验室开放基金(2012RYJ04)
中科院智能信息处理重点实验室开放课题(IIP2013-1)
-
文摘
中文文本校对是自然语言处理领域重要课题,在汉语校对中,文本错误有很多种,其中同音词错误占很大的比例,文中提出一种基于决策列表的方法,首先手工整理出常见的1000对同音词混淆集,通过大量语料训练出2元模型和上下文语境模型,校对文本时提取词以及它所有同音词的2元特征和上下文特征,根据训练好的模型计算出支持度,这就是同音词组决策列表的构建,从决策列表中判断哪个词的支持度最高,从而实现同音词自动查错与纠错。最后,为了改善由于数据稀疏带来的问题,文章用同义词聚类对实验进行了改进,提高了召回率等。根据实验,这种方法能有效的解决同音词错误。
-
关键词
同音词错误
决策列表
2元模型
上下文语境
-
Keywords
homophone errors
decision list
2-gram model
context
-
分类号
TN02
[电子电信—物理电子学]
-
-
题名基于决策列表的客户响应模型研究
- 2
-
-
作者
陈爱华
-
机构
安徽财经大学管理科学与工程学院
-
出处
《大众科技》
2013年第9期25-27,14,共4页
-
文摘
决策列表是进行数据分析和数据挖掘的重要方法,一般用于形成公司决策和模型预测。文章介绍了决策列表、关联规则及其客户响应模型的构建,然后将决策列表算法应用于金融机构营销计划的实施中,通过对历史数据分析得到一些较为实用的预测性客户属性规则,提高销售效率。
-
关键词
数据挖掘
决策列表
客户响应模型
-
Keywords
data mining
decision list
customer response model
-
分类号
TP31
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于决策表的数据挖掘建模方法研究
被引量:2
- 3
-
-
作者
杜松江
张继成
-
机构
长江大学工程技术学院
-
出处
《常州工学院学报》
2016年第2期51-54,共4页
-
文摘
挖掘模型的建立与评价是数据挖掘的核心部分。介绍了数据挖掘中的决策表算法,再以某商业银行CRM系统为例,选取银行营销活动历史数据为对象,并详述了通过Clementine数据挖掘软件建立银行客户响应预测模型的方法。
-
关键词
决策列表
CLEMENTINE
预测模型
响应率
-
Keywords
decision list
Clementine
prediction model
response rate
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名解决多音字字-音转换的一种统计学习方法
被引量:10
- 4
-
-
作者
张子荣
初敏
-
机构
北京理工大学计算机科学与工程系
北京理工大学微软亚洲研究院
-
出处
《中文信息学报》
CSCD
北大核心
2002年第3期39-45,共7页
-
文摘
字 -音转换是语音合成系统中的一个重要模块 ,其中多音词和以单字词形式存在的多音字读音的确定一直是个没有很好解决的问题。本文通过对大量标注有正确拼音的语料的统计 ,指出着重解决 4 1个重点多音字和 2 2个重点多音词就可基本解决字 -音转换的问题。本文采用基于扩展的随机复杂度的随机决策列表方法自动提取多音字 (词 )的读音规则 ,将字 -音转换的错误率由 8 8‰降低到 4 4‰。规则的训练和测试的材料的标注是一个耗费人力和时间的工作 ,而训练材料的数量和质量又直接影响最终的结果。本文提出一种半自动的语料标注流程 。
-
关键词
统计学习方法
随机决策列表
字-音转换
多音字
多音词
语言合成系统
语音规则
-
Keywords
ESC based stochastic decision list
grapheme to phoneme conversion
Polyphone character
Words with multi pronunciations
-
分类号
TN912.33
[电子电信—通信与信息系统]
-