-
题名基于机器学习的红楼梦作者鉴定
- 1
-
-
作者
车东宇
李新靓
王心如
吴宇航
-
机构
华北理工大学理学院
华北理工大学以升创新教育基地
华北理工大学数学建模创新实验室
河北省数据科学与应用重点实验室
-
出处
《新一代信息技术》
2018年第3期41-47,共7页
-
基金
国家自然基金资助项目(No.11601151)。
-
文摘
《红楼梦》是中国古典小说巅峰之作,中国封建社会的百科全书,传统文化的集大成者,但由于历史原因,《红楼梦》在传播和保留过程中出现了令人遗憾的缺失,目前公认的版本是前80回为曹雪芹本著,高鹗续后40回,现通过建模佐证前80回与后40回作者不同。用朴素叶贝斯分类器通过字的频率,判别《红楼梦》的章回作者不同。首先,对每一章节进行分词,建立词频矩阵;接着使用非参数检验剔除显著性不大的人称代词;然后筛选出所有在每一章回出现大于6次的字;最后将频繁出现的字创建指示特征,利用红、玉等125个特征,训练朴素叶贝斯分类器,成功预测出作者的不同,预测正确率高达97%。针对词的判断,首先引入红楼梦词语等细胞词库,使章回分词更加精确;接着,筛选出与文章情节关联不大的词语,计算词在每一章出现的频率的标准差,选择标准差小于0.9的词语作为特征;最后利用“宝玉”,“咱们”等256个词语作为特征训练建立的朴素叶贝斯分类器,成功预测出作者的不同,正确率高达95%。
-
关键词
朴素贝叶斯分类器
R语言
词频
数据预处理
-
Keywords
Naive bayesian classifier
R language
Word frequency
Data preprocessing
-
分类号
I20
[文学—中国文学]
-
-
题名基于遗传算法的RGV动态调度问题
- 2
-
-
作者
李新靓
王心如
车东宇
吴宇航
-
机构
华北理工大学以升创新教育基地
华北理工大学理学院
华北理工大学数学建模创新实验室
河北省数据科学与应用重点实验室
-
出处
《新一代信息技术》
2018年第2期13-21,共9页
-
基金
国家自然基金资助项目(No.11601151)。
-
文摘
RGV(有轨穿梭小车)提高了劳动生产率,在制造业,调度是实现制造业生产高效率、高柔性和高可靠性的关键,分别考虑一道工序与两道工序的物料加工形式、正常工作与发生故障的情况,制定合理的RGV动态调度策略拥有强大的时代背景和现实意义。在一定时间内,加工工件到达数量呈泊松分布,根据泊松公式解得一班(8个小时)内加工工件数约为235个。确定指标时选取产品完成时间、生产周期等时间指标,原材料成本、人工成本等成本指标,人员利用率、时间利用率等资源指标作为优化约束条件。最后应用遗传算法对RGV动态调度问题进行求解,编码方式应用基于工序的编码方式;插入贪婪解码算法对传统遗传算法进行优化;应用POX交叉算子进行交叉操作,使其可继承父代优良特征;为保持群体多样性、改善子代性能采用基于邻域搜索的变异操作;在选择操作过程中结合最佳个体保存和比例选择,引入个体竞争,来提高全局收敛和计算效率;最后得出235个工件一班之内的加工顺序流程。
-
关键词
泊松分布
遗传算法
POX交叉算子
贪婪解码算法
个体竞争
-
Keywords
Poisson distribution
Genetic algorithm POX crossover operator
Greedy decoding algorithm
The individual competition
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名基于种群竞争模型的出租市场对比分析
- 3
-
-
作者
王心如
车东宇
李新靓
吴宇航
-
机构
华北理工大学以升创新教育基地
华北理工大学理学院
华北理工大学数学建模创新实验室
河北省数据科学与应用重点实验室
-
出处
《新一代信息技术》
2018年第3期34-40,47,共8页
-
基金
国家自然基金资助项目(No.11601151)。
-
文摘
出租车一直是便捷交通的不二选择,近年来,网约车伴随“互联网+”的潮流,短时间内迅猛发展,冲击了出租车市场,与传统出租车在出租出行市场中呈现出显著的博弈关系。为分析两者运营状况,并预测未来三年网约车与传统出租车市场份额的变化情况首先建立模糊综合评价模型,运用调查所得2014-2017年网约车与传统出租各指标的数据,得到评估结果:网约车迅猛发展,但略有回落;传统出租车总体占有优势,但发展滞后,改革后情况缓和。再建立种群竞争模型,进一步分析未来运营状况:网约车的竞争潜力更大,在2019年左右或将超越传统出租车的地位。最后应用灰色预测模型并进行精度检验,在精度合理范围内,基于2014-2017年数据预测未来三年网约车的市场份额分别为:0.39138,0.39611,0.40091;传统出租车未来三年市场份额为0.60057,0.59601,0.59147。
-
关键词
模糊综合评价模型
种群的竞争模型
灰色预测模型
-
Keywords
Fuzzy comprehensive evaluation model
Population competition model
Gray forecast model
-
分类号
F42
[经济管理—产业经济]
-