期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
新经济业态P2P网络借贷的风险甄别研究 被引量:45
1
作者 范超 王磊 解明明 《统计研究》 CSSCI 北大核心 2017年第2期33-43,共11页
国内P2P网贷平台存在的问题及风险令人触目惊心,本研究旨在探索P2P网络借贷这一重要新经济业态的风险甄别问题。本文在我国444家P2P平台基本信息与交易信息基础上,通过网络爬虫获取了30万余条网民评论和新闻数据,利用文本挖掘技术提取... 国内P2P网贷平台存在的问题及风险令人触目惊心,本研究旨在探索P2P网络借贷这一重要新经济业态的风险甄别问题。本文在我国444家P2P平台基本信息与交易信息基础上,通过网络爬虫获取了30万余条网民评论和新闻数据,利用文本挖掘技术提取了重要的外部信息,综合使用11种统计模型评估变量的重要性并讨论其经济意义。研究表明:1平台风险与基本信息、交易信息和外部信息间存在复杂的非线性关系,SVM、树类模型等非线性模型对预判P2P平台风险更加有效;2网民评论、关注度等基于互联网的非结构化信息,以及平均利率波动、资金净流入波动、未来待还金额波动等信息对甄别风险具有重要的作用;3根据拍拍贷的案例,小额、超短期、男性借款人具有更高的违约风险;4基于线性模式的传统风险指数构建方法并不适用于甄别P2P平台风险。有关部门应从完善法律法规、加大信息披露力度、发布风险预警综合指数等对P2P行业进行监管。 展开更多
关键词 P2P网络借贷 大数据 文本挖掘
下载PDF
融合互联网文本大数据的上市企业信用评价 被引量:3
2
作者 韩嵩 李晓俊 《统计学报》 2021年第5期72-81,共10页
以2008—2019年制造业上市企业为研究样本,爬取年度财务报告与互联网股民评论文本数据,建立包含风险透明度和股民信心的上市公司信用评价指标体系,并利用随机森林、AdaBoost和Bagging三种集成学习模型构建评价模型。研究发现,年度财务... 以2008—2019年制造业上市企业为研究样本,爬取年度财务报告与互联网股民评论文本数据,建立包含风险透明度和股民信心的上市公司信用评价指标体系,并利用随机森林、AdaBoost和Bagging三种集成学习模型构建评价模型。研究发现,年度财务报告与股民评论文本中所蕴涵的文本数据对信用评价具有有效性,且随机森林具有更优的预测效果与模型泛化能力。 展开更多
关键词 互联网文本大数据 信用评价 风险透明度 股民信心 集成学习模型
下载PDF
互联网基金对股票市场的影响——基于大数据情绪指数的实证研究 被引量:6
3
作者 许承明 田婧倩 《南京审计大学学报》 2016年第6期33-40,共8页
投资者在进行投资决策时易受到自身情绪的影响,并且投资者行为是影响金融市场间波动溢出的直接原因。运用文本挖掘技术对新浪微博2014年4月至2016年7月的博文进行文本分析和随机森林-主成分分析并构建微博大数据投资者情绪指数,根据投... 投资者在进行投资决策时易受到自身情绪的影响,并且投资者行为是影响金融市场间波动溢出的直接原因。运用文本挖掘技术对新浪微博2014年4月至2016年7月的博文进行文本分析和随机森林-主成分分析并构建微博大数据投资者情绪指数,根据投资者情绪指数研究互联网基金市场对股票市场的影响,结果表明互联网基金市场对股票市场具有波动溢出效应。 展开更多
关键词 互联网基金市场 大数据情绪指数 文本挖掘 波动溢出效应 投资者行为 投资者情绪指数 互联网 金融 股票市场 余额宝
下载PDF
基于互联网社交媒体的“河湖长制”舆情分析系统构建 被引量:2
4
作者 陈喆 魏思奇 +3 位作者 吴仪邦 文雄飞 向大享 李经纬 《长江科学院院报》 CSCD 北大核心 2021年第10期174-179,191,共7页
微博作为目前主流的互联网社交媒体,群众可在其上随时随地发布“河湖长制”相关的事件信息。通过微博对感兴趣事件进行提取与分类可以有效提高“河湖长制”管理过程中问题事件的发现与解决效率,并针对群众对河湖岸线管理状态评价进行有... 微博作为目前主流的互联网社交媒体,群众可在其上随时随地发布“河湖长制”相关的事件信息。通过微博对感兴趣事件进行提取与分类可以有效提高“河湖长制”管理过程中问题事件的发现与解决效率,并针对群众对河湖岸线管理状态评价进行有效的监测与分析。随着“互联网+”技术在河湖长制中发挥巨大作用,对微博社交大数据在“河湖长制”管理工作中的应用进行了探讨,基于互联网社交媒体中含有的大量关于“河湖长制”事件的文字描述信息,提出了微博社交文本信息挖掘系统框架,采用互联网爬取技术和语义分析技术抓取关于“河湖长制”事件的新闻和公众信息,并对事件进行识别,提取时间、位置和事件类型等标签,最后进行数据挖掘分析情感倾向。以2018年6月至2020年12月微博上珠江河网区数据为实例,情感分析模型在测试集上的事件分类准确率为88.6%,证明该模型具有一定的可用性。该舆情分析系统可极大提高了“河湖长制”管理效率。 展开更多
关键词 互联网大数据 文本处理 河湖长制 舆情分析 语义建模
下载PDF
基于大数据的网络舆情文本挖掘方法
5
作者 赵宇 《信息与电脑》 2021年第12期184-186,共3页
传统的文本挖掘方法由于不能准确划分网络舆情关键词,导致文本挖掘时的聚类效果不佳。为此,本文提出基于大数据的网络舆情文本挖掘方法。首先,通过分布式处理方法控制系统延展性,创新文本混合数据储存形式,根据建立语义解析机制;其次,... 传统的文本挖掘方法由于不能准确划分网络舆情关键词,导致文本挖掘时的聚类效果不佳。为此,本文提出基于大数据的网络舆情文本挖掘方法。首先,通过分布式处理方法控制系统延展性,创新文本混合数据储存形式,根据建立语义解析机制;其次,划分网络舆情关键词,划分文本特征为定义性原始数据和描述性原始数据;最后,提取网络舆情文本特征,基于大数据构建文本挖掘模型,完成基于大数据的网络舆情文本挖掘方法设计。 展开更多
关键词 大数据分析 网络舆情 文本挖掘 文本特征 聚类效果 语义分析
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部