期刊文献+

二次检索

题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息

年份

学科

共找到2篇文章
< 1 >
每页显示 20 50 100
基于分步降维框架的股吧短文本数据关键信息抽取与个股收益预测 被引量:1
1
作者 卢珊 王惠文 赵吉昌 《计量经济学报》 CSSCI CSCD 2023年第3期707-721,共15页
社交媒体是股市投资者获取金融信息的重要来源,其中携带的情感等信号与股价走势关系密切.但社交媒体信息表达随意,口语化严重,长度较短且语义密度低,使得基于情感词典的传统文本分析方法存在损失有价值词汇的风险.近期Fan et al.(2021)... 社交媒体是股市投资者获取金融信息的重要来源,其中携带的情感等信号与股价走势关系密切.但社交媒体信息表达随意,口语化严重,长度较短且语义密度低,使得基于情感词典的传统文本分析方法存在损失有价值词汇的风险.近期Fan et al.(2021)提出的分步降维框架试图通过充分利用文本本身的语义特征以提升关键信息抽取的精准性.本文将这一框架扩展至社交媒体情景,以系统探索东方财富网股吧短文本是否为个股价格走势提供有效的前导信息.具体而言,首先使用主成分分析方法提取文本中的公共因子,继而对残差矩阵依次实施变量扫描进一步过滤信息,再采用Lasso回归构建预测模型,从而在实现降维的基础上,更大程度地挖掘文本中蕴含的面向个股的独特价值语义.结果表明该框架能够较好地从股吧短文本中抽取预测个股收益的信息.此外,其识别出的具备预测能力的词汇集合也体现了社交媒体短文本不同于其他金融文本的特点,且与传统的金融情感词典差异较大.因此,该分步降维框架为分析社交媒体短文本数据提供了新思路. 展开更多
关键词 社交媒体 短文本数据 主成分分析 变量筛选 股价预测
原文传递
基于社交平台数据的文本分类算法研究 被引量:9
2
作者 施瑞朗 《电子科技》 2018年第10期69-70,75,共3页
文本分类是文本挖掘、机器学习、自然语言处理等诸多领域的子问题之一,在过去的十多年里,网络上的文本数据量呈现高速增长的趋势,尤其是在社交类平台,其文本数据大多都以文本长度短、数量多的形式出现,如何将这些短文本数据进行分类以... 文本分类是文本挖掘、机器学习、自然语言处理等诸多领域的子问题之一,在过去的十多年里,网络上的文本数据量呈现高速增长的趋势,尤其是在社交类平台,其文本数据大多都以文本长度短、数量多的形式出现,如何将这些短文本数据进行分类以及提取出每个类中的具有代表性的词语是文本分类的一大难题,且目前在社交平台上关于短文本的文本分类研究甚少。文中抓取一部分社交平台Twitter上的数据,使用不同的机器学习算法进行模型训练和模型评估,实验结果表明,基于SVM的模型在短文本分类上有较好的表现。 展开更多
关键词 文本分类 机器学习算法 短文本数据 SVM TF-IDF
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部