期刊文献+
共找到179篇文章
< 1 2 9 >
每页显示 20 50 100
Integrated Real-Time Big Data Stream Sentiment Analysis Service 被引量:1
1
作者 Sun Sunnie Chung Danielle Aring 《Journal of Data Analysis and Information Processing》 2018年第2期46-66,共21页
Opinion (sentiment) analysis on big data streams from the constantly generated text streams on social media networks to hundreds of millions of online consumer reviews provides many organizations in every field with o... Opinion (sentiment) analysis on big data streams from the constantly generated text streams on social media networks to hundreds of millions of online consumer reviews provides many organizations in every field with opportunities to discover valuable intelligence from the massive user generated text streams. However, the traditional content analysis frameworks are inefficient to handle the unprecedentedly big volume of unstructured text streams and the complexity of text analysis tasks for the real time opinion analysis on the big data streams. In this paper, we propose a parallel real time sentiment analysis system: Social Media Data Stream Sentiment Analysis Service (SMDSSAS) that performs multiple phases of sentiment analysis of social media text streams effectively in real time with two fully analytic opinion mining models to combat the scale of text data streams and the complexity of sentiment analysis processing on unstructured text streams. We propose two aspect based opinion mining models: Deterministic and Probabilistic sentiment models for a real time sentiment analysis on the user given topic related data streams. Experiments on the social media Twitter stream traffic captured during the pre-election weeks of the 2016 Presidential election for real-time analysis of public opinions toward two presidential candidates showed that the proposed system was able to predict correctly Donald Trump as the winner of the 2016 Presidential election. The cross validation results showed that the proposed sentiment models with the real-time streaming components in our proposed framework delivered effectively the analysis of the opinions on two presidential candidates with average 81% accuracy for the Deterministic model and 80% for the Probabilistic model, which are 1% - 22% improvements from the results of the existing literature. 展开更多
关键词 SENTIMENT ANALYSIS REAL-TIME text ANALYSIS OPINION ANALYSIS big data An-alytics
下载PDF
基于FastText的短文本分类 被引量:5
2
作者 王光慈 汪洋 《电子设计工程》 2020年第3期98-101,共4页
在大数据背景下,如何快速准确的从庞大数据集中筛选过滤出有用信息一直是自然语言处理领域的一个研究目标,对用户所提问题进行意图识别能够帮助用户在向问答系统进行沟通的时候,根据用户提出的直接或者间接的信息来快速判断用户的真实意... 在大数据背景下,如何快速准确的从庞大数据集中筛选过滤出有用信息一直是自然语言处理领域的一个研究目标,对用户所提问题进行意图识别能够帮助用户在向问答系统进行沟通的时候,根据用户提出的直接或者间接的信息来快速判断用户的真实意图,过滤无用冗余信息后返回一个概率最大答案给用户。FastText是Facebook AI Research推出的文本分类和词训练工具,它的最大特点是模型简单并且在文本分类的准确率上,和现有的深度学习的方法效果相近,即在保证了准确率的情况下大大缩短了分类时间。 展开更多
关键词 自然语言处理 大数据 Fasttext 文本分类
下载PDF
游客大数据视角下的辽宁省海岛旅游发展研究
3
作者 李鹏 唐辉 《绿色科技》 2024年第17期145-153,175,共10页
探索海岛旅游高质量发展路径,推动旅游业高质量发展是满足游客高品质旅游需求和实现旅游业提质增效,实现可持续发展的必由之路。基于辽宁省海岛旅游大数据,从游客的视角对辽宁省海岛旅游发展进行研究,探索辽宁省海岛旅游的发展路径。结... 探索海岛旅游高质量发展路径,推动旅游业高质量发展是满足游客高品质旅游需求和实现旅游业提质增效,实现可持续发展的必由之路。基于辽宁省海岛旅游大数据,从游客的视角对辽宁省海岛旅游发展进行研究,探索辽宁省海岛旅游的发展路径。结果显示:游客对辽宁海岛旅游的情感态度以正面情绪为主,但辽宁海岛旅游发展还有很大的提升空间;旅游吸引物以资源型为主,自然资源和游客体验吸引力较强,而基础设施与服务、人文旅游资源吸引力较弱;人文旅游资源及基础设施与服务这两个维度吸引力在辽宁省海岛普遍较弱;旅游发展不均衡,空间差异显著。辽宁省海岛旅游总体发展主要集中在大连市长海县。并提出如下解决措施:走文旅融合路线,突出海岛特色和文化特色;创新旅游产品开发策略,完善海岛内基础设施;相关部门要加强市场监管;加强营销宣传力度,创新旅游业高质量发展动能;打造海岛全域旅游网络,建立海岛旅游示范区。 展开更多
关键词 海岛旅游 旅游大数据 游客评论 文本分析 百度指数
下载PDF
产业政策关联度与企业社会责任关系研究——基于政策文本及财务年报的大数据分析 被引量:2
4
作者 杨长进 罗仁杰 +1 位作者 刘芮彤 黄俊 《科技进步与对策》 CSSCI 北大核心 2024年第8期76-84,共9页
选取2012—2021年沪深新能源汽车上市公司为样本,利用Python软件测算企业年报与新能源汽车产业政策关联度,实证检验产业政策关联度对企业社会责任的影响。结果发现:中国新能源汽车产业政策关联度与企业社会责任具有正相关关系,该关系存... 选取2012—2021年沪深新能源汽车上市公司为样本,利用Python软件测算企业年报与新能源汽车产业政策关联度,实证检验产业政策关联度对企业社会责任的影响。结果发现:中国新能源汽车产业政策关联度与企业社会责任具有正相关关系,该关系存在一个阈值:高于该阈值时,国有企业、大规模企业、盈利企业、东部企业社会责任与产业政策关联度存在显著正相关关系,而民营企业、小规模企业、亏损企业、西部企业社会责任与产业政策关联度关系不显著;低于该阈值时,产业政策关联度与企业社会责任关系不显著。结论有助于企业意识到应与政策保持较强的关联性,从而更好地履行社会责任。 展开更多
关键词 政策关联度 社会责任 政策文本 大数据分析 新能源汽车
下载PDF
数字化转型与企业竞争力:基于信息披露模式的影响 被引量:3
5
作者 卫铭 赵谦亨 王文慧 《经济问题》 CSSCI 北大核心 2024年第5期33-42,共10页
近年来,我国作为数字经济的引领者,企业数字化转型已成为顺应时代潮流、响应政策号召、适应行业竞争的必由之路。研究表明:第一,企业数字化转型的财务数据、非财务数据的信息披露与企业竞争力并未存在显著关系。进一步检验发现,企业数... 近年来,我国作为数字经济的引领者,企业数字化转型已成为顺应时代潮流、响应政策号召、适应行业竞争的必由之路。研究表明:第一,企业数字化转型的财务数据、非财务数据的信息披露与企业竞争力并未存在显著关系。进一步检验发现,企业数字化转型的文本信息与财务信息均存在异常披露行为。第二,以企业数字化转型“言”与“行”二维视角衡量企业数字化转型信息披露模式,发现在“言行一致”的披露模式下,企业数字化相关信息有利于提升企业市场竞争力,主要通过缓解自身融资约束程度的路径实现;而“多言寡行”的策略性披露会增加企业管理者的权力,不利于企业竞争力的提升。研究结论为相关部门对上市公司披露数字化转型相关信息进行规范和监督提供真实可靠的经验证据。 展开更多
关键词 企业数字化转型 企业竞争力 信息披露模式 大数据文本
下载PDF
基于改进遗传算法和DBSCAN聚类的学习数据深度挖掘方法 被引量:2
6
作者 孟涛 王晓勇 胡胜利 《齐齐哈尔大学学报(自然科学版)》 2024年第1期45-50,55,共7页
为了从在线学习大数据中提取有用信息,实现自适应特征提取和聚类,提出了基于改进模糊遗传算法和DBSCAN聚类的细粒度学习数据挖掘方法。通过在信息管理平台中应用数据挖掘技术,将学习表现评估转换为文本分类问题,基于动态数据分析细粒度... 为了从在线学习大数据中提取有用信息,实现自适应特征提取和聚类,提出了基于改进模糊遗传算法和DBSCAN聚类的细粒度学习数据挖掘方法。通过在信息管理平台中应用数据挖掘技术,将学习表现评估转换为文本分类问题,基于动态数据分析细粒度的知识获取结果。所提改进的遗传算法自动提取出文本中的最优特征集,利用模糊规则关联测试内容与知识点。最后,利用基于密度的聚类算法得到每个知识点的个体和整体测试结果。实验结果表明,所提方法能够自动处理大量数据,全面准确地分析测试结果中不同知识点的掌握程度,有助于信息管理平台数据的二次开发和深入挖掘。 展开更多
关键词 大数据 数据挖掘 遗传算法 模糊规则 文本分类
下载PDF
基于大数据文本挖掘的高职院校电子商务专业学生实践能力培养研究
7
作者 裴祥静 《黑龙江科学》 2024年第11期136-140,共5页
随着“十四五”规划的提出,经济社会的数字化转型趋势日益凸显,为电子商务类专业发展与人才培养带来了新的机遇与挑战。针对当前高职院校电子商务专业人才实践能力培养中存在的主要问题,采用大数据文本挖掘技术在招聘就业网站深入挖掘... 随着“十四五”规划的提出,经济社会的数字化转型趋势日益凸显,为电子商务类专业发展与人才培养带来了新的机遇与挑战。针对当前高职院校电子商务专业人才实践能力培养中存在的主要问题,采用大数据文本挖掘技术在招聘就业网站深入挖掘用人单位对电子商务专业人才的岗位要求,获取企业对电商人才实践能力的期望信息,并根据能力期望词云图进行实践能力要求归纳。基于归纳的实践能力需求,高职院校应从构建电子商务专业学生实践能力培养新模式、课程体系建构与校企共育产教融合等方面加强对电子商务专业人才实践能力的培养,以不断提升人才培养质量,适应产业转型升级与科技发展需要。 展开更多
关键词 电子商务 大数据 文本挖掘 高职教育 实践能力培养
下载PDF
铁路货运营销大数据系统的设计与实现
8
作者 王娜娜 张建国 《铁路计算机应用》 2024年第5期36-39,共4页
为实现货运营销各项业务的有机融合,优化铁路货运营销模式,设计了铁路货运营销大数据系统,阐述了系统的总体架构,通过数据采集调度技术和基于机器学习的预测分析技术实现客户关系管理、一体化考核管理、分析决策管理和市场监测等功能。... 为实现货运营销各项业务的有机融合,优化铁路货运营销模式,设计了铁路货运营销大数据系统,阐述了系统的总体架构,通过数据采集调度技术和基于机器学习的预测分析技术实现客户关系管理、一体化考核管理、分析决策管理和市场监测等功能。该系统已在中国铁路济南局集团有限公司上线应用,实现了经济效益的显著提升,有效提升货运生产组织水平,为货运部门的各项营销决策提供技术支持。 展开更多
关键词 货运营销 大数据 全文检索 预测分析 客户关系
下载PDF
河南省旅游目的地形象的维度分异研究
9
作者 肖智中 《信阳农林学院学报》 2024年第4期21-27,共7页
随着旅游业的蓬勃发展,目的地形象的塑造和传播对于提升地区旅游竞争力变得至关重要。本文采用后羿采集器对马蜂窝网站上关于河南省的游记文本进行抓取,然后利用SPSSAU进行处理与分析,以揭示游客对河南省旅游目的地的感知与评价。研究... 随着旅游业的蓬勃发展,目的地形象的塑造和传播对于提升地区旅游竞争力变得至关重要。本文采用后羿采集器对马蜂窝网站上关于河南省的游记文本进行抓取,然后利用SPSSAU进行处理与分析,以揭示游客对河南省旅游目的地的感知与评价。研究结果显示,河南省成功地构建了以“历史”“文化”“道教”“佛教”等为特色的旅游形象,这一形象以自然景观为基础,人文内涵为提升。从情感分析的结果来看,大部分游客对于河南省的旅游体验持正面或偏正面的情感态度,而游客对于不同旅游目的地的评价存在差异。根据旅游形象感知的分析,河南省旅游吸引物和公共基础设施是最为关键的维度,它们对旅游形象有着决定性的影响。基于分析结果,本文提出河南省应继续推动旅游基础设施建设,加强挖掘和保护文化旅游资源。同时,要不断提升地方氛围和服务质量,建立游客反馈机制,以促进旅游业的持续健康发展。 展开更多
关键词 旅游目的地形象 大数据 文本分析 游客情感分析
下载PDF
中青年心肌梗死患者院前症状及就医情况的文本挖掘
10
作者 黄晶晶 黄素芳 +4 位作者 王荃 刘雨晨 张可心 盛晓萱 刘诗雅 《护理学杂志》 CSCD 北大核心 2024年第18期28-31,共4页
目的了解中青年急性心肌梗死患者的院前症状和就医特征,为医护人员开展针对性健康教育以改善患者就医延迟提供参考。方法根据纳入及排除标准,从医院的医疗大数据平台提取200例中青年急性心肌梗死患者的电子病历数据,对其电子病历中的非... 目的了解中青年急性心肌梗死患者的院前症状和就医特征,为医护人员开展针对性健康教育以改善患者就医延迟提供参考。方法根据纳入及排除标准,从医院的医疗大数据平台提取200例中青年急性心肌梗死患者的电子病历数据,对其电子病历中的非结构化文本信息进行文本挖掘,使用词频分析和可视化方法分析患者院前症状和就医情况。结果胸痛和胸闷是中青年急性心肌梗死患者的典型和特异症状,大汗、乏力、心慌等是次常见和次强相关的院前症状。148例患者选择当地就诊后寻求进一步诊治而转诊上级医院。结论中青年急性心肌梗死患者就医前有不同程度的典型症状或非典型症状,患者就医情况与病情有关。医疗大数据平台在操作便利性、数据获取能力方面展现出独特优势,但数据质量需提高。 展开更多
关键词 中青年 急性心肌梗死 院前症状 就医延迟 医疗大数据平台 电子病历 文本数据 文本挖掘
下载PDF
新经济业态P2P网络借贷的风险甄别研究 被引量:45
11
作者 范超 王磊 解明明 《统计研究》 CSSCI 北大核心 2017年第2期33-43,共11页
国内P2P网贷平台存在的问题及风险令人触目惊心,本研究旨在探索P2P网络借贷这一重要新经济业态的风险甄别问题。本文在我国444家P2P平台基本信息与交易信息基础上,通过网络爬虫获取了30万余条网民评论和新闻数据,利用文本挖掘技术提取... 国内P2P网贷平台存在的问题及风险令人触目惊心,本研究旨在探索P2P网络借贷这一重要新经济业态的风险甄别问题。本文在我国444家P2P平台基本信息与交易信息基础上,通过网络爬虫获取了30万余条网民评论和新闻数据,利用文本挖掘技术提取了重要的外部信息,综合使用11种统计模型评估变量的重要性并讨论其经济意义。研究表明:1平台风险与基本信息、交易信息和外部信息间存在复杂的非线性关系,SVM、树类模型等非线性模型对预判P2P平台风险更加有效;2网民评论、关注度等基于互联网的非结构化信息,以及平均利率波动、资金净流入波动、未来待还金额波动等信息对甄别风险具有重要的作用;3根据拍拍贷的案例,小额、超短期、男性借款人具有更高的违约风险;4基于线性模式的传统风险指数构建方法并不适用于甄别P2P平台风险。有关部门应从完善法律法规、加大信息披露力度、发布风险预警综合指数等对P2P行业进行监管。 展开更多
关键词 P2P网络借贷 大数据 文本挖掘
下载PDF
电力文本数据挖掘现状及挑战 被引量:34
12
作者 王慧芳 曹靖 罗麟 《浙江电力》 2019年第3期1-7,共7页
文本数据是电力大数据的重要组成部分,对其进行有效挖掘是智能电网深入、全面发展的需要。在目前已有研究成果的基础上,对电力领域文本数据挖掘的现状及挑战进行了深入剖析。首先分析了文本挖掘技术的发展过程及存在难题;接着重点分析... 文本数据是电力大数据的重要组成部分,对其进行有效挖掘是智能电网深入、全面发展的需要。在目前已有研究成果的基础上,对电力领域文本数据挖掘的现状及挑战进行了深入剖析。首先分析了文本挖掘技术的发展过程及存在难题;接着重点分析了电力文本数据挖掘的关键技术及其研究现状,包括文本预处理技术、文本表示方法以及数据挖掘方法;然后以电力设备缺陷文本为对象,介绍了文本挖掘技术在电力领域的应用,包括缺陷文本质量的提升与保证、缺陷文本严重程度自动分类、缺陷发生部件及程度的自动提取、缺陷文本检索、基于缺陷文本的电力设备健康状态评价等,可为其他类型电力文本的挖掘提供参考;最后,探讨了电力文本挖掘面临的挑战以及未来发展方向。 展开更多
关键词 电力大数据 文本数据 数据挖掘 自然语言处理 电力设备 缺陷文本
下载PDF
国外大数据硕士人才培养的经验与启示——基于大数据文本挖掘 被引量:9
13
作者 阮敬 刘宏晶 纪宏 《统计与信息论坛》 CSSCI 北大核心 2017年第9期29-36,共8页
利用半结构化文本数据分析方法,从国外高校387个大数据硕士相关项目及国内22个相关硕士项目人才培养方案中提取出大数据高端人才培养的七大方向,并对不同方向的培养目标、课程、学分、学制等设置及其对应的人才市场需求匹配情况等相关... 利用半结构化文本数据分析方法,从国外高校387个大数据硕士相关项目及国内22个相关硕士项目人才培养方案中提取出大数据高端人才培养的七大方向,并对不同方向的培养目标、课程、学分、学制等设置及其对应的人才市场需求匹配情况等相关内容进行剖析,为改革中国大数据高端人才的供给提出一定建议。 展开更多
关键词 大数据 大数据人才 人才培养 网页文本挖掘
下载PDF
基于语义推理的文本信息关联关系分析技术 被引量:7
14
作者 陈天莹 苏智慧 《电讯技术》 北大核心 2014年第1期68-73,共6页
重点论述了文本信息中的知识发现及潜在关联分析技术。采用本体建模技术、信息抽取技术以及知识库上的语义推理技术等来完成并实现文本信息的关联关系发现和分析,最后给出了语义关联分析技术在文本信息处理系统中的应用,并简要描述了系... 重点论述了文本信息中的知识发现及潜在关联分析技术。采用本体建模技术、信息抽取技术以及知识库上的语义推理技术等来完成并实现文本信息的关联关系发现和分析,最后给出了语义关联分析技术在文本信息处理系统中的应用,并简要描述了系统的处理流程。在信息处理领域的大数据环境下,该技术有利于信息分析人员快速获取关联线索,辅助完成信息挖掘,为指挥决策提供更全面的信息支持。 展开更多
关键词 大数据 文本信息 数据挖掘 语义技术 信息抽取 关联分析
下载PDF
在线社区支持倾向对股市收益和波动的影响 被引量:12
15
作者 钱宇 李子饶 +1 位作者 李强 袁华 《管理科学学报》 CSSCI CSCD 北大核心 2020年第2期140-154,共15页
互联网技术的飞速发展使得非专业的个体投资者可以通过在线金融社区分享信息并表达倾向.本文利用东方财富网的5178824条用户评论,运用卷积神经网络的分类算法,提取并测量了在线用户对未来市场看涨或看跌的支持倾向,并从市场收益和波动... 互联网技术的飞速发展使得非专业的个体投资者可以通过在线金融社区分享信息并表达倾向.本文利用东方财富网的5178824条用户评论,运用卷积神经网络的分类算法,提取并测量了在线用户对未来市场看涨或看跌的支持倾向,并从市场收益和波动两个方面,检验了在线用户支持倾向及其一致性对股市的影响.结果表明,在线用户当期支持倾向对未来的股市收益具有显著的负向影响,支持倾向的一致性则会放大市场的波动幅度.进一步的证据表明,用户支持倾向很大程度上是基于股票市场的历史表现而形成,且具有一定的“羊群效应”. 展开更多
关键词 文本大数据 在线社区 支持倾向 市场收益 市场波动
下载PDF
电力企业文本数据挖掘技术研究 被引量:8
16
作者 吕旭明 雷振江 +1 位作者 赵永彬 由广浩 《电力信息与通信技术》 2016年第1期7-10,共4页
在国家电网公司信息化工程的建设过程中,积累了大量的文本数据。如何挖掘文本数据中蕴含的有价值信息将成为电力企业大数据挖掘方向研究的重点对象。文章结合电力行业目前的数据现状,使用文本挖掘的方法对电力设备检修资金投入工作效能... 在国家电网公司信息化工程的建设过程中,积累了大量的文本数据。如何挖掘文本数据中蕴含的有价值信息将成为电力企业大数据挖掘方向研究的重点对象。文章结合电力行业目前的数据现状,使用文本挖掘的方法对电力设备检修资金投入工作效能场景进行挖掘,对生产信息管理系统中报缺单数据进行文本聚类,实现对缺陷的细分。实践表明,该方法可以得出各类别的缺陷特征,从而证明了文本挖掘在电力行业的可用性。 展开更多
关键词 电力设备检修 文本数据 文本挖掘 大数据挖掘
下载PDF
基于Spark框架XGBoost的林业文本并行分类方法研究 被引量:11
17
作者 崔晓晖 师栋瑜 +1 位作者 陈志泊 许福 《农业机械学报》 EI CAS CSCD 北大核心 2019年第6期280-287,共8页
针对当前“互联网+”技术与林业的交叉融合,涌现出海量待挖掘的涉林文本,而林业文本分类的相关研究尚不成熟的问题,使用网络爬虫技术面向互联网采集涉林文本,基于丰富的语料重新构建分类标签,提出基于Spark计算框架的XGBoost并行化方法... 针对当前“互联网+”技术与林业的交叉融合,涌现出海量待挖掘的涉林文本,而林业文本分类的相关研究尚不成熟的问题,使用网络爬虫技术面向互联网采集涉林文本,基于丰富的语料重新构建分类标签,提出基于Spark计算框架的XGBoost并行化方法,对林业文本进行分类。经由交叉验证,构建的XGBoost并行分类算法准确率为0.9234,在各类别中最低F1为0.8604,最高为0.9984;其在2.1万条、4.2万条、8.4万条数据集上的训练加速比分别为2.13、3.47、3.82。结果表明,基于该标签设定的分类模型对现存互联网中涉林文本的适应性较好;Spark环境下实现的XGBoost并行化算法的准确率显著优于其他4种机器学习(朴素贝叶斯、GBDT决策树、BP神经网络和ELM神经网络算法)的并行化算法,算法执行效率远高于单机版本,且数据量越大,其加速比越高,能有效应对海量林业文本的实时、准确分类。 展开更多
关键词 林业文本 文本分类 大数据分析 SPARK XGBoost
下载PDF
基于文本挖掘的学习分析应用研究 被引量:24
18
作者 刘三女牙 彭晛 +3 位作者 刘智 孙建文 刘林 郑年亨 《电化教育研究》 CSSCI 北大核心 2016年第2期23-30,共8页
当前,关于学习分析的研究,国内外研究者主要关注学习者在网络教学环境下产生的结构化数据,而伴随学习交互模式的多元化,以文本为主的非结构化数据正在不断生成。近年来,通过对文本数据的挖掘来测评学习者的知识能力以及甄别其心理与行... 当前,关于学习分析的研究,国内外研究者主要关注学习者在网络教学环境下产生的结构化数据,而伴随学习交互模式的多元化,以文本为主的非结构化数据正在不断生成。近年来,通过对文本数据的挖掘来测评学习者的知识能力以及甄别其心理与行为已成为一种新的学习分析方法。本文首先描述了学习分析、文本挖掘的概念,通过文献分析法,对国内外采用文本挖掘技术的学习分析研究现状进行了综述;其次,介绍了学习分析中文本挖掘的数据来源、方法和工具;最后主要从课程评价支持、学习者知识能力测评、学习共同体分组、学习行为危机预警、学习效果预测和学习状态可视化等6个方面阐述了文本挖掘应用于学习分析中的具体实例,并对未来作了进一步的展望和探讨。 展开更多
关键词 教育大数据 学习分析 文本挖掘 文本分析
下载PDF
电力企业投诉工单文本挖掘模型 被引量:14
19
作者 刘兴平 章晓明 +5 位作者 沈然 林少娃 章琛敏 张维 朱斌 何韵 《电力需求侧管理》 2016年第2期57-60,共4页
以客户投诉工单和回访不满意工单为样本,引入LDA文档主题生成模型对文本信息进行中文自然语言处理和数据挖掘,发现问题属性类别,通过大数据对文本挖掘结果进行分析和监控,构建适合电力公司的投诉工单文本挖掘模型,实现对工单进行分类筛... 以客户投诉工单和回访不满意工单为样本,引入LDA文档主题生成模型对文本信息进行中文自然语言处理和数据挖掘,发现问题属性类别,通过大数据对文本挖掘结果进行分析和监控,构建适合电力公司的投诉工单文本挖掘模型,实现对工单进行分类筛选、便签判断和初步归因。 展开更多
关键词 客户满意度 诉投工单 文本挖掘 大数据分析
下载PDF
大数据环境下文本和数据挖掘的版权例外研究——以欧盟《DSM版权指令》提案为视角 被引量:28
20
作者 唐思慧 《知识产权》 CSSCI 北大核心 2017年第10期109-116,共8页
大数据时代,文本和数据挖掘技术的广泛应用打破版权法构建的利益平衡机制,给我国著作权法带来了挑战,亟需调整。美国的应对是从默示许可转到无条件例外规则,而欧盟《DSM版权指令》提案以义务式的模式规定了"科学研究领域的文本和... 大数据时代,文本和数据挖掘技术的广泛应用打破版权法构建的利益平衡机制,给我国著作权法带来了挑战,亟需调整。美国的应对是从默示许可转到无条件例外规则,而欧盟《DSM版权指令》提案以义务式的模式规定了"科学研究领域的文本和数据挖掘"例外规则,对科研促进及对版权保护力度适中,值得借鉴。我国著作权法修改应制定"文本和数据挖掘合理使用规则",严格限制适用条件,重构利益平衡机制。 展开更多
关键词 大数据 文本和数据挖掘 版权例外 利益平衡
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部