不平行的空间:用户生成内容大数据质量探析被引量：4

Unparallel Spaces:Inquiry on the Quality of UGC Data

下载PDF

导出

摘要 UGC大数据中有许多前互联网时代难以获取甚至无法获取的资料,并且避免了通过传统方法获取数据的诸多缺陷,因而被作为一种新的资源运用于社会科学研究。开展这类研究,UGC大数据的质量是必须首先考虑的问题。本文从信息生产特点、信息传播过程、信息检测识别技术等多个角度,对UGC大数据质量存在的问题及其形成原因进行探析。研究发现:UGC大数据存在自身特有的缺陷,网络信息空间并不能完美地映射社会现实空间;将UGC大数据运用于社会科学研究,难以保证数据的真实性、自然性和准确性。因此,具体研究需要对数据质量进行预判和检验,并采用与传统研究方法相结合等策略来应对。 UGC big data contains many materials that were difficult or impossible to obtain in the pre-Internet era,and it avoids many shortcomings of obtaining data through traditional methods,so it is used as a new resource for social science research.To carry out this kind of research,the quality of UGC big data must be the first consideration.This article analyzes the problems of UGC big data quality and their causes from multiple perspectives such as the characteristics of information production,information dissemination process,and information detection and identification technology.The study found that:UGC big data has its own unique flaws,and the network information space cannot perfectly map the social reality space;applying UGC big data to social science research can hardly guarantee the authenticity,naturalness,and accuracy of the data.Therefore,specific research needs to predict and test data quality,and adopt strategies such as combining with traditional research methods to deal with it.

作者陈峥 Chen Zheng(Hubei Open University;School of Sociology,Wuhan University)

机构地区湖北开放大学武汉大学社会学院

出处《图书馆》 CSSCI 北大核心 2021年第3期90-98,共9页 Library

基金 2016年度国家社科基金重大项目“大数据时代计算社会科学的产生、现状与发展前景研究”(项目编号:16ZDA086)研究成果之一。

关键词大数据用户生成内容数据质量检测识别技术 Big data User generated content Data quality Detection and recognition technology

分类号 G203 [文化科学—传播学]

引文网络
相关文献

参考文献2

1罗俊,罗教讲.互联网舆情偏态传播与引导[J].人民论坛,2015(A12):25-27. 被引量：8
2罗俊,李凤翔.计算社会科学视角下的数据观[J].吉首大学学报（社会科学版）,2018,39(2):17-25. 被引量：19

二级参考文献5

1杨子岩,段艺琳.??美国建“网络水军”混淆视听(N)人民日报海外版. 2011 (006)
2李国杰,程学旗.大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考[J].中国科学院院刊,2012,27(6):647-657. 被引量：1605
3钟瑛,张恒山.大数据的缘起、冲击及其应对[J].现代传播（中国传媒大学学报）,2013,35(7):104-109. 被引量：96
4邬贺铨.大数据思维[J].科学与社会,2014,4(1):1-13. 被引量：139
5罗俊,罗教讲.数据密集型知识发现的边界与陷阱——以美国大选预测为例[J].学术论坛,2017,40(3):1-7. 被引量：15

共引文献24

1林华瑜.社会治理视角下涉警网络舆情的治理研究[J].湖北警官学院学报,2016,29(4):92-98. 被引量：9
2孙彬,吴纯渊,杨更生,王东.大数据环境下的主动引导型文明教育模型研究[J].新疆教育学院学报,2016,32(4):61-64.
3郝龙.“计算”的边界:互联网大数据与社会研究[J].中南大学学报（社会科学版）,2018,24(2):148-158. 被引量：13
4李凤翔,罗教讲.计算社会科学视角:媒体传播效果的计算机模拟研究[J].学术论坛,2018,41(4):15-27. 被引量：10
5严利华,陈捷琪.突发事件中的舆论失焦现象及其启示[J].决策与信息,2016(22):130-137. 被引量：23
6孙彬,王东.基于自媒体信息圈的多元教育引导模型研究[J].思想政治教育研究,2018,34(1):155-160.
7鹿星南.承继与创新:大数据背景下教育研究范式变革的反思及其动向[J].现代教育科学,2018(10):1-6. 被引量：2
8李凤翔.患方对医方信任中的能力期望与道德期望——基于网络大数据与社会状况调查的实证研究[J].江汉学术,2019,38(4):5-16. 被引量：5
9曾琼.突破与重构:大数据时代的计算广告学研究[J].湖南师范大学社会科学学报,2019,48(5):150-156. 被引量：7
10徐小奔.人工智能“创作”的人格要素[J].求索,2019,0(6):95-102. 被引量：24

同被引文献46

1饶勇.中央苏区时期的“读报用报”运动刍议[J].中国出版,2011(4):67-70. 被引量：5
2秦敏.企业开放式创新社区研究探索与展望[J].江西师范大学学报（哲学社会科学版）,2014,47(5):21-26. 被引量：4
3刘海虹.媒体融合背景下新闻聚合的著作权法规制——以网络商业模式的创新为视角[J].新闻大学,2015(2):7-13. 被引量：19
4张敏,霍朝光,霍帆帆.突发公共安全事件社交舆情传播行为的影响因素分析——基于情感距离的调节作用[J].情报杂志,2016,35(5):38-45. 被引量：25
5陈艳.民间读书会与公共图书馆合作模式探析[J].图书馆界,2017(1):9-12. 被引量：12
6李奕莹,戚桂杰.基于系统动力学的企业开放式创新社区中用户生成内容管理研究[J].情报杂志,2017,36(4):112-117. 被引量：8
7杨沉,张家武,黄仲山.全民阅读视角下新媒体阅读生态重构研究[J].图书情报工作,2017,61(12):86-93. 被引量：33
8李旭,刘鲁川.信息过载背景下社会化阅读APP用户的忽略与退出行为——心理契约违背视角[J].图书馆,2018(2):75-84. 被引量：41
9阮光册,夏磊.高质量用户生成内容主题分布特征研究[J].图书馆杂志,2018,37(4):95-101. 被引量：6
10沙垚.新中国成立之初农村读报组的历史考察——以关中地区为例[J].新闻记者,2018,0(6):50-57. 被引量：18

引证文献4

1董娜.基于用户生成内容的短视频网络舆情传播生态系统构建[J].图书馆,2022(4):73-81. 被引量：11
2李林容,张靖雯.社会化阅读:历史回眸、现实困境与解困之思[J].中国编辑,2022(9):16-22. 被引量：7
3杨吉.社会化阅读对全民阅读推广的意义重估[J].出版参考,2023(3):10-13.
4杨汶静,汪明艳.基于多模型融合的开放式创新社区内容质量特征挖掘[J].智能计算机与应用,2024,14(1):214-223.

二级引证文献18

1赵奕.融媒体语境下短视频的传播生态[J].卫星电视与宽带多媒体,2022(17):79-81.
2王伟军,叶建梅,周锐,黄英辉,黄大炜.UGC短视频用户持续贡献行为影响因素及作用机理研究[J].图书与情报,2022(5):31-40. 被引量：9
3胡漠,张蕴潮.在线健康社区生态系统架构与关键影响要素识别研究[J].图书情报工作,2023,67(2):33-43. 被引量：1
4杨吉.社会化阅读对全民阅读推广的意义重估[J].出版参考,2023(3):10-13.
5石亚光.新媒体背景下短视频优质内容生态建构策略探究[J].传播力研究,2023,7(15):67-69.
6郑慧,王清楠,韦兆焯.数字创意产业背景下侨批档案的文化价值实现[J].北京档案,2023(6):15-18. 被引量：2
7万君,张静.大学生社会化阅读APP持续使用意愿实证研究[J].大学图书情报学刊,2023,41(4):70-77.
8朱攀龙,夏一雪,金冬雪.基于SEM-SD的网络舆情生态系统失衡动力学机理研究[J].新媒体研究,2023,9(14):1-8.
9王依晨.从参与到异化:社会化阅读应用程序中的数字劳动[J].西部广播电视,2023,44(24):53-56.
10李林容,赵雅馨.在平台间摇摆:复媒体环境中的社会化阅读行为[J].出版发行研究,2024(2):77-84.

1段建龄.新媒体技术在广播电视新闻采编中的应用[J].记者摇篮,2021(4):159-160. 被引量：13
2熊凤水,戴琬莹.空间错位与重塑:新生代农民工市民转化的空间视角[J].当代青年研究,2020(5):89-94. 被引量：8
3李婵,陶丽,张文德.视频类知识付费内容著作权侵权风险评价指标体系构建[J].情报理论与实践,2021,44(3):84-90. 被引量：9
4周鸿艳,闫忠红.《医学伦理学》线上课程建设现状调查及策略[J].中华医学教育探索杂志,2021,20(3):360-366. 被引量：1
5赵清源,黄磊.互联网超强连结阶段谣言传播制约因素变迁[J].新闻研究导刊,2021(3):63-68.
6金煜瑶.论企业提高内部审计质量的途径[J].现代商贸工业,2021,42(10):95-96. 被引量：3
7何爱国.立磨行星齿轮减速机偏载的分析处理[J].水泥工程,2021(1):52-54.
8金帅华.5G前景下的移动端字体应用前瞻[J].美与时代（创意）（上）,2021(2):74-76.
9张涛.国土资源规划与可持续发展的思考[J].农民致富之友,2021(11):237-237.
10胡希俅.生物传感器在临床检验中的应用研究[J].中国设备工程,2021(6):169-170.

图书馆

2021年第3期

浏览历史

内容加载中请稍等...

不平行的空间:用户生成内容大数据质量探析被引量：4

参考文献2

二级参考文献5

共引文献24

同被引文献46

引证文献4

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

不平行的空间:用户生成内容大数据质量探析 被引量：4

参考文献2

二级参考文献5

共引文献24

同被引文献46

引证文献4

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

不平行的空间:用户生成内容大数据质量探析被引量：4