期刊文献+
共找到30,141篇文章
< 1 2 250 >
每页显示 20 50 100
Method to Remove Handwritten Texts Using Smart Phone
1
作者 Haiquan Fang 《Journal of Harbin Institute of Technology(New Series)》 CAS 2024年第2期12-21,共10页
To remove handwritten texts from an image of a document taken by smart phone,an intelligent removal method was proposed that combines dewarping and Fully Convolutional Network with Atrous Convolutional and Atrous Spat... To remove handwritten texts from an image of a document taken by smart phone,an intelligent removal method was proposed that combines dewarping and Fully Convolutional Network with Atrous Convolutional and Atrous Spatial Pyramid Pooling(FCN-AC-ASPP).For a picture taken by a smart phone,firstly,the image is transformed into a regular image by the dewarping algorithm.Secondly,the FCN-AC-ASPP is used to classify printed texts and handwritten texts.Lastly,handwritten texts can be removed by a simple algorithm.Experiments show that the classification accuracy of the FCN-AC-ASPP is better than FCN,DeeplabV3+,FCN-AC.For handwritten texts removal effect,the method of combining dewarping and FCN-AC-ASPP is superior to FCN-AC-ASP alone. 展开更多
关键词 handwritten texts printed texts CLASSIFICATION FCN-AC-ASPP smart phone
下载PDF
Study on the Textual Coherence Function of Conjunctions in Political Texts and Their Translation Reconstruction
2
作者 Goya Guli Kader Jingwen Qiao Aixia Yang 《Journal of Contemporary Educational Research》 2024年第1期25-30,共6页
The assessment of translation quality in political texts is primarily based on achieving effective communication.Throughout the translation process,it is essential to not only accurately convey the original content bu... The assessment of translation quality in political texts is primarily based on achieving effective communication.Throughout the translation process,it is essential to not only accurately convey the original content but also effectively transform the structural mechanisms of the source language.In the translation reconstruction of political texts,various textual cohesion methods are often employed,with conjunctions serving as a primary means for semantic coherence within text units. 展开更多
关键词 Political texts CONJUNCTIONS Textual cohesion Chinese to Russian translation
下载PDF
Deep-BERT:Transfer Learning for Classifying Multilingual Offensive Texts on Social Media 被引量:1
3
作者 Md.Anwar Hussen Wadud M.F.Mridha +2 位作者 Jungpil Shin Kamruddin Nur Aloke Kumar Saha 《Computer Systems Science & Engineering》 SCIE EI 2023年第2期1775-1791,共17页
Offensive messages on social media,have recently been frequently used to harass and criticize people.In recent studies,many promising algorithms have been developed to identify offensive texts.Most algorithms analyze ... Offensive messages on social media,have recently been frequently used to harass and criticize people.In recent studies,many promising algorithms have been developed to identify offensive texts.Most algorithms analyze text in a unidirectional manner,where a bidirectional method can maximize performance results and capture semantic and contextual information in sentences.In addition,there are many separate models for identifying offensive texts based on monolin-gual and multilingual,but there are a few models that can detect both monolingual and multilingual-based offensive texts.In this study,a detection system has been developed for both monolingual and multilingual offensive texts by combining deep convolutional neural network and bidirectional encoder representations from transformers(Deep-BERT)to identify offensive posts on social media that are used to harass others.This paper explores a variety of ways to deal with multilin-gualism,including collaborative multilingual and translation-based approaches.Then,the Deep-BERT is tested on the Bengali and English datasets,including the different bidirectional encoder representations from transformers(BERT)pre-trained word-embedding techniques,and found that the proposed Deep-BERT’s efficacy outperformed all existing offensive text classification algorithms reaching an accuracy of 91.83%.The proposed model is a state-of-the-art model that can classify both monolingual-based and multilingual-based offensive texts. 展开更多
关键词 Offensive text classification deep convolutional neural network(DCNN) bidirectional encoder representations from transformers(BERT) natural language processing(NLP)
下载PDF
Short-Term Memory Capacity across Time and Language Estimated from Ancient and Modern Literary Texts. Study-Case: New Testament Translations
4
作者 Emilio Matricciani 《Open Journal of Statistics》 2023年第3期379-403,共25页
We study the short-term memory capacity of ancient readers of the original New Testament written in Greek, of its translations to Latin and to modern languages. To model it, we consider the number of words between any... We study the short-term memory capacity of ancient readers of the original New Testament written in Greek, of its translations to Latin and to modern languages. To model it, we consider the number of words between any two contiguous interpunctions I<sub>p</sub>, because this parameter can model how the human mind memorizes “chunks” of information. Since I<sub>P</sub> can be calculated for any alphabetical text, we can perform experiments—otherwise impossible— with ancient readers by studying the literary works they used to read. The “experiments” compare the I<sub>P</sub> of texts of a language/translation to those of another language/translation by measuring the minimum average probability of finding joint readers (those who can read both texts because of similar short-term memory capacity) and by defining an “overlap index”. We also define the population of universal readers, people who can read any New Testament text in any language. Future work is vast, with many research tracks, because alphabetical literatures are very large and allow many experiments, such as comparing authors, translations or even texts written by artificial intelligence tools. 展开更多
关键词 Alphabetical Languages Artificial Intelligence Writing GREEK LATIN New Testament Readers Overlap Probability Short-Term Memory Capacity texts Translation Words Interval
下载PDF
Social Media Cyberbullying Detection on Political Violence from Bangla Texts Using Machine Learning Algorithm
5
作者 Md. Tofael Ahmed Almas Hossain Antar +3 位作者 Maqsudur Rahman Abu Zafor Muhammad Touhidul Islam Dipankar Das Md. Golam Rashed 《Journal of Intelligent Learning Systems and Applications》 2023年第4期108-122,共15页
When someone threatens or humiliates another person online by sending those unpleasant messages or comments, this is known as Cyberbullying. Recently, Bangla text has been used much more often on social media. People ... When someone threatens or humiliates another person online by sending those unpleasant messages or comments, this is known as Cyberbullying. Recently, Bangla text has been used much more often on social media. People communicate with others on social media through messages and comments. So bullies use social media as a rich environment to bully others, especially on political issues. Fights over Cyberbullying on political and social media posts are common today. Most of the time, it does a lot of damage. However, few works have been done for monitoring Bangla text on social media & no work has been done yet for detecting the bullying Bangla text on political issues due to the lack of annotated corpora and morphologic analyzers. In this work, we used several machine learning classifiers & a model. That will help to detect the Bangla bullying texts on social media. For this work, 11,000 Bangla texts have been collected from the comments section of political Facebook posts to make a new dataset and labelled the data as either bullied or not. This dataset has been used to train the machine learning classifier. The results indicate that Random Forest achieves superior accuracy of 91.08%. 展开更多
关键词 CYBERBULLYING Bangla texts Political Issues Machine Learning Random Forest Social Media
下载PDF
Research on Translation Strategies of Political Texts for International Publicity from the Perspective of Eco-Translatology
6
作者 Jia Yang Chengjing Li 《Journal of Contemporary Educational Research》 2023年第12期64-70,共7页
Eco-translatology provides a new perspective and methodology for the international publicity translation of political texts.This paper applies the viewpoint and methodology of eco-translatology,focuses on the three-di... Eco-translatology provides a new perspective and methodology for the international publicity translation of political texts.This paper applies the viewpoint and methodology of eco-translatology,focuses on the three-dimensional transformation of language,culture,and communication,and discusses how translators can adapt to the eco-environment of political texts through the specific example of the keynote speech of China’s president at the opening ceremony of the Third Belt and Road Forum for International Cooperation and select suitable translation strategies and techniques to achieve an ecological balance of the target text in multiple dimensions. 展开更多
关键词 ECO-TRANSLATOLOGY Three-dimensional transformation Political texts International publicity translation
下载PDF
基于RoBERTa和图增强Transformer的序列推荐方法 被引量:1
7
作者 王明虎 石智奎 +1 位作者 苏佳 张新生 《计算机工程》 CAS CSCD 北大核心 2024年第4期121-131,共11页
自推荐系统出现以来,有限的数据信息就一直制约着推荐算法的进一步发展。为降低数据稀疏性的影响,增强非评分数据的利用率,基于神经网络的文本推荐模型相继被提出,但主流的卷积或循环神经网络在文本语义理解和长距离关系捕捉方面存在明... 自推荐系统出现以来,有限的数据信息就一直制约着推荐算法的进一步发展。为降低数据稀疏性的影响,增强非评分数据的利用率,基于神经网络的文本推荐模型相继被提出,但主流的卷积或循环神经网络在文本语义理解和长距离关系捕捉方面存在明显劣势。为了更好地挖掘用户与商品之间的深层潜在特征,进一步提高推荐质量,提出一种基于Ro BERTa和图增强Transformer的序列推荐(RGT)模型。引入评论文本数据,首先利用预训练的Ro BERTa模型捕获评论文本中的字词语义特征,初步建模用户的个性化兴趣,然后根据用户与商品的历史交互信息,构建具有时序特性的商品关联图注意力机制网络模型,通过图增强Transformer的方法将图模型学习到的各个商品的特征表示以序列的形式输入Transformer编码层,最后将得到的输出向量与之前捕获的语义表征以及计算得到的商品关联图的全图表征输入全连接层,以捕获用户全局的兴趣偏好,实现用户对商品的预测评分。在3组真实亚马逊公开数据集上的实验结果表明,与Deep FM、Conv MF等经典文本推荐模型相比,RGT模型在均方根误差(RMSE)和平均绝对误差(MAE)2种指标上有显著提升,相较于最优对比模型最高分别提升4.7%和5.3%。 展开更多
关键词 推荐算法 评论文本 RoBERTa模型 图注意力机制 Transformer机制
下载PDF
基于融合矩阵的文本相似度计算实现检索结果聚类
8
作者 赵悦阳 崔雷 《医学信息学杂志》 CAS 2024年第3期58-64,共7页
目的/意义弥补医学文本语义表示方面的不足,实现PubMed数据库检索结果聚类。方法/过程采用Jaccard系数和TF-IDF构建融合矩阵方法,建立短语间、文档间、短语与文档内容间的相似性关系融合矩阵,训练聚类算法,将PubMed数据库检索结果集合分... 目的/意义弥补医学文本语义表示方面的不足,实现PubMed数据库检索结果聚类。方法/过程采用Jaccard系数和TF-IDF构建融合矩阵方法,建立短语间、文档间、短语与文档内容间的相似性关系融合矩阵,训练聚类算法,将PubMed数据库检索结果集合分组,随后生成类别标签,描述每一类簇文档的含义。结果/结论基于融合矩阵的聚类效果较好,提取出描述类别的高频词能很好地区分类别含义,对检索结果文本聚类任务有效。 展开更多
关键词 文献检索 文本聚类 融合矩阵 文本相似度
下载PDF
本科护理专业“解决问题,促进健康”课程建设情况分析
9
作者 李小雪 邹海欧 +2 位作者 孔莹 杨志凝 郭爱敏 《中华护理教育》 CSCD 2024年第2期179-183,共5页
目的 分析“解决问题,促进健康”课程建设情况,结合劳动教育相关要求明确后期建设方向。方法 梳理“解决问题,促进健康”课程建设情况,采用ROST内容挖掘系统对1 032项学生项目选题和177条学生项目总结语句进行文本分析。结果 历经20余... 目的 分析“解决问题,促进健康”课程建设情况,结合劳动教育相关要求明确后期建设方向。方法 梳理“解决问题,促进健康”课程建设情况,采用ROST内容挖掘系统对1 032项学生项目选题和177条学生项目总结语句进行文本分析。结果 历经20余年发展,“解决问题,促进健康”课程现已成为必修课,以项目驱动的方式帮助学生提高社会实践能力。通过对学生项目选题的词频分析发现,“知识”出现的总频次(275次)最高;“老年人”出现的频次升至第二位。学生项目总结语句情感分析结果显示,85.88%(152条)为积极情绪,主要涉及项目对学生自身社会实践能力的积极影响;11.86%为消极情绪,主要为学生所关注的健康问题带来的不良影响或实践过程中的不足之处。结论“解决问题,促进健康”的课程建设在社会性和实践性教育方面已取得了初步成效,但仍有不足。后期需根据教育部关于劳动教育的指导纲要进行改革,可在一定程度上推动护理专业课程劳动教育建设。 展开更多
关键词 教育 护理 课程 文本分析 劳动教育
下载PDF
数字化转型对纺织业升级的影响研究 被引量:1
10
作者 李建琴 童文庆 周恒 《丝绸》 CAS CSCD 北大核心 2024年第1期1-10,共10页
纺织业是传统产业中的支柱产业,用数字技术推动中国纺织产业升级具有重要意义。本文基于2012—2020年中国A股上市公司数据,构建纺织企业升级的指标,考察数字化转型对纺织业升级的影响。实证结果表明,数字化转型主要通过推动企业流程升... 纺织业是传统产业中的支柱产业,用数字技术推动中国纺织产业升级具有重要意义。本文基于2012—2020年中国A股上市公司数据,构建纺织企业升级的指标,考察数字化转型对纺织业升级的影响。实证结果表明,数字化转型主要通过推动企业流程升级和功能升级两种途径,显著促进纺织业升级。本文采用工具变量法弱化由于遗漏变量等因素导致的内生性问题,通过替换变量和滞后变量法进行稳健性检验,得到一致的检验结果。机制检验表明,数字化转型主要通过营运效应、市场效应和成本效应促进纺织产业升级。本文的研究结果为促进企业数字化转型、推动纺织业升级和通过数字化转型促进纺织业产业升级提供了政策启示。 展开更多
关键词 数字化转型 纺织业 产业升级 影响机制 中介效应 文本分析法
下载PDF
基于字词向量融合的民航智慧监管短文本分类
11
作者 王欣 干镞锐 +2 位作者 许雅玺 史珂 郑涛 《中国安全科学学报》 CAS CSCD 北大核心 2024年第2期37-44,共8页
为解决民航监管事项所产生的检查记录仅依靠人工进行分类分析导致效率低的问题,提出一种基于数据增强与字词向量融合的双通道特征提取的短文本分类模型,探讨民航监管事项的分类,包括与人、设备设施环境、制度程序和机构职责等相关问题... 为解决民航监管事项所产生的检查记录仅依靠人工进行分类分析导致效率低的问题,提出一种基于数据增强与字词向量融合的双通道特征提取的短文本分类模型,探讨民航监管事项的分类,包括与人、设备设施环境、制度程序和机构职责等相关问题。为解决类别不平衡问题,采用数据增强算法在原始文本上进行变换,生成新的样本,使各个类别的样本数量更加均衡。将字向量和词向量按字融合拼接,得到具有词特征信息的字向量。将字词融合的向量分别送入到文本卷积神经网络(TextCNN)和双向长短期记忆(BiLSTM)模型中进行不同维度的特征提取,从局部的角度和全局的角度分别提取特征,并在民航监管事项检查记录数据集上进行试验。结果表明:该模型准确率为0.9837,F 1值为0.9836。与一些字嵌入模型和词嵌入模型相对比,准确率提升0.4%。和一些常用的单通道模型相比,准确率提升3%,验证了双通道模型提取的特征具有全面性和有效性。 展开更多
关键词 字词向量融合 民航监管 短文本 文本卷积神经网络(TextCNN) 双向长短期记忆(BiLSTM)
下载PDF
基于视频的轨道车辆自主定位方法研究
12
作者 沈拓 谢远翔 +4 位作者 盛峰 谢兰欣 张颖 安雪晖 曾小清 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第2期174-183,共10页
针对轨道施工车辆自主定位需求,提出一种基于车载前视相机拍摄百米标视频的轨道车辆自主定位方法。该方法首先对YOLOX-s网络进行改进并构建了百米标的目标检测模型,完成对百米标的目标检测;其次,当检测到百米标后,结合图像预处理和卷积... 针对轨道施工车辆自主定位需求,提出一种基于车载前视相机拍摄百米标视频的轨道车辆自主定位方法。该方法首先对YOLOX-s网络进行改进并构建了百米标的目标检测模型,完成对百米标的目标检测;其次,当检测到百米标后,结合图像预处理和卷积循环神经网络(CRNN)网络构建百米标数字文本识别模型,提取百米标的数字文本信息,从而实现对轨道施工车辆的定位。经实验验证该方法能够快速准确定位轨道施工车辆的位置信息。 展开更多
关键词 轨道车辆定位 机器视觉 目标检测 文本识别
下载PDF
深度学习的自然场景文本识别方法综述
13
作者 曾凡智 冯文婕 周燕 《计算机科学与探索》 CSCD 北大核心 2024年第5期1160-1181,共22页
自然场景文本识别在学术研究和实际应用中具有重要价值,已经成为计算机视觉领域的研究热点之一。然而,识别过程存在文本风格多样、背景环境复杂等挑战,导致识别效率和准确率不佳。传统的基于手工设计特征文本识别方法由于其有限的表示能... 自然场景文本识别在学术研究和实际应用中具有重要价值,已经成为计算机视觉领域的研究热点之一。然而,识别过程存在文本风格多样、背景环境复杂等挑战,导致识别效率和准确率不佳。传统的基于手工设计特征文本识别方法由于其有限的表示能力,不足以有效地应对复杂的自然场景文本识别任务。近年来,采用深度学习方法在自然场景文本识别中取得了重大进展,系统地梳理了近年来相关研究工作。首先,根据是否需要对单字符进行分割,将自然场景文本识别方法分为基于分割与无需分割的方法,再根据其技术实现特点将无需分割的方法进行细分,并对各类最具有代表性的方法工作原理进行了阐述。然后,介绍了当前常用数据集以及评价指标,并在数据集上对各类方法进行了性能对比,从多个方面讨论了各类方法的优势与局限性。最后,指出基于深度学习的自然场景文本识别研究存在的不足和难点,对其未来的发展趋势进行了展望。 展开更多
关键词 文本识别 深度学习 自然场景
下载PDF
融合领域要素知识的多粒度法律文本匹配方法
14
作者 罗森林 董勃 +1 位作者 潘丽敏 吴舟婷 《北京理工大学学报》 EI CAS CSCD 北大核心 2024年第3期298-305,共8页
法律文本匹配的目标是快速提炼对比要素信息并发现关联案件,保障法律适用的统一性同案同判.现有方法未能充分利用特定类型案件的先验知识,其核心要素提取准确率低,仅进行词向量的权重计算,忽略字义、句义、句法的向量信息,影响匹配效果... 法律文本匹配的目标是快速提炼对比要素信息并发现关联案件,保障法律适用的统一性同案同判.现有方法未能充分利用特定类型案件的先验知识,其核心要素提取准确率低,仅进行词向量的权重计算,忽略字义、句义、句法的向量信息,影响匹配效果.提出一种融合领域要素知识的多粒度法律文本匹配方法,通过建立特定案件类型领域知识库准确提取法律要素,引入字、词、句3个粒度的注意力机制计算不同文本向量的权重提升匹配模型效果.实验结果表明,该方法在公开数据集上可达到最好效果. 展开更多
关键词 文本匹配 法律要素 多粒度 领域知识
下载PDF
基于知识图谱的冬奥赛事气象服务文本生成方法研究
15
作者 丰德恩 张雪英 +4 位作者 唐卫 王益鹏 王慕华 渠寒花 李敏 《科学技术与工程》 北大核心 2024年第16期6600-6609,共10页
气象服务文本是为赛事顺利举行及赛事期间的各项活动提供必要的气象保障,是组委会、裁判、各代表队的工作人员获取气象信息开展相关工作的载体。现有气象文本生产需要人工编写审核,效率不高。相比之下,全自动文本生成更加依赖于模板和... 气象服务文本是为赛事顺利举行及赛事期间的各项活动提供必要的气象保障,是组委会、裁判、各代表队的工作人员获取气象信息开展相关工作的载体。现有气象文本生产需要人工编写审核,效率不高。相比之下,全自动文本生成更加依赖于模板和固定的形式。针对以上问题,结合自然语言处理技术提出基于知识图谱的冬奥赛事气象服务文本生成方法。重点从历史赛事气象服务文本中进行内容分析和特征提取,利用气象数据和历史赛事信息构建高山滑雪赛事知识图谱。该方法根据实时气象数据和文稿模板生成天气描述文本,然后基于知识图谱查询推理技术得到赛事影响结果并生成相应文本。实验结果表明:气象服务文本的自动生成结果具有较好的准确性和可读性,有助于冬奥赛事的顺利推进,该文本生成方法面向特定领域也具有较好的应用前景。 展开更多
关键词 知识图谱 文本生成 气象服务 冬奥赛事 知识推理
下载PDF
“双碳”背景下中国绿色金融政策协同有效性研究——基于多维文本量化分析
16
作者 孔莉 彭宇亭 李想成真 《技术经济与管理研究》 北大核心 2024年第6期97-103,共7页
绿色金融政策的协同性研究对实现碳达峰碳中和,推进绿色金融可持续发展具有重要意义。通过政策协同理论,构建绿色金融政策“协同—属性—工具”分析框架,采用基于机器学习的文本相似度算法与系统耦合协同模型,从政策纵向协同、横向协同... 绿色金融政策的协同性研究对实现碳达峰碳中和,推进绿色金融可持续发展具有重要意义。通过政策协同理论,构建绿色金融政策“协同—属性—工具”分析框架,采用基于机器学习的文本相似度算法与系统耦合协同模型,从政策纵向协同、横向协同和耦合协同多个维度对2016—2022年中央及地方绿色金融政策进行文本量化分析。研究发现:我国绿色金融政策纵向协同、横向协同和耦合协同水平逐渐提升,但总体强度仍较低;在区域上,我国绿色金融政策三维协同具有区域差异性;在政策类型维度上,央地绿色金融政策类型呈现多样化特征;在政策工具维度上,央地绿色金融政策工具结构失衡,使用供给型和环境型政策工具较多而需求型工具略少。因此,为提高我国绿色金融政策有效性,应进一步优化绿色金融政策多维协同机制。 展开更多
关键词 绿色金融政策 政策协同 文本量化 文本相似度 耦合协同
下载PDF
ChatGPT生成中文学术内容分析——以情报学领域为例
17
作者 郭鑫 王一博 王继民 《图书馆论坛》 北大核心 2024年第3期134-143,共10页
学术写作是ChatGPT的主要应用方向之一。文章以情报学领域的核心期刊论文为研究对象,首先从词、句、篇3个维度出发,使用词性标注、n-gram等文本处理方法对ChatGPT和人类产出的论文引言内容进行对比分析。然后将判断学术内容是否由ChatGP... 学术写作是ChatGPT的主要应用方向之一。文章以情报学领域的核心期刊论文为研究对象,首先从词、句、篇3个维度出发,使用词性标注、n-gram等文本处理方法对ChatGPT和人类产出的论文引言内容进行对比分析。然后将判断学术内容是否由ChatGPT生成视作一个二元分类任务,采用朴素贝叶斯、支持向量机、随机森林算法进行文本分类实验,并使用SHAP方法对文本结构特征的重要性进行分析。研究发现:ChatGPT在描述有具体时间节点的事实性信息和引用政策文件或研究报告等方面表现较弱,生成引言的篇幅较集中,撰写论文相较于人类更加“循规蹈矩”;查重工具通常无法准确检测出ChatGPT生成内容的原创性,但分类模型可以比较容易地区分出引言是否由ChatGPT生成,平均句子长度、词汇多样性和文本长度是影响分类结果最重要的文本结构特征。 展开更多
关键词 ChatGPT 论文写作 情报学 文本分类 查重检测
下载PDF
基于注意力机制和CNN的多标签文本分类模型
18
作者 杨春霞 吴佳君 +1 位作者 瞿涛 姚思诚 《计算机应用与软件》 北大核心 2024年第3期156-162,共7页
针对目前多标签文本分类模型存在无法充分提取文本语义与标签的相互关系,提出一种基于注意力机制和卷积神经网络(CNN)的多标签文本分类模型。通过多头注意力机制和CNN对文本进行建模表示,充分挖掘文本全局和局部的语义特征;结合标签与... 针对目前多标签文本分类模型存在无法充分提取文本语义与标签的相互关系,提出一种基于注意力机制和卷积神经网络(CNN)的多标签文本分类模型。通过多头注意力机制和CNN对文本进行建模表示,充分挖掘文本全局和局部的语义特征;结合标签与文本信息进行交互注意力计算,捕捉结合文本内容后标签间的相互关系;使用一种自适应融合策略进一步提取两者语义信息。实验结果表明,该模型相比于其他主流模型能有效提升多标签文本分类效果。 展开更多
关键词 多标签文本分类 注意力机制 卷积神经网络 文本表示
下载PDF
基于文本分析的中国数字创业政策评价研究
19
作者 李亮 严良 +1 位作者 唐敏 周敏 《武汉理工大学学报(信息与管理工程版)》 CAS 2024年第2期260-268,共9页
随着数字经济在中国的蓬勃发展,数字创业面临着巨大的机遇和挑战,对于数字创业政策的有效评估有助于了解政策不足并推动区域数字创业进一步发展。基于此,利用文本分析方法对中国省级层面实施的数字创业政策进行了深入分析,在计算区域创... 随着数字经济在中国的蓬勃发展,数字创业面临着巨大的机遇和挑战,对于数字创业政策的有效评估有助于了解政策不足并推动区域数字创业进一步发展。基于此,利用文本分析方法对中国省级层面实施的数字创业政策进行了深入分析,在计算区域创业绩效水平的基础上探究不同类别省份的数字创业政策特征,利用PMC指数法分析区域数字创业政策的总体有效性及维度特征。该研究可为中国不同类型省份进一步优化政策布局提供参考。 展开更多
关键词 数字创业 政策评价 文本分析 创业绩效 数字经济
下载PDF
基于社交媒体数据的城市洪涝灾害信息智能提取与分析
20
作者 康玲 温云亮 +4 位作者 周丽伟 郭金垒 叶金旺 陈锦帅 邹强 《中国农村水利水电》 北大核心 2024年第5期155-160,共6页
近年来,由于气候变化导致极端降雨引起的城市内涝灾害事件频发,给我国城市水安全和可持续发展带来威胁,准确掌握受灾区域的舆论主体和公众情绪,对提高应急管理部门内涝灾害的态势感知能力具有重要意义。在当今智能网络时代,人们通过社... 近年来,由于气候变化导致极端降雨引起的城市内涝灾害事件频发,给我国城市水安全和可持续发展带来威胁,准确掌握受灾区域的舆论主体和公众情绪,对提高应急管理部门内涝灾害的态势感知能力具有重要意义。在当今智能网络时代,人们通过社交媒体反映问题和建议的诉求日益凸显,社交媒体已逐渐成为反映民众情感和社会舆情的主要载体,为获取自然灾害信息提供了新的途径。如何从社交媒体中快速提取城市洪涝灾害信息,并对自然灾害信息进行主题分类和情感分析,准确掌握区域灾情的主题类别和民众舆论倾向,是目前亟待解决的关键技术问题。以新浪微博为例,阐述了洪涝灾害数据的获取与预处理方法,构建了基于FastText的城市洪涝灾害信息主题分类和情感分析模型,以准确掌握受灾区域的主题类别和舆论导向。以2021年郑州“7.20”特大暴雨期间洪涝灾害为例的研究结果表明,本文方法实现了对社交媒体中城市洪涝灾害数据的智能提取与分析,主题分类模型对预设八种类别数据的分类预测F1值达到0.80以上,且情感分析模型基本能够准确预测情感标记为“负面”的数据,这表明本文构建的基于FastText的城市洪涝灾害信息主题分类和情感分析模型能够满足支撑城市应急管理部门动态掌握洪涝灾害发展态势及公众情绪的需求,对防涝减灾调度、安抚民众情绪和实时定点救援等工作具有重要的指导意义。 展开更多
关键词 城市内涝 社交媒体 FastText 文本分类 情感分析
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部