期刊文献+
共找到161篇文章
< 1 2 9 >
每页显示 20 50 100
基于Bert-TextCNN的开源威胁情报文本的多标签分类方法
1
作者 陆佳丽 《信息安全研究》 CSCD 北大核心 2024年第8期760-768,共9页
开源威胁情报对网络安全防护十分重要,但其存在着分布广、形式多、噪声大的特点.所以如何能对收集到的海量开源威胁情报进行高效的整理和分析就成为亟需解决的问题.因此,探索了一种以Bert-TextCNN模型为基础且同时考虑标题、正文和正则... 开源威胁情报对网络安全防护十分重要,但其存在着分布广、形式多、噪声大的特点.所以如何能对收集到的海量开源威胁情报进行高效的整理和分析就成为亟需解决的问题.因此,探索了一种以Bert-TextCNN模型为基础且同时考虑标题、正文和正则判断的多标签分类方法.根据情报源发布文本的特点,设置正则判断规则,以弥补模型的欠缺;为更全面反映开源威胁情报文本所涉及的威胁主题,针对标题和正文分别设置了Bert-TextCNN多标签分类模型,并将2部分标签整理去重以得到文本的最终威胁类别.通过与只依据正文建立的Bert-TextCNN多标签分类模型进行对比,所设置的模型在性能上有所提升,且召回率提升明显,能为开源威胁情报分类工作提供有价值的参考. 展开更多
关键词 开源威胁情报 多标签分类 文本分类 Bert模型 textCNN模型
下载PDF
Opening Moves Involved in Text-based Computer-Mediated-Communication (CMC) by Chinese Adults
2
作者 李莉华 《海外英语》 2011年第3X期257-258,260,共3页
The development of science and technology has made it not only possible but very convenient for people living in different parts of the world to communicate with each other, thus bringing forth a new form of communica... The development of science and technology has made it not only possible but very convenient for people living in different parts of the world to communicate with each other, thus bringing forth a new form of communication: computer-mediated communication (CMC). Text-based CMC is one of the most popular forms of CMC in which people send instant messages to others in different settings. Since this mode of interaction combines features of both the written and spoken language (Greenfield & Subrahmanyam, 2003), it's of great interest whether it follows the same sequential rule as the telephone conversation. However, compared to telephone conversations, computer-mediated communication has received much less attention, let alone text-based CMC. The existing body of literature mostly focuses on content analysis and linguistic features but neglects the sequential organization of such interaction (Paolillo, 1999; Greenfield and Subrahmanyam, 2003; Herring, 1999). In light of this, this paper examines the opening moves of instant message exchanges among Chinese adults in an attempt to find out the unique features characterizing the way they open an online chat. The framework that was chosen for data analysis was the sequential model proposed by Schegloff for American telephone openings. 展开更多
关键词 computer-mediated communication(CMC) text-based CMC openING MOVES instant message exchanges on line chat sequential model
下载PDF
开放同行评审中自动评审分类方法研究 被引量:1
3
作者 陈红玉 胡文俊 路永和 《现代情报》 北大核心 2024年第5期95-106,共12页
[目的/意义]科技论文是学术界传递和交流知识的重要方式。科技论文评审是对科技论文承载的知识的价值衡量,高效准确的科技论文评审分类预测可以快速判断论文价值,加速有价值的知识传播进程。[方法/过程]本文讨论开放同行评审中自动评审... [目的/意义]科技论文是学术界传递和交流知识的重要方式。科技论文评审是对科技论文承载的知识的价值衡量,高效准确的科技论文评审分类预测可以快速判断论文价值,加速有价值的知识传播进程。[方法/过程]本文讨论开放同行评审中自动评审分类方法,利用科技论文语义信息和开放同行评审中的专家评分,分别构建基于传统机器学习和基于深度学习的科技论文文本表示及分类模型,提供自动评审分类结果。[结果/结论]实验结果表明,融合语义信息和评分信息的评审分类模型比单纯依靠评分均值进行评审判断更为有效,以评分+均值为评分信息输入、基于SCIBERT的质量评审分类模型准确率最高,达到90.17%。本文提出的自动评审分类方法具有可用性,准确率较高,可以辅助期刊编辑快速筛选有潜力的科技论文,促进科技论文智能评审的发展。 展开更多
关键词 文本语义 开放同行评审 自动评审分类 深度学习
下载PDF
数据论文引证意图自动识别研究--以生物医学领域为例
4
作者 黄珊 刘茹 +1 位作者 石燕青 杨波 《情报理论与实践》 北大核心 2024年第8期190-200,共11页
[目的/意义]探索数据论文引用意图自动识别方法,为实现更高效的科学数据组织和数据共享提供参考和依据。[方法/过程]以生物医学领域为例,在构建大规模数据论文引用句标准语料库的基础上,通过引用句的内容特征对引用意图进行分类,提出基... [目的/意义]探索数据论文引用意图自动识别方法,为实现更高效的科学数据组织和数据共享提供参考和依据。[方法/过程]以生物医学领域为例,在构建大规模数据论文引用句标准语料库的基础上,通过引用句的内容特征对引用意图进行分类,提出基于深度学习技术的数据论文引用意图自动识别方法。[结果/结论]利用文本分类手段对数据论文引用意图进行自动识别具有可行性,深度预训练的语言模型PubMedBert性能优良且具有明显的领域优势,能够应用于大规模语料实践任务中。在数据论文引用意图中,半数以上是实质性引用且这类引用呈上升趋势。 展开更多
关键词 数据论文 引用意图 开放科学 文本分类
下载PDF
中国自由贸易试验区制度创新:特征、问题及对策
5
作者 钱学锋 高婉 《长安大学学报(社会科学版)》 2024年第3期103-124,共22页
为了探研中国自由贸易试验区制度创新的特征以及存在的问题,对中国自由贸易试验区10年来国家和地方层面要求复制推广的2130项制度创新成果进行了全面系统的梳理,通过文本挖掘的方法对其实践特征进行量化分析。研究发现,各自由贸易试验... 为了探研中国自由贸易试验区制度创新的特征以及存在的问题,对中国自由贸易试验区10年来国家和地方层面要求复制推广的2130项制度创新成果进行了全面系统的梳理,通过文本挖掘的方法对其实践特征进行量化分析。研究发现,各自由贸易试验区形成了大批制度创新成果,推动了各地区高质量发展;然而,这些制度创新成果也存在制度供给需求不相匹配、改革领域过于集中以及改革深度不够等问题。研究表明,进一步推动中国自由贸易试验区高质量制度创新的重要途经是,要建立市场与管理双向沟通的渠道,将短期内难以显现改革绩效的考核方式由结果导向转为程序导向;加大放权力度的同时加强数字政府的建设,通过网络平台建立来自政府服务受众的多途径信息反馈机制;在国家、省级层面上对自由贸易试验区制度创新相关事宜进行立法;结合自由贸易试验区提升战略,更加注重产业发展领域的制度创新,加强制度创新的系统集成和协同高效,以及深入推进高水平制度型开放。 展开更多
关键词 自由贸易试验区 海南自由贸易港 制度创新 文本挖掘 高水平对外开放
下载PDF
基于文字局部结构相似度量的开放集文字识别方法
6
作者 刘畅 杨春 殷绪成 《自动化学报》 EI CAS CSCD 北大核心 2024年第10期1977-1987,共11页
开放集文字识别(Open-set text recognition,OSTR)是一项新任务,旨在解决开放环境下文字识别应用中的语言模型偏差及新字符识别与拒识问题.最近的OSTR方法通过将上下文信息与视觉信息分离来解决语言模型偏差问题.然而,这些方法往往忽视... 开放集文字识别(Open-set text recognition,OSTR)是一项新任务,旨在解决开放环境下文字识别应用中的语言模型偏差及新字符识别与拒识问题.最近的OSTR方法通过将上下文信息与视觉信息分离来解决语言模型偏差问题.然而,这些方法往往忽视了字符视觉细节的重要性.考虑到上下文信息的偏差,局部细节信息在区分视觉上接近的字符时变得更加重要.本文提出一种基于自适应字符部件表示的开放集文字识别框架,构建基于文字局部结构相似度量的开放集文字识别方法,通过对不同字符部件进行显式建模来改进对局部细节特征的建模能力.与基于字根(Radical)的方法不同,所提出的框架采用数据驱动的部件设计,具有语言无关的特性和跨语言泛化识别的能力.此外,还提出一种局部性约束正则项来使模型训练更加稳定.大量的对比实验表明,本文方法在开放集、传统闭集文字识别任务上均具有良好的性能. 展开更多
关键词 开放集文字识别 开放集学习 泛用零样本学习 组成学习
下载PDF
从政策工具视角审视我国开放科学政策文本特征
7
作者 凡庆涛 张士运 +2 位作者 李博 魏晨 杜赟 《大学图书情报学刊》 2024年第5期90-99,共10页
利用政策工具分析国内开放科学政策文本特征,为今后我国开放科学政策制定和完善提供思路。提出政策工具、开放科学内容要素二维政策分析框架,采用文本分析法对政策发布、内容和结构特征分析。发现国内开放科学政策以供给面、环境面政策... 利用政策工具分析国内开放科学政策文本特征,为今后我国开放科学政策制定和完善提供思路。提出政策工具、开放科学内容要素二维政策分析框架,采用文本分析法对政策发布、内容和结构特征分析。发现国内开放科学政策以供给面、环境面政策为主,重点关注法规标准、工作制度和公共服务类政策工具,需求面政策工具运用不足;开放科学各内容要素的政策布局不均,开放流程、开放合作与交流要素政策亟待优化。建议加强顶层设计,构建多级联动的开放科学政策体系;优化政策工具结构,提高需求面和供给面政策工具运用;覆盖开放科学全要素,聚焦核心要素政策布局。 展开更多
关键词 开放科学 政策工具 文本特征 内容分析
下载PDF
全球开放获取运动的新进展——OpenAIRE-COAR2014年会的观察与思考 被引量:14
8
作者 聂华 《大学图书馆学报》 CSSCI 北大核心 2015年第2期5-12,共8页
以OpenAIRE-COAR2014年会的基本情况为背景,介绍全球范围内开放获取运动的最新发展,包括开放获取生态系统涉及到的联盟、机构、其他参与方及其项目的进展,开放获取涉及的多元化和多样性的主题和内容。同时,思考全球尤其是欧洲的开放获... 以OpenAIRE-COAR2014年会的基本情况为背景,介绍全球范围内开放获取运动的最新发展,包括开放获取生态系统涉及到的联盟、机构、其他参与方及其项目的进展,开放获取涉及的多元化和多样性的主题和内容。同时,思考全球尤其是欧洲的开放获取运动的进展和路径为中国开放获取运动的发展所带来的影响、促进以及启示。 展开更多
关键词 开放获取 开放知识库 研究数据 文本与数据挖掘
下载PDF
指向高阶思维能力培养的高考生物学开放性试题分析及启示
9
作者 高倩倩 曹苡 李雪峰 《生物学教学》 北大核心 2024年第1期60-63,共4页
开放性试题有着结论开放、情境真实以及要求学生通过复杂认知活动完成作答的特点,是考查学生高阶思维能力的重要题型之一。广东省2023年高考生物学试题中出现了多道开放性试题,通过对试题的分析发现其对学生的多项高阶思维能力展开了考... 开放性试题有着结论开放、情境真实以及要求学生通过复杂认知活动完成作答的特点,是考查学生高阶思维能力的重要题型之一。广东省2023年高考生物学试题中出现了多道开放性试题,通过对试题的分析发现其对学生的多项高阶思维能力展开了考查,也对开放性试题的命制和课堂教学有一定的借鉴意义。 展开更多
关键词 开放性试题 高考生物学 试题分析 高阶思维能力
下载PDF
改革开放以来我国休闲体育政策文本分析研究
10
作者 陈昶 夏江涛 《山东体育科技》 2024年第2期12-17,共6页
运用NVivo14.0软件,从政策工具视角对1979—2022年我国政府层面颁布的90份政策文件进行文献计量和内容分析,意在从各个政策工具在政策研究中的分化和侧重中总结规律。研究结果显示,从占比上看,我国供给型政策工具占比在政策文件中占比最... 运用NVivo14.0软件,从政策工具视角对1979—2022年我国政府层面颁布的90份政策文件进行文献计量和内容分析,意在从各个政策工具在政策研究中的分化和侧重中总结规律。研究结果显示,从占比上看,我国供给型政策工具占比在政策文件中占比最多;从分布上看,各个政策工具的子工具分布欠合理;从整体上看,Y要素政策工具的子工具与大部分X维度政策工具衔接出现阻隔现象。据此提出建议,探索“多元协同”政策制定模式,优化子政策工具配置组合;健全政策工具应用体系,优化三大政策结构布局;要注重政策之间的关联性,确保整体部署。 展开更多
关键词 改革开放 政策文本 Nvivo14.0 休闲体育
下载PDF
我国地方政府数据开放政策的注意力配置及优化研究 被引量:1
11
作者 石晶 李苗 《情报探索》 2024年第4期24-31,共8页
[目的/意义]旨在探究我国政府数据开放政策的注意力配置情况及不足,进而优化政策制定。[方法/过程]基于2013—2022年我国省级政府发布的98份数据开放政策文本,运用NVivo 11和ROST CM 6.0软件分析注意力配置情况。[结果/结论]总体上我国... [目的/意义]旨在探究我国政府数据开放政策的注意力配置情况及不足,进而优化政策制定。[方法/过程]基于2013—2022年我国省级政府发布的98份数据开放政策文本,运用NVivo 11和ROST CM 6.0软件分析注意力配置情况。[结果/结论]总体上我国地方政府数据开放政策注意力呈现初级开放阶段(2015年以前)、重视利用阶段(2016—2019年)、深度利用阶段(2020年至今)的演变特征;政策工具的使用存在不均衡现象;政策主题主要集中于数据开放与建设、数据安全与保障、数据利用与发展层面,在不同层面政府偏好使用不同的政策工具。在政策工具的使用中,应强化需求型政策工具的使用比例,提高政策科学性;优化政策工具的内部使用结构,创新政策要素;深化数据质量类别的工具使用,克服供给困境。 展开更多
关键词 政府数据开放 注意力配置 政策文本
下载PDF
《红楼梦》缘何“说不尽”
12
作者 陈才训 毛艳秋 《求是学刊》 北大核心 2024年第2期157-168,共12页
曹雪芹屡屡以隐晦婉曲的“春秋笔法”叙事写人,使《红楼梦》颇多“烟云模糊处”;他又“远师楚人”,以比兴寄托之象征手法塑造意象化人物,并通过系统的叙事意象寄寓情志;“一芹一脂”共同塑成了充满“矛盾”与张力的开放性小说文本形态;... 曹雪芹屡屡以隐晦婉曲的“春秋笔法”叙事写人,使《红楼梦》颇多“烟云模糊处”;他又“远师楚人”,以比兴寄托之象征手法塑造意象化人物,并通过系统的叙事意象寄寓情志;“一芹一脂”共同塑成了充满“矛盾”与张力的开放性小说文本形态;经学阐释传统之“过度阐释”与“强制阐释”对小说批评领域的强势介入:这些都在不同程度上左右着人们对《红楼梦》的阐释维度。正因《红楼梦》呈现出“伟大的混沌”状态,阐释者才会歧见纷出,从而成就了其“说不尽”的艺术魅力。 展开更多
关键词 《红楼梦》 曲笔 人物意象与叙事意象 开放性文本 “无结局”小说 过度阐释与强制阐释
下载PDF
Dixit Player with Open CLIP
13
作者 Ryan Wei 《Journal of Data Analysis and Information Processing》 2023年第4期536-547,共12页
A computer vision approach through Open AI’s CLIP, a model capable of predicting text-image pairs, is used to create an AI agent for Dixit, a game which requires creative linking between images and text. This paper c... A computer vision approach through Open AI’s CLIP, a model capable of predicting text-image pairs, is used to create an AI agent for Dixit, a game which requires creative linking between images and text. This paper calculates baseline accuracies for both the ability to match the correct image to a hint and the ability to match up with human preferences. A dataset created by previous work on Dixit is used for testing. CLIP is utilized through the comparison of a hint to multiple images, and previous hints, achieving a final accuracy of 0.5011 which surpasses previous results. 展开更多
关键词 Computer Vision AI CLIP Dixit open AI Creative Gameplay open CLIP Natural Language Processing Visual Models Game AI Image-text Pairing
下载PDF
中国特色政府信息公开与数据开放关联性分析
14
作者 段尧清 易明 《学术前沿》 北大核心 2024年第6期94-107,共14页
政府信息公开与数据开放是数字政府建设的重要内容,厘清两者之间的关系,有助于两者相互促进、推进国家治理体系和治理能力现代化。政府信息公开与数据开放在发展过程中具有一致性和差异性,两者存在有益共生关系。基于此,未来应优化数据... 政府信息公开与数据开放是数字政府建设的重要内容,厘清两者之间的关系,有助于两者相互促进、推进国家治理体系和治理能力现代化。政府信息公开与数据开放在发展过程中具有一致性和差异性,两者存在有益共生关系。基于此,未来应优化数据要素,推进政府信息公开和数据开放协同发展。同时,将开放推进到数据层面,实现数据的深度开放和共享。 展开更多
关键词 政府信息公开 数据开放 灰色关联度分析 政策文本计算 多维度分析
下载PDF
目的论视角下第三十一届世界大学生夏季运动会致辞的翻译研究
15
作者 万竹青 《文化创新比较研究》 2024年第5期19-23,共5页
2023年7月28日晚间,第三十一届世界大学生夏季运动会在中国成都隆重举行。开幕式作为大运会序幕的重要环节,向来吸引着广泛的公众关注。该仪式不仅需要反映大运会的核心理念,还应充分展示东道国的中华文化精粹、地域风情及政府机构的组... 2023年7月28日晚间,第三十一届世界大学生夏季运动会在中国成都隆重举行。开幕式作为大运会序幕的重要环节,向来吸引着广泛的公众关注。该仪式不仅需要反映大运会的核心理念,还应充分展示东道国的中华文化精粹、地域风情及政府机构的组织能力。此外,开幕式亦承担着向国际社会传达热忱欢迎的重要职责。而大运会开幕式致辞是国际社会了解中国政治、中国经济和中国文化的一个微观窗口,因而广受关注。这项盛大的赛事将展示成都这个充满活力的城市,同时也将吸引数以千计的运动员和观众来到这座城市,共同庆祝这一盛事。该文从功能目的论的角度,探讨分析习近平总书记在成都第三十一届世界大学生夏季运动会开幕式致辞中的英文翻译文本,发现文中使用意译、直译、增译和减译等翻译策略。 展开更多
关键词 成都大运会 功能目的论 翻译策略 开幕式致辞翻译文本 直译 意译
下载PDF
Identifying Scientific Project-generated Data Citation from Full-text Articles: An Investigation of TCGA Data Citation 被引量:4
16
作者 Jiao Li Si Zheng +2 位作者 Hongyu Kang Zhen Hou Qing Qian 《Journal of Data and Information Science》 2016年第2期32-44,共13页
Purpose: In the open science era, it is typical to share project-generated scientific data by depositing it in an open and accessible database. Moreover, scientific publications are preserved in a digital library arc... Purpose: In the open science era, it is typical to share project-generated scientific data by depositing it in an open and accessible database. Moreover, scientific publications are preserved in a digital library archive. It is challenging to identify the data usage that is mentioned in literature and associate it with its source. Here, we investigated the data usage of a government-funded cancer genomics project, The Cancer Genome Atlas(TCGA), via a full-text literature analysis.Design/methodology/approach: We focused on identifying articles using the TCGA dataset and constructing linkages between the articles and the specific TCGA dataset. First, we collected 5,372 TCGA-related articles from Pub Med Central(PMC). Second, we constructed a benchmark set with 25 full-text articles that truly used the TCGA data in their studies, and we summarized the key features of the benchmark set. Third, the key features were applied to the remaining PMC full-text articles that were collected from PMC.Findings: The amount of publications that use TCGA data has increased significantly since 2011, although the TCGA project was launched in 2005. Additionally, we found that the critical areas of focus in the studies that use the TCGA data were glioblastoma multiforme, lung cancer, and breast cancer; meanwhile, data from the RNA-sequencing(RNA-seq) platform is the most preferable for use.Research limitations: The current workflow to identify articles that truly used TCGA data is labor-intensive. An automatic method is expected to improve the performance.Practical implications: This study will help cancer genomics researchers determine the latest advancements in cancer molecular therapy, and it will promote data sharing and data-intensive scientific discovery.Originality/value: Few studies have been conducted to investigate data usage by governmentfunded projects/programs since their launch. In this preliminary study, we extracted articles that use TCGA data from PMC, and we created a link between the full-text articles and the source data. 展开更多
关键词 Scientific data Full-text literature open access PubMed Central Data citation
下载PDF
政策工具视域下我国档案开放政策文本量化分析 被引量:2
17
作者 周丽霞 兰访 《山西档案》 2023年第1期32-41,共10页
分析我国已经出台的档案开放政策文本,发现政策间存在的复杂关系,为政府今后制定和完善相关政策文件提供借鉴。基于文本分析方法与政策工具理论,借助NVivo11质性分析软件对58份档案开放政策样本进行编码与统计分析。目前我国档案开放政... 分析我国已经出台的档案开放政策文本,发现政策间存在的复杂关系,为政府今后制定和完善相关政策文件提供借鉴。基于文本分析方法与政策工具理论,借助NVivo11质性分析软件对58份档案开放政策样本进行编码与统计分析。目前我国档案开放政策文本内容覆盖较为全面,但也存在着三种政策工具应用比例分布不均、内部工具结构配置失衡的现象。因此对未来档案开放政策制定提出四点建议:一是增强政策整体有效性;二是优化档案开放政策工具结构,三是加强政策制定主体之间合作沟通,四是出台专门性的档案开放政策来完善我国档案开放政策体系。 展开更多
关键词 档案开放 政策工具 文本分析 Nvivo
下载PDF
资本市场开放推动企业数字化转型了吗?——基于准自然实验和文本分析方法 被引量:13
18
作者 李成明 周迪 董志勇 《统计研究》 北大核心 2023年第8期96-109,共14页
企业数字化转型是畅通国内大循环的重要举措,也是推动高质量发展的关键路径,但现有文献对企业数字化转型的动因关注较少。本文运用文本分析方法对2009—2021年上市公司年报进行分析,构建了企业数字化转型指数,并基于沪港通准自然实验研... 企业数字化转型是畅通国内大循环的重要举措,也是推动高质量发展的关键路径,但现有文献对企业数字化转型的动因关注较少。本文运用文本分析方法对2009—2021年上市公司年报进行分析,构建了企业数字化转型指数,并基于沪港通准自然实验研究了资本市场开放对企业数字化转型的影响及其机制。实证结果显示,资本市场开放显著推动了企业数字化转型,且这一结论在进行一系列稳健性检验后依然成立。机制分析发现,资本市场开放主要通过改变企业信息披露行为和促进企业长期价值回归两条路径推动企业数字化转型,即企业数字化转型兼具策略性和实质性。异质性分析发现,资本市场开放的数字化转型效应在非国有企业、高新技术产业、融资约束较高企业和管理层权力较大的企业中表现更明显。本文剖析了“开放”与“转型”之间的关系,为企业数字化转型的影响因素研究提供了新视角,也为开放进程中加快企业数字化转型以促进经济高质量发展提供了经验证据。本文结论说明,通过资本市场开放融入国际大循环,可以加快企业数字化转型以畅通国内大循环,有助于构建以国内大循环为主体、国内国际双循环相互促进的新发展格局。 展开更多
关键词 数字化转型 资本市场开放 新发展格局 文本分析 准自然实验
下载PDF
开放领域新闻中基于自适应决策边界的突发事件识别和分类研究 被引量:2
19
作者 胡庭恺 陈祖琴 +2 位作者 葛继科 陈超 董焱 《情报理论与实践》 北大核心 2023年第2期194-200,共7页
[目的/意义]网络新闻是获取突发事件情报的重要来源之一,提高海量网络新闻中突发事件的识别准确率和分类效果,并减少非突发事件新闻造成的开放集识别问题和降低人工标注非突发事件新闻的成本,这是当前突发事件识别与分类研究的重要课题... [目的/意义]网络新闻是获取突发事件情报的重要来源之一,提高海量网络新闻中突发事件的识别准确率和分类效果,并减少非突发事件新闻造成的开放集识别问题和降低人工标注非突发事件新闻的成本,这是当前突发事件识别与分类研究的重要课题。[方法/过程]选择BERT预训练模型获得文本的特征表示,融合不同层级之间的语义信息增强文本表示的质量,采用自适应决策边界模型,学习各突发事件类别在高维语义表示空间上的球形最佳决策边界,根据新闻样本的文本表示和各突发事件类别的球形最佳决策边界的欧几里得距离,检测出突发事件新闻并判断突发事件的类别,并在CEC公开数据集和实时爬取的中文新闻数据集CEN上对模型的有效性进行验证。[结果/结论]实验结果表明,本文模型在CEC数据集和CEN数据集上的宏F1值分别为98.46%和95.80%,与基准模型相比,本文模型的宏F1值分别提升了5.15%和19.69%。模型应用展示了提出方法在解决实际问题时的有效性。[局限]未考虑突发事件新闻可能存在多标签的情况。 展开更多
关键词 突发事件 自适应决策边界 开放集识别 文本分类
下载PDF
互联网开源文本情报智能分析技术综述 被引量:2
20
作者 刘航冶 富铁楠 杨勇 《情报杂志》 北大核心 2023年第2期12-16,共5页
[研究目的]随着网络技术的长足发展,基于互联网的开源情报更加受到情报分析领域的重视,自动化、高效的文本情报智能分析处理技术是海量开源情报数据处理的必要手段。[研究方法]从互联网文本情报智能分析处理的数据获取、关键信息抽取及... [研究目的]随着网络技术的长足发展,基于互联网的开源情报更加受到情报分析领域的重视,自动化、高效的文本情报智能分析处理技术是海量开源情报数据处理的必要手段。[研究方法]从互联网文本情报智能分析处理的数据获取、关键信息抽取及智能分析三个核心处理流程着手,对互联网开源文本情报智能分析中存在的问题和研究进展进行了总结和分析,阐述了解决问题近年来采用的新方法新思路。[研究结论]基于机器学习和深度学习的结合使用,使得互联网开源文本情报智能分析技术越来越走向实用,但如何解决特征设计和样本标注量的问题值得进一步研究,同时由于自然语言理解本身的复杂性,对文本信息的深层次理解仍然极具挑战。 展开更多
关键词 开源情报 文本挖掘 智能分析 自然语言处理 实体抽取 关系抽取 文本聚类
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部