期刊文献+
共找到280篇文章
< 1 2 14 >
每页显示 20 50 100
Unlocking the Potential:A Comprehensive Systematic Review of ChatGPT in Natural Language Processing Tasks
1
作者 Ebtesam Ahmad Alomari 《Computer Modeling in Engineering & Sciences》 SCIE EI 2024年第10期43-85,共43页
As Natural Language Processing(NLP)continues to advance,driven by the emergence of sophisticated large language models such as ChatGPT,there has been a notable growth in research activity.This rapid uptake reflects in... As Natural Language Processing(NLP)continues to advance,driven by the emergence of sophisticated large language models such as ChatGPT,there has been a notable growth in research activity.This rapid uptake reflects increasing interest in the field and induces critical inquiries into ChatGPT’s applicability in the NLP domain.This review paper systematically investigates the role of ChatGPT in diverse NLP tasks,including information extraction,Name Entity Recognition(NER),event extraction,relation extraction,Part of Speech(PoS)tagging,text classification,sentiment analysis,emotion recognition and text annotation.The novelty of this work lies in its comprehensive analysis of the existing literature,addressing a critical gap in understanding ChatGPT’s adaptability,limitations,and optimal application.In this paper,we employed a systematic stepwise approach following the Preferred Reporting Items for Systematic Reviews and Meta-Analyses(PRISMA)framework to direct our search process and seek relevant studies.Our review reveals ChatGPT’s significant potential in enhancing various NLP tasks.Its adaptability in information extraction tasks,sentiment analysis,and text classification showcases its ability to comprehend diverse contexts and extract meaningful details.Additionally,ChatGPT’s flexibility in annotation tasks reducesmanual efforts and accelerates the annotation process,making it a valuable asset in NLP development and research.Furthermore,GPT-4 and prompt engineering emerge as a complementary mechanism,empowering users to guide the model and enhance overall accuracy.Despite its promising potential,challenges persist.The performance of ChatGP Tneeds tobe testedusingmore extensivedatasets anddiversedata structures.Subsequently,its limitations in handling domain-specific language and the need for fine-tuning in specific applications highlight the importance of further investigations to address these issues. 展开更多
关键词 Generative AI large languagemodel(LLM) natural language processing(NLP) ChatGPT GPT(generative pretraining transformer) GPT-4 sentiment analysis NER information extraction ANNOTATION text classification
下载PDF
A Survey of Web Information System and Applications
2
作者 HAN Yanbo LI Juanzi +3 位作者 YANG Nan LIU Qing XU Baowen MENG Xiaofeng 《Wuhan University Journal of Natural Sciences》 CAS 2007年第5期769-772,共4页
The fourth international conference on Web information systems and applications (WISA 2007) has received 409 submissions and has accepted 37 papers for publication in this issue. The papers cover broad research area... The fourth international conference on Web information systems and applications (WISA 2007) has received 409 submissions and has accepted 37 papers for publication in this issue. The papers cover broad research areas, including Web mining and data warehouse, Deep Web and Web integration, P2P networks, text processing and information retrieval, as well as Web Services and Web infrastructure. After briefly introducing the WISA conference, the survey outlines the current activities and future trends concerning Web information systems and applications based on the papers accepted for publication. 展开更多
关键词 Web mining data warehouse Deep Web Web integration Web services P2P computing text processing information retrieval Web security
下载PDF
基于多级语义对齐的图像-文本匹配算法
3
作者 李艺茹 姚涛 +2 位作者 张林梁 孙玉娟 付海燕 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第2期551-558,共8页
图像中的区域特征更关注于图像中的前景信息,背景信息往往被忽略,如何有效的联合局部特征和全局特征还没有得到充分地研究。为解决上述问题,加强全局概念和局部概念之间的关联得到更准确的视觉特征,提出一种基于多级语义对齐的图像-文... 图像中的区域特征更关注于图像中的前景信息,背景信息往往被忽略,如何有效的联合局部特征和全局特征还没有得到充分地研究。为解决上述问题,加强全局概念和局部概念之间的关联得到更准确的视觉特征,提出一种基于多级语义对齐的图像-文本匹配算法。提取局部图像特征,得到图像中的细粒度信息;提取全局图像特征,将环境信息引入到网络的学习中,从而得到不同的视觉关系层次,为联合的视觉特征提供更多的信息;将全局-局部图像特征进行联合,将联合后的视觉特征和文本特征进行全局-局部对齐得到更加精准的相似度表示。通过大量的实验和分析表明:所提算法在2个公共数据集上具有有效性。 展开更多
关键词 图像-文本匹配 跨模态信息处理 特征提取 神经网络 特征融合
下载PDF
文本视觉问答综述
4
作者 朱贵德 黄海 《计算机工程》 CAS CSCD 北大核心 2024年第2期1-14,共14页
传统视觉问答(VQA)大多只关注图像中的视觉对象信息,忽略了对图像中文本信息的关注。文本视觉问答(TextVQA)除了视觉信息外还关注了图像中的文本信息,能够更加准确并高效地回答问题。近年来,TextVQA已经成为多模态领域的研究热点,在自... 传统视觉问答(VQA)大多只关注图像中的视觉对象信息,忽略了对图像中文本信息的关注。文本视觉问答(TextVQA)除了视觉信息外还关注了图像中的文本信息,能够更加准确并高效地回答问题。近年来,TextVQA已经成为多模态领域的研究热点,在自动驾驶、场景理解等包含文本信息的场景中有重要的应用前景。阐述TextVQA的概念以及存在的问题与挑战,从方法、数据集、未来研究方向等方面对TextVQA任务进行系统性的分析。总结现有的TextVQA研究方法,并将其归纳为3个阶段,分别为特征提取阶段、特征融合阶段和答案预测阶段。根据融合阶段使用方法的不同,从简单注意力方法、基于Transformer方法和基于预训练方法这3个方面对TextVQA方法进行阐述,分析对比不同方法的特点以及在公开数据集中的表现。介绍TextVQA领域4种常用的公共数据集,并对它们的特点和评价指标进行分析。在此基础上,探讨当前TextVQA任务中存在的问题与挑战,并对该领域未来的研究方向进行展望。 展开更多
关键词 文本视觉问答 文本信息 自然语言处理 计算机视觉 多模态融合
下载PDF
面向医学影像报告生成的门归一化编解码网络
5
作者 谭立玮 张淑军 +2 位作者 韩琪 郭淇 王鸿雁 《智能系统学报》 CSCD 北大核心 2024年第2期411-419,共9页
医学影像报告的自动生成可以减轻医生的工作强度,减少误诊或漏诊的情况发生。由于医学影像的独特性,通常病灶比较小,与正常区域灰度差异难以分辨,导致文本生成时关键词的缺失,报告不够准确。对此提出一种面向医学影像报告生成的门归一... 医学影像报告的自动生成可以减轻医生的工作强度,减少误诊或漏诊的情况发生。由于医学影像的独特性,通常病灶比较小,与正常区域灰度差异难以分辨,导致文本生成时关键词的缺失,报告不够准确。对此提出一种面向医学影像报告生成的门归一化编解码网络,通过门控通道变换单元优化视觉特征提取,加强特征间的差异,自动筛选关键特征;提出门归一化算法,沿通道维度整合上下文信息,在浅层网络激活、深层网络抑制通道间神经元活性,过滤无效特征,使文本和视觉语义充分交互,提高报告生成质量。在2种广泛使用的基准数据集IU X-Ray和MIMIC-CXR上的试验结果表明,模型能够取得先进的性能,生成的影像报告也具有更好的视觉语义一致性。 展开更多
关键词 医学影像处理 文本处理 特征提取 信息融合 通道编码 深度学习 报告生成器 灰度差异
下载PDF
藏文支持在OpenOffice.org办公套件中的实现
6
作者 贾彦民 吴健 +1 位作者 欧珠 孙玉芳 《中文信息学报》 CSCD 北大核心 2006年第3期49-54,77,共7页
办公套件是人们日常应用最为广泛的信息处理软件之一,但真正意义的藏文办公套件至今都尚未问世,成为藏文信息技术发展的“瓶颈”。开源项目OpenO ffice.org的不断发展和日益成熟,为藏文办公套件的研制开发提供了有利的契机。以OpenO ffi... 办公套件是人们日常应用最为广泛的信息处理软件之一,但真正意义的藏文办公套件至今都尚未问世,成为藏文信息技术发展的“瓶颈”。开源项目OpenO ffice.org的不断发展和日益成熟,为藏文办公套件的研制开发提供了有利的契机。以OpenO ffice.org为源代码基础,采用藏文编码字符集(扩充集A)国家标准,研制的藏文办公套件可支持藏文排版习惯和藏文本地环境,着重解决了藏文文本自动断行的问题,能够满足藏语文用户日常办公需要。 展开更多
关键词 计算机应用 中文信息处理 藏文字符集 办公套件 藏文信息处理 文本断行
下载PDF
Text-to-SQL文本信息处理技术研究综述
7
作者 彭钰寒 乔少杰 +5 位作者 薛骐 李江敏 谢添丞 徐康镭 冉黎琼 曾少北 《无线电工程》 2024年第5期1053-1062,共10页
信号与信息处理的需求日益增加,离不开数据处理技术,数据处理需要数据库的支持,然而没有经过训练的使用者会因为不熟悉数据库操作产生诸多问题。文本转结构化查询语言(Text to Structured Query Language,Text-to-SQL)的出现,使用户无... 信号与信息处理的需求日益增加,离不开数据处理技术,数据处理需要数据库的支持,然而没有经过训练的使用者会因为不熟悉数据库操作产生诸多问题。文本转结构化查询语言(Text to Structured Query Language,Text-to-SQL)的出现,使用户无需掌握结构化查询语言(Structured Query Language,SQL)也能够熟练操作数据库。介绍Text-to-SQL的研究背景及面临的挑战;介绍Text-to-SQL关键技术、基准数据集、模型演变及最新研究进展,关键技术包括Transformer等主流技术,用于模型训练的基准数据集包括WikiSQL和Spider;介绍Text-to-SQL不同阶段模型的特点,详细阐述Text-to-SQL最新研究成果的工作原理,包括模型构建、解析器设计及数据集生成;总结Text-to-SQL未来的发展方向及研究重点。 展开更多
关键词 文本转结构化查询语言 解析器 文本信息处理 数据库 深度学习
下载PDF
蒙古文显示在OpenOffice.org办公套件中的实现 被引量:3
8
作者 孟凡强 吴健 贾彦民 《中文信息学报》 CSCD 北大核心 2007年第2期117-121,共5页
蒙古文是一种复杂文字,目前操作系统和办公套件都还不支持蒙古文的显示。OpenOffice.org是可以运行在Linux和Windows上跨平台的办公套件,它分别使用ICU LayoutEngine和Uniscribe进行复杂文字处理。本文以支持蒙古文处理的Linux版本OpenO... 蒙古文是一种复杂文字,目前操作系统和办公套件都还不支持蒙古文的显示。OpenOffice.org是可以运行在Linux和Windows上跨平台的办公套件,它分别使用ICU LayoutEngine和Uniscribe进行复杂文字处理。本文以支持蒙古文处理的Linux版本OpenOiffice.org为基础,详细分析了OpenOffice.org在Linux和Windows系统上的复杂文本处理过程,采用Uniscribe与ICU相结合的方案,实现了OpenOffice.org在Windows平台上对蒙古文的显示。 展开更多
关键词 计算机应用 中文信息处理 复杂文字 复杂文本布局引擎 ICU Uniscribe
下载PDF
A Hybrid Algorithm for Stemming of Nepali Text
9
作者 Chiranjibi Sitaula 《Intelligent Information Management》 2013年第4期136-139,共4页
In this paper, a new context free stemmer is proposed which consists of the combination of traditional rule based system with string similarity approach. This algorithm can be called as hybrid algorithm. It is languag... In this paper, a new context free stemmer is proposed which consists of the combination of traditional rule based system with string similarity approach. This algorithm can be called as hybrid algorithm. It is language dependent algorithm. Context free stemmer means that stemmer which stems the word that is not based on the context i.e., for every context such rule is applied. After stripping the words using traditional context free rule based approach, it may over stem or under stem the inflected words which are overcome by applying string similarity function of dynamic programming. For measuring the string similarity function, edit distance is used. The stripped inflected word is compared with the words stored in a text database available. That word having minimum distance is taken as the substitution of the stripped inflected word which leads to the stem of it. The concept of traditional rule based system and corpus based approach is heavily used in this approach. This algorithm is tested for Nepali Language which is based on Devanagari Script. The approach has given better result in comparison to traditional rule based system particularly for Nepali Language only. The total accuracy of this hybrid algorithm is 70.10% whereas the total accuracy of traditional rule based system is 68.43%. 展开更多
关键词 STRING SIMILARITY information RETRIEVAL TEXT Mining Natural Language processing Dynamic PROGRAMMING
下载PDF
A Rule Based System for Speech Language Context Understanding
10
作者 Imran Sarwar Bajwa Muhammad Abbas Choudhary 《Journal of Donghua University(English Edition)》 EI CAS 2006年第6期39-42,共4页
Speech or Natural language contents are major tools of communication. This research paper presents a natural language processing based automated system for understanding speech language text. A new rule based model ha... Speech or Natural language contents are major tools of communication. This research paper presents a natural language processing based automated system for understanding speech language text. A new rule based model has been presented for analyzing the natural languages and extracting the relative meanings from the given text. User writes the natural language text in simple English in a few paragraphs and the designed system has a sound ability of analyzing the given script by the user. After composite analysis and extraction of associated information, the designed system gives particular meanings to an assortment of speech language text on the basis of its context. The designed system uses standard speech language rules that are clearly defined for all speech languages as English, Urdu, Chinese, Arabic, French, etc. The designed system provides a quick and reliable way to comprehend speech language context and generate respective meanings. 展开更多
关键词 语言 理解能力 汉语 英语 信息技术
下载PDF
ESG观点与股票市场定价——来自AI语言模型和新闻文本的证据
11
作者 徐凤敏 马杰傲 景奎 《当代经济科学》 北大核心 2023年第6期29-43,共15页
基于机器学习中自然语言处理方法,利用2018—2021年40余万篇企业信息披露与新闻媒体文本数据,将所蕴含的特定信息定义为一种全新的ESG观点。研究发现,文本中隐含的ESG观点被股票市场定价,且体现出投资者的部分投资偏好。不同视角下的ES... 基于机器学习中自然语言处理方法,利用2018—2021年40余万篇企业信息披露与新闻媒体文本数据,将所蕴含的特定信息定义为一种全新的ESG观点。研究发现,文本中隐含的ESG观点被股票市场定价,且体现出投资者的部分投资偏好。不同视角下的ESG观点对其企业股票收益率影响不一,积极的环境观点、治理观点和综合ESG观点与未来股票收益率显著正相关,且此影响存在月度反转现象。异质性检验结果显示,ESG观点对股票收益率的作用在“双碳”目标提出后得到增强,在大规模企业中该效应更加明显。ESG观点也体现出部分投资者信念。ESG观点正面的企业其股票交易量与ESG观点显著正相关,而对于ESG观点负面企业的结论则截然相反,且环境相关信息对投资者的交易行为影响尤为明显。当前,中国正处于经济向高质量发展转型的重要阶段,行业协会、监管部门等应引导上市企业更好地承担ESG责任,推动企业ESG战略转型,加强ESG行为监管,强化ESG信息披露制度建设,提高股票市场定价效率。 展开更多
关键词 ESG 股票价格 信息披露 文本情绪 自然语言处理 投资者关注度 投资偏好
下载PDF
基于微博文本的灾害事件信息时空过程聚合方法 被引量:2
12
作者 叶鹏 张雪英 张春菊 《测绘学报》 EI CSCD 北大核心 2023年第3期490-500,共11页
各类灾害事件频发已成为全球可持续发展面临的重大威胁。在大数据环境下,微博文本逐渐被应用于灾害管理的预防、准备、响应和恢复工作。以往研究多关注微博文本中灾情信息的获取,却忽略对这些碎片化信息进行有序化整合。本文从时空视角... 各类灾害事件频发已成为全球可持续发展面临的重大威胁。在大数据环境下,微博文本逐渐被应用于灾害管理的预防、准备、响应和恢复工作。以往研究多关注微博文本中灾情信息的获取,却忽略对这些碎片化信息进行有序化整合。本文从时空视角构建多层次的灾害事件信息模型,在抽取出微博文本中灾害事件信息要素的基础上,提出基于“对象-状态”的过程信息聚合方法,解决微博文本中灾害事件信息分散化、时空粒度多样化和无序化的问题。基于新浪微博进行台风“利奇马”事件的案例分析,结果表明,本文方法能够全面地获取灾害事件过程中各个时空节点上的灾情信息,有利于从微博文本中挖掘小尺度下的灾害突发状况。 展开更多
关键词 灾害事件 时空过程 多层次信息聚合 微博文本
下载PDF
预训练语言模型的应用综述 被引量:5
13
作者 孙凯丽 罗旭东 罗有容 《计算机科学》 CSCD 北大核心 2023年第1期176-184,共9页
近年来,预训练语言模型发展迅速,将自然语言处理推到了一个全新的发展阶段。文中的综述旨在帮助研究人员了解强大的预训练语言模型在何处以及如何应用于自然语言处理。具体来讲,首先简要回顾了典型的预训练模型,包括单语言预训练模型、... 近年来,预训练语言模型发展迅速,将自然语言处理推到了一个全新的发展阶段。文中的综述旨在帮助研究人员了解强大的预训练语言模型在何处以及如何应用于自然语言处理。具体来讲,首先简要回顾了典型的预训练模型,包括单语言预训练模型、多语言预训练模型以及中文预训练模型;然后讨论了这些预训练模型对5个不同的自然语言处理任务的贡献,即信息提取、情感分析、问答系统、文本摘要和机器翻译;最后讨论了预训练模型的应用所面临的一些挑战。 展开更多
关键词 预训练语言模型 自然语言处理 深度学习 信息提取 情感分析 问答系统 文本摘要 机器翻译
下载PDF
古籍文本挖掘技术综述 被引量:5
14
作者 林立涛 王东波 《科技情报研究》 2023年第1期78-91,共14页
[目的/意义]采用深度学习、自然语言处理等文本挖掘技术、方法和理念,对海量中国古籍进行文本挖掘,不仅有利于促进中华传统文化的传播和推广,而且对提升国家文化软实力具有重要意义。[方法/过程]在厘清古籍文本挖掘概念的基础上,整体把... [目的/意义]采用深度学习、自然语言处理等文本挖掘技术、方法和理念,对海量中国古籍进行文本挖掘,不仅有利于促进中华传统文化的传播和推广,而且对提升国家文化软实力具有重要意义。[方法/过程]在厘清古籍文本挖掘概念的基础上,整体把握古籍文本挖掘技术应用现状,从文本特征提取技术、词汇级文本挖掘技术、句子级文本挖掘技术、篇章级文本挖掘技术和知识组织与呈现等5个方面梳理了广泛用于古籍文本挖掘的算法、模型、工具。[结果/结论]较为全面地梳理了古籍文本挖掘领域的常用技术,总结了存在的问题并进行了展望。 展开更多
关键词 数字人文 计算人文 古籍文本挖掘 古文信息处理
下载PDF
面向真实世界的知识挖掘与知识图谱补全研究(二):非结构化电子病历信息抽取方法及进展 被引量:1
15
作者 阎思宇 李绪辉 +8 位作者 陈沐坤 朱海锋 谭杰骏 高旷 王永博 黄桥 任相颖 靳英辉 王行环 《医学新知》 CAS 2023年第5期358-365,共8页
随着信息技术的普及和推广,健康医疗大数据呈指数级增长,基于健康医疗大数据的临床真实世界研究日益受到关注。医院电子病历记录了真实世界下患者的诊疗全过程,是最能为临床决策提供支持的数据源之一。但电子病历数据中大量非结构化文... 随着信息技术的普及和推广,健康医疗大数据呈指数级增长,基于健康医疗大数据的临床真实世界研究日益受到关注。医院电子病历记录了真实世界下患者的诊疗全过程,是最能为临床决策提供支持的数据源之一。但电子病历数据中大量非结构化文本数据的存在,增加了数据处理难度,制约了基于电子病历数据研究的开展。急需将信息技术、人工智能等先进的方法用于非结构化电子病历数据的处理,以加速数据价值转化。本文总结了当前非结构化医学数据处理的常用方法,包括基于词典和规则的方法、基于传统机器学习和深度学习的方法和以本体为代表的基于认知模型的方法,探讨了非结构化电子病历数据处理时的标准化问题及透明化报告问题,展望了相关发展。 展开更多
关键词 非结构化数据 电子病历 信息抽取 文本挖掘 自然语言处理 本体 真实世界数据
下载PDF
地理标志农产品品牌管理政策注意力分析模型构建及应用
16
作者 霍梦佳 刘娟 黄杰 《农业图书情报学报》 2023年第7期94-104,共11页
[目的/意义]地理标志是中国地方政府开展品牌建设的重要抓手,政府在地理标志农产品品牌管理领域的政策注意力问题值得深入探究。论文旨在构建地理标志品牌分析模型,以支持分析品牌发展现状、探究政策注意力分布、提出优化策略。[方法/过... [目的/意义]地理标志是中国地方政府开展品牌建设的重要抓手,政府在地理标志农产品品牌管理领域的政策注意力问题值得深入探究。论文旨在构建地理标志品牌分析模型,以支持分析品牌发展现状、探究政策注意力分布、提出优化策略。[方法/过程]论文首先采集数据构建语料库,采用UIE通用信息抽取框架抽取文本,采用基于Transformer模型的品牌管理措施分类模型,开展管理措施分类,最终完成构建品牌分析模型,支持政策注意力分析,找到瓶颈问题,进行措施优化等应用。[结果/结论]论文以烟台苹果为例进行模型验证,对大量语料进行抽取、分类,发现烟台苹果政策注意力较集中、措施雷同性高,收集文本中的41.1%集中在品牌定位与规划部分,31.7%集中在品牌核心能力提升部分,涉及品牌营销及保护的不到10%,未利用好地理标志品牌的品牌效应。 展开更多
关键词 农产品地理标志 自然语言处理 政策注意力 信息抽取 文本分类
下载PDF
自然语言处理在招投标文件管理平台中的应用
17
作者 宋学武 张劲松 +3 位作者 唐世贵 廖松 陈昀 尹智 《科技创新与应用》 2023年第29期189-192,共4页
在一个招投标项目中,庞杂的文件若是疏于管理,就极有可能造成工期延误、成本增加等严重后果,因此文件管理对项目的顺利进行发挥至关重要的作用,尤其关键作用不容忽视。为此,很多企业试图建立独立的招投标文件管理平台,该文针对管理平台... 在一个招投标项目中,庞杂的文件若是疏于管理,就极有可能造成工期延误、成本增加等严重后果,因此文件管理对项目的顺利进行发挥至关重要的作用,尤其关键作用不容忽视。为此,很多企业试图建立独立的招投标文件管理平台,该文针对管理平台中的诸多问题,如文件不规范、文档中错误频出等,采用自然语言处理技术来进一步解决,分析技术对于招投标文件分析编制的可行性,并在此基础上对未来文件管理的趋势和规律进行展望。通过该文论述,可以得出自然语言处理技术在招投标文件管理平台中有着不可忽视的重要作用,有助于实现统一的文件管理,实现信息的高效共享,大大提高办公效率及整体项目的经济效益。 展开更多
关键词 自然语言处理 招投标 信息抽取 命名实体识别 文本聚类
下载PDF
一种基于特征权重的文本分类新算法
18
作者 胡晓辉 《科技创新与应用》 2023年第4期39-42,共4页
自然语言处理的一个重要分支,即自动文本分类,是文本信息处理的重要基础,是人工智能研究的一个热点,有助于文本的信息管理。已经有大量的专家学者对朴素贝叶斯、神经网络、支持向量机、k近邻等传统算法进行研究,但大量的专家学者实验证... 自然语言处理的一个重要分支,即自动文本分类,是文本信息处理的重要基础,是人工智能研究的一个热点,有助于文本的信息管理。已经有大量的专家学者对朴素贝叶斯、神经网络、支持向量机、k近邻等传统算法进行研究,但大量的专家学者实验证明KNN、SVM等经典的文本分类算法大都基于向量空间模型,因泛化能力不足,导致对于复杂的文本分类结果较差。该文提出一种新的特征权重计算方法,充分利用文本结构特征信息对特征权重进行计算,对于不同位置出现的词语赋予不同的权重,突出关键位置词语的重要性,同时考虑词分布密度对分类结果的影响,在分类模型中考虑词密度权重,优化TF-IDF算法。在2个语料库上的实验表明该文基于特征权重的分类算法较大地提高分类效果。 展开更多
关键词 文本分类 特征选择 自然语言处理 类别信息 向量空间模型
下载PDF
基于自然语言处理的情报文本抽取与分析技术研究
19
作者 李希朋 周云 《无线互联科技》 2023年第24期157-159,共3页
针对情报文本的抽取与分析问题,文章提出了一种基于自然语言处理(Natural Language Processing,NLP)的技术。首先,明确了情报文本中存在的信息丰富、多样性和复杂性问题以及传统手工分析方法的限制。其次,分析了如何利用NLP技术来有效... 针对情报文本的抽取与分析问题,文章提出了一种基于自然语言处理(Natural Language Processing,NLP)的技术。首先,明确了情报文本中存在的信息丰富、多样性和复杂性问题以及传统手工分析方法的限制。其次,分析了如何利用NLP技术来有效抽取和分析文本中的关键信息,包括情报来源、威胁分析、战略趋势等。最后,提出了解决方法,展示了其在实际情报分析中的潜在应用。 展开更多
关键词 自然语言处理 情报分析 文本抽取 信息分析
下载PDF
基于深度学习的藏文文本自动分类研究
20
作者 索南多杰 官却多杰 +1 位作者 拉玛杰 公保加羊 《青海科技》 2023年第3期192-196,共5页
在藏文信息处理中,文本分类技术可以将藏文文档自动分类为某种提前设定的类别,因此藏文文本分类在信息检索、新闻推荐等应用中具有重要的应用价值。传统的文本分类方法需要复杂的特征工程处理,分类效果不是非常理想。随着深度学习的快... 在藏文信息处理中,文本分类技术可以将藏文文档自动分类为某种提前设定的类别,因此藏文文本分类在信息检索、新闻推荐等应用中具有重要的应用价值。传统的文本分类方法需要复杂的特征工程处理,分类效果不是非常理想。随着深度学习的快速发展,基于深度学习的藏文文本分类方法成为主要研究趋势。文章提出基于双向LSTM的文本分类方法,在藏文文本分类数据集上进行实验,本文算法的精准率、召回率、F1分数分别提升2.56%、1.87%和1.75%。 展开更多
关键词 藏文信息处理 文本分类 深度学习 Bi-LSTM
下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部