期刊文献+
共找到156篇文章
< 1 2 8 >
每页显示 20 50 100
Unlocking the Potential:A Comprehensive Systematic Review of ChatGPT in Natural Language Processing Tasks
1
作者 Ebtesam Ahmad Alomari 《Computer Modeling in Engineering & Sciences》 SCIE EI 2024年第10期43-85,共43页
As Natural Language Processing(NLP)continues to advance,driven by the emergence of sophisticated large language models such as ChatGPT,there has been a notable growth in research activity.This rapid uptake reflects in... As Natural Language Processing(NLP)continues to advance,driven by the emergence of sophisticated large language models such as ChatGPT,there has been a notable growth in research activity.This rapid uptake reflects increasing interest in the field and induces critical inquiries into ChatGPT’s applicability in the NLP domain.This review paper systematically investigates the role of ChatGPT in diverse NLP tasks,including information extraction,Name Entity Recognition(NER),event extraction,relation extraction,Part of Speech(PoS)tagging,text classification,sentiment analysis,emotion recognition and text annotation.The novelty of this work lies in its comprehensive analysis of the existing literature,addressing a critical gap in understanding ChatGPT’s adaptability,limitations,and optimal application.In this paper,we employed a systematic stepwise approach following the Preferred Reporting Items for Systematic Reviews and Meta-Analyses(PRISMA)framework to direct our search process and seek relevant studies.Our review reveals ChatGPT’s significant potential in enhancing various NLP tasks.Its adaptability in information extraction tasks,sentiment analysis,and text classification showcases its ability to comprehend diverse contexts and extract meaningful details.Additionally,ChatGPT’s flexibility in annotation tasks reducesmanual efforts and accelerates the annotation process,making it a valuable asset in NLP development and research.Furthermore,GPT-4 and prompt engineering emerge as a complementary mechanism,empowering users to guide the model and enhance overall accuracy.Despite its promising potential,challenges persist.The performance of ChatGP Tneeds tobe testedusingmore extensivedatasets anddiversedata structures.Subsequently,its limitations in handling domain-specific language and the need for fine-tuning in specific applications highlight the importance of further investigations to address these issues. 展开更多
关键词 Generative AI large languagemodel(LLM) natural language processing(NLP) ChatGPT GPT(generative pretraining transformer) GPT-4 sentiment analysis NER information extraction ANNOTATION text classification
下载PDF
基于自然标注的跨平台虚拟账号关联方法研究
2
作者 季铎 敬少杰 +1 位作者 彭如香 孔华锋 《计算机应用与软件》 北大核心 2024年第9期190-194,共5页
随着大数据时代的到来,跨平台虚拟账号的关联成为网络监管领域亟待解决的问题。该文以微博、微信等用户文本数据为研究对象,通过对数据的抽样和人工标注,开展开放式社交平台中跨平台账号自然标注行为的量化分析,并由此提出基于用户自然... 随着大数据时代的到来,跨平台虚拟账号的关联成为网络监管领域亟待解决的问题。该文以微博、微信等用户文本数据为研究对象,通过对数据的抽样和人工标注,开展开放式社交平台中跨平台账号自然标注行为的量化分析,并由此提出基于用户自然标注的跨平台虚拟账号的关联方法。该方法针对自然标注特点,构建基于上下字词特征的虚拟账号识别的模型,并利用二分类的深度学习模型进行昵称和用户的同一认证,最终实现对跨平台虚拟账号的识别,识别准确率达到85%以上。 展开更多
关键词 虚拟账号 自然标注 账号关联
下载PDF
基于Transformer的司法文书命名实体识别方法
3
作者 王颖洁 张程烨 +1 位作者 白凤波 汪祖民 《计算机科学》 CSCD 北大核心 2024年第S01期113-121,共9页
命名实体识别是自然语言处理领域的关键任务之一,是实现下游任务的基础。目前针对司法领域的相关研究相对较少,司法系统的信息化和智能化转型仍有许多问题亟需解决。相比其他领域的文本,司法文书存在专业性强、语料资源少等局限,导致现... 命名实体识别是自然语言处理领域的关键任务之一,是实现下游任务的基础。目前针对司法领域的相关研究相对较少,司法系统的信息化和智能化转型仍有许多问题亟需解决。相比其他领域的文本,司法文书存在专业性强、语料资源少等局限,导致现有的司法文书识别结果较低。因此,从以下3方面开展研究:首先,提出了一种多标签层级迭代的文本标注方式,可以对原始司法文书文本进行自动化标注,同时有效地提升司法文书命名实体识别任务的实体识别效果;其次,提出了一种交融式的Transformer神经网络模型,对汉字固有属性的深层特征进行了充分利用,用于对司法文书进行命名实体识别;最后,对所提出的标注方法和模型与其他神经网络模型进行了对比实验。所提出的文本标注方式可以较为准确地实现司法文书的标注任务;同时,所提出的模型在通用数据集中相对于对照模型有较大的提高,并在司法领域数据集中取得了良好的效果。 展开更多
关键词 自然语言处理 数据标注 Transformer模型 深度学习 司法信息化
下载PDF
基于CRF的中文语法错误诊断系统的实现与应用
4
作者 李斌 王浩畅 《计算机科学》 CSCD 北大核心 2024年第S01期1129-1134,共6页
随着中国国际影响力的提高和汉语国际地位的提升,将中文作为第二语言学习的外国人数量逐年增加,中文已成为世界上最为流行的语言之一。基于此,中文语法错误诊断的研究备受关注。首先,从中文语法错误诊断的定义出发,总结目前的研究现状... 随着中国国际影响力的提高和汉语国际地位的提升,将中文作为第二语言学习的外国人数量逐年增加,中文已成为世界上最为流行的语言之一。基于此,中文语法错误诊断的研究备受关注。首先,从中文语法错误诊断的定义出发,总结目前的研究现状。其次,通过对各种中文语法错误诊断方法的分析,构建了基于条件随机场的中文语法错误诊断系统,探究中文语法自动检错系统及其具体应用流程,以帮助中文学习者提高学习效率。在CGED2016数据集上的实验结果表明,该系统在检测层和识别层上的性能较好,在位置层上还需要改进。 展开更多
关键词 中文语法错误诊断 序列标注 条件随机场 自然语言处理
下载PDF
汉代古音古读在高丽半岛韩语中的遗存举隅
5
作者 梁建芬 《中国文字研究》 2024年第1期232-236,共5页
在中国汉代语言知识类型标注过程中,集合了部分汉代语言音读标记。对照汉代古音在东亚地区高丽半岛韩语中的遗存,乃至日本列岛的传播记录,举出语料使用较为充分的音注现象,从而观察汉代古音保存乃至传播演变规则,由此可以实现对以往相... 在中国汉代语言知识类型标注过程中,集合了部分汉代语言音读标记。对照汉代古音在东亚地区高丽半岛韩语中的遗存,乃至日本列岛的传播记录,举出语料使用较为充分的音注现象,从而观察汉代古音保存乃至传播演变规则,由此可以实现对以往相关汉代语言语音史观察缺环的补充,并对若干相关文字音注现象作出合乎历史语言语音史发展实际的重新解释。 展开更多
关键词 汉代音读 语音标注 韩日遗存
下载PDF
民国《新繁县志》卷四《礼俗·方言》音注探赜
6
作者 马康雅 《乐山师范学院学报》 2024年第9期57-64,共8页
民国三十六年序刊本(1947)《新繁县志》卷四《礼俗·方言》是记录20世纪上半叶新繁地区方言的文献材料;其中,70例方言条目附音注,可划分为前代文献音注和纂志新拟音注两类。这些音注能够体现方志纂修者强调方言与通语语音差异、坚... 民国三十六年序刊本(1947)《新繁县志》卷四《礼俗·方言》是记录20世纪上半叶新繁地区方言的文献材料;其中,70例方言条目附音注,可划分为前代文献音注和纂志新拟音注两类。这些音注能够体现方志纂修者强调方言与通语语音差异、坚持贯古通今的语音史观、注重方言词语音义匹配的记音态度。深入分析方言音注构成,可以发现,当时当地的部分方音仍然保留着较古的读法,能够反映民国时期西南官话灌赤片岷江小片方言的部分声、韵、调特征。 展开更多
关键词 民国《新繁县志》 礼俗·方言 音注 记音态度 方言语音
下载PDF
敦煌唐写本《吴都赋》残卷校理
7
作者 刘明 《辽东学院学报(社会科学版)》 2024年第3期1-6,共6页
考察敦煌唐写本《吴都赋》残卷音注的来源,是拓展该帙写本研究的关键性问题。依据《艺文类聚》等现存《吴都赋》的4种音注本认为,《吴都赋》是属于有音注的文本。这些音注由李善、五臣等注家予以继承或因袭。通过审视《吴都赋》残卷里的... 考察敦煌唐写本《吴都赋》残卷音注的来源,是拓展该帙写本研究的关键性问题。依据《艺文类聚》等现存《吴都赋》的4种音注本认为,《吴都赋》是属于有音注的文本。这些音注由李善、五臣等注家予以继承或因袭。通过审视《吴都赋》残卷里的3处音注,有理由相信它们并不见得来自残卷的抄者或圈点者。这意味着音注研究是拓展和深化《文选》文献学研究的新路径,此件残卷的校理为此提供了典型个案。 展开更多
关键词 《吴都赋》 《艺文类聚》 音注
下载PDF
Image interpretation: mining the visible and syntactic correlation of annotated words
8
作者 Ding-yin XIA Fei WU +1 位作者 Wen-hao LIU Han-wang ZHANG 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2009年第12期1759-1768,共10页
Automatic web image annotation is a practical and effective way for both web image retrieval and image understanding. However, current annotation techniques make no further investigation of the statement-level syntact... Automatic web image annotation is a practical and effective way for both web image retrieval and image understanding. However, current annotation techniques make no further investigation of the statement-level syntactic correlation among the annotated words, therefore making it very difficult to render natural language interpretation for images such as "pandas eat bamboo". In this paper, we propose an approach to interpret image semantics through mining the visible and textual information hidden in images. This approach mainly consists of two parts: first the annotated words of target images are ranked according to two factors, namely the visual correlation and the pairwise co-occurrence; then the statement-level syntactic correlation among annotated words is explored and natural language interpretation for the target image is obtained. Experiments conducted on real-world web images show the effectiveness of the proposed approach. 展开更多
关键词 Web image annotation VISIBILITY Pairwise co-occurrence Natural language interpretation
原文传递
深度学习技术在井区自然状况调查中的应用
9
作者 黄冬 黎翔 +2 位作者 杨棚程 任晟宏 龙曦 《石化技术》 CAS 2024年第11期136-138,共3页
随着地理信息系统(GIS)在各领域应用的深入,自动化的地理信息处理技术变得尤为重要。提出了一种结合深度学习技术与GIS的新型自动化井区自然状况调查方法。利用U形网络模型(U-Net)和分割任意物体模型(SAM)等先进的深度学习模型,实现了... 随着地理信息系统(GIS)在各领域应用的深入,自动化的地理信息处理技术变得尤为重要。提出了一种结合深度学习技术与GIS的新型自动化井区自然状况调查方法。利用U形网络模型(U-Net)和分割任意物体模型(SAM)等先进的深度学习模型,实现了高分辨率正射影像中房屋、水系和道路等关键地理要素的高效识别和标注。实验结果显示,与传统手工标注方法相比,在识别准确率上达到95%~100%,大幅提升了标注效率并减少了时间成本。未来的研究方向包括提高模型在不同环境条件下的适应性,增强实时数据处理能力,以及改进用户交互体验。研究成果为GIS自动化处理技术在地理空间数据分析领域的应用提供了新思路,对推动相关技术的发展具有重要意义。 展开更多
关键词 地理信息系统 深度学习 自动化标注 井区自然状况调查 U 形网络模型
下载PDF
中文文本的地理空间关系标注 被引量:22
10
作者 张雪英 张春菊 朱少楠 《测绘学报》 EI CSCD 北大核心 2012年第3期468-474,共7页
为有效地解决当前相关标准和标准数据匮乏的问题,通过分析中文文本中地理空间关系描述的语言特点,提出中文文本的地理空间关系标注体系,并以GATE(General Architecture for Text Engineering)为标注工具,以《中国大百科全书中国地理》... 为有效地解决当前相关标准和标准数据匮乏的问题,通过分析中文文本中地理空间关系描述的语言特点,提出中文文本的地理空间关系标注体系,并以GATE(General Architecture for Text Engineering)为标注工具,以《中国大百科全书中国地理》为文本数据源,采用交叉校验方式建立了地理空间关系标注语料库。实现了中文文本中地理空间关系描述的结构化表达,提供了地理空间关系信息抽取的标准化测试数据。 展开更多
关键词 自然语言 中文文本 地理空间关系 标注体系 标注语料库
下载PDF
中文文本的地理命名实体标注 被引量:27
11
作者 张雪英 朱少楠 张春菊 《测绘学报》 EI CSCD 北大核心 2012年第1期115-120,共6页
地理信息的语义解析有效地解决自然语言与地理信息系统之间的语义障碍问题。在分析中文文本和地理信息系统中地理实体描述和表达机制差异的基础上,结合地理命名实体描述的语言特点,制定中文文本的地理命名实体标注体系和标注规范,并以GA... 地理信息的语义解析有效地解决自然语言与地理信息系统之间的语义障碍问题。在分析中文文本和地理信息系统中地理实体描述和表达机制差异的基础上,结合地理命名实体描述的语言特点,制定中文文本的地理命名实体标注体系和标注规范,并以GATE(General Architecture for Text Engineering)作为标注平台,构建基于《中国大百科全书中国地理》的大规模标注语料库,以解决当前相关标准和规模化标准数据匮乏的问题。 展开更多
关键词 中文文本 地理命名实体 标注体系 标注语料库 自然语言
下载PDF
《经典释文》中的“又音”与音义匹配 被引量:8
12
作者 岳利民 张翠翠 《语言科学》 CSSCI 北大核心 2016年第1期42-51,共10页
《经典释文》中的"又音"用例多,性质复杂。有些"又音"不为字头注音,被注字另有其字;有些"又音"为字头注音,但"首音"不为字头注音;有些"又音"是为异义异音字的字头注音;有些"又... 《经典释文》中的"又音"用例多,性质复杂。有些"又音"不为字头注音,被注字另有其字;有些"又音"为字头注音,但"首音"不为字头注音;有些"又音"是为异义异音字的字头注音;有些"又音"是为同义异音字的字头注音;有些"又音"是用来易字的无效音切。 展开更多
关键词 经典释文 又音 音义匹配
下载PDF
基于用户自然标注的微博文本的消费意图识别 被引量:8
13
作者 付博 陈毅恒 +1 位作者 邵艳秋 刘挺 《中文信息学报》 CSCD 北大核心 2017年第4期208-215,共8页
消费意图是指用户在文本中明确表达出的购买产品或服务等一些商业消费的意愿,如"想买一部手机"。该文针对微博上的消息文本,提出一种基于用户自然标注的微博消费意图识别方法。该方法将微博消费意图识别看作为领域自适应学习... 消费意图是指用户在文本中明确表达出的购买产品或服务等一些商业消费的意愿,如"想买一部手机"。该文针对微博上的消息文本,提出一种基于用户自然标注的微博消费意图识别方法。该方法将微博消费意图识别看作为领域自适应学习问题,通过自动获取的训练语料基于源域和目标域共同特征设计分类器,抽取置信度高的伪标注消费意图微博,再利用微博特征训练新的分类器对微博进行消费意图识别。实验结果表明该文所采用的方法是有效的,F值达到69%和77%,其中使用的各种特征对于提高消费意图识别的效果皆有帮助。 展开更多
关键词 消费意图 自然标注 社会媒体 领域自适应
下载PDF
常见医学单词释义与注音掌握情况的调查分析 被引量:9
14
作者 孔令泉 吴凯南 +3 位作者 罗国辉 潘永林 王立贵 黄征丽 《医学教育探索》 2003年第4期67-69,共3页
为了解学生对医学专业英语释义与注音掌握情况及存在问题,对我校98级七年制学生进行测试并对结果进行分析,以探索全面提高医学英语水平的有效方法。
关键词 医学专业英语 注音 释义
下载PDF
基于Android的智能中文输入法 被引量:5
15
作者 刘峰 王晔晗 +2 位作者 汤步洲 王晓龙 王轩 《计算机工程》 CAS CSCD 北大核心 2011年第7期225-227,共3页
介绍语句级汉字拼音输入技术的基本原理,讨论在移动设备上面临的问题和解决方案,并实现基于Android操作系统的语句级汉字拼音输入法。将该输入法应用于多普达A3288手机,运行状态良好,汉字输入流畅,音字转换准确率为86.92%。随着用户对... 介绍语句级汉字拼音输入技术的基本原理,讨论在移动设备上面临的问题和解决方案,并实现基于Android操作系统的语句级汉字拼音输入法。将该输入法应用于多普达A3288手机,运行状态良好,汉字输入流畅,音字转换准确率为86.92%。随着用户对输入法和输入习惯的适应,准确率还会有一定的提高。 展开更多
关键词 输入法 ANDROID操作系统 音字转换 自然语言处理
下载PDF
基于中文电子病历的心血管疾病风险因素标注体系及语料库构建 被引量:14
16
作者 苏嘉 何彬 +5 位作者 吴昊 杨锦锋 关毅 姜京池 王焕政 于秋滨 《自动化学报》 EI CSCD 北大核心 2019年第2期420-426,共7页
本文讨论了从中文电子病历中标注心血管疾病风险因素及其相关信息的问题,提出了适应中文电子病历内容特点的心血管疾病风险因素标注体系,构建了中文健康信息处理领域首份关于心血管疾病风险因素的标注语料库.
关键词 心血管疾病 中文电子病历 风险因素 语料标注 自然语言处理
下载PDF
基于自然标注信息和隐含主题模型的无监督文本特征抽取 被引量:4
17
作者 饶高琦 于东 荀恩东 《中文信息学报》 CSCD 北大核心 2015年第6期141-149,共9页
术语和惯用短语可以体现文本特征。无监督的抽取特征词语对诸多自然语言处理工作起到支持作用。该文提出了"聚类-验证"过程,使用主题模型对文本中的字符进行聚类,并采用自然标注信息对提取出的字符串进行验证和过滤,从而实现... 术语和惯用短语可以体现文本特征。无监督的抽取特征词语对诸多自然语言处理工作起到支持作用。该文提出了"聚类-验证"过程,使用主题模型对文本中的字符进行聚类,并采用自然标注信息对提取出的字符串进行验证和过滤,从而实现了从未分词领域语料中无监督获得词语表的方法。通过优化和过滤,我们可以进一步获得了富含有术语信息和特征短语的高置信度特征词表。在对计算机科学等六类不同领域语料的实验中,该方法抽取的特征词表具有较好的文体区分度和领域区分度。 展开更多
关键词 自然标注信息 自然语块 隐含主题模型 领域特征 文体特征
下载PDF
《经典释文》音切类目研究的基本结论 被引量:6
18
作者 万献初 《语言研究》 CSSCI 北大核心 2003年第4期72-77,共6页
从性质上看,《释文》是一部因音辨义的训诂书;《释文》音切叠合了多层面的书面文献语言读书音;《释文》音切对汉语词汇发展史、构词法和上古汉语形态构成的研究有更为突出的价值。使用《释文》音切要正确区分真值注音音切和假性注音音... 从性质上看,《释文》是一部因音辨义的训诂书;《释文》音切叠合了多层面的书面文献语言读书音;《释文》音切对汉语词汇发展史、构词法和上古汉语形态构成的研究有更为突出的价值。使用《释文》音切要正确区分真值注音音切和假性注音音切、要正确认识“首音”和“又音”、要正确理解“如字”的作用。 展开更多
关键词 经典释文 音切研究 性质 价值
下载PDF
基于自然标注的网页信息抽取研究 被引量:4
19
作者 李志义 沈之锐 《情报学报》 CSSCI 北大核心 2013年第8期853-859,共7页
随着Web网页数量的爆炸式增长和网页噪声不断增多,网上获取重要信息变得越来越困难。本文从一个新的角度,提出了一种基于自然标注的网页信息抽取方法。依据这种方法,首先对网页进行聚类,提取具有相似结构的网页并进行相同的标注,... 随着Web网页数量的爆炸式增长和网页噪声不断增多,网上获取重要信息变得越来越困难。本文从一个新的角度,提出了一种基于自然标注的网页信息抽取方法。依据这种方法,首先对网页进行聚类,提取具有相似结构的网页并进行相同的标注,然后采用SVM对抽取项进行训练,最后提取到需要抽取的数据。文章的主要贡献在于对网页中的自然标注进行分析和发现,给出了九大类自然标注的例子,并结合聚类和支持向量机,给出了训练方法。从实验结果上看,本方法优于其他方法。 展开更多
关键词 自然标注 信息抽取 聚类 支持向量机 语义
下载PDF
网页语义标注研究综述 被引量:6
20
作者 郭少友 窦畅 常桢 《情报杂志》 CSSCI 北大核心 2015年第4期169-175,共7页
网页语义标注是指利用本体对蕴含在网页中的知识进行描述以便计算机和人均能理解。首先对网页语义标注的涵义、要求和形式进行分析,然后分别讨论静态网页和动态网页的语义标注方法,并对现有的标注工具进行总结,最后提出有待进一步研究... 网页语义标注是指利用本体对蕴含在网页中的知识进行描述以便计算机和人均能理解。首先对网页语义标注的涵义、要求和形式进行分析,然后分别讨论静态网页和动态网页的语义标注方法,并对现有的标注工具进行总结,最后提出有待进一步研究的几个问题。 展开更多
关键词 网页 语义标注 本体 自然语言处理
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部