期刊文献+
共找到346篇文章
< 1 2 18 >
每页显示 20 50 100
基于Sentence-Rank的图像句子标注
1
作者 徐守坤 徐坚 +2 位作者 李宁 周佳 刘楚秋 《计算机工程与应用》 CSCD 北大核心 2019年第2期121-127,共7页
传统的图像语义句子标注是利用句子模板完成对图像内容描述,但其标注句子很难做到符合语言逻辑。针对这一问题,提出基于统计思想从语料库中选出一条最优的句子来描述图像内容,设计以N-gram算法为主要思想的Sentence-Rank算法生成标注句... 传统的图像语义句子标注是利用句子模板完成对图像内容描述,但其标注句子很难做到符合语言逻辑。针对这一问题,提出基于统计思想从语料库中选出一条最优的句子来描述图像内容,设计以N-gram算法为主要思想的Sentence-Rank算法生成标注句子。首先执行机器视觉特征学习,选择标注性能最好的HSV-LBP-HOG融合特征完成图像分类,获得图像标注关键词。然后,利用字符串匹配算法从语料库中列出包含所有标注关键词的句子,并将得到的句子通过Sentence-Rank算法进行价值排序,选取评分最高的句子描述图像。实验结果表明,该方法得到的标注句子具有较低的困惑度,较好地解决了句子的语言逻辑问题。 展开更多
关键词 机器学习 自然语言处理 特征融合 sentence-Rank N-GRAM
下载PDF
On Stylistic Features of News English from Reports on H1N1
2
作者 朱赛伟 《海外英语》 2011年第7X期385-387,393,共4页
As H1N1 influenza rages across the world from the very beginning of mid 2009,lots of news reports focus on it.This essay mainly studies the stylistics features of News English by reading news reports on H1N1.The study... As H1N1 influenza rages across the world from the very beginning of mid 2009,lots of news reports focus on it.This essay mainly studies the stylistics features of News English by reading news reports on H1N1.The study tries to find lexical features,sentence features and grammatical features of News English.Through the study we find that News English has its own stylistics features in words,sentences and grammar. 展开更多
关键词 NEWS ENGLISH LEXICAL features sentence features GRAMMATICAL features STYLISTICS
下载PDF
基于Sentence-LDA主题模型的短文本分类 被引量:4
3
作者 张浩 钟敏 《计算机与现代化》 2019年第3期102-106,共5页
短文本特征稀疏、上下文依赖性强的特点,导致传统长文本分类技术不能有效地被直接应用。为了解决短文本特征稀疏的问题,提出基于Sentence-LDA主题模型进行特征扩展的短文本分类方法。该主题模型是隐含狄利克雷分布模型(Latent Dirichlet... 短文本特征稀疏、上下文依赖性强的特点,导致传统长文本分类技术不能有效地被直接应用。为了解决短文本特征稀疏的问题,提出基于Sentence-LDA主题模型进行特征扩展的短文本分类方法。该主题模型是隐含狄利克雷分布模型(Latent Dirichlet Allocation, LDA)的扩展,假设一个句子只产生一个主题分布。利用训练好的Sentence-LDA主题模型预测原始短文本的主题分布,从而将得到的主题词扩展到原始短文本特征中,完成短文本特征扩展。对扩展后的短文本使用支持向量机(Support Vector Machine, SVM)进行最后的分类。实验显示,与传统的基于向量空间模型(Vector Space Model,VSM)直接表示短文本的方法比较,本文提出的方法可以有效地提高短文本分类的准确率。 展开更多
关键词 短文本分类 sentence-LDA 主题模型 特征扩展 SVM
下载PDF
Assessment of Sentiment Analysis Using Information Gain Based Feature Selection Approach
4
作者 R.Madhumathi A.Meena Kowshalya R.Shruthi 《Computer Systems Science & Engineering》 SCIE EI 2022年第11期849-860,共12页
Sentiment analysis is the process of determining the intention or emotion behind an article.The subjective information from the context is analyzed by the sentimental analysis of the people’s opinion.The data that is... Sentiment analysis is the process of determining the intention or emotion behind an article.The subjective information from the context is analyzed by the sentimental analysis of the people’s opinion.The data that is analyzed quantifies the reactions or sentiments and reveals the information’s contextual polarity.In social behavior,sentiment can be thought of as a latent variable.Measuring and comprehending this behavior could help us to better understand the social issues.Because sentiments are domain specific,sentimental analysis in a specific context is critical in any real-world scenario.Textual sentiment analysis is done in sentence,document level and feature levels.This work introduces a new Information Gain based Feature Selection(IGbFS)algorithm for selecting highly correlated features eliminating irrelevant and redundant ones.Extensive textual sentiment analysis on sentence,document and feature levels are performed by exploiting the proposed Information Gain based Feature Selection algorithm.The analysis is done based on the datasets from Cornell and Kaggle repositories.When compared to existing baseline classifiers,the suggested Information Gain based classifier resulted in an increased accuracy of 96%for document,97.4%for sentence and 98.5%for feature levels respectively.Also,the proposed method is tested with IMDB,Yelp 2013 and Yelp 2014 datasets.Experimental results for these high dimensional datasets give increased accuracy of 95%,96%and 98%for the proposed Information Gain based classifier for document,sentence and feature levels respectively compared to existing baseline classifiers. 展开更多
关键词 Sentiment analysis sentence level document level feature level information gain
下载PDF
从句后置型假设句的语法特征与语用动因
5
作者 张雪平 《中州大学学报》 2024年第1期100-105,共6页
现代汉语从句后置型假设句是一种主要用于言域的语用性特殊假设句式。因使用非常规语序而语义关系不明,便强制要求使用假设标记,同时排斥推论标记,形成“……,如果……的话”这样的典型结构形式。其语体分布和假设标记显示了其书面化倾... 现代汉语从句后置型假设句是一种主要用于言域的语用性特殊假设句式。因使用非常规语序而语义关系不明,便强制要求使用假设标记,同时排斥推论标记,形成“……,如果……的话”这样的典型结构形式。其语体分布和假设标记显示了其书面化倾向,具有追补说明作用的从句可为主句所言提供适宜性条件。这种特殊语序假设句能在汉语中使用开来,外受西文翻译的影响,内则因凸显强调主句内容及与前后文保持语义连贯的语用需要。语用表达需求是假设句语序变异的主要原因。 展开更多
关键词 从句后置型假设句 语用性 语法特征 语用动因
下载PDF
基于语段理论的存现句的核心结构与生成
6
作者 唐玉柱 《广东技术师范大学学报》 2024年第2期96-104,共9页
基于在Chomsky近期所提出的“语段理论”尝试探讨自然语言中的存现句的生成机制。论证存现句的核心结构是一个以表“存在”义的功能语类轻动词Ex的投射。该轻动词Ex缺少外论元,因而不是语段。研究还发现,Ex的边缘特征EF在不同语言中呈... 基于在Chomsky近期所提出的“语段理论”尝试探讨自然语言中的存现句的生成机制。论证存现句的核心结构是一个以表“存在”义的功能语类轻动词Ex的投射。该轻动词Ex缺少外论元,因而不是语段。研究还发现,Ex的边缘特征EF在不同语言中呈现参数化差异,可以以此解释英汉存现结构之间的差异。 展开更多
关键词 最简方案 存现句 语段 EF特征 核心结构投射
下载PDF
基于特征融合的汉语被动句自动识别研究
7
作者 胡康 曲维光 +3 位作者 魏庭新 周俊生 李斌 顾彦慧 《中文信息学报》 CSCD 北大核心 2024年第8期15-24,共10页
汉语中的被动句根据有无被动标记词可分为有标记被动句和无标记被动句。由于其形态构成复杂多样,给自然语言理解带来很大困难,因此实现汉语被动句的自动识别对自然语言处理下游任务具有重要意义。该文构建了一个被动句语料库,提出了一... 汉语中的被动句根据有无被动标记词可分为有标记被动句和无标记被动句。由于其形态构成复杂多样,给自然语言理解带来很大困难,因此实现汉语被动句的自动识别对自然语言处理下游任务具有重要意义。该文构建了一个被动句语料库,提出了一个融合词性和动词论元框架信息的PC-BERT-CNN模型,对汉语被动句进行自动识别。实验结果表明,该文提出的模型能够准确地识别汉语被动句,其中有标记被动句识别F1值达到98.77%,无标记被动句识别F1值达到96.72%。 展开更多
关键词 汉语被动句 自动识别 特征融合 语料库
下载PDF
融合局部特征的多知识库常识问答模型
8
作者 田雨晴 汪春梅 袁非牛 《计算机工程与应用》 CSCD 北大核心 2024年第12期129-135,共7页
当前的多知识库融合常识推理模型的输入和特征组合的方式过于简单,导致模型丢失了一些与问题和答案相关的重要信息,限制了融合外部知识的常识推理模型的效果。另外,在进行常识问答的任务时,预训练语言模型输出的问题和答案表示存在的向... 当前的多知识库融合常识推理模型的输入和特征组合的方式过于简单,导致模型丢失了一些与问题和答案相关的重要信息,限制了融合外部知识的常识推理模型的效果。另外,在进行常识问答的任务时,预训练语言模型输出的问题和答案表示存在的向量各向异性问题没有得到解决。这些问题都是导致常识问答推理性能不够高的因素。针对以上问题,提出了一种基于局部特征融合的多知识库常识问答模型,改进外部知识库和问答文本的融合方式。模型将局部的问题和答案特征融入预训练语言模型全局特征,以丰富模型的特征信息,并在预测层结合了多种维度的特征进行预测;模型对于待匹配的问题和答案句子表示进行了白化处理,然后执行匹配任务。通过白化操作,模型增强了句子表示的各向同性,提升了句子向量的表征能力;还探索了不同预训练编码器(如:ALBERT、ELECTRA)在模型上的效果,以加强对知识文本的特征抽取能力,并证明了模型的稳定性。实验结果证明,在相同BERT-base编码器的实验下,模型的准确率达到78.6%,相较于基线模型,准确率提升了3.5个百分点;在ELECTRA-base编码器的实验下,模型的准确率达到80.1%。 展开更多
关键词 常识问答 知识库融合 局部特征融合预测 向量白化
下载PDF
融合反讽语言特征的反讽语句识别模型
9
作者 韦斯羽 朱广丽 +1 位作者 谈光璞 张顺香 《智能系统学报》 CSCD 北大核心 2024年第3期689-696,共8页
反讽是采用内隐的形式来表达情感的一种方法,反讽语句在文字和所想表达的情感上存在着不同,这使得对反讽语句进行情感分类变得更加困难。针对这一现象,提出一种融合反讽语言特征的反讽语句识别模型,通过加入反讽语言特征来提高反讽语句... 反讽是采用内隐的形式来表达情感的一种方法,反讽语句在文字和所想表达的情感上存在着不同,这使得对反讽语句进行情感分类变得更加困难。针对这一现象,提出一种融合反讽语言特征的反讽语句识别模型,通过加入反讽语言特征来提高反讽语句的识别准确率。首先,采用卡方检验算法对反讽语言进行分析并获取语言特征;然后,利用Word2Vec对语言特征进行训练获取语言特征的特征表示,同时使用注意力机制与Bi-GRU(双向门控循环神经单元)模型获取句子的特征表示;最后,将语言特征的特征表示与句子的特征表示进行融合并作为情感分类层的输入,对反讽语句进行识别。与CNN-AT、CNN-Adv、EPSN等3种模型进行对比,实验结果表明,该模型可以有效提高对于反讽语句的识别准确率。 展开更多
关键词 反讽语句识别 语言特征 卡方检验算法 Word2Vec 双向门控循环神经单元 注意力机制 深度学习 智能信息处理
下载PDF
English Text Named Entity Recognition Method by Fusing Local and Global Features
10
作者 Liuxin Gao 《IJLAI Transactions on Science and Engineering》 2024年第3期72-80,共9页
Because of the ambiguity and dynamic nature of natural language,the research of named entity recognition is very challenging.As an international language,English plays an important role in the fields of science and te... Because of the ambiguity and dynamic nature of natural language,the research of named entity recognition is very challenging.As an international language,English plays an important role in the fields of science and technology,finance and business.Therefore,the early named entity recognition technology is mainly based on English,which is often used to identify the names of people,places and organizations in the text.International conferences in the field of natural language processing,such as CoNLL,MUC,and ACE,have identified named entity recognition as a specific evaluation task,and the relevant research uses evaluation corpus from English-language media organizations such as the Wall Street Journal,the New York Times,and Wikipedia.The research of named entity recognition on relevant data has achieved good results.Aiming at the sparse distribution of entities in text,a model combining local and global features is proposed.The model takes a single English character as input,and uses the local feature layer composed of local attention and convolution to process the text pieceby way of sliding window to construct the corresponding local features.In addition,the self-attention mechanism is used to generate the global features of the text to improve the recognition effect of the model on long sentences.Experiments on three data sets,Resume,MSRA and Weibo,show that the proposed method can effectively improve the model’s recognition of English named entities. 展开更多
关键词 English named entity recognition Local feature Global feature Self-attention mechanism Long sentence
原文传递
基于句法结构特征的汉越神经机器翻译
11
作者 裴非非 杨舰 《信息技术》 2024年第2期15-21,共7页
在低资源神经机器翻译中,长句译文质量普遍不佳,而汉-越语言差异较大,是典型的资源匮乏型语种,对于长句的处理应尽可能保持句子语义信息不变。因此,提出一种基于句法结构特征处理长句的方法。首先,对原有语料库中长句进行句法树解析,然... 在低资源神经机器翻译中,长句译文质量普遍不佳,而汉-越语言差异较大,是典型的资源匮乏型语种,对于长句的处理应尽可能保持句子语义信息不变。因此,提出一种基于句法结构特征处理长句的方法。首先,对原有语料库中长句进行句法树解析,然后,根据句法解析树提取短句和对远离根节点的叶子节点词进行标记,最后,对提取的短句进行反向翻译生成伪平行数据作为扩充,对原有长句中标记词进行与该词语义相近词的加权组合替换训练。实验表明,该方法提高了模型性能,显著改善了长句译文质量。 展开更多
关键词 低资源神经机器翻译 长句译文 汉-越语言 语义信息 句法结构特征
下载PDF
廉州方言程度副词研究
12
作者 马芬 《文化创新比较研究》 2024年第7期32-37,共6页
北海市廉州方言相关书志中对廉州方言程度副词进行过粗略描写,但是仍存在描写错误、归类错误等问题。该文结合田野调查、文献调查的方法,在收集语料的基础上整理出31个廉州方言程度副词,划分出与普通话异形异义、异形同义、同形同义三大... 北海市廉州方言相关书志中对廉州方言程度副词进行过粗略描写,但是仍存在描写错误、归类错误等问题。该文结合田野调查、文献调查的方法,在收集语料的基础上整理出31个廉州方言程度副词,划分出与普通话异形异义、异形同义、同形同义三大类,并对异形异义的廉州方言特色程度副词的语义、语法特征、特殊句式等进行描写和分析,以揭示廉州方言程度副词的基本面貌和语言特色。虽然大部分廉州方言程度副词在语法特征和用法上与普通话大体相同,但也存在自己的特色:一是程度副词“有啲”“沤蛮”可以重叠词缀变成“有啲啲”“沤蛮蛮”表示程度减轻;二是大部分廉州方言程度副词后面可以附加虚化的词缀“鬼”,加深程度量。 展开更多
关键词 粤语 廉州方言 程度副词 语义 语法特征 特殊句式
下载PDF
基于规则的连用关系标记的自动标识研究 被引量:15
13
作者 胡金柱 陈江曼 +2 位作者 杨进才 舒江波 雷利利 《计算机科学》 CSCD 北大核心 2012年第7期190-194,共5页
复句中的关系词对研究复句中各分句的语义关系有着重要意义,但在基于规则的关系词自动识别的研究中发现,并非复句中出现的关系标记都是关系词,从中识别出真正的关系词是研究的重点和难点。提出对一种典型的关系标记——位置相邻的关系... 复句中的关系词对研究复句中各分句的语义关系有着重要意义,但在基于规则的关系词自动识别的研究中发现,并非复句中出现的关系标记都是关系词,从中识别出真正的关系词是研究的重点和难点。提出对一种典型的关系标记——位置相邻的关系标记进行自动标记的算法,该算法结合关系词库和关系词提取技术,分析其连用特征。实验表明,该算法对连用关系标记的标识准确率达到72.9%。 展开更多
关键词 有标复句 连用特征 自动标识 规则
下载PDF
一种基于情感句模的文本情感分类方法 被引量:10
14
作者 陈涛 徐睿峰 +1 位作者 吴明芬 刘滨 《中文信息学报》 CSCD 北大核心 2013年第5期67-74,共8页
考虑到同类型的情感句往往具有相同或者相似的句法和语义表达模式,该文提出了一种基于情感句模的文本情感自动分类方法。首先,将情感表达相关句模人工分为3大类105个二级分类;然后,设计了一种利用依存特征、句法特征和同义词特征的句模... 考虑到同类型的情感句往往具有相同或者相似的句法和语义表达模式,该文提出了一种基于情感句模的文本情感自动分类方法。首先,将情感表达相关句模人工分为3大类105个二级分类;然后,设计了一种利用依存特征、句法特征和同义词特征的句模获取方法,从标注情感句中半自动地获取情感句模。最后,通过对输入句进行情感句模分类实现文本情感分类。在NLP&CC2013中文微博情绪分类评测语料及RenCECps博客语料的实验结果显示,该文提出的分类方法准确率显著高于基于词特征支持向量机分类器。 展开更多
关键词 情感句模 情感分类 句法特征 依存特征
下载PDF
完句条件与指称特征的允准 被引量:58
15
作者 胡建华 石定栩 《语言科学》 2005年第5期42-49,共8页
本文对孔令达(1994)、黄南松(1994)、竟成(1996)以及Tang&Lee(2000)关于完句的观点做了进一步抽象,把他们的信息说、时间说以及时态/焦点说抽象为指称特征允准说。本文认为,英、汉语在完句上的句法要求是一致的,即句子要投射成IP/CP... 本文对孔令达(1994)、黄南松(1994)、竟成(1996)以及Tang&Lee(2000)关于完句的观点做了进一步抽象,把他们的信息说、时间说以及时态/焦点说抽象为指称特征允准说。本文认为,英、汉语在完句上的句法要求是一致的,即句子要投射成IP/CP,名词性成分要投射成DP,从而变成在概念—意向界面可以解读的成分。它们之间的差别仅仅在于满足这一句法要求的途径不同。 展开更多
关键词 完句 指称特征 算子 自由变量
下载PDF
权衡熵和相关度的自动摘要技术研究 被引量:9
16
作者 罗文娟 马慧芳 +1 位作者 何清 史忠植 《中文信息学报》 CSCD 北大核心 2011年第5期9-16,共8页
生成高质量的文档摘要需要用简约而不丢失信息的描述文档,是自动摘要技术的一大难题。该文认为高质量的文档摘要必须尽量多的覆盖原始文档中的信息,同时尽可能的保持紧凑。从这一角度出发,从文档中抽取出熵和相关度这两组特征用以权衡... 生成高质量的文档摘要需要用简约而不丢失信息的描述文档,是自动摘要技术的一大难题。该文认为高质量的文档摘要必须尽量多的覆盖原始文档中的信息,同时尽可能的保持紧凑。从这一角度出发,从文档中抽取出熵和相关度这两组特征用以权衡摘要的信息覆盖率和紧凑性。该文采用基于回归的有监督摘要技术对提取的特征进行权衡,并且采用单文档摘要和多文档摘要进行了系统的实验。实验结果证明对于单文档摘要和多文档摘要,权衡熵和相关度均能有效地提高文档摘要的质量。 展开更多
关键词 自动摘要 句子特征抽取 相关度
下载PDF
句子阅读理解过程中句意的建构时间 被引量:3
17
作者 钟伟芳 莫雷 +1 位作者 金花 徐贵平 《心理学报》 CSSCI CSCD 北大核心 2012年第6期735-744,共10页
一般语言学理论认为,在句子阅读理解过程中,句子意义建构是基于词汇语义整合的,其反映在N400之上,开始于词语呈现后约250ms。然而,近年关于语义P600效应的研究却提示句意建构可能存在多通道或方式,读者甚至可能在N400反映的加工... 一般语言学理论认为,在句子阅读理解过程中,句子意义建构是基于词汇语义整合的,其反映在N400之上,开始于词语呈现后约250ms。然而,近年关于语义P600效应的研究却提示句意建构可能存在多通道或方式,读者甚至可能在N400反映的加工出现之前就已建立了初步句意。为探明在句子阅读理解过程中是否存在比N400反映的加工更早的句意建构,以及如果存在这样的句意建构,其是从何时开始的,本研究开展了四个实验。实验1发现被试在句末双字词呈现200ms后已将其联系到上文语义表征而建立了句意,提示句意建构开始于N400反映的加工出现之前。实验2与3进一步发现,读者开始建立句意的时间约在句末词呈现了150ms之时。实验4排除了实验1-3效应的其他一些可能解释,提升了实验l~3结果的可靠性。总体上,本研究提示:在句子阅读理解过程中,读者在句末双字词呈现了约150ms之时就已建立了句意;可能存在比N400反映的加工更早的句意建构。 展开更多
关键词 句子理解 意义建构 时间特征 N400
下载PDF
基于主题词权重和句子特征的自动文摘 被引量:17
18
作者 蒋昌金 彭宏 +1 位作者 陈建超 马千里 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2010年第7期50-55,共6页
为获得高质量的自动文摘,在组合词识别算法的基础上,充分考虑词的频率、词性、词的位置、词长等因素,构建了一个词语权重计算公式,该公式能使表达主题的词和短语具有较高的权重.对句子权重的计算,则考虑了句子的内容、位置以及线索词的... 为获得高质量的自动文摘,在组合词识别算法的基础上,充分考虑词的频率、词性、词的位置、词长等因素,构建了一个词语权重计算公式,该公式能使表达主题的词和短语具有较高的权重.对句子权重的计算,则考虑了句子的内容、位置以及线索词的作用和用户偏好等.摘要的生成充分考虑了候选文摘句的相似性,避免了冗余信息的加入.对摘要的评估进行了从句子粒度到词语粒度的改进,提出了一种基于词语粒度的准确率和召回率计算方法.实验证明,该算法生成的自动文摘有着较高的质量,平均准确率达到77.1%. 展开更多
关键词 主题词 自动文摘 组合词 权重计算 句子特征
下载PDF
基于多特征融合的句子语义相似度计算 被引量:18
19
作者 赵臻 吴宁 宋盼盼 《计算机工程》 CAS CSCD 2012年第1期171-173,共3页
传统的句子相似度计算方法只关注句子的某个特征,导致召回率和准确率的不均衡。针对该问题,提出一种基于多特征的句子相似度计算方法(MFS)。该方法加入包含词性和位置信息的词权重,并综合考虑词的语义和句子结构。实验结果表明,与其他... 传统的句子相似度计算方法只关注句子的某个特征,导致召回率和准确率的不均衡。针对该问题,提出一种基于多特征的句子相似度计算方法(MFS)。该方法加入包含词性和位置信息的词权重,并综合考虑词的语义和句子结构。实验结果表明,与其他方法相比,MFS方法的F1值较高。在基于实例的问答系统中,使用MFS方法得到的MRR值也较高。 展开更多
关键词 句子相似度 多特征 词权重 知网 问答系统
下载PDF
基于隐马尔可夫模型的主观句识别 被引量:10
20
作者 刘培玉 荀静 +1 位作者 费绍栋 朱振方 《中文信息学报》 CSCD 北大核心 2016年第4期206-212,共7页
文本情感倾向分析是意见挖掘和情感文摘中的一个重要环节,而在情感倾向分析中涉及到的是主观性文本,这就需要进行主客观文本分类。当前的主客观文本分类方法主要是基于特征词典的概率统计方法,并没有考虑特征之间的语法与语义关系。针... 文本情感倾向分析是意见挖掘和情感文摘中的一个重要环节,而在情感倾向分析中涉及到的是主观性文本,这就需要进行主客观文本分类。当前的主客观文本分类方法主要是基于特征词典的概率统计方法,并没有考虑特征之间的语法与语义关系。针对该问题,该文提出一种基于隐马尔可夫模型(HMM)的主观句识别方法。该方法首先从训练语料中抽取具有明显分类效果的七类主客观特征,然后每个句子应用HMM进行特征角色类别标注,并依据标注的结果计算句子的权重,最终识别主观句。该方法在第六届中文倾向性分析评测任务中能够有效地识别主观句。 展开更多
关键词 隐马尔可夫模型 特征标注 主观句识别
下载PDF
上一页 1 2 18 下一页 到第
使用帮助 返回顶部