期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
Word Embeddings and Semantic Spaces in Natural Language Processing
1
作者 Peter J. Worth 《International Journal of Intelligence Science》 2023年第1期1-21,共21页
One of the critical hurdles, and breakthroughs, in the field of Natural Language Processing (NLP) in the last two decades has been the development of techniques for text representation that solves the so-called curse ... One of the critical hurdles, and breakthroughs, in the field of Natural Language Processing (NLP) in the last two decades has been the development of techniques for text representation that solves the so-called curse of dimensionality, a problem which plagues NLP in general given that the feature set for learning starts as a function of the size of the language in question, upwards of hundreds of thousands of terms typically. As such, much of the research and development in NLP in the last two decades has been in finding and optimizing solutions to this problem, to feature selection in NLP effectively. This paper looks at the development of these various techniques, leveraging a variety of statistical methods which rest on linguistic theories that were advanced in the middle of the last century, namely the distributional hypothesis which suggests that words that are found in similar contexts generally have similar meanings. In this survey paper we look at the development of some of the most popular of these techniques from a mathematical as well as data structure perspective, from Latent Semantic Analysis to Vector Space Models to their more modern variants which are typically referred to as word embeddings. In this review of algoriths such as Word2Vec, GloVe, ELMo and BERT, we explore the idea of semantic spaces more generally beyond applicability to NLP. 展开更多
关键词 Natural language Processing Vector Space models semantic Spaces word Embeddings Representation Learning Text Vectorization Machine Learning Deep Learning
下载PDF
Intelligent Agent Based Mapping of Software Requirement Specification to Design Model
2
作者 Emdad Khan Mohammed Alawairdhi 《Journal of Software Engineering and Applications》 2013年第12期630-637,共8页
Automatically mapping a requirement specification to design model in Software Engineering is an open complex problem. Existing methods use a complex manual process that use the knowledge from the requirement specifica... Automatically mapping a requirement specification to design model in Software Engineering is an open complex problem. Existing methods use a complex manual process that use the knowledge from the requirement specification/modeling and the design, and try to find a good match between them. The key task done by designers is to convert a natural language based requirement specification (or corresponding UML based representation) into a predominantly computer language based design model—thus the process is very complex as there is a very large gap between our natural language and computer language. Moreover, this is not just a simple language conversion, but rather a complex knowledge conversion that can lead to meaningful design implementation. In this paper, we describe an automated method to map Requirement Model to Design Model and thus automate/partially automate the Structured Design (SD) process. We believe, this is the first logical step in mapping a more complex requirement specification to design model. We call it IRTDM (Intelligent Agent based requirement model to design model mapping). The main theme of IRTDM is to use some AI (Artificial Intelligence) based algorithms, semantic representation using Ontology or Predicate Logic, design structures using some well known design framework and Machine Learning algorithms for learning over time. Semantics help convert natural language based requirement specification (and associated UML representation) into high level design model followed by mapping to design structures. AI method can also be used to convert high level design structures into lower level design which then can be refined further by some manual and/or semi automated process. We emphasize that automation is one of the key ways to minimize the software cost, and is very important for all, especially, for the “Design for the Bottom 90% People” or BOP (Base of the Pyramid People). 展开更多
关键词 Software Engineering Artificial Intelligence Ontology INTELLIGENT Agent Requirements SPECIFICATION Requirements modelING Design modelING semantics Natural language Understanding Machine Learning Universal modelING language (UML) ICT (Information and Communication Technology and BOP (Base of the PYRAMID People)
下载PDF
基于对抗训练的事件要素识别方法
3
作者 廖涛 沈文龙 +1 位作者 张顺香 马文祥 《计算机工程与设计》 北大核心 2024年第2期540-545,共6页
针对目前大多数事件要素识别模型未考虑词级别的语义信息,及模型鲁棒性不高的问题,提出一种融合词信息和对抗训练的事件要素识别方法。将Bert(bidirectional encode representations from transformers)预训练语言模型生成的字向量与分... 针对目前大多数事件要素识别模型未考虑词级别的语义信息,及模型鲁棒性不高的问题,提出一种融合词信息和对抗训练的事件要素识别方法。将Bert(bidirectional encode representations from transformers)预训练语言模型生成的字向量与分词信息进行融合,在得到的融合向量中添加扰动因子产生对抗样本,将对抗样本与融合向量表示作为编码层的输入;采用BiGRU(bidirectional gating recurrent unit)网络对输入的文本进行编码,丰富文本的上下文语义信息;采用CRF(conditional random field)函数计算完成事件要素的识别任务。在CEC(Chinese emergency corpus)中文突发事件语料库上的实验结果表明,该方法能够取得较好的效果。 展开更多
关键词 事件要素识别 鲁棒性 词信息 对抗训练 预训练语言模型 扰动因子 上下文语义信息
下载PDF
基于List-Based转移的英语语义分析翻译系统研究 被引量:1
4
作者 王娟娟 《电子设计工程》 2020年第16期35-38,共4页
针对智能语义分析方法中的非投射弧问题,在List-Based转移算法的基础上,文中结合抽象语义关系图,提出了一种语义分析翻译系统。利用对比大量词语对的方法,List-Based转移算法可以获取这些词语的语义关系,且同时还具有较小的时间复杂度,... 针对智能语义分析方法中的非投射弧问题,在List-Based转移算法的基础上,文中结合抽象语义关系图,提出了一种语义分析翻译系统。利用对比大量词语对的方法,List-Based转移算法可以获取这些词语的语义关系,且同时还具有较小的时间复杂度,再结合改进的JAMR对齐器和Oracle分析器,最终提出了基于List-Baesd转移的语义分析翻译系统。该翻译系统可以准确识别出英语等语言的词语顺序变化,从而避免出现智能语义分析方法的非投射弧问题。相关的仿真结果表明,与常用的智能语义分析方法相比,基于List-Based转移算法的语义分析翻译系统具有更加优秀的分析和翻译准确度。 展开更多
关键词 语义分析 JAMR对齐器 List-based转移算法 语义匹配 语言模型 Oracle分析
下载PDF
基于Word2vec的语义查询扩展方法 被引量:1
5
作者 章露露 吕晓伟 《软件导刊》 2018年第9期48-51,共4页
查询扩展是信息检索领域重要研究内容。为了解决信息检索过程中用户提交查询时描述不准确以及查询词不匹配的问题,提出一种基于Word2vec的语义查询扩展方法。使用分布式神经语言概率模型Word2vec训练低维词向量,选取扩展词候选集,利用... 查询扩展是信息检索领域重要研究内容。为了解决信息检索过程中用户提交查询时描述不准确以及查询词不匹配的问题,提出一种基于Word2vec的语义查询扩展方法。使用分布式神经语言概率模型Word2vec训练低维词向量,选取扩展词候选集,利用面向扩展词的查询向量生成方法过滤候选集,使选取的扩展词能更有效地体现整个查询的语义及语法相关性。实验结果表明基于Word2vec的语义查询扩展方法使查全率及查准率均有提高,因此该方法能很好地应用于查询扩展领域。 展开更多
关键词 查询扩展 分布式神经语言概率模型 word2vec 面向扩展词 语义相关性
下载PDF
Research on Metamodels Consistency Verification Based on Formalization of Domain-Specific Metamodeling Language 被引量:1
6
作者 江涛 王新 《Journal of Shanghai Jiaotong university(Science)》 EI 2012年第2期171-177,共7页
Domain-specific metamodeling language(DSMML) defined by informal method cannot strictly represent its structural semantics,so its properties such as consistency cannot be holistically and systematically verified.In re... Domain-specific metamodeling language(DSMML) defined by informal method cannot strictly represent its structural semantics,so its properties such as consistency cannot be holistically and systematically verified.In response,the paper proposes a formal representation of the structural semantics of DSMML named extensible markup language(XML) based metamodeling language(XMML) and its metamodels consistency verification method.Firstly,we describe our approach of formalization,based on this,the method of consistency verification of XMML and its metamodels based on first-order logical inference is presented;then,the formalization automatic mapping engine for metamodels is designed to show the feasibility of our formal method. 展开更多
关键词 domain-specific metamodeling language(DSMML) extensible markup language(XML) based metamodeling language(XMML) structural semantics meta-type consistency verification
原文传递
Semantic Model for Voice Controlled Telephone Dialing and Inquiry Systems
7
作者 张建平 王作英 《Tsinghua Science and Technology》 EI CAS 2000年第2期217-221,共5页
A new scheme is presented to detect a large number ofKeywordsin voice controlled switchboard tasks. The new scheme is based on two stages. In the first stage, N best syllable candidates with their corresponding acous... A new scheme is presented to detect a large number ofKeywordsin voice controlled switchboard tasks. The new scheme is based on two stages. In the first stage, N best syllable candidates with their corresponding acoustic scores are generated by an acoustic recognizer. In the second stage, a semantic model based parser is applied to determine the optimum keywords by searching through the lattice of N best candidates. The experimental results show that when the spoken input deviates from the predefined syntactic constraints, the parser can also demonstrate high performance. For comparison purposes, the most common way to incorporate the syntactic knowledge of the task directly into the acoustic recognizer in the form of a finite state network is also investigated. Furthermore, to address the sparse data problems, out of domain data in the form of newspaper text are used to obtain a more robust combined semantic model. The experiments show that the combined semantic model can improve the keywords detection rate from 90.07% to 92.91% when 80 ungrammatical sentences which do not conform to the task grammar are used as testing material. 展开更多
关键词 Key words semantic model language model keywords spotting context free grammar N best candidates PERPLEXITY
原文传递
基于语义理解的智能搜索引擎研究 被引量:13
8
作者 陈林 杨丹 赵俊芹 《计算机科学》 CSCD 北大核心 2008年第6期152-154,共3页
本文提出了一种基于自然语言理解的搜索引擎模型。它的核心技术是基于自然语言理解的相关技术,包括从关键词、提问方式、提问重点三个层次对用户查询进行语义分析、特征向量提取及基于该思想建立了面向Web网页内容的特征库,提出返回文... 本文提出了一种基于自然语言理解的搜索引擎模型。它的核心技术是基于自然语言理解的相关技术,包括从关键词、提问方式、提问重点三个层次对用户查询进行语义分析、特征向量提取及基于该思想建立了面向Web网页内容的特征库,提出返回文档排序的算法,基于Lucene全文索引工具包建立了搜索引擎,对库中已收入的特征词进行了查询测试,查准率为86.7%。实验表明,该模型基本实现了对查询短语的理解,对提高搜索引擎的查准率有显著的效果。 展开更多
关键词 自然语言处理 分词 语义分析 向量空间模型
下载PDF
汉语语气词用法的自动识别研究 被引量:5
9
作者 周溢辉 穆玲玲 +1 位作者 昝红英 袁应成 《计算机工程》 CAS CSCD 北大核心 2010年第23期155-157,161,共4页
研究现代汉语语气词用法的自动识别问题,从语气词的实际用法入手,构建语气词用法词典和语气词用法规则库,利用语气场构建语气词用法规则库。采用1998年1月的《人民日报》分词与词性标注语料,利用语气词用法规则库进行语气词的自动识别... 研究现代汉语语气词用法的自动识别问题,从语气词的实际用法入手,构建语气词用法词典和语气词用法规则库,利用语气场构建语气词用法规则库。采用1998年1月的《人民日报》分词与词性标注语料,利用语气词用法规则库进行语气词的自动识别。实验结果证明,语气词的识别准确率为78.433%。 展开更多
关键词 自然语言处理 虚词知识库 语气词用法识别 语义场
下载PDF
跨语言查询扩展优化 被引量:9
10
作者 魏露 李书琴 +1 位作者 李伟男 李新乐 《计算机工程与设计》 CSCD 北大核心 2014年第8期2785-2788,2803,共5页
为提高跨语言查询扩展检索精度,在原有跨语言查询扩展基础上,引入降低噪声和孤立点的k-medoid聚类算法,提出避免语义信息丢失或过拟合的择优模型。构建若干个不同维度值的d维模型,结合奇异值分解和非负矩阵分解法计算文本之间的相似度,... 为提高跨语言查询扩展检索精度,在原有跨语言查询扩展基础上,引入降低噪声和孤立点的k-medoid聚类算法,提出避免语义信息丢失或过拟合的择优模型。构建若干个不同维度值的d维模型,结合奇异值分解和非负矩阵分解法计算文本之间的相似度,选取相似度最大的模型建立双语空间,经过跨语言扩展与权值调整,实现查询扩展优化。实验对比结果表明,该方案有效提高了检索精度,为跨语言查询提供了可参考的模型与算法。 展开更多
关键词 潜在语义 跨语言 查询扩展 k-中心点聚类 非负矩阵分解 择优模型
下载PDF
基于全局与局部特征的视频索引模型 被引量:7
11
作者 詹国华 庄越挺 吴翌 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2000年第12期911-916,共6页
视频是在网络上需求日益增多的多媒体信息 ,由于视频量的巨大以及结构的线形性 ,因而越来越多的引起研究者的重视 .其相应的检索方式与针对文本信息采用的关键字检索有很大不同 .文中将视频的特征分成局部和全局两种 ,并系统阐述了如何... 视频是在网络上需求日益增多的多媒体信息 ,由于视频量的巨大以及结构的线形性 ,因而越来越多的引起研究者的重视 .其相应的检索方式与针对文本信息采用的关键字检索有很大不同 .文中将视频的特征分成局部和全局两种 ,并系统阐述了如何提取视频局部和全局特征 。 展开更多
关键词 全局特征 局部特征 信息检索 视频索引模型
下载PDF
神经网络语言模型在统计机器翻译中的应用 被引量:11
12
作者 张家俊 宗成庆 《情报工程》 2017年第3期21-28,共8页
近两年来,神经机器翻译(Neural Machine Translation,NMT)模型主导了机器翻译的研究,但是统计机器翻译(Statistical Machine Translation,SMT)在很多应用场合(尤其是专业领域)仍有较强的竞争力。如何利用深度学习技术提升现有统计机器... 近两年来,神经机器翻译(Neural Machine Translation,NMT)模型主导了机器翻译的研究,但是统计机器翻译(Statistical Machine Translation,SMT)在很多应用场合(尤其是专业领域)仍有较强的竞争力。如何利用深度学习技术提升现有统计机器翻译的水平成为研究者们关注的主要问题。由于语言模型是统计机器翻译中最核心的模块之一,本文主要从语言模型的角度入手,探索神经网络语言模型在统计机器翻译中的应用。本文分别探讨了基于词和基于短语的神经网络语言模型,在汉语到英语和汉语到日语的翻译实验表明神经网络语言模型能够显著改善统计机器翻译的译文质量。 展开更多
关键词 统计机器翻译 神经网络语言模型 基于词的语言模型 基于短语的语言模型
下载PDF
融合字词语义信息的猕猴桃种植领域命名实体识别研究 被引量:5
13
作者 李书琴 张明美 刘斌 《农业机械学报》 EI CAS CSCD 北大核心 2022年第12期323-331,共9页
针对猕猴桃种植领域命名实体识别任务中实体词复杂度较高,识别精确率较低的问题,提出一种融合字词语义信息的猕猴桃种植实体识别方法。以BiGRU-CRF为基本模型,融合词级别和字符级别的信息。在词级别上,通过引入词集信息,并使用多头自注... 针对猕猴桃种植领域命名实体识别任务中实体词复杂度较高,识别精确率较低的问题,提出一种融合字词语义信息的猕猴桃种植实体识别方法。以BiGRU-CRF为基本模型,融合词级别和字符级别的信息。在词级别上,通过引入词集信息,并使用多头自注意力(Multiple self-attention mechanisms,MHA)调整词集中不同词的权重;同时使用注意力机制忽略不可靠的词集,将注意力集中在重要的词集上,从而提高实体识别效果;在字符级别上,引入无监督的基于转换器的双向编码表征(Bidirectional encoder representations form transformers,BERT)预训练模型增强字的语义表示。在包含12477条标注样本和7个类别实体的猕猴桃种植领域自制语料上进行了实验,结果表明,本文模型与SoftLexicon模型相比,F1值提高1.58个百分点。此外,本文模型在公开数据集ResumeNER上与Lattice-LSTM、WC-LSTM等模型进行实验对比取得了最佳效果,F1值达到96.17%,表明本文模型具有一定的泛化能力。 展开更多
关键词 猕猴桃种植 命名实体识别 字词融合 语义增强 自注意力机制 预训练语言模型
下载PDF
从汉字教学看对外汉语教学中的本位问题 被引量:15
14
作者 施正宇 《民族教育研究》 CSSCI 北大核心 2010年第6期104-110,共7页
本文以汉字教学为出发点,通过对汉语教学本位问题的缘起、发展及其影响的历史回顾与理性思考,探讨对外汉语教学领域中词本位教学法和字本位教学法的实质。在此基础上,笔者认为汉语作为第二语言教学应当遵循汉字、语素和词汇并重的基本原... 本文以汉字教学为出发点,通过对汉语教学本位问题的缘起、发展及其影响的历史回顾与理性思考,探讨对外汉语教学领域中词本位教学法和字本位教学法的实质。在此基础上,笔者认为汉语作为第二语言教学应当遵循汉字、语素和词汇并重的基本原则,建立有别于西方第二语言教学的对外汉语教学模式。 展开更多
关键词 本位 词本位 语素本位 汉字本位 汉语教学模式
下载PDF
基于多特征语义匹配的知识库问答系统 被引量:3
15
作者 赵小虎 赵成龙 《计算机应用》 CSCD 北大核心 2020年第7期1873-1878,共6页
知识库问答(KBQA)任务主要目的在于精确地将自然语言问题和知识库(KB)中的三元组进行匹配。传统的KBQA方法通常专注于实体识别和谓语匹配,实体识别的错误会导致错误传播从而无法得到正确的答案。针对上述问题提出一种端到端的解决方案... 知识库问答(KBQA)任务主要目的在于精确地将自然语言问题和知识库(KB)中的三元组进行匹配。传统的KBQA方法通常专注于实体识别和谓语匹配,实体识别的错误会导致错误传播从而无法得到正确的答案。针对上述问题提出一种端到端的解决方案直接匹配问题和三元组,该系统主要包含候选三元组生成和候选三元组排序两个部分来实现精确问答。首先通过BM25算法计算问题和知识库中三元组的相关性生成候选三元组;然后通过多特征语义匹配模型(MFSMM)进行三元组的排序,即用MFSMM分别通过双向长短时记忆网络(Bi-LSTM)和卷积神经网络(CNN)实现语义相似度和字符相似度的计算,并通过融合来对三元组进行排序。该系统在NLPCC-ICCPOL 2016KBQA数据集上的平均F1为80.35%,接近了现有最好的表现。 展开更多
关键词 知识库 自然语言问题 三元组 多特征语义匹配模型 语义相似度 字符相似度
下载PDF
一种基于词对齐的中文深层语义解析模型
16
作者 郑晓东 胡汉辉 +1 位作者 赵林度 吕永涛 《计算机工程与应用》 CSCD 北大核心 2017年第20期8-13,共6页
语义解析是指将自然语言句子转化成便于机器理解和推理的意义形式。近年来英文语义解析的研究取得了很大进展。然而,中文语义解析的相关工作则相对较少。中文和英文之间存在一定的差异,适用于英文的语义解析方法不一定适合中文。因此,... 语义解析是指将自然语言句子转化成便于机器理解和推理的意义形式。近年来英文语义解析的研究取得了很大进展。然而,中文语义解析的相关工作则相对较少。中文和英文之间存在一定的差异,适用于英文的语义解析方法不一定适合中文。因此,针对中文的语言特点,提出一种基于词对齐的中文语义解析方法,将中文句子转化成其相应的意义表示看作是一个机器翻译的过程。首先将英文语义解析方法中常用的训练数据集GEOQUERY转化成中文数据集,数据集中每条训练数据包括一个中文句子及其正确的意义表示。然后利用词对齐模型来获取由中文自然语言字符串及其相应的意义表示所组成的双语词典。最后通过学习一个概率估计模型来确定最终的语义解析模型。实验结果表明,WACSP有较高的精确度和覆盖率。 展开更多
关键词 自然语言处理 语义解析 词对齐模型
下载PDF
基于语义网的知识服务系统研究与应用 被引量:2
17
作者 陈红叶 《安徽农业科学》 CAS 北大核心 2010年第30期17222-17224,共3页
传统的农业知识服务是基于关键字而不是基于内容的,查全率和查准率都有待提高,运用基于语义网的知识表达,可以真正实现语义级的知识服务。分析了农业知识服务系统的现状并指出其不足,阐述了语义网技术和本体构建方法;构建基于语义网的... 传统的农业知识服务是基于关键字而不是基于内容的,查全率和查准率都有待提高,运用基于语义网的知识表达,可以真正实现语义级的知识服务。分析了农业知识服务系统的现状并指出其不足,阐述了语义网技术和本体构建方法;构建基于语义网的农业知识服务系统模型并给出了它的框架结构和功能设计;并设计了适合种植、生产与销售实际的茶叶本体,部分实现了茶叶领域的农业知识服务系统。 展开更多
关键词 农业知识服务 语义网 本体 JAVA MYSQL
下载PDF
基于空间索引的分布式空间数据Web服务发现 被引量:1
18
作者 陈荦 景宁 《地理与地理信息科学》 CSSCI CSCD 北大核心 2005年第3期14-18,共5页
SOA体系结构是目前构建Web数据集成系统的理想结构,服务发现是其中一个重要的研究问题。传统的服务发现方法基于关键字匹配技术实现,缺乏对具有空间约束的空间Web服务的支持,使服务执行的整个过程受到影响。该文基于空间数据服务的尺度... SOA体系结构是目前构建Web数据集成系统的理想结构,服务发现是其中一个重要的研究问题。传统的服务发现方法基于关键字匹配技术实现,缺乏对具有空间约束的空间Web服务的支持,使服务执行的整个过程受到影响。该文基于空间数据服务的尺度和范围约束,提出一种计算空间Web服务相关性的模型,并实现两种基于空间索引结构的服务发现算法。实验结果表明,该方法能明显提高服务发现的查准率。 展开更多
关键词 服务发现 空间数据 分布式 WEB服务 数据集成系统 空间索引结构 理想结构 体系结构 技术实现 发现方法 空间约束 数据服务 发现算法 SOA 关键字 相关性 查准率
下载PDF
基于递归神经网络的恶意程序检测研究 被引量:3
19
作者 王乐乐 汪斌强 +2 位作者 刘建港 张建辉 苗启广 《计算机科学》 CSCD 北大核心 2019年第7期86-90,共5页
针对传统恶意程序检测判定效率低及自动分析恶意程序能力不足的问题,在深度学习环境下,研究利用递归神经网络进行恶意程序的检测分类的问题。首先,用快速模拟器(Quick Emulator,QEMU)捕获到恶意程序运行时所调用的API及其参数序列,经过... 针对传统恶意程序检测判定效率低及自动分析恶意程序能力不足的问题,在深度学习环境下,研究利用递归神经网络进行恶意程序的检测分类的问题。首先,用快速模拟器(Quick Emulator,QEMU)捕获到恶意程序运行时所调用的API及其参数序列,经过行为抽象,形成恶意程序的特征序列。然后使用对数化的双线性模型(Hierarchical Log-bilinear Language Model,HLBL)将特征序列映射成固定长度的词向量,并将这些词向量合成递归神经网络(Recursive Neural Network,RNN)所需要的输入矩阵。通过对递归神经网络模型的训练,建立恶意程序的多层语义聚合模型,完成对恶意程序的分类检测。实验数据表明,递归神经网络模型在恶意程序检测分类中能够有效地检测出恶意程序,与传统机器学习算法相比,其检测率提高了17%。特别是在引入张量(Tensor)的概念,采用递归张量神经网络(Recursive Neural Tensor Network,RNTN)模型后,通过降低整体的参数数量和计算量,使检测率较RNN模型又提高了7%。实验数据充分说明,采用递归神经网络模型完全可以完成大数据环境下恶意程序的检测分类任务。 展开更多
关键词 QEMU HLBL 词向量 递归神经网络 多层语义聚合模型
下载PDF
基于词的分布式实值表示的汉语基本块识别 被引量:4
20
作者 侯潇琪 王瑞波 李济洪 《中北大学学报(自然科学版)》 CAS 北大核心 2013年第5期582-585,共4页
基于神经语言模型生成汉语词语的实值向量表示,称为词语的分布式表示,相应地以这种分布式表示构造的词特征称为分布式词特征.将这种分布式词特征替换基本块识别任务中所常用的条件随机场模型中的词特征,在清华大学TCT语料上进行了汉语... 基于神经语言模型生成汉语词语的实值向量表示,称为词语的分布式表示,相应地以这种分布式表示构造的词特征称为分布式词特征.将这种分布式词特征替换基本块识别任务中所常用的条件随机场模型中的词特征,在清华大学TCT语料上进行了汉语基本块识别任务实验,结果表明:在仅使用词窗口[-2,2]的词特征的模型中,和使用词窗口[-2,2]+词性特征的模型中,采用分布式词特征比传统的词特征的模型的标记精度分别高38.01%,1.86%,说明词语的分布式表示对汉语基本块识别任务是有作用的. 展开更多
关键词 神经语言模型 分布式词特征 基本块分析 边界识别
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部