期刊文献+
共找到68篇文章
< 1 2 4 >
每页显示 20 50 100
黎平侗语比较结构研究
1
作者 张成 石璐 《兴义民族师范学院学报》 2024年第2期1-12,共12页
黎平侗语的比较结构比较丰富,主要有差比结构、等比结构和极比结构三类。语义上有四种关系,即“优胜”义、“不如”义、“等同”义和“最高”义。结构上,比较结构逐渐进入到句子中,置于比较主体和比较基准之间。语序上有四种,其中前面... 黎平侗语的比较结构比较丰富,主要有差比结构、等比结构和极比结构三类。语义上有四种关系,即“优胜”义、“不如”义、“等同”义和“最高”义。结构上,比较结构逐渐进入到句子中,置于比较主体和比较基准之间。语序上有四种,其中前面两种为固有的语序,后者为借用的语序。黎平侗语的比较标记有两个类型,即固有的比较标记和借用的比较标记。固有的比较结构均由实义动词语法化而来,分别为“有”和“过”。语法化路径为:实义动词>辅助动词>比较标记。借用的比较结构是借用汉语西南官话的结构形式,通过拷贝形式体现出来。通过跨语言比较,壮侗语族比较结构的语序具有类型学上的共性,比较标记的来源具有一致性。 展开更多
关键词 黎平侗语 比较结构 语义特征 语序类型 比较标记 语法化路径
下载PDF
Helps Towards Correct English Word-Order
2
作者 Li Zecheng(Department of Foreign Languages, Kunming Institute of Technology, Kunming 650093) 《昆明理工大学学报(自然科学版)》 CAS 1994年第S1期15-21,共7页
HelpsTowardsCorrectEnglishWord-OrderLiZecheng(DepartmentofForeignLanguages,KunmingInstituteofTechnology,Kunm... HelpsTowardsCorrectEnglishWord-OrderLiZecheng(DepartmentofForeignLanguages,KunmingInstituteofTechnology,Kunming650093)HelpsTo... 展开更多
关键词 word-order inversion end-position mid-position initial exceptionChinese BOOKS and reference materials classification numher H314.3
下载PDF
“一顿V”语序带来的句法语义语用特征
3
作者 储泽祥 《汉语学报》 北大核心 2023年第4期96-106,共11页
现代汉语里“V一顿”比“一顿V”常见。本文在系统梳理已有研究成果的基础上,探讨“一顿V”的句法语义语用特征。本文的观察结果主要包括以下四个方面:(一)典型的“一顿V”具有过程性特征,V是持续性及物动词,表示损耗、伤害性动作,要求... 现代汉语里“V一顿”比“一顿V”常见。本文在系统梳理已有研究成果的基础上,探讨“一顿V”的句法语义语用特征。本文的观察结果主要包括以下四个方面:(一)典型的“一顿V”具有过程性特征,V是持续性及物动词,表示损耗、伤害性动作,要求受事必须出现;(二)“一顿V”可以充当遭受义动词、给予义动词的宾语,表现出一定的体词性,有一定的指称作用;(三)“一顿V”可以受介宾短语“对/把/被+N”修饰,但不受能愿助动词修饰,不带“了”,具有动作和结果的一体性特征;(四)“一顿V”虽然结构比较紧密,但可以插入副词“好”来表示程度,并带有感叹意味,且“好”倾向放在单音V前边,当双音V包含程度义时,“好”只能放在“一顿”前边。 展开更多
关键词 “一顿V” 语序 句法特征 语义特征 语用特征
下载PDF
土家语的正反问句及其类型学意义 被引量:1
4
作者 田洋 《语言科学》 北大核心 2023年第4期436-448,共13页
土家语正反问句的基本语序类型为“VP-conj-V-Neg”和“VP-Vcw-conj-VP-Vcwneg”。它与汉藏语系其他语言不同,否定成分位于句末是其语序的显著特征,这与土家语自身语法规则有关:否定副词和助动词均置于动词形容词之后。由否定动词构成... 土家语正反问句的基本语序类型为“VP-conj-V-Neg”和“VP-Vcw-conj-VP-Vcwneg”。它与汉藏语系其他语言不同,否定成分位于句末是其语序的显著特征,这与土家语自身语法规则有关:否定副词和助动词均置于动词形容词之后。由否定动词构成的重叠式正反问句格式为AAB式,它源自于由否定动词构成的“VP-conj-Vneg”式正反问句的成分省略。“VP-thai35”格式的正反问句是随着土家族与汉族密切接触,土家语受汉语深度影响后而产生的,是土家人复制当地汉语方言“V没有”正反问句格式的结果,它的产生不仅扩大了土家语“thai35没有”的使用范畴,也代表了土家语正反问句发展的趋势,即采用相对简洁的问句形式表达询问。 展开更多
关键词 土家语 正反问句 语序 类型学
下载PDF
基于注意力机制的手语语序转换方法
5
作者 张哲岩 王青山 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2023年第1期42-46,59,共6页
文章考虑听障人士与健全人士在语法和语言结构上的差异,设计一种基于注意力机制的手语语序转换器,实现手语语序到书面表达的转换。语序转换器在编码阶段使用双向长短期记忆网络(long short-term memory,LSTM)提取手语语序特征,解码阶段... 文章考虑听障人士与健全人士在语法和语言结构上的差异,设计一种基于注意力机制的手语语序转换器,实现手语语序到书面表达的转换。语序转换器在编码阶段使用双向长短期记忆网络(long short-term memory,LSTM)提取手语语序特征,解码阶段使用一维卷积提取编码器隐藏状态的特征,并利用注意力机制避免了长距离的依赖问题,从而得到书面表达。实验结果表明,语序转换器准确率最高为92.64%。 展开更多
关键词 注意力机制 语序转换 编解码模型 特征提取
下载PDF
基于最大熵模型的词位标注汉语分词 被引量:8
6
作者 于江德 王希杰 樊孝忠 《郑州大学学报(理学版)》 CAS 北大核心 2011年第1期70-74,共5页
近年来基于字的词位标注汉语分词方法极大地提高了分词的性能,该方法将汉语分词转化为字的词位标注问题,借助于优秀的序列标注模型,词位标注汉语分词逐渐成为汉语分词的主要技术路线.该方法中特征模板集设定和词位标注集的选择至关重要... 近年来基于字的词位标注汉语分词方法极大地提高了分词的性能,该方法将汉语分词转化为字的词位标注问题,借助于优秀的序列标注模型,词位标注汉语分词逐渐成为汉语分词的主要技术路线.该方法中特征模板集设定和词位标注集的选择至关重要,采用不同的词位标注集,使用最大熵模型进一步研究了词位标注汉语分词技术.在国际汉语分词评测Bakeoff2005的语料上进行了封闭测试,并对比了不同词位标注集对分词性能的影响.实验表明所采用的六词位标注集配合相应的特征模板集TMPT-6较其他词位标注集分词性能要好. 展开更多
关键词 汉语分词 词位标注 最大熵模型 词位标注集 特征模板
下载PDF
基于链式条件随机场的中文分词改进方法 被引量:10
7
作者 徐浩煜 任智慧 +1 位作者 施俊 周晗 《计算机应用与软件》 CSCD 2016年第12期211-213,233,共4页
基于链式条件随机场模型的序列标注中文分词方法随着中文分词评测Bakeoff的展开得到广泛应用。词位标注集和特征模板集对该模型的学习至关重要,但当前的研究大多采用单一的标注集和特征模板集进行实验,缺乏标注集和特征模板集结合的尝试... 基于链式条件随机场模型的序列标注中文分词方法随着中文分词评测Bakeoff的展开得到广泛应用。词位标注集和特征模板集对该模型的学习至关重要,但当前的研究大多采用单一的标注集和特征模板集进行实验,缺乏标注集和特征模板集结合的尝试,使得中文分词中未登录词识别率不高,从而影响互联网领域语料的分词效果。首次采用六词位标注集结合TMPT-10和TMPT-10`特征模板,并与常见标注集和特征模板集的组合在Bakeoff语料上进行实验对比,结果表明,改进的方法 6tag-tmpt10取得更好的未登录词召回率,在互联网领域中文分词能取得很好的效果;同时在F值上也与其他最好结果相当。 展开更多
关键词 中文分词 词位标注 条件随机场 特征模板
下载PDF
基于影评数据的在线评论有用性影响因素研究 被引量:237
8
作者 郝媛媛 叶强 李一军 《管理科学学报》 CSSCI 北大核心 2010年第8期78-88,96,共12页
面对互联网上海量的在线客户评论,如何能快速有效地进行识别和选择从而发现和利用其中有用的评论,已经成为人们关注的重要问题.以体验型商品电影的在线评论为研究对象,结合文本挖掘技术和实证研究方法,从文本特征出发探索影响在线评论... 面对互联网上海量的在线客户评论,如何能快速有效地进行识别和选择从而发现和利用其中有用的评论,已经成为人们关注的重要问题.以体验型商品电影的在线评论为研究对象,结合文本挖掘技术和实证研究方法,从文本特征出发探索影响在线评论有用性的因素,建立在线评论有用性影响因素模型,并利用该模型对评论有用性进行分类预测.与现有相关研究相比,提出的模型总体拟合效果显著提高,并发现在线影评中积极的情感倾向、较高的正负情感混杂度、较高的主客观表达混杂度以及较长的平均各句长度,对评论的有用性具有显著的正面影响.最后预测结果表明,该模型对在线影评的有用性具有较强的判别能力. 展开更多
关键词 口碑 在线评论 有用性 文本特征 正负情感 主客观表达形式 文本挖掘
下载PDF
基于条件随机域模型的比较要素抽取研究 被引量:4
9
作者 王巍 赵铁军 +1 位作者 辛国栋 徐永东 《自动化学报》 EI CSCD 北大核心 2015年第8期1385-1393,共9页
随着主观性评价文本数量的不断增长,文本情感分析已经成为众多研究者关注的对象.比较要素抽取是比较句情感分析的重要研究任务之一,比较句的情感分析结果与比较要素相结合才更有意义.为了提高比较要素抽取的性能,本文提出在构建系统模... 随着主观性评价文本数量的不断增长,文本情感分析已经成为众多研究者关注的对象.比较要素抽取是比较句情感分析的重要研究任务之一,比较句的情感分析结果与比较要素相结合才更有意义.为了提高比较要素抽取的性能,本文提出在构建系统模型的过程中引入浅层句法信息、比较词候选信息和启发式位置信息等多种语言学相关特征,并且在不增加领域知识的情况下,有效提高系统的准确率和F1值,同时本文提出的方法可以有效处理含有多个比较关系的句子.实验结果表明,将本文提出的特征应用于条件随机域(Conditional random fields,CRFs)模型可以有效提高比较要素抽取的各项性能指标,同时,将本文的实验结果与2012年中文情感分析评测结果的最大值进行了比较,各项指标均超过最大值,进一步证明了本文方法的有效性. 展开更多
关键词 情感分析 比较要素抽取 浅层句法特征 比较词候选特征 启发式位置特征
下载PDF
词位标注汉语分词中特征模板定量研究 被引量:4
10
作者 于江德 王希杰 樊孝忠 《计算机工程与设计》 CSCD 北大核心 2012年第3期1239-1244,共6页
基于字的词位标注的方法能极大地提高汉语分词的性能,该方法将汉语分词转化为字的词位标注问题,词位标注汉语分词中特征模板的设定至关重要,为了更加准确地设定特征模板,从多个角度进行了定量分析,并在国际汉语分词评测Bakeoff2005的PKU... 基于字的词位标注的方法能极大地提高汉语分词的性能,该方法将汉语分词转化为字的词位标注问题,词位标注汉语分词中特征模板的设定至关重要,为了更加准确地设定特征模板,从多个角度进行了定量分析,并在国际汉语分词评测Bakeoff2005的PKU和MSRA两种语料上进行了封闭测试,得到如下结论:同等条件下,训练出的模型大小与扩展出的特征数成正比;不同的单字特征模板在同一语料中扩展出的特征数基本相同,单字特征模板对分词性能的贡献要比双字特征模板小得多;增加B特征模板之后,训练时间大大增加,模型大小基本不变,对分词性能都是正增长。 展开更多
关键词 汉语分词 词位标注 特征模板 定量分析 条件随机场
下载PDF
局部位置特征与全局轮廓特征相结合的图像分类方法 被引量:4
11
作者 李雅倩 吴超 +1 位作者 李海滨 刘彬 《电子学报》 EI CAS CSCD 北大核心 2018年第7期1726-1731,共6页
在空间金字塔词袋模型的基础上,针对其空间信息利用不足的问题,本文先计算图像中每一个字典向量的相对位置分布来提取出局部位置特征.然后,用非下采样轮廓波变换和线性判别分析来生成图像的全局轮廓特征.最后,通过局部位置特征与全局轮... 在空间金字塔词袋模型的基础上,针对其空间信息利用不足的问题,本文先计算图像中每一个字典向量的相对位置分布来提取出局部位置特征.然后,用非下采样轮廓波变换和线性判别分析来生成图像的全局轮廓特征.最后,通过局部位置特征与全局轮廓特征相结合的方式提高空间信息利用率,从而提高场景和物体图像分类正确率.为了检验方法的可行性,本文分别在数据库Caltech 101、MSRC和15 Scene上进行实验.实验结果证明,本文提出的方法进一步利用了空间信息,从而提高了分类正确率. 展开更多
关键词 图像分类 词袋模型 局部位置特征 非下采样轮廓波变换 全局轮廓特征
下载PDF
曲线坐标系下线状要素名称注记定位模型的研究 被引量:2
12
作者 罗广祥 张转 +1 位作者 王俊峰 祝国瑞 《测绘科学》 CSCD 北大核心 2007年第3期57-58,共2页
提出了在数字空间描述线状要素的一种曲线坐标系,给定了在该坐标系下确定线状要素名称注记定位点的模型体系,并结合注记配置规则,对线状要素名称注记字隙的确定进行了建模,最后提出了曲线坐标系下线状要素名称注记优化配置的宏观逻辑。... 提出了在数字空间描述线状要素的一种曲线坐标系,给定了在该坐标系下确定线状要素名称注记定位点的模型体系,并结合注记配置规则,对线状要素名称注记字隙的确定进行了建模,最后提出了曲线坐标系下线状要素名称注记优化配置的宏观逻辑。此方法、模型体系正确可行,实施简单。 展开更多
关键词 地图注记配置 线状要素 名称注记 曲线坐标系 字隙 字顺
下载PDF
一种基于向量词序的句子相似度算法研究 被引量:15
13
作者 程志强 闵华松 《计算机仿真》 CSCD 北大核心 2014年第7期419-424,共6页
针对传统的句子相似度算法在句法结构等方面存在匹配率低的问题。为提高相似度计算的准确性,提出了一种改进的基于向量距离词序的句子相似度算法,从特征领域权重和词序方面进行改进,通过建立相应的领域特征集,对于相关领域的特征项给予... 针对传统的句子相似度算法在句法结构等方面存在匹配率低的问题。为提高相似度计算的准确性,提出了一种改进的基于向量距离词序的句子相似度算法,从特征领域权重和词序方面进行改进,通过建立相应的领域特征集,对于相关领域的特征项给予更高的权重,同时,在向量空间模型的基础上,引入词序因子,计算句子词序相似度。使用包含6个领域的2651个句子作为语料库,实验结果表明,改进方法使特征领域内句子相似度计算的准确度得到提高。 展开更多
关键词 向量空间模型 特征领域权重 词序
下载PDF
基于词位的藏文黏写形式的切分 被引量:6
14
作者 康才畯 龙从军 江荻 《计算机工程与应用》 CSCD 2014年第11期218-222,共5页
基于词位的统计分析方法识别并切分现代藏语文本中的黏写形式,其最大特点是减少了未登录词对识别效果的影响。首先根据藏文自身的特点,将常用的四词位扩充为六词位,再利用条件随机场模型作为标注建模工具来进行训练和测试,并根据规则对... 基于词位的统计分析方法识别并切分现代藏语文本中的黏写形式,其最大特点是减少了未登录词对识别效果的影响。首先根据藏文自身的特点,将常用的四词位扩充为六词位,再利用条件随机场模型作为标注建模工具来进行训练和测试,并根据规则对识别结果进行后处理。从实验结果来看,该方法有较高的识别正确率,具有进一步研究的价值。下一步的改进需要扩充训练语料,并对模型选用的特征集进行优化。 展开更多
关键词 藏文黏写形式 词位 条件随机场 特征模板 后处理
下载PDF
汉语分词中上文和下文重要性比较 被引量:2
15
作者 于江德 王希杰 樊孝忠 《计算机工程与应用》 CSCD 北大核心 2011年第4期117-120,共4页
上下文是统计语言学中获取语言知识和解决自然语言处理中多种实际应用问题必须依靠的资源和基础。近年来基于字的词位标注的方法极大地提高了汉语分词的性能,该方法将汉语分词转化为字的词位标注问题,当前字的词位标注需要借助于该字的... 上下文是统计语言学中获取语言知识和解决自然语言处理中多种实际应用问题必须依靠的资源和基础。近年来基于字的词位标注的方法极大地提高了汉语分词的性能,该方法将汉语分词转化为字的词位标注问题,当前字的词位标注需要借助于该字的上下文来确定。为克服仅凭主观经验给出猜测结果的不足,采用四词位标注集,使用条件随机场模型研究了词位标注汉语分词中上文和下文对分词性能的贡献情况,在国际汉语分词评测Bakeoff2005的PKU和MSRA两种语料上进行了封闭测试,采用分别表征上文和下文的特征模板集进行了对比实验,结果表明,下文对分词性能的贡献比上文的贡献高出13个百分点以上。 展开更多
关键词 汉语分词 上下文 条件随机场 词位标注 特征模板
下载PDF
假设句句法操作形式的跨语言比较 被引量:15
16
作者 董秀英 徐杰 《汉语学报》 2009年第4期64-74,共11页
本文试图运用句法操作的一般理论来研究假设句的句法操作问题,并运用语言类型学理论来解释假设标记添加位置差异的原因。文章的主体包括两大部分:(1)以34种语言和43个汉语方言的假设句为考察对象,根据句法操作手段和操作位置的不同,把... 本文试图运用句法操作的一般理论来研究假设句的句法操作问题,并运用语言类型学理论来解释假设标记添加位置差异的原因。文章的主体包括两大部分:(1)以34种语言和43个汉语方言的假设句为考察对象,根据句法操作手段和操作位置的不同,把假设句的句法操作分为四类,即句首添加、谓头添加、句尾添加和谓头移位。(2)通过考察34种语言和43个汉语方言的189个假设标记添加位置跟不同语言小句语序的关联,发现假设标记位置的前后差异与不同语言的小句语序类型是和谐的,VO型语言倾向于使用前置标记,OV型语言倾向于使用后置标记。并且这种语序和谐特征在汉语方言中也有不同程度的反映。 展开更多
关键词 句法操作手段 句法操作位置 跨语言比较 语序和谐
下载PDF
基于Fisher线性判别式的层次文档分类 被引量:1
17
作者 徐敏 张丽萍 朱梧槚 《南京理工大学学报》 EI CAS CSCD 北大核心 2005年第4期460-463,共4页
将文档按照主题进行层次分类,利用Fisher线性判别式的思想来提取每一类的正特征词和负特征词,给出基于Fisher线性判别式的层次文档分类算法(HDCF)。HDCF不仅克服一般层次分类算法中假定特征词之间必须满足独立性的条件,而且能处理一个... 将文档按照主题进行层次分类,利用Fisher线性判别式的思想来提取每一类的正特征词和负特征词,给出基于Fisher线性判别式的层次文档分类算法(HDCF)。HDCF不仅克服一般层次分类算法中假定特征词之间必须满足独立性的条件,而且能处理一个文档涉及多个类的分类问题。在实验中,采用召全率和准确率2个指标与其它算法进行比较,结果表明:HDCF的效果好于其它算法。 展开更多
关键词 特征选择 正特征词 负特征词 Fisher线性判别式 层次文档分类
下载PDF
中文文本分类中的特征词抽取方法 被引量:16
18
作者 李晓红 《计算机工程与设计》 CSCD 北大核心 2009年第17期4127-4129,共3页
针对目前各类主流的中文文本特征词抽取方法中只关心词频信息却不关注特征的位置这一现象,给出了位置权重的概念,对以往提出的无词典分词算法进行了适当的修改,并在此基础上提出将信息增益、卡方统计和互信息这3种常用的特征选择方法有... 针对目前各类主流的中文文本特征词抽取方法中只关心词频信息却不关注特征的位置这一现象,给出了位置权重的概念,对以往提出的无词典分词算法进行了适当的修改,并在此基础上提出将信息增益、卡方统计和互信息这3种常用的特征选择方法有机的结合起来,构成新的特征选择方法。这种新方法综合考虑了特征的各类信息,从而更加准确地选取文本中的有效特征词,并且试验结果也验证了这种改进算法的可行性和有效性。 展开更多
关键词 特征抽取 无词典分词 位置权重 词条过滤 文本分类
下载PDF
领域概念术语提取中特征项自动抽取方法 被引量:3
19
作者 孙珠婷 顾倩颐 《计算机工程与设计》 CSCD 北大核心 2012年第8期3189-3193,共5页
针对领域概念术语提取过程中特征项来源于人工获取领域文本集以及特征项抽取的准确性不高的问题,提出一种特征项自动抽取方法。首先利用第三方接口从文献资源库中获取大量领域文本集,并对其进行段落分析,在文本预处理阶段提出一种改进... 针对领域概念术语提取过程中特征项来源于人工获取领域文本集以及特征项抽取的准确性不高的问题,提出一种特征项自动抽取方法。首先利用第三方接口从文献资源库中获取大量领域文本集,并对其进行段落分析,在文本预处理阶段提出一种改进的无词典分词方法进行二次分词,结合TFIDF,开方检验,信息增益及词汇位置权重方法进行特征项抽取。实验结果表明,该方法能实现特征项自动化抽取。 展开更多
关键词 领域概念术语 特征项自动抽取 领域文本集 无词典分词 位置权重
下载PDF
矮寨苗语形容词修饰名词语序的类型学特征 被引量:9
20
作者 余金枝 《中央民族大学学报(哲学社会科学版)》 CSSCI 北大核心 2004年第1期106-109,共4页
 矮寨苗语形容词修饰名词有"名+形"和"形+名"两种语序。"名+形"的语义焦点是名词,"形+名"的语义焦点是形容词。
关键词 矮寨苗语 形容词修饰名词 语序 类型学特征
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部