期刊文献+
共找到69篇文章
< 1 2 4 >
每页显示 20 50 100
Helps Towards Correct English Word-Order
1
作者 Li Zecheng(Department of Foreign Languages, Kunming Institute of Technology, Kunming 650093) 《昆明理工大学学报(自然科学版)》 CAS 1994年第S1期15-21,共7页
HelpsTowardsCorrectEnglishWord-OrderLiZecheng(DepartmentofForeignLanguages,KunmingInstituteofTechnology,Kunm... HelpsTowardsCorrectEnglishWord-OrderLiZecheng(DepartmentofForeignLanguages,KunmingInstituteofTechnology,Kunming650093)HelpsTo... 展开更多
关键词 word-order inversion end-position mid-position initial exceptionChinese BOOKS and reference materials classification numher H314.3
下载PDF
黎平侗语比较结构研究 被引量:1
2
作者 张成 石璐 《兴义民族师范学院学报》 2024年第2期1-12,共12页
黎平侗语的比较结构比较丰富,主要有差比结构、等比结构和极比结构三类。语义上有四种关系,即“优胜”义、“不如”义、“等同”义和“最高”义。结构上,比较结构逐渐进入到句子中,置于比较主体和比较基准之间。语序上有四种,其中前面... 黎平侗语的比较结构比较丰富,主要有差比结构、等比结构和极比结构三类。语义上有四种关系,即“优胜”义、“不如”义、“等同”义和“最高”义。结构上,比较结构逐渐进入到句子中,置于比较主体和比较基准之间。语序上有四种,其中前面两种为固有的语序,后者为借用的语序。黎平侗语的比较标记有两个类型,即固有的比较标记和借用的比较标记。固有的比较结构均由实义动词语法化而来,分别为“有”和“过”。语法化路径为:实义动词>辅助动词>比较标记。借用的比较结构是借用汉语西南官话的结构形式,通过拷贝形式体现出来。通过跨语言比较,壮侗语族比较结构的语序具有类型学上的共性,比较标记的来源具有一致性。 展开更多
关键词 黎平侗语 比较结构 语义特征 语序类型 比较标记 语法化路径
下载PDF
基于最大熵模型的词位标注汉语分词 被引量:8
3
作者 于江德 王希杰 樊孝忠 《郑州大学学报(理学版)》 CAS 北大核心 2011年第1期70-74,共5页
近年来基于字的词位标注汉语分词方法极大地提高了分词的性能,该方法将汉语分词转化为字的词位标注问题,借助于优秀的序列标注模型,词位标注汉语分词逐渐成为汉语分词的主要技术路线.该方法中特征模板集设定和词位标注集的选择至关重要... 近年来基于字的词位标注汉语分词方法极大地提高了分词的性能,该方法将汉语分词转化为字的词位标注问题,借助于优秀的序列标注模型,词位标注汉语分词逐渐成为汉语分词的主要技术路线.该方法中特征模板集设定和词位标注集的选择至关重要,采用不同的词位标注集,使用最大熵模型进一步研究了词位标注汉语分词技术.在国际汉语分词评测Bakeoff2005的语料上进行了封闭测试,并对比了不同词位标注集对分词性能的影响.实验表明所采用的六词位标注集配合相应的特征模板集TMPT-6较其他词位标注集分词性能要好. 展开更多
关键词 汉语分词 词位标注 最大熵模型 词位标注集 特征模板
下载PDF
基于链式条件随机场的中文分词改进方法 被引量:10
4
作者 徐浩煜 任智慧 +1 位作者 施俊 周晗 《计算机应用与软件》 CSCD 2016年第12期211-213,233,共4页
基于链式条件随机场模型的序列标注中文分词方法随着中文分词评测Bakeoff的展开得到广泛应用。词位标注集和特征模板集对该模型的学习至关重要,但当前的研究大多采用单一的标注集和特征模板集进行实验,缺乏标注集和特征模板集结合的尝试... 基于链式条件随机场模型的序列标注中文分词方法随着中文分词评测Bakeoff的展开得到广泛应用。词位标注集和特征模板集对该模型的学习至关重要,但当前的研究大多采用单一的标注集和特征模板集进行实验,缺乏标注集和特征模板集结合的尝试,使得中文分词中未登录词识别率不高,从而影响互联网领域语料的分词效果。首次采用六词位标注集结合TMPT-10和TMPT-10`特征模板,并与常见标注集和特征模板集的组合在Bakeoff语料上进行实验对比,结果表明,改进的方法 6tag-tmpt10取得更好的未登录词召回率,在互联网领域中文分词能取得很好的效果;同时在F值上也与其他最好结果相当。 展开更多
关键词 中文分词 词位标注 条件随机场 特征模板
下载PDF
基于影评数据的在线评论有用性影响因素研究 被引量:240
5
作者 郝媛媛 叶强 李一军 《管理科学学报》 CSSCI 北大核心 2010年第8期78-88,96,共12页
面对互联网上海量的在线客户评论,如何能快速有效地进行识别和选择从而发现和利用其中有用的评论,已经成为人们关注的重要问题.以体验型商品电影的在线评论为研究对象,结合文本挖掘技术和实证研究方法,从文本特征出发探索影响在线评论... 面对互联网上海量的在线客户评论,如何能快速有效地进行识别和选择从而发现和利用其中有用的评论,已经成为人们关注的重要问题.以体验型商品电影的在线评论为研究对象,结合文本挖掘技术和实证研究方法,从文本特征出发探索影响在线评论有用性的因素,建立在线评论有用性影响因素模型,并利用该模型对评论有用性进行分类预测.与现有相关研究相比,提出的模型总体拟合效果显著提高,并发现在线影评中积极的情感倾向、较高的正负情感混杂度、较高的主客观表达混杂度以及较长的平均各句长度,对评论的有用性具有显著的正面影响.最后预测结果表明,该模型对在线影评的有用性具有较强的判别能力. 展开更多
关键词 口碑 在线评论 有用性 文本特征 正负情感 主客观表达形式 文本挖掘
下载PDF
基于条件随机域模型的比较要素抽取研究 被引量:4
6
作者 王巍 赵铁军 +1 位作者 辛国栋 徐永东 《自动化学报》 EI CSCD 北大核心 2015年第8期1385-1393,共9页
随着主观性评价文本数量的不断增长,文本情感分析已经成为众多研究者关注的对象.比较要素抽取是比较句情感分析的重要研究任务之一,比较句的情感分析结果与比较要素相结合才更有意义.为了提高比较要素抽取的性能,本文提出在构建系统模... 随着主观性评价文本数量的不断增长,文本情感分析已经成为众多研究者关注的对象.比较要素抽取是比较句情感分析的重要研究任务之一,比较句的情感分析结果与比较要素相结合才更有意义.为了提高比较要素抽取的性能,本文提出在构建系统模型的过程中引入浅层句法信息、比较词候选信息和启发式位置信息等多种语言学相关特征,并且在不增加领域知识的情况下,有效提高系统的准确率和F1值,同时本文提出的方法可以有效处理含有多个比较关系的句子.实验结果表明,将本文提出的特征应用于条件随机域(Conditional random fields,CRFs)模型可以有效提高比较要素抽取的各项性能指标,同时,将本文的实验结果与2012年中文情感分析评测结果的最大值进行了比较,各项指标均超过最大值,进一步证明了本文方法的有效性. 展开更多
关键词 情感分析 比较要素抽取 浅层句法特征 比较词候选特征 启发式位置特征
下载PDF
词位标注汉语分词中特征模板定量研究 被引量:4
7
作者 于江德 王希杰 樊孝忠 《计算机工程与设计》 CSCD 北大核心 2012年第3期1239-1244,共6页
基于字的词位标注的方法能极大地提高汉语分词的性能,该方法将汉语分词转化为字的词位标注问题,词位标注汉语分词中特征模板的设定至关重要,为了更加准确地设定特征模板,从多个角度进行了定量分析,并在国际汉语分词评测Bakeoff2005的PKU... 基于字的词位标注的方法能极大地提高汉语分词的性能,该方法将汉语分词转化为字的词位标注问题,词位标注汉语分词中特征模板的设定至关重要,为了更加准确地设定特征模板,从多个角度进行了定量分析,并在国际汉语分词评测Bakeoff2005的PKU和MSRA两种语料上进行了封闭测试,得到如下结论:同等条件下,训练出的模型大小与扩展出的特征数成正比;不同的单字特征模板在同一语料中扩展出的特征数基本相同,单字特征模板对分词性能的贡献要比双字特征模板小得多;增加B特征模板之后,训练时间大大增加,模型大小基本不变,对分词性能都是正增长。 展开更多
关键词 汉语分词 词位标注 特征模板 定量分析 条件随机场
下载PDF
局部位置特征与全局轮廓特征相结合的图像分类方法 被引量:4
8
作者 李雅倩 吴超 +1 位作者 李海滨 刘彬 《电子学报》 EI CAS CSCD 北大核心 2018年第7期1726-1731,共6页
在空间金字塔词袋模型的基础上,针对其空间信息利用不足的问题,本文先计算图像中每一个字典向量的相对位置分布来提取出局部位置特征.然后,用非下采样轮廓波变换和线性判别分析来生成图像的全局轮廓特征.最后,通过局部位置特征与全局轮... 在空间金字塔词袋模型的基础上,针对其空间信息利用不足的问题,本文先计算图像中每一个字典向量的相对位置分布来提取出局部位置特征.然后,用非下采样轮廓波变换和线性判别分析来生成图像的全局轮廓特征.最后,通过局部位置特征与全局轮廓特征相结合的方式提高空间信息利用率,从而提高场景和物体图像分类正确率.为了检验方法的可行性,本文分别在数据库Caltech 101、MSRC和15 Scene上进行实验.实验结果证明,本文提出的方法进一步利用了空间信息,从而提高了分类正确率. 展开更多
关键词 图像分类 词袋模型 局部位置特征 非下采样轮廓波变换 全局轮廓特征
下载PDF
曲线坐标系下线状要素名称注记定位模型的研究 被引量:2
9
作者 罗广祥 张转 +1 位作者 王俊峰 祝国瑞 《测绘科学》 CSCD 北大核心 2007年第3期57-58,共2页
提出了在数字空间描述线状要素的一种曲线坐标系,给定了在该坐标系下确定线状要素名称注记定位点的模型体系,并结合注记配置规则,对线状要素名称注记字隙的确定进行了建模,最后提出了曲线坐标系下线状要素名称注记优化配置的宏观逻辑。... 提出了在数字空间描述线状要素的一种曲线坐标系,给定了在该坐标系下确定线状要素名称注记定位点的模型体系,并结合注记配置规则,对线状要素名称注记字隙的确定进行了建模,最后提出了曲线坐标系下线状要素名称注记优化配置的宏观逻辑。此方法、模型体系正确可行,实施简单。 展开更多
关键词 地图注记配置 线状要素 名称注记 曲线坐标系 字隙 字顺
下载PDF
一种基于向量词序的句子相似度算法研究 被引量:16
10
作者 程志强 闵华松 《计算机仿真》 CSCD 北大核心 2014年第7期419-424,共6页
针对传统的句子相似度算法在句法结构等方面存在匹配率低的问题。为提高相似度计算的准确性,提出了一种改进的基于向量距离词序的句子相似度算法,从特征领域权重和词序方面进行改进,通过建立相应的领域特征集,对于相关领域的特征项给予... 针对传统的句子相似度算法在句法结构等方面存在匹配率低的问题。为提高相似度计算的准确性,提出了一种改进的基于向量距离词序的句子相似度算法,从特征领域权重和词序方面进行改进,通过建立相应的领域特征集,对于相关领域的特征项给予更高的权重,同时,在向量空间模型的基础上,引入词序因子,计算句子词序相似度。使用包含6个领域的2651个句子作为语料库,实验结果表明,改进方法使特征领域内句子相似度计算的准确度得到提高。 展开更多
关键词 向量空间模型 特征领域权重 词序
下载PDF
基于词位的藏文黏写形式的切分 被引量:6
11
作者 康才畯 龙从军 江荻 《计算机工程与应用》 CSCD 2014年第11期218-222,共5页
基于词位的统计分析方法识别并切分现代藏语文本中的黏写形式,其最大特点是减少了未登录词对识别效果的影响。首先根据藏文自身的特点,将常用的四词位扩充为六词位,再利用条件随机场模型作为标注建模工具来进行训练和测试,并根据规则对... 基于词位的统计分析方法识别并切分现代藏语文本中的黏写形式,其最大特点是减少了未登录词对识别效果的影响。首先根据藏文自身的特点,将常用的四词位扩充为六词位,再利用条件随机场模型作为标注建模工具来进行训练和测试,并根据规则对识别结果进行后处理。从实验结果来看,该方法有较高的识别正确率,具有进一步研究的价值。下一步的改进需要扩充训练语料,并对模型选用的特征集进行优化。 展开更多
关键词 藏文黏写形式 词位 条件随机场 特征模板 后处理
下载PDF
汉语分词中上文和下文重要性比较 被引量:2
12
作者 于江德 王希杰 樊孝忠 《计算机工程与应用》 CSCD 北大核心 2011年第4期117-120,共4页
上下文是统计语言学中获取语言知识和解决自然语言处理中多种实际应用问题必须依靠的资源和基础。近年来基于字的词位标注的方法极大地提高了汉语分词的性能,该方法将汉语分词转化为字的词位标注问题,当前字的词位标注需要借助于该字的... 上下文是统计语言学中获取语言知识和解决自然语言处理中多种实际应用问题必须依靠的资源和基础。近年来基于字的词位标注的方法极大地提高了汉语分词的性能,该方法将汉语分词转化为字的词位标注问题,当前字的词位标注需要借助于该字的上下文来确定。为克服仅凭主观经验给出猜测结果的不足,采用四词位标注集,使用条件随机场模型研究了词位标注汉语分词中上文和下文对分词性能的贡献情况,在国际汉语分词评测Bakeoff2005的PKU和MSRA两种语料上进行了封闭测试,采用分别表征上文和下文的特征模板集进行了对比实验,结果表明,下文对分词性能的贡献比上文的贡献高出13个百分点以上。 展开更多
关键词 汉语分词 上下文 条件随机场 词位标注 特征模板
下载PDF
假设句句法操作形式的跨语言比较 被引量:15
13
作者 董秀英 徐杰 《汉语学报》 2009年第4期64-74,共11页
本文试图运用句法操作的一般理论来研究假设句的句法操作问题,并运用语言类型学理论来解释假设标记添加位置差异的原因。文章的主体包括两大部分:(1)以34种语言和43个汉语方言的假设句为考察对象,根据句法操作手段和操作位置的不同,把... 本文试图运用句法操作的一般理论来研究假设句的句法操作问题,并运用语言类型学理论来解释假设标记添加位置差异的原因。文章的主体包括两大部分:(1)以34种语言和43个汉语方言的假设句为考察对象,根据句法操作手段和操作位置的不同,把假设句的句法操作分为四类,即句首添加、谓头添加、句尾添加和谓头移位。(2)通过考察34种语言和43个汉语方言的189个假设标记添加位置跟不同语言小句语序的关联,发现假设标记位置的前后差异与不同语言的小句语序类型是和谐的,VO型语言倾向于使用前置标记,OV型语言倾向于使用后置标记。并且这种语序和谐特征在汉语方言中也有不同程度的反映。 展开更多
关键词 句法操作手段 句法操作位置 跨语言比较 语序和谐
下载PDF
基于Fisher线性判别式的层次文档分类 被引量:1
14
作者 徐敏 张丽萍 朱梧槚 《南京理工大学学报》 EI CAS CSCD 北大核心 2005年第4期460-463,共4页
将文档按照主题进行层次分类,利用Fisher线性判别式的思想来提取每一类的正特征词和负特征词,给出基于Fisher线性判别式的层次文档分类算法(HDCF)。HDCF不仅克服一般层次分类算法中假定特征词之间必须满足独立性的条件,而且能处理一个... 将文档按照主题进行层次分类,利用Fisher线性判别式的思想来提取每一类的正特征词和负特征词,给出基于Fisher线性判别式的层次文档分类算法(HDCF)。HDCF不仅克服一般层次分类算法中假定特征词之间必须满足独立性的条件,而且能处理一个文档涉及多个类的分类问题。在实验中,采用召全率和准确率2个指标与其它算法进行比较,结果表明:HDCF的效果好于其它算法。 展开更多
关键词 特征选择 正特征词 负特征词 Fisher线性判别式 层次文档分类
下载PDF
中文文本分类中的特征词抽取方法 被引量:16
15
作者 李晓红 《计算机工程与设计》 CSCD 北大核心 2009年第17期4127-4129,共3页
针对目前各类主流的中文文本特征词抽取方法中只关心词频信息却不关注特征的位置这一现象,给出了位置权重的概念,对以往提出的无词典分词算法进行了适当的修改,并在此基础上提出将信息增益、卡方统计和互信息这3种常用的特征选择方法有... 针对目前各类主流的中文文本特征词抽取方法中只关心词频信息却不关注特征的位置这一现象,给出了位置权重的概念,对以往提出的无词典分词算法进行了适当的修改,并在此基础上提出将信息增益、卡方统计和互信息这3种常用的特征选择方法有机的结合起来,构成新的特征选择方法。这种新方法综合考虑了特征的各类信息,从而更加准确地选取文本中的有效特征词,并且试验结果也验证了这种改进算法的可行性和有效性。 展开更多
关键词 特征抽取 无词典分词 位置权重 词条过滤 文本分类
下载PDF
领域概念术语提取中特征项自动抽取方法 被引量:3
16
作者 孙珠婷 顾倩颐 《计算机工程与设计》 CSCD 北大核心 2012年第8期3189-3193,共5页
针对领域概念术语提取过程中特征项来源于人工获取领域文本集以及特征项抽取的准确性不高的问题,提出一种特征项自动抽取方法。首先利用第三方接口从文献资源库中获取大量领域文本集,并对其进行段落分析,在文本预处理阶段提出一种改进... 针对领域概念术语提取过程中特征项来源于人工获取领域文本集以及特征项抽取的准确性不高的问题,提出一种特征项自动抽取方法。首先利用第三方接口从文献资源库中获取大量领域文本集,并对其进行段落分析,在文本预处理阶段提出一种改进的无词典分词方法进行二次分词,结合TFIDF,开方检验,信息增益及词汇位置权重方法进行特征项抽取。实验结果表明,该方法能实现特征项自动化抽取。 展开更多
关键词 领域概念术语 特征项自动抽取 领域文本集 无词典分词 位置权重
下载PDF
矮寨苗语形容词修饰名词语序的类型学特征 被引量:9
17
作者 余金枝 《中央民族大学学报(哲学社会科学版)》 CSSCI 北大核心 2004年第1期106-109,共4页
 矮寨苗语形容词修饰名词有"名+形"和"形+名"两种语序。"名+形"的语义焦点是名词,"形+名"的语义焦点是形容词。
关键词 矮寨苗语 形容词修饰名词 语序 类型学特征
下载PDF
基于语序位置特征的汉英术语对自动抽取研究 被引量:6
18
作者 张莉 刘昱显 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2015年第4期707-713,共7页
双语的术语抽取和对齐在跨语言检索、构建双语词典和机器翻译等研究领域有着重要的作用.提出一种基于语序位置特征信息的汉英术语对自动对齐算法.该算法对双语术语抽取两步走策略中的术语对齐部分进行了改进,将基于短语的机器翻译中的... 双语的术语抽取和对齐在跨语言检索、构建双语词典和机器翻译等研究领域有着重要的作用.提出一种基于语序位置特征信息的汉英术语对自动对齐算法.该算法对双语术语抽取两步走策略中的术语对齐部分进行了改进,将基于短语的机器翻译中的语序位置特征融合进术语对齐算法中,通过对基准方法的对比,新方法显著提高了术语对齐的精确率,特别在术语翻译概率较低时提高更为明显,同时又避免了基于短语的机器翻译中计算效率低的缺陷. 展开更多
关键词 汉英术语抽取 汉英术语对齐 语序位置特征
下载PDF
共现语境特征对情态动词语义排歧的限制作用 被引量:1
19
作者 于建平 孙亚楠 +2 位作者 孙锐 张涛 洪文学 《江苏科技大学学报(自然科学版)》 CAS 2019年第6期60-67,共8页
情态动词具有非常复杂的语义系统.情态动词的意义是其词汇基本意义与语境因素相互作用的结果.因此,语境对于情态动词的意义识别和语义排歧都具有重要的互动限制作用.文中基于形式概念分析理论和属性偏序图方法,以英语情态动词can为例,... 情态动词具有非常复杂的语义系统.情态动词的意义是其词汇基本意义与语境因素相互作用的结果.因此,语境对于情态动词的意义识别和语义排歧都具有重要的互动限制作用.文中基于形式概念分析理论和属性偏序图方法,以英语情态动词can为例,研究了共现语境特征对英语情态动词语义排歧的限制作用;将语境特征划分为言内语境和言外语境两部分,言内语境包括12个语义特征和6个共现的句法特征;言外语境选取了7个情景语境特征;构建了表达情态动词can不同语义的对象与语境特征属性关系的形势背景,并以生成的可视化属性偏序结构图作为语义排歧和知识发现的模型;排歧正确率达91.33%;基于该模型发现了对can的语义排歧限制作用大的属性特征.文中研究结果为语义排歧和自然语言处理中的特征选择提供了重要的实践依据. 展开更多
关键词 英语情态动词can 语境特征 语义排歧 属性偏序图
下载PDF
汉语递加关系多项定语与法语相关句式的比较 被引量:4
20
作者 耿京茹 《汉语学习》 北大核心 2002年第5期73-76,共4页
本文通过对法语背景的留学生在汉语学习中出现的病句的分析 ,探讨汉语递加关系的多项定语与法语相关句式的对应关系 ,指出汉语和法语两种句式存有差异的原因 ,以便教学更具针对性 ,提高教学效率。
关键词 多项定语 位置 词序 比较
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部