期刊文献+
共找到1,432篇文章
< 1 2 72 >
每页显示 20 50 100
词根频率和语义透明度对英语二语后缀派生词加工模型影响的实证研究
1
作者 陈士法 秦越 +1 位作者 顾晓岚 彭玉乐 《外语学刊》 CSSCI 北大核心 2024年第5期76-84,共9页
本研究采用词汇判断任务,探究词根频率、语义透明度及其交互效应对英语二语后缀派生词加工模型的影响。实验发现:(1)在反应时上词根频率主效应显著,高频词根派生词的平均反应时低于低频词根派生词;(2)在反应时上语义透明度主效应显著,... 本研究采用词汇判断任务,探究词根频率、语义透明度及其交互效应对英语二语后缀派生词加工模型的影响。实验发现:(1)在反应时上词根频率主效应显著,高频词根派生词的平均反应时低于低频词根派生词;(2)在反应时上语义透明度主效应显著,语义透明派生词的平均反应时低于语义晦涩派生词;(3)在正确率上二者交互效应显著,语义透明度对低频词根派生词正确率的影响更大,词根频率对语义晦涩派生词正确率的影响更大。据此,我们构建中国学习者英语二语后缀派生词分解加工模型:分为词素分解和词素整合两个阶段,词根频率和语义透明度均影响派生词加工的时间进程,二者交互影响派生词的加工质量。 展开更多
关键词 英语后缀派生词 词根频率 语义透明度 分解加工模型
下载PDF
学术期刊论文标题后缀词“研究”使用的必要性问题
2
作者 张结根 谢佳 端义镭 《大连大学学报》 2024年第4期37-43,共7页
本研究以带有“研究”后缀词的学术期刊论文标题为研究对象,首先通过分析收集到的144个该类标题归纳出其结构类型,然后从中选择24个标题用于制作调查问卷,最后通过定量与定性相结合的方法论证不同类型标题使用“研究”的必要性程度和标... 本研究以带有“研究”后缀词的学术期刊论文标题为研究对象,首先通过分析收集到的144个该类标题归纳出其结构类型,然后从中选择24个标题用于制作调查问卷,最后通过定量与定性相结合的方法论证不同类型标题使用“研究”的必要性程度和标准。研究结果显示:带有研究背景、理论或方法的论文标题比仅含研究对象的标题使用“研究”后缀词的必要性程度高,差异显著;判断必要性的标准有完整性、准确性和简洁性。研究建议:当“研究”被形容词性短语修饰时后缀词必不可少,以保证标题结构的完整性;当“研究”的缺失可能会造成误解或歧义时建议保留,以确保标题语义的准确性;其他情况下建议不用,以增加标题语言的简洁性。 展开更多
关键词 学术期刊 论文标题 标题后缀
下载PDF
衡山方言的后缀“首”和“气”——“相因生义”与“通感引申”的殊途同归
3
作者 刘娟 《衡阳师范学院学报》 2024年第4期118-123,共6页
湘语衡山方言中的“首”和“气”可以附着于动词后构成表示抽象意义的名词,首/气相当于普通话中接于动词词根后表示有这样做的价值的“头”。“气”还可以附加在形容词性、名词性语素后构成一个新的合成词,其义是指气味、味道,或者人的... 湘语衡山方言中的“首”和“气”可以附着于动词后构成表示抽象意义的名词,首/气相当于普通话中接于动词词根后表示有这样做的价值的“头”。“气”还可以附加在形容词性、名词性语素后构成一个新的合成词,其义是指气味、味道,或者人的作风、习气、品质、外形等,又或者表示一种抽象的心理感觉。“首”和“气”都发展为表示价值的同义后缀,但二者语义发展演变的动因和轨迹并不相同,可谓殊途同归:后缀“首”的形成是普通话后缀“头”相因生义的结果,后缀“气”的多种语义则是通感引申的结果。 展开更多
关键词 衡山方言 后缀
下载PDF
Z变音的合音后缀
4
作者 魏梦洋 《现代语文》 2024年第6期57-69,共13页
关于Z变音合音成分的本源字问题,学界仍未达成共识,主要有四种观点:“子”后缀合音说、“儿”后缀合音说、“头”后缀合音说、“子”“儿”混用说。对这些观点进行理性反思和简要评述,阐明它们在论证过程中所存在的主要问题。在此基础上... 关于Z变音合音成分的本源字问题,学界仍未达成共识,主要有四种观点:“子”后缀合音说、“儿”后缀合音说、“头”后缀合音说、“子”“儿”混用说。对这些观点进行理性反思和简要评述,阐明它们在论证过程中所存在的主要问题。在此基础上,结合相关方言文献与语言事实,从后缀“子”“儿”的空间分布、语法功能、语音形式等方面,对Z变韵的合音后缀进行分析。研究显示,Z变韵的合音后缀应是早期“儿”及“子”的早期儿化韵形式,而不是“子”,更不是“头”。 展开更多
关键词 Z变音 合音后缀 儿化韵 “子”后缀
下载PDF
基于诱导排序的藏文后缀数组构建算法
5
作者 张学通 彭展 《中央民族大学学报(自然科学版)》 2024年第2期32-39,共8页
后缀数组、BWT、LCP数组是进行全文索引和文本压缩的重要数据结构,BWT和LCP数组通常由构造完成的后缀数组计算而来。基于诱导排序的SAIS算法是最快的后缀数组构造算法之一,本文对SAIS进行改进后提出了藏文后缀数组算法ITSBL,在诱导产生... 后缀数组、BWT、LCP数组是进行全文索引和文本压缩的重要数据结构,BWT和LCP数组通常由构造完成的后缀数组计算而来。基于诱导排序的SAIS算法是最快的后缀数组构造算法之一,本文对SAIS进行改进后提出了藏文后缀数组算法ITSBL,在诱导产生后缀数组的同时计算BWT而无须在内存中保存完整的后缀数组,结合藏文的音节结构特点对计算出的后缀数组进行处理,得到以藏文音节字为单位的藏文后缀数组和LCP数组,结果更符合藏文的使用习惯。相比单独计算后缀数组、BWT、LCP数组,ITSBL算法在较大文本下性能提升约10%,较小文本下提升约30%,具有一定的应用价值。 展开更多
关键词 诱导排序 藏文 后缀数组
下载PDF
音系学视角下英语后缀派生过程中的音变探究
6
作者 王震 《英语广场(学术研究)》 2024年第30期35-38,共4页
很多英语单词在加后缀时,为了避免语流失畅,会在发音与拼写上产生诸多变化,这无疑会给学习者带来不少困惑。本文以音系过程理论和音节的响度顺序原则为依据,探究这些变化的系统性规则,并对其进行了分析与归纳,最终总结出后缀派生词音变... 很多英语单词在加后缀时,为了避免语流失畅,会在发音与拼写上产生诸多变化,这无疑会给学习者带来不少困惑。本文以音系过程理论和音节的响度顺序原则为依据,探究这些变化的系统性规则,并对其进行了分析与归纳,最终总结出后缀派生词音变规则体系图。此规则体系图可以帮助英语学习者理解单词派生过程中可能出现的发音与拼写变化规律,使派生词记忆事半功倍,还可帮助学习者推测出派生词的正确拼写与读音。 展开更多
关键词 音系过程 响度顺序原则 后缀派生词 音变
下载PDF
韩汉语同形后缀“-?”与“-室”的对比研究
7
作者 成晓 《今古文创》 2024年第6期112-114,共3页
本文以韩汉语同形后缀“-?”与“-室”为对象,搜集相应的派生词语料,对两者派生词的形态差异进行分析;并选取中韩两国权威词典,在搜集的语料基础上,对两者语义方面的差异进行进一步对比研究,期待能够帮助语言学习者加深对韩汉语同形后... 本文以韩汉语同形后缀“-?”与“-室”为对象,搜集相应的派生词语料,对两者派生词的形态差异进行分析;并选取中韩两国权威词典,在搜集的语料基础上,对两者语义方面的差异进行进一步对比研究,期待能够帮助语言学习者加深对韩汉语同形后缀的理解。 展开更多
关键词 汉字词后缀 后缀 对比研究
下载PDF
浅谈天津方言中的形容词后缀“叽”
8
作者 白墨 《今古文创》 2024年第15期116-118,共3页
本文以天津方言中含“叽”的8个形容词后缀作为研究对象,从构词特征、语义特征和色彩特征的角度展开讨论。在构词特征上,后缀“叽”具有独特性,“不叽”“不叽叽”和“不拉叽”具有一致性;“了巴叽”和“了呱叽”亦有高一致性;在语义特... 本文以天津方言中含“叽”的8个形容词后缀作为研究对象,从构词特征、语义特征和色彩特征的角度展开讨论。在构词特征上,后缀“叽”具有独特性,“不叽”“不叽叽”和“不拉叽”具有一致性;“了巴叽”和“了呱叽”亦有高一致性;在语义特征上,除“叽”外的7个后缀都给成词增加了状态义和感觉义;在色彩特征上,8个后缀都给词根增加了一定的感情色彩,并且不受词根色彩的影响。 展开更多
关键词 天津方言 形容词后缀 “叽” 感情色彩
下载PDF
英语元音弱化的-man与汉语指人类后缀比较分析
9
作者 韦伟韫 《海外英语》 2024年第2期74-77,共4页
-man作为一种构词要素,在英语中大量存在。-man的读音主要有三种类型,第一类是与自由词素相同的完全元音[mæn],如superman[′suːpəmæn];第二类为弱化元音[mən],如postman[′pəʊstmən];第三类读音则在前面两种读音间变化,如fre... -man作为一种构词要素,在英语中大量存在。-man的读音主要有三种类型,第一类是与自由词素相同的完全元音[mæn],如superman[′suːpəmæn];第二类为弱化元音[mən],如postman[′pəʊstmən];第三类读音则在前面两种读音间变化,如freeman[′friːmən]或[′friːmæn]。文章将以元音弱化的-man词汇为研究对象,通过与汉语指人类后缀进行对比分析来判定-man的构词地位。研究发现,元音弱化的-man可以称之为类后缀,其与汉语指人类后缀具有共同特点:1)经历语法化;2)构词稳定;3)具有能产性。 展开更多
关键词 元音弱化的-man 指人类后缀 构式 能产性
下载PDF
SuffIndex——一种基于后缀树的XML索引结构 被引量:7
10
作者 包小源 宋再生 +2 位作者 唐世渭 杨冬青 王腾蛟 《计算机研究与发展》 EI CSCD 北大核心 2004年第10期1793-1801,共9页
针对形如∥element1/element2 /… /elementm 的查询 ,提出了一种基于后缀树 (suffixtree)的XML索引结构SuffIndex SuffIndex的构造通过只对OEM数据树遍历一次以及在SuffIndex中引入后缀链 (Sufflink)的方法 ,从而达到较低的构造代价 S... 针对形如∥element1/element2 /… /elementm 的查询 ,提出了一种基于后缀树 (suffixtree)的XML索引结构SuffIndex SuffIndex的构造通过只对OEM数据树遍历一次以及在SuffIndex中引入后缀链 (Sufflink)的方法 ,从而达到较低的构造代价 SuffIndex中所有结点利用Hash表保存到其所有子结点的指针 ,最终使查询∥element1/element2 /… /elementm 的处理代价为O(m) 展开更多
关键词 后缀 XML 索引
下载PDF
前后缀与特征词相结合的地名地址提取 被引量:17
11
作者 王克永 刘纪平 +1 位作者 罗安 王勇 《测绘通报》 CSCD 北大核心 2016年第2期64-68,共5页
随着地理信息与计算机技术的发展,网络中的非结构化地名地址数据越来越多,逐步成为地理信息更新的重要途径之一。针对互联网中地名地址的存在方式及结构特点,本文提出了一种前后缀与特征词相结合的地名地址识别提取方法。首先利用HMM训... 随着地理信息与计算机技术的发展,网络中的非结构化地名地址数据越来越多,逐步成为地理信息更新的重要途径之一。针对互联网中地名地址的存在方式及结构特点,本文提出了一种前后缀与特征词相结合的地名地址识别提取方法。首先利用HMM训练进行分词,接着通过地名地址前后缀词库进行候选地名切分与预提取,最后根据特征词进行匹配过滤,实现对地名地址的准确提取。试验结果证明,本文方法提高了地名地址识别的准确率和召回率,很大程度上解决了未登录地址提取问题。 展开更多
关键词 后缀 特征词 HMM分词 地名地址
下载PDF
一种改进的基于广义后缀树的文本聚类算法 被引量:7
12
作者 杜红斌 夏克文 +1 位作者 刘南平 吴涛 《信息与控制》 CSCD 北大核心 2009年第3期331-336,共6页
分析了基本STC算法存在的三个缺点,即不能有效处理包含文本数目差距较大但具有包含关系的节点,不能有效处理包含文本相似但主题不同的节点,缺乏有效的类别标识提取算法。针对以上问题,在综合考虑主题相似性以及文本包含相似性的基础上,... 分析了基本STC算法存在的三个缺点,即不能有效处理包含文本数目差距较大但具有包含关系的节点,不能有效处理包含文本相似但主题不同的节点,缺乏有效的类别标识提取算法。针对以上问题,在综合考虑主题相似性以及文本包含相似性的基础上,给出了改进的用于基类合并的相似度公式,并提出基于信息增益的类别标识提取算法。为了进一步提高聚类效率,给出了一种简单有效的用于基类选择的测度,用来排除一些无意义的广义后缀树节点。实验结果表明,所提算法不仅可以有效提高STC算法的聚类准确度,而且可以对聚类结果进行有效的类别标识。 展开更多
关键词 文本聚类 WEB挖掘 广义后缀 后缀树聚类(STC)
下载PDF
基于后缀数组的克隆检测 被引量:7
13
作者 史庆庆 张丽萍 +1 位作者 尹丽丽 刘东升 《计算机工程》 CAS CSCD 2013年第9期123-127,共5页
程序员对源代码的拷贝、粘贴及修改活动会导致软件中出现大量克隆代码,增加软件开发和维护的成本。为解决该问题,提出一种新的克隆检测方法。利用基于后缀数组的算法查找重复的Token子串,进而检测出克隆代码,开发相应的克隆检测工具SaCD... 程序员对源代码的拷贝、粘贴及修改活动会导致软件中出现大量克隆代码,增加软件开发和维护的成本。为解决该问题,提出一种新的克隆检测方法。利用基于后缀数组的算法查找重复的Token子串,进而检测出克隆代码,开发相应的克隆检测工具SaCD,用其检测29款C语言开源软件。实验结果表明,SaCD能快速有效地检测软件中的Type-1和Type-2语句克隆,其检测速度比传统的克隆检测工具CCFinderx快了近20倍。 展开更多
关键词 克隆代码 克隆检测 Token串 后缀数组 重复子串 DC3算法
下载PDF
带后缀“者”的派生词识别 被引量:9
14
作者 冯敏萱 杨翠兰 陈小荷 《语言文字应用》 CSSCI 北大核心 2006年第2期139-144,共6页
我们通过对1200万字语料的统计得出,派生词约占词条总数的8.66%,构成派生词的词缀共有188个。其中,后缀“者”所构成的派生词词条数最多,构词成分最为复杂。我们采用基本词表、词例知识规则并结合词语的搭配、共现频率的混合策略对带后... 我们通过对1200万字语料的统计得出,派生词约占词条总数的8.66%,构成派生词的词缀共有188个。其中,后缀“者”所构成的派生词词条数最多,构词成分最为复杂。我们采用基本词表、词例知识规则并结合词语的搭配、共现频率的混合策略对带后缀“者”的派生词进行了自动识别,封闭测试的精确率为93.06%,开放测试的精确率为82.40%。 展开更多
关键词 派生词 后缀 “者” 自动识别模式 汉语
下载PDF
基于后缀树模型的文本实时分类系统的研究和实现 被引量:12
15
作者 郭莉 张吉 谭建龙 《中文信息学报》 CSCD 北大核心 2005年第5期16-23,共8页
本文在面向网络内容分析的前提下,提出了一种基于后缀树的文本向量空间模型(VSM),并在此模型之上实现了文本分类系统。对比基于词的VSM,该模型利用后缀树的快速匹配,实时获得文本的向量表示,不需要对文本进行分词、特征抽取等复杂计算... 本文在面向网络内容分析的前提下,提出了一种基于后缀树的文本向量空间模型(VSM),并在此模型之上实现了文本分类系统。对比基于词的VSM,该模型利用后缀树的快速匹配,实时获得文本的向量表示,不需要对文本进行分词、特征抽取等复杂计算。同时,该模型能够保证训练集中文本的更改,对分类结果产生实时影响。实验结果和算法分析表明,我们系统的文本预处理的时间复杂度为O(N),远远优于分词系统的预处理时间复杂度。此外,由于不需要分词和特征抽取,分类过程与具体语种无关,所以是一种独立语种的分类方法。 展开更多
关键词 计算机应用 中文信息处理 实时文本分类 向量空间模型 后缀
下载PDF
基于概率后缀树的移动对象轨迹预测 被引量:4
16
作者 王兴 蒋新华 +1 位作者 林劼 熊金波 《计算机应用》 CSCD 北大核心 2013年第11期3119-3122,3133,共5页
在移动对象轨迹预测中,针对低阶马尔可夫模型预测准确率不高、高阶模型状态空间膨胀的问题,提出一种基于概率后缀树(PST)的动态自适应变长马尔可夫模型预测方法。首先依时间先后将移动对象的轨迹路径序列化;然后根据移动对象的历史轨迹... 在移动对象轨迹预测中,针对低阶马尔可夫模型预测准确率不高、高阶模型状态空间膨胀的问题,提出一种基于概率后缀树(PST)的动态自适应变长马尔可夫模型预测方法。首先依时间先后将移动对象的轨迹路径序列化;然后根据移动对象的历史轨迹数据进行学习训练,计算序列上下文的概率特征,建立路径序列的概率后缀树模型,结合当前实际轨迹数据,动态自适应预测将来的位置信息。实验结果表明,该模型在二阶时取得最高的预测精度,随着阶数的增加,预测精度保持在82%左右,能取得较好的预测效果;同时空间复杂度呈指数级减少,大大节省了存储空间。该方法充分利用历史轨迹数据和当前轨迹信息预测未来轨迹,能够提供更加灵活、高效的基于位置服务。 展开更多
关键词 变长马尔可夫模型 概率后缀 历史轨迹 轨迹预测
下载PDF
一种基于后缀树的中文网页层次聚类方法 被引量:11
17
作者 史庆伟 赵政 朝柯 《辽宁工程技术大学学报(自然科学版)》 EI CAS 北大核心 2006年第6期890-892,共3页
为了便于用户浏览搜索引擎产生的搜索结果,结合STC算法和变色龙算法提出了一种中文网页的层次聚类方法-STCC算法。该方法采用雅可比系数修改了STC算法中基本类相似度的计算方法,然后根据基本类相似度矩阵,利用变色龙算法完成网页聚类。... 为了便于用户浏览搜索引擎产生的搜索结果,结合STC算法和变色龙算法提出了一种中文网页的层次聚类方法-STCC算法。该方法采用雅可比系数修改了STC算法中基本类相似度的计算方法,然后根据基本类相似度矩阵,利用变色龙算法完成网页聚类。实验结果表明:STCC算法与STC算法相比,聚类精度提高将近10%,避免了单链接算法的链式效应,适用于大规模网页聚类。 展开更多
关键词 WEB挖掘 层次聚类 WEB搜索 后缀
下载PDF
基于后缀数组检测函数克隆 被引量:3
18
作者 侯敏 张丽萍 +1 位作者 史庆庆 刘东升 《计算机应用研究》 CSCD 北大核心 2014年第4期1082-1085,共4页
为了提高检测效率,提出了一种新的函数克隆检测方法。该方法对传统后缀数组进行了改进,优化了基于后缀数组的算法。利用该算法可高效查找重复函数子串,进而检测出Type-1和Type-2类型的函数克隆。同时开发出相应的函数克隆检测工具FCD以... 为了提高检测效率,提出了一种新的函数克隆检测方法。该方法对传统后缀数组进行了改进,优化了基于后缀数组的算法。利用该算法可高效查找重复函数子串,进而检测出Type-1和Type-2类型的函数克隆。同时开发出相应的函数克隆检测工具FCD以实现该方法,并检测了24款C语言的开源软件。实验结果的分析验证了FCD能高效检测软件中的函数克隆。 展开更多
关键词 函数克隆 克隆检测 token串 后缀数组 公共函数前缀
下载PDF
基于压缩后缀数组技术的搜索引擎 被引量:2
19
作者 姚全珠 张楠 +1 位作者 杨增辉 田元 《计算机工程》 CAS CSCD 北大核心 2008年第10期83-85,88,共4页
目前,搜索引擎的核心模块(索引器)均采用倒排文件结构,对短语查询的准确率较低。该文引入后缀数组技术进行全文索引,为克服全文索引时占用空间大的缺点,研究了压缩后缀数组技术,把后缀数组索引的大小压缩到了O(n)位,并给出应用压缩后缀... 目前,搜索引擎的核心模块(索引器)均采用倒排文件结构,对短语查询的准确率较低。该文引入后缀数组技术进行全文索引,为克服全文索引时占用空间大的缺点,研究了压缩后缀数组技术,把后缀数组索引的大小压缩到了O(n)位,并给出应用压缩后缀数组索引的步骤和核心操作伪代码。对比实验表明,基于压缩后缀数组的索引比传统倒排文件索引的短语查准率提高了近20%。 展开更多
关键词 压缩后缀数组 倒排文件 后缀数组 搜索引擎
下载PDF
基于后缀树的Web论坛信息抽取 被引量:3
20
作者 肖建鹏 张来顺 +1 位作者 任星 宋晓光 《计算机工程与设计》 CSCD 北大核心 2008年第7期1675-1677,共3页
针对现有网上论坛信息抽取的不足,提出一种基于后缀树的论坛信息抽取方法。将标准化后的HTML文档转换为后缀树,查找出其中的重复模式并产生分装器,将分装器转换为NFA(非确定型有穷自动机)达到抽取论坛信息的目的。该方法运用构造后缀树... 针对现有网上论坛信息抽取的不足,提出一种基于后缀树的论坛信息抽取方法。将标准化后的HTML文档转换为后缀树,查找出其中的重复模式并产生分装器,将分装器转换为NFA(非确定型有穷自动机)达到抽取论坛信息的目的。该方法运用构造后缀树的技术来抽取论坛信息,较好地解决了现有的抽取方法准确性较差、通用性不强的问题。实验结果表明,该方法具有较高的准确性和实用性。 展开更多
关键词 信息抽取 分装器 后缀 重复模式 论坛
下载PDF
上一页 1 2 72 下一页 到第
使用帮助 返回顶部