期刊文献+
共找到144篇文章
< 1 2 8 >
每页显示 20 50 100
湖北仙桃话“里”类方位词“■底tou^(35).ti”及类型学考察
1
作者 黄芳 《湖北师范大学学报(哲学社会科学版)》 2023年第6期42-48,共7页
“■底tou^(35).ti”是湖北仙桃话中常用的“里”类方位词。双音节方位词“■底”与单音节方位词“底”相比,方所义更明显,具有单用功能以及鲜明的处所词特征。方位词“■底”来源于身体词“■”,是汉语“里”类方位词的一个重要来源。... “■底tou^(35).ti”是湖北仙桃话中常用的“里”类方位词。双音节方位词“■底”与单音节方位词“底”相比,方所义更明显,具有单用功能以及鲜明的处所词特征。方位词“■底”来源于身体词“■”,是汉语“里”类方位词的一个重要来源。类型学考察发现:仙桃话“里”类方位词表现出处于汉语南北方言(官话与非官话)交汇地带的地域特点;身体词“■”用作方位词的现象在汉语南方方言中也普遍存在;汉藏语系语言中也存在这种现象。 展开更多
关键词 仙桃话 “■底” “里”类方位词 身体词“■” 类型学考察
下载PDF
网络语言中类后缀“界”的构词
2
作者 张嘉嘉 李欢 《辽东学院学报(社会科学版)》 2023年第1期100-105,共6页
在网络语言中,和食物相关的“X界”的生成方式除直接构词外,还有缩略与杂糅、合并与简称、谐音构词、仿拟构词和类推构词五种。“X界”的构词能力强,涉及范围广,偏重双音化和多音化,具有即时、细化、丰富的特点。“X界”的语义色彩既庄... 在网络语言中,和食物相关的“X界”的生成方式除直接构词外,还有缩略与杂糅、合并与简称、谐音构词、仿拟构词和类推构词五种。“X界”的构词能力强,涉及范围广,偏重双音化和多音化,具有即时、细化、丰富的特点。“X界”的语义色彩既庄重又诙谐、既严肃又活泼。“X界”中蕴含着群体心理认同和个体情感的社会心理,带有时代和社会文化生活的印记。 展开更多
关键词 网络语言 类后缀 “界” 构词
下载PDF
一种基于后缀数组的无词典分词方法 被引量:14
3
作者 张长利 赫枫龄 左万利 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2004年第4期548-553,共6页
提出一种基于后缀数组的无词典分词算法.该算法通过后缀数组和利用散列表获得汉字的结合模式,通过置信度筛选词.实验表明,在无需词典和语料库的前提下,该算法能够快速准确地抽取文档中的中、高频词.适用于对词条频度敏感、对计算速度要... 提出一种基于后缀数组的无词典分词算法.该算法通过后缀数组和利用散列表获得汉字的结合模式,通过置信度筛选词.实验表明,在无需词典和语料库的前提下,该算法能够快速准确地抽取文档中的中、高频词.适用于对词条频度敏感、对计算速度要求高的中文信息处理. 展开更多
关键词 无词典分词 数组 文档 散列表 计算速度 算法 中文信息处理 法能 频度 实验
下载PDF
说“X式”——兼论汉语词汇的语法化过程 被引量:45
4
作者 张谊生 《上海师范大学学报(哲学社会科学版)》 2002年第3期96-105,共10页
本文从性质特征、句法功能和表义方式三方面对附加型“X式”进行考察和分析。本文认为,“X式”在功能上接近于区别词又不同于区别词,是一种融词汇单位、语法形式为一身,集交际语境、百科常识为一体的特殊语言形式。作为一种语法化中的... 本文从性质特征、句法功能和表义方式三方面对附加型“X式”进行考察和分析。本文认为,“X式”在功能上接近于区别词又不同于区别词,是一种融词汇单位、语法形式为一身,集交际语境、百科常识为一体的特殊语言形式。作为一种语法化中的“词—语连续统”,“X式”的发展反映了当代汉语表达方式日趋灵活多样的新趋势。 展开更多
关键词 "X式" 词缀 类词缀 比况助词 准比况助词 性质特征 汉语 词汇 语法化
下载PDF
利用扩展标记集的词结构分析 被引量:2
5
作者 孙静 方艳 +1 位作者 丁彬 周国栋 《中文信息学报》 CSCD 北大核心 2014年第5期39-45,82,共8页
该文给出了一种与传统分词不同的词法分析选择,提出了一种利用扩展标记集来实现词内部结构分析的方法。首先阐述了词的内部结构特点,把结构中的前后缀视为特殊的词,进而通过识别出每一个词的前后缀来识别词的内部结构。方法是把词内部... 该文给出了一种与传统分词不同的词法分析选择,提出了一种利用扩展标记集来实现词内部结构分析的方法。首先阐述了词的内部结构特点,把结构中的前后缀视为特殊的词,进而通过识别出每一个词的前后缀来识别词的内部结构。方法是把词内部结构识别问题转换成序列标注问题,通过扩展标记集,采用CRF模型来实现词的内部结构分析。最终实验表明,无论是在总体性能上,还是在各层结构的识别上都取得了较高的准确度。 展开更多
关键词 扩展标记集 词结构分析 前后缀 序列标注问题
下载PDF
量词"头"的历时考察及其他称量动物的量词 被引量:17
6
作者 叶桂郴 《古汉语研究》 CSSCI 北大核心 2004年第4期68-73,共6页
语言在历史演变中需要遵循下面两个原则:经济原则和准确原则。"个"和"头"是汉语量词演变过程最 能体现上述原则的两个量词。即"个"的泛化和"头"的分化。本文通过"头"的分化来考察称... 语言在历史演变中需要遵循下面两个原则:经济原则和准确原则。"个"和"头"是汉语量词演变过程最 能体现上述原则的两个量词。即"个"的泛化和"头"的分化。本文通过"头"的分化来考察称量动物这一组量词。 展开更多
关键词 量词 他称 汉语 历时 经济原则 准确 语言 历史演变 演变过程 泛化
下载PDF
多语种网络文本快速新词抽取 被引量:2
7
作者 刘冰洋 刘倩 +2 位作者 张瑾 刘欣然 程学旗 《中文信息学报》 CSCD 北大核心 2014年第2期78-84,共7页
从网络文本中提取新词是网络信息处理中的一个重要问题,在信息检索、文本挖掘、词典编纂、中文分词等领域中都有重要应用。本文提出了一种与语言无关的快速新词提取算法,首先针对后缀树的数据结构将多语言文本进行统一编码,然后使用改... 从网络文本中提取新词是网络信息处理中的一个重要问题,在信息检索、文本挖掘、词典编纂、中文分词等领域中都有重要应用。本文提出了一种与语言无关的快速新词提取算法,首先针对后缀树的数据结构将多语言文本进行统一编码,然后使用改进的统计方法在双后缀树上以线性时间统计重复串与邻接类别,并计算字符串的整体度,同时通过剪枝大幅度减少计算量,在中、英文语料上较好地实现了新词的抽取及排序。 展开更多
关键词 新词 邻接类别 字符串整体度 后缀树 多语言
下载PDF
基于后缀树词序列核挖掘Web文档 被引量:2
8
作者 傅鹏 张德运 +1 位作者 陈海诠 董皓 《微电子学与计算机》 CSCD 北大核心 2005年第12期4-7,共4页
通过将文档表示为一棵后缀树,文章提出一种基于后缀树索引计算文档相似度的词序列核。首先根据文档的词序列构造出后缀树,然后根据后缀树词序列核计算文档间的相似度,最后利用支持向量机对文档进行分类。理论分析表明后缀树词序列核的... 通过将文档表示为一棵后缀树,文章提出一种基于后缀树索引计算文档相似度的词序列核。首先根据文档的词序列构造出后缀树,然后根据后缀树词序列核计算文档间的相似度,最后利用支持向量机对文档进行分类。理论分析表明后缀树词序列核的计算只与比较文档的长度成线性关系,大大减少了序列核的计算时间。在reuters-21578文档集上将后缀树词序列核与词序列核、多项式核进行比较,实验结果表明在改善速度的同时,后缀树词序列核可达到与词序列核相当的性能,优于多项式核,更适于Web文档挖掘等应用。 展开更多
关键词 核学习方法 词序列核 字符串核 后缀树 WEB挖掘
下载PDF
汉语后缀“子”的范畴化功能 被引量:8
9
作者 杨振兰 《山东大学学报(哲学社会科学版)》 CSSCI 北大核心 2007年第5期42-47,共6页
后缀"子"的范畴化是通过转化相关动作、性状等范畴而实现的,具体事物尤其是其中的工具以及部分特殊人群成为"子"缀词要表达的主要范畴,与同类的"儿""头"相比,在具体与抽象、称人与称物等方面... 后缀"子"的范畴化是通过转化相关动作、性状等范畴而实现的,具体事物尤其是其中的工具以及部分特殊人群成为"子"缀词要表达的主要范畴,与同类的"儿""头"相比,在具体与抽象、称人与称物等方面三者呈现出一定的互补性,但它们有着共同的转喻认知基础。范畴化的"子"表现出语义上的人工性、非常态性等特点。 展开更多
关键词 后缀“子” “子”缀词 范畴化 转喻
下载PDF
一种对英文字符串进行分词的方法 被引量:2
10
作者 邹智敏 郭荷清 高英 《计算机应用研究》 CSCD 北大核心 2007年第7期52-54,共3页
对Aho-Corasick算法略作改变,用一个收词丰富的有优先级的字典构造Aho-Corasick树,并利用它对英文字符串进行字典匹配。对匹配的结果,利用后缀词按优先级排序的特点设计了一个高效的分词算法。实验证明该算法具有高效性。
关键词 字典匹配 英文分词 后缀词
下载PDF
吴闽语进行体和持续体的语法化序列分析 被引量:11
11
作者 蔡国妹 《福建师范大学学报(哲学社会科学版)》 CSSCI 北大核心 2006年第3期157-160,共4页
莆仙方言的进行体和持续体标记来源于处所词,这是吴语和闽语的共同特征。但莆仙方言的这两种体标记来源于处所代词“即、许”,而不是方位后缀或动介词,这又不同于吴语与闽语的其他方言。本文先描写莆仙方言的进行体和持续体特征,然后结... 莆仙方言的进行体和持续体标记来源于处所词,这是吴语和闽语的共同特征。但莆仙方言的这两种体标记来源于处所代词“即、许”,而不是方位后缀或动介词,这又不同于吴语与闽语的其他方言。本文先描写莆仙方言的进行体和持续体特征,然后结合吴闽语其他八种方言的资料,分析进行体和持续体标记的语法化序列,从而观察其演变发展的过程。 展开更多
关键词 进行体 持续体 方位后缀 语法化 吴闽语
下载PDF
杭州方言儿缀词研究 被引量:9
12
作者 徐越 《杭州师范学院学报(社会科学版)》 2002年第2期93-97,共5页
由于历史上宋室南迁等原因 ,杭州话带上了浓厚的官话色彩 ,具有诸多不同于浙江吴语其它方言的特点 ,大量的儿缀词就是其特点之一。现对杭州方言儿缀词的结构、读音、来历以及儿缀词所表示的主要的语法意义和语用意义作一个初步的探讨。
关键词 杭州方言 儿缀 儿缀词
下载PDF
商丘话的子尾[tei]及相关问题 被引量:13
13
作者 张世方 《语言科学》 CSSCI 2008年第5期518-525,共8页
文章考察商丘话子尾及体貌助词"着"的特殊读音[tei]及其变体的来历及演变过程。联系邻近的鲁西南方言的共时差异,认为[tei]除了直接经历由[ts10]声母塞音化,韵母央化、高化并分裂为复韵母这样一个可能的变化路径外,还可能是... 文章考察商丘话子尾及体貌助词"着"的特殊读音[tei]及其变体的来历及演变过程。联系邻近的鲁西南方言的共时差异,认为[tei]除了直接经历由[ts10]声母塞音化,韵母央化、高化并分裂为复韵母这样一个可能的变化路径外,还可能是早期子尾儿化形式的孑遗。体貌助词"着"读[tei],是因为商丘话早期"着"的语音形式与早期子尾读音[ts10]形式相同。同时联系商丘话及周边方言的子尾情况,讨论了晋南方言子尾的演变过程。 展开更多
关键词 商丘话 鲁西南方言 晋南方言 子尾 儿化 体貌助词 “着”
下载PDF
浅谈英语构词法 被引量:16
14
作者 卢春媚 《广州大学学报(社会科学版)》 2002年第3期29-32,共4页
词汇是英语学习者的主要障碍之一。英语构词法可以帮助我们正确辨认单词的词形、词性和理解词意 ,并迅速扩大词汇量 ,是学习英语的有效途径。而在所有构词法中 ,缀合法是构词能力最强的一种 ,它所构成的单词数量最大 ,是英语扩充词汇的... 词汇是英语学习者的主要障碍之一。英语构词法可以帮助我们正确辨认单词的词形、词性和理解词意 ,并迅速扩大词汇量 ,是学习英语的有效途径。而在所有构词法中 ,缀合法是构词能力最强的一种 ,它所构成的单词数量最大 ,是英语扩充词汇的最主要方法 ,被誉为“学习英语的最短最佳的途径”。 展开更多
关键词 英语构词法 缀合构词法 前缀 词根 后缀
下载PDF
量词“头”源流浅探 被引量:15
15
作者 王彤伟 《语言科学》 2005年第3期68-73,共6页
“头”本为名词,表“脑袋”,由此引申为表示“有头之物”的量词。用为量词的时代至迟不晚于汉初之《史记》。量词“头”的称量范围从汉至今多有变化,称量对象也时见新的名物,从量词“头”的基本意义和其所称量的名词之间的关系上来看,... “头”本为名词,表“脑袋”,由此引申为表示“有头之物”的量词。用为量词的时代至迟不晚于汉初之《史记》。量词“头”的称量范围从汉至今多有变化,称量对象也时见新的名物,从量词“头”的基本意义和其所称量的名词之间的关系上来看,主要是替代类的相联关系、相似关系、相约关系。从语法特征上看,先秦两汉时期主要为“名+数+头(量词)”式的结构,明代以后,“数+头(量词)+名”的结构普遍出现,其词汇意义进一步减弱,逐步形成了现代汉语的惯用表达方式。 展开更多
关键词 汉语史 量词 常用词
下载PDF
带后缀三字词的自动识别 被引量:1
16
作者 冯敏萱 方芳 陈小荷 《计算机工程与应用》 CSCD 北大核心 2006年第19期161-163,169,共4页
带后缀的三字词约占三字词总数的17.5%。笔者通过对120万字语料的统计和内省共获得71种能构成三字词的后缀,并分析了这些三字词的组合规律及前缀等上下文特征。运用这些知识,对65万字语料中带后缀的三字词进行识别,精确率和召回率由原来... 带后缀的三字词约占三字词总数的17.5%。笔者通过对120万字语料的统计和内省共获得71种能构成三字词的后缀,并分析了这些三字词的组合规律及前缀等上下文特征。运用这些知识,对65万字语料中带后缀的三字词进行识别,精确率和召回率由原来的85.2%和86.6%分别提高到86.6%和99.7%。 展开更多
关键词 后缀 三字词 中文信息处理 自动识别
下载PDF
试论外来类后缀“门”和“秀” 被引量:3
17
作者 李丽 查中林 《内江师范学院学报》 2009年第5期51-53,共3页
"门"、"秀"作为词缀来源于英语,意义虚化成为类后缀,这种现象在现代汉语里不太常见。"门"、"秀"进入汉语后,经过汉语系统规则的改造,意义逐渐虚化,构词时位置趋于固定,处于汉语构词语素和词缀... "门"、"秀"作为词缀来源于英语,意义虚化成为类后缀,这种现象在现代汉语里不太常见。"门"、"秀"进入汉语后,经过汉语系统规则的改造,意义逐渐虚化,构词时位置趋于固定,处于汉语构词语素和词缀的"中间状态"。 展开更多
关键词 外来词 类后缀
下载PDF
基于树型结构和加权熵的中文高频词提取算法 被引量:1
18
作者 王龙 刘衍珩 +1 位作者 李晓光 官健 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2011年第1期188-192,共5页
提出了一种基于树型结构和加权熵的中文高频词提取算法。简单介绍了中文的树型结构和加权信息熵,详细叙述了算法的原理和设计步骤,并给出了具体的算法描述。实验结果表明,该算法是可行和有效的。
关键词 计算机应用 中文高频词 提取算法 加权熵 前缀树 后缀树
下载PDF
现代汉语“的”字语法功能类别新论 被引量:4
19
作者 钱书新 《南昌大学学报(人文社会科学版)》 北大核心 2006年第1期132-136,共5页
朱德熙先生[1]把“红红的”和“非常便宜的”中的“的”看作相同的类别,认为都是后缀;而把“非常便宜的”与“便宜的”中“的”却看作不同的类别,认为前者是后缀,后者是助词。这一分类忽视了“的”字语法分布的不同层面,具有明显的不足... 朱德熙先生[1]把“红红的”和“非常便宜的”中的“的”看作相同的类别,认为都是后缀;而把“非常便宜的”与“便宜的”中“的”却看作不同的类别,认为前者是后缀,后者是助词。这一分类忽视了“的”字语法分布的不同层面,具有明显的不足。语言事实表明,现代汉语“的”有三种主要的语法功能:作为黏着语素(后缀)、作为独用的语法单位(虚词)、作为所译外语词性的标记。 展开更多
关键词 “的” 功能 黏着语素 虚词 外语词性标记
下载PDF
基于微博的情感新词发现研究 被引量:8
20
作者 王非 《软件》 2015年第11期6-8,共3页
微博作为社交网络的典型应用,每天都有新的富含情感的新词涌现,面向微博短文本的情感新词发现研究成为自然语言处理领域一个新的研究热点。本文提出了一种基于重复串统计的方法抽取候选词串,使用广义后缀树抽取所有可能的候选词串。然... 微博作为社交网络的典型应用,每天都有新的富含情感的新词涌现,面向微博短文本的情感新词发现研究成为自然语言处理领域一个新的研究热点。本文提出了一种基于重复串统计的方法抽取候选词串,使用广义后缀树抽取所有可能的候选词串。然后利用本文提出的相关统计特征:候选词串的互信息与邻接信息熵等对候选词串进行筛选,实现新词过滤。 展开更多
关键词 微博 新词发现 新词过滤 后缀树
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部