期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
关于设立源点词、中间词、临界词和终点词的思考——以语气词为例
1
作者 王珏 《对外汉语研究》 2014年第1期59-71,共13页
鉴于已有描写语法化过程的术语不足,本文建议增加“中间词”“临界词”两个新术语。本文还讨论了新术语系统对语法化过程的研究可能带来三个便利:一是有利于归纳语法化过程的类型,二是有利于细致刻画语法化过程,三是有利于认识源点... 鉴于已有描写语法化过程的术语不足,本文建议增加“中间词”“临界词”两个新术语。本文还讨论了新术语系统对语法化过程的研究可能带来三个便利:一是有利于归纳语法化过程的类型,二是有利于细致刻画语法化过程,三是有利于认识源点词、临界词的特点。最后分类讨论了语气词源点词的源义特征。 展开更多
关键词 源点 临界词 中间 终点 语气
原文传递
SegT:一个实用的藏文分词系统 被引量:25
2
作者 刘汇丹 诺明花 +2 位作者 赵维纳 吴健 贺也平 《中文信息学报》 CSCD 北大核心 2012年第1期97-103,共7页
在分析现有藏文分词方法的基础上,该文重点研究了藏文分词中的格助词分块、临界词识别、词频统计、交集型歧义检测和消歧等问题并提出了相应的方法。应用这些方法,设计实现了一个藏文分词系统SegT。该系统采用格助词分块并识别临界词,... 在分析现有藏文分词方法的基础上,该文重点研究了藏文分词中的格助词分块、临界词识别、词频统计、交集型歧义检测和消歧等问题并提出了相应的方法。应用这些方法,设计实现了一个藏文分词系统SegT。该系统采用格助词分块并识别临界词,然后采用最大匹配方法分词,并进行紧缩词识别。系统采用双向切分检测交集型歧义字段并使用预先统计的词频信息进行消歧。实验结果表明,该文设计的格助词分块和临界词识别方法可以将分词速度提高15%左右,但格助词分块对分词效果没有明显提高或降低。系统最终分词正确率为96.98%,基本达到了实用的水平。 展开更多
关键词 藏文分 格助 临界词识别 频统计 藏文信息处理 中文信息处理
下载PDF
基于单字特征和搜索引擎的新词识别 被引量:2
3
作者 苏宁 惠子敬 刘娟 《武汉大学学报(理学版)》 CAS CSCD 北大核心 2010年第6期704-710,共7页
新词识别是影响搜索准确率以及速率的重要因素.本文提出了一种基于统计模型和词语搭配的中文新词自动识别方法.采用条件概率的方法提取单字词搭配特征和临界词特征,并采用层次结构实现新词定位以及识别.首先采用双向最大匹配相结合的方... 新词识别是影响搜索准确率以及速率的重要因素.本文提出了一种基于统计模型和词语搭配的中文新词自动识别方法.采用条件概率的方法提取单字词搭配特征和临界词特征,并采用层次结构实现新词定位以及识别.首先采用双向最大匹配相结合的方法对文本进行词法粗切分,然后根据单字词搭配得到候选新词的位置,用临界词方法确定候选新词的边界,采用改进Nagao串频统计方法对新词候选词在本文内进行重复串统计,对于只在文中出现一次的新词则借助搜索引擎进行确定.对新浪网近期的网络文章进行测试,结果表明,基于本文方法设计的系统可以识别不同领域的新词,在低频词、较长的词以及新词语搭配方面取得了良好的效果.单字词搭配检查发现新词位置综合指标F值达到96.8%. 展开更多
关键词 识别 单字 临界词 搭配抽取 搜索引擎
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部