期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
探析中文信息处理中的“词”及分词标准问题——试比较《分词规范》与《正词法》
1
作者 郑博 《南宁职业技术学院学报》 2011年第2期72-75,共4页
《分词规范》与《正词法》1在中文信息处理中有着同样重要作用,两者既有各自的侧重点又存在一些共性的,两者所规定的词均与"语法词"、"词汇词"存在着联系,但《正词法》规定的分词连写方式并不能够解决中文信息处理... 《分词规范》与《正词法》1在中文信息处理中有着同样重要作用,两者既有各自的侧重点又存在一些共性的,两者所规定的词均与"语法词"、"词汇词"存在着联系,但《正词法》规定的分词连写方式并不能够解决中文信息处理的分词问题,只有充分利用《正词法》的研究成果,再结合中文信息处理的特点,才能使《分词规范》更加完善,促进中文信息处理分词问题的解决。 展开更多
关键词 中文信息处理 分词单位 分词连写 分词标准
下载PDF
汉语真需要词间空格吗——对汉语分词连写献疑 被引量:4
2
作者 熊文新 《语言科学》 CSSCI 北大核心 2014年第6期655-669,共15页
汉语分词是中文信息处理的一项基础性工作。为避免人工阅读或机器处理时的分词歧义和未登录词难以识别的问题,有专家建议写作时在汉语词之间添加空格。文章从语言学本体研究、语言使用以及语言工程等不同角度对传统观念下的汉语分词存... 汉语分词是中文信息处理的一项基础性工作。为避免人工阅读或机器处理时的分词歧义和未登录词难以识别的问题,有专家建议写作时在汉语词之间添加空格。文章从语言学本体研究、语言使用以及语言工程等不同角度对传统观念下的汉语分词存在的困难进行探讨,指出汉语分词在词的定义、群众语感以及分词规范、词表确定及工程应用等方面都存在不确定及不一致等因素。近年汉语自动分词处理不纠缠于词的确切定义,以字组词,针对标注语料和网络上带有丰富结构信息的海量文本,利用机器学习方法对汉语"切分单位"的标注取得了较好的进展。针对基础性的汉语分词规范,从语言规划的政策性、科学性及引导性角度提出建议,最后指出结合语言学指导和数据驱动的机器学习策略,可望为实现汉语自动分词的准确性和适应性提升服务。 展开更多
关键词 汉语分词 词间空格 分词标准 中文信息处理 语言规划
下载PDF
少数民族语言分词技术评测数据集MLWS2021 被引量:1
3
作者 赵小兵 高璐 +5 位作者 高定国 包乌格徳勒 米尔阿迪力江·麦麦提 刘洋 才智杰 孙媛 《中国科学数据(中英文网络版)》 CSCD 2022年第2期2-10,共9页
依据蒙古文、藏文和维吾尔文词汇的构词规律和特点,制定适合计算机信息处理的蒙古文、藏文和维吾尔文分词评测标准,构建蒙古文、藏文和维吾尔文的分词标注语料,形成标准评测数据集(MLWS2021),为解决自动分词、词性标注、信息检索、语料... 依据蒙古文、藏文和维吾尔文词汇的构词规律和特点,制定适合计算机信息处理的蒙古文、藏文和维吾尔文分词评测标准,构建蒙古文、藏文和维吾尔文的分词标注语料,形成标准评测数据集(MLWS2021),为解决自动分词、词性标注、信息检索、语料库构建等研究课题提供依据。MLWS2021共包含2.5万句藏文、6.5万句蒙古文、6.5万句维吾尔文。本评测数据集将面向社会,提供免费评测服务,逐步建成权威的少数民族语言分词技术评测平台,推动少数民族语言信息处理技术的发展。 展开更多
关键词 少数民族语言 分词标注 评测数据集 分词标准规范
下载PDF
基于层叠CRF模型的词结构分析 被引量:7
4
作者 方艳 周国栋 《中文信息学报》 CSCD 北大核心 2015年第4期1-7,24,共8页
传统的中文分词就是识别出每个词的边界,它忽略了汉语中词与短语分界不清这一特点。在理论上,语言学家对词边界的确定往往各持己见,各语料库的分词标准不能统一,在实践中也不能完全满足具体应用的需求。该文给出了基于层叠CRF模型的词... 传统的中文分词就是识别出每个词的边界,它忽略了汉语中词与短语分界不清这一特点。在理论上,语言学家对词边界的确定往往各持己见,各语料库的分词标准不能统一,在实践中也不能完全满足具体应用的需求。该文给出了基于层叠CRF模型的词结构自动分析方法,能够以较高的精确度获得词的边界信息和内部结构信息。相比于传统的分词,词的结构分析更加符合汉语词法与句法边界模糊的事实,解决了语料库标准的不一致性以及应用的不同需求。 展开更多
关键词 中文分词 内部结构 分词标准 层叠CRF
下载PDF
Perspectives of Chunk Analyses
5
作者 LIN Wei-yan 《Sino-US English Teaching》 2014年第6期447-453,共7页
This paper reviews three main perspectives of chunk analyses: traditional phraseological, psycholinguistic, and corpus linguistic perspectives. Traditional phraseological perspective focuses on syntactic and semantic... This paper reviews three main perspectives of chunk analyses: traditional phraseological, psycholinguistic, and corpus linguistic perspectives. Traditional phraseological perspective focuses on syntactic and semantic aspects of chunks and its most important criteria of chunk identifications and classifications are compositionality and frozenness/fixedness. Psycholinguistic perspective focuses on the psychological salience of chunks and its most important criterion of identifying a chunk is whether it is processed as a whole unit. Corpus linguistic perspective focuses on frequencies of chunks and its identification of chunks is done on the basis of frequency counts. All of the three perspectives have tapped into the phenomenon of multi-word combinations and yielded fruitful findings on the use of chunks in aspects of quantitative, syntactic, semantic, functional, and psychological features; however, each has their pros and cons 展开更多
关键词 phraseological tendency CHUNK PERSPECTIVE
下载PDF
Morphologic observation and classification criteria of atretic follicles in guinea pigs 被引量:2
6
作者 Wei WANG Hong-lin LIU Wei TIAN Fen-fen ZHANG Yan GONG Jin-wei CHEN Da-gan MAO Fang-xiong SHI 《Journal of Zhejiang University-Science B(Biomedicine & Biotechnology)》 SCIE CAS CSCD 2010年第5期307-314,共8页
There is a lack of appropriate classification criteria for the determination of atretic follicles in guinea pigs.In the present study,new criteria were established based on the latest morphologic criteria for cell dea... There is a lack of appropriate classification criteria for the determination of atretic follicles in guinea pigs.In the present study,new criteria were established based on the latest morphologic criteria for cell death proposed by the Nomenclature Committee on Cell Death(NCCD) in 2009.Ovaries of guinea pigs were sampled on different stages of estrous cycle,and the morphologic observations of atretic follicles were investigated in serial sections.The results showed that the process of follicular atresia could be classified into four continuous stages:(1) the granulosa layer became loose,and some apoptotic bodies began to appear;(2) the granulosa cells were massively eliminated;(3) the theca interna cells differentiated;and(4) the residual follicular cells degenerated.In addition,the examination revealed that these morphologic criteria were accurate and feasible.In conclusion,this study provides new criteria for the classification of atretic follicles in guinea pigs,and this knowledge can inform future research in the area. 展开更多
关键词 Guinea pig Follicular atresia Classification criteria
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部