期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于规则和统计的日语分词和词性标注的研究 被引量:4
1
作者 姜尚仆 陈群秀 《中文信息学报》 CSCD 北大核心 2010年第1期117-122,共6页
日语分词和词性标注是以日语为源语言的机器翻译等自然语言处理工作的第一步。该文提出了一种基于规则和统计的日语分词和词性标注方法,使用基于单一感知器的联合分词和词性标注算法作为基本框架,在其中加入了基于规则的词语的邻接属性... 日语分词和词性标注是以日语为源语言的机器翻译等自然语言处理工作的第一步。该文提出了一种基于规则和统计的日语分词和词性标注方法,使用基于单一感知器的联合分词和词性标注算法作为基本框架,在其中加入了基于规则的词语的邻接属性作为特征。在小规模测试集上的实验结果表明,这种方法分词的F值达到了98.2%,分词加词性标注的F值达到了94.8%。该文所采用的方法已经成功应用到日汉机器翻译系统中。 展开更多
关键词 人工智能 机器翻译 日汉机器翻译系统 日语分词 日语词性标注 联合分词
下载PDF
基于“讲述中国故事”日语文本的专用分词词表构建研究——以《人民网日文版》为例
2
作者 谭元昌 吴雨 《现代语言学》 2024年第8期489-495,共7页
用日语讲述中国故事、传播中国声音是面向日本构建中国国际形象的重要一环,也是国内日语教育的主要目标之一。《人民网日文版》正是国家对日宣传的重要媒介,可用作培养讲述中国故事日语人才的教学资源。为分析该媒体的对日新闻文本中国... 用日语讲述中国故事、传播中国声音是面向日本构建中国国际形象的重要一环,也是国内日语教育的主要目标之一。《人民网日文版》正是国家对日宣传的重要媒介,可用作培养讲述中国故事日语人才的教学资源。为分析该媒体的对日新闻文本中国形象宣传现状,充分挖掘其教育教学功能,收集《人民网日文本》的新闻文本并构建语料库开展量化分析,是较为有效的研究路径。准确的分词结果是量化分析日语语料的前提,但研究发现,目前的日语分词工具难以处理中国故事日语文本的精确分词,将严重影响分析结论的可靠性。因此,本研究抽取《人民网日文版》新闻文本中与中国社会、经济、文化和科技等相关的日语表述,构建适用于中国故事日语文本的专用分词词表,并评测该词表的实用效果。Telling China’s story and spreading China’s voice in Japanese are crucial for shaping China’s international image in Japan and are also one of the primary goals of domestic Japanese language education. The People’s Daily Japanese Edition is an important medium for China’s stories towards Japan and can serve as a valuable resource for training Japanese language talents to tell China’s story. To analyze the current state of China’s image publicity in this media’s news texts and to fully exploit its educational functions, collecting and constructing a corpus of these news texts for quantitative analysis is an effective research approach. Accurate word segmentation is a prerequisite for the quantitative analysis of Japanese corpora. However, research has found that current Japanese word segmentation tools struggle to precisely segment texts related to China’s story, which significantly affects the reliability of the analysis results. Therefore, this study extracts Japanese expressions related to Chinese society, economy, culture, and technology from the People’s Daily Japanese Edition news texts, constructs a custom segmentation word dictionary for these texts, and evaluates the accuracy and practicality of this dictionary. 展开更多
关键词 讲好中国故事 日语文本 日语分词 词表构建 人民网日文版
下载PDF
日语文本语料库的开发与利用 被引量:2
3
作者 耿治萌 钟春琳 刘玉琴 《中国教育信息化(高教职教)》 2015年第1期58-60,共3页
大连理工大学软件学院日语实验室创建的日语文本语料库JTCH(Japanese Text Corpus Handler)利用sen日语分词技术,以NHK、朝日新闻为主要文章数据来源,通过一系列搜索算法,对文章进行句子分析、数据分析和统计处理。为日语学习、教学以... 大连理工大学软件学院日语实验室创建的日语文本语料库JTCH(Japanese Text Corpus Handler)利用sen日语分词技术,以NHK、朝日新闻为主要文章数据来源,通过一系列搜索算法,对文章进行句子分析、数据分析和统计处理。为日语学习、教学以及科研提供了具有例句查找、数据统计和语句分析等多种功能的学习平台。 展开更多
关键词 文本语料库 数据分析 日语分词 日语搜索
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部