期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
7
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
语言数据资源建设中的关键问题及对策
被引量:
2
1
作者
钱小飞
《语料库语言学》
2021年第2期94-105,共12页
语言数据资源包括语料库和语言知识库,是语言服务和语言信息处理的重要支撑。本文分析了我国语言数据资源建设中存在的质量问题、发展不平衡问题、规范与评价问题、版权与共享问题,以及学科建设问题,并从理论建设、项目规划、管理与支...
语言数据资源包括语料库和语言知识库,是语言服务和语言信息处理的重要支撑。本文分析了我国语言数据资源建设中存在的质量问题、发展不平衡问题、规范与评价问题、版权与共享问题,以及学科建设问题,并从理论建设、项目规划、管理与支持、规范与标准建设、版权研究、团队合作与人才培养等角度提出了14条建议,以推进我国的语言数据资源建设,弥补现有短板,面向未来语言学理论研究和应用发展的需求。
展开更多
关键词
语言数据资源
建设
宏观问题
发展建议
下载PDF
职称材料
基于语言资源理念的语言规划——以“语言资源监测研究”和“中国语言资源有声数据库建设”为例
被引量:
28
2
作者
王铁琨
《陕西师范大学学报(哲学社会科学版)》
CSSCI
北大核心
2010年第6期58-66,共9页
语言不仅是一种工具,更是一种有价值、可利用、出效益、能发展的社会资源。它可以孕育新的职业和产业,并转化为生产力。保护语言资源,解决语言问题,维护语言权利是三个不可分割的工作方面,需统筹兼顾、协调发展。国外语言资源建设和语...
语言不仅是一种工具,更是一种有价值、可利用、出效益、能发展的社会资源。它可以孕育新的职业和产业,并转化为生产力。保护语言资源,解决语言问题,维护语言权利是三个不可分割的工作方面,需统筹兼顾、协调发展。国外语言资源建设和语言监测已于上世纪提上议程,中国语言资源问题直到本世纪初才受到关注,成立了中国语言资源联盟;教育部语言文字信息管理司与各高校合作,共建国家语言资源监测与研究中心,建立大规模动态流通语料库,既进行资源建设又进行理论研究。今后还应加强语言资源有声数据库的建设。
展开更多
关键词
语言
资源
语言
规划
语言
资源
监测
语言
观
中国
语言
资源
数据
库
下载PDF
职称材料
综合型语言知识库的建设与利用
被引量:
29
3
作者
俞士汶
段慧明
+1 位作者
朱学锋
张化瑞
《中文信息学报》
CSCD
北大核心
2004年第5期1-10,共10页
语言知识库的规模和质量决定了自然语言处理系统的成败。经过 18年的努力 ,北京大学计算语言学研究所已经积累了一系列颇具规模、质量上乘的语言数据资源 :现代汉语语法信息词典 ,大规模基本标注语料库 ,现代汉语语义词典 ,中文概念词...
语言知识库的规模和质量决定了自然语言处理系统的成败。经过 18年的努力 ,北京大学计算语言学研究所已经积累了一系列颇具规模、质量上乘的语言数据资源 :现代汉语语法信息词典 ,大规模基本标注语料库 ,现代汉语语义词典 ,中文概念词典 ,不同单位对齐的双语语料库 ,多个专业领域的术语库 ,现代汉语短语结构规则库 ,中国古代诗词语料库等等。本项研究将把这些语言数据资源集成为一个综合型的语言知识库。集成不同的语言数据资源时 ,必须克服它们之间的“缝隙”。规划中的综合型语言知识库除了有统一的友好的使用界面和方便的应用程序接口外 ,还将提供支持知识挖掘的工具软件 ,促使现有的语言数据资源从初级产品形式向深加工产品形式不断发展 ;提供多种形式的知识传播和信息服务机制 ,让综合型语言知识库为语言信息处理研究、语言学本体研究和语言教学提供全方位的。
展开更多
关键词
计算机应用
中文信息处理
语言
处理
语言
知识库
语言数据资源
电子词典
语料库
下载PDF
职称材料
罗塞塔石碑与机器翻译
被引量:
7
4
作者
冯志伟
《外语学刊》
CSSCI
北大核心
2020年第1期1-17,共17页
解读Rosetta石碑依据的平行语料库方法是非常具有启发性的,这样的方法现在已经成为当代机器翻译方法的基础,它既是统计机器翻译方法的基础,也是神经机器翻译方法的基础。神经机器翻译需要大规模语言数据资源的支持,语言数据资源的匮乏...
解读Rosetta石碑依据的平行语料库方法是非常具有启发性的,这样的方法现在已经成为当代机器翻译方法的基础,它既是统计机器翻译方法的基础,也是神经机器翻译方法的基础。神经机器翻译需要大规模语言数据资源的支持,语言数据资源的匮乏是当前神经机器翻译面临的一个难题。
展开更多
关键词
Rosetta石碑
语言数据资源
统计机器翻译
噪声信道模型
神经机器翻译
神经网络
数据
资源
匮乏
下载PDF
职称材料
下一站在哪里?
被引量:
3
5
作者
董振东
董强
郝长伶
《中文信息学报》
CSCD
北大核心
2011年第6期3-11,共9页
该文简要回顾了中文信息处理30年的主要成果,以及近20年来中文信息处理中的计算语言学研究的状况。该文分析了汉语与英语的主要差异,讨论了语言的共性与个性。该文表示了对于中文大规模语料的词性标注、树库建设的质疑。该文提出未来的...
该文简要回顾了中文信息处理30年的主要成果,以及近20年来中文信息处理中的计算语言学研究的状况。该文分析了汉语与英语的主要差异,讨论了语言的共性与个性。该文表示了对于中文大规模语料的词性标注、树库建设的质疑。该文提出未来的中文语言资源建设的一些设想,期望一些新的尝试,提出以语义取代现有的句法,以深度标注取代现有的浅层标注,具体将包括标注的目标的定点化,内容的多样化,步骤的阶段化,标注人员的大众化、群体化。文章还提出了未来发展的关键点:技术的融合,人本计算。
展开更多
关键词
中文信息处理
语言数据资源
语料标注
句法
语义
下载PDF
职称材料
从语料记音看当代常德方言吟诵的传承与发展
6
作者
方雨露
熊慧
马连菊
《美化生活》
2021年第9期22-24,共3页
常德市位于湖南省的西北部,其方言归属于北方方言分支的西南官话,是湖南西南官话的一个重要代表。而常德方言的吟诵语料记音与常德地区的本土文化紧密结合,具有其独特的地域文化价值,其语料研究价值和潜在历史文化价值有待进一步挖掘。...
常德市位于湖南省的西北部,其方言归属于北方方言分支的西南官话,是湖南西南官话的一个重要代表。而常德方言的吟诵语料记音与常德地区的本土文化紧密结合,具有其独特的地域文化价值,其语料研究价值和潜在历史文化价值有待进一步挖掘。在普通话全面推广的时代背景下,地方方言的生存空间受到其官方语言的强势侵蚀,其方言的传承与发展问题迫在眉睫。围绕相关问题,本文对常德方言吟诵进行系统探讨,探求其保存现有的常德方言语料吟诵记音与建设语言资源有声数据库的有效途径,对探索常德方言语料记音的创新发展道路起到一定的示范启发作用。
展开更多
关键词
常德方言
语料记音
吟诵
语言
资源
有声
数据
库
下载PDF
职称材料
面向计算的构式研究:现状、问题与展望
7
作者
詹卫东
王佳骏
《语言学研究》
2022年第1期39-51,共13页
本文首先概要介绍面向计算的构式相关研究工作,包括面向计算的形式化构式语法理论模型的构建,以及面向计算的构式语言数据资源建设工作。在此基础上,结合我们所做的现代汉语构式知识库建设和构式语料标注工作,本文提出将构式的句法语义...
本文首先概要介绍面向计算的构式相关研究工作,包括面向计算的形式化构式语法理论模型的构建,以及面向计算的构式语言数据资源建设工作。在此基础上,结合我们所做的现代汉语构式知识库建设和构式语料标注工作,本文提出将构式的句法语义分析与传统的“词库+短语规则”语言知识系统融合的思路,并指出当前面向自然语言处理的构式研究的重点任务是构式数据资源的建设。
展开更多
关键词
构式知识库
语料库标注
形式化表征
语言数据资源
建设
自然
语言
处理
原文传递
题名
语言数据资源建设中的关键问题及对策
被引量:
2
1
作者
钱小飞
机构
上海大学文学院
出处
《语料库语言学》
2021年第2期94-105,共12页
基金
国家语委“十三五”科研规划一般项目“中国语言信息化政策研究文献数据库建设”(YB135-98)资助
文摘
语言数据资源包括语料库和语言知识库,是语言服务和语言信息处理的重要支撑。本文分析了我国语言数据资源建设中存在的质量问题、发展不平衡问题、规范与评价问题、版权与共享问题,以及学科建设问题,并从理论建设、项目规划、管理与支持、规范与标准建设、版权研究、团队合作与人才培养等角度提出了14条建议,以推进我国的语言数据资源建设,弥补现有短板,面向未来语言学理论研究和应用发展的需求。
关键词
语言数据资源
建设
宏观问题
发展建议
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
H08 [语言文字—语言学]
下载PDF
职称材料
题名
基于语言资源理念的语言规划——以“语言资源监测研究”和“中国语言资源有声数据库建设”为例
被引量:
28
2
作者
王铁琨
机构
教育部语言文字信息管理司
出处
《陕西师范大学学报(哲学社会科学版)》
CSSCI
北大核心
2010年第6期58-66,共9页
文摘
语言不仅是一种工具,更是一种有价值、可利用、出效益、能发展的社会资源。它可以孕育新的职业和产业,并转化为生产力。保护语言资源,解决语言问题,维护语言权利是三个不可分割的工作方面,需统筹兼顾、协调发展。国外语言资源建设和语言监测已于上世纪提上议程,中国语言资源问题直到本世纪初才受到关注,成立了中国语言资源联盟;教育部语言文字信息管理司与各高校合作,共建国家语言资源监测与研究中心,建立大规模动态流通语料库,既进行资源建设又进行理论研究。今后还应加强语言资源有声数据库的建设。
关键词
语言
资源
语言
规划
语言
资源
监测
语言
观
中国
语言
资源
数据
库
Keywords
language resources
language planning
language resources monitoring
view of language
chi- nese language resources database
分类号
H002 [语言文字—语言学]
下载PDF
职称材料
题名
综合型语言知识库的建设与利用
被引量:
29
3
作者
俞士汶
段慧明
朱学锋
张化瑞
机构
北京大学计算语言学研究所
出处
《中文信息学报》
CSCD
北大核心
2004年第5期1-10,共10页
基金
国家 8 6 3计划资助项目 (2 0 0 1AA114 2 10
2 0 0 2AA1170 10 )
国家自然科学基金资助项目 (6 0 1730 0 5 )
文摘
语言知识库的规模和质量决定了自然语言处理系统的成败。经过 18年的努力 ,北京大学计算语言学研究所已经积累了一系列颇具规模、质量上乘的语言数据资源 :现代汉语语法信息词典 ,大规模基本标注语料库 ,现代汉语语义词典 ,中文概念词典 ,不同单位对齐的双语语料库 ,多个专业领域的术语库 ,现代汉语短语结构规则库 ,中国古代诗词语料库等等。本项研究将把这些语言数据资源集成为一个综合型的语言知识库。集成不同的语言数据资源时 ,必须克服它们之间的“缝隙”。规划中的综合型语言知识库除了有统一的友好的使用界面和方便的应用程序接口外 ,还将提供支持知识挖掘的工具软件 ,促使现有的语言数据资源从初级产品形式向深加工产品形式不断发展 ;提供多种形式的知识传播和信息服务机制 ,让综合型语言知识库为语言信息处理研究、语言学本体研究和语言教学提供全方位的。
关键词
计算机应用
中文信息处理
语言
处理
语言
知识库
语言数据资源
电子词典
语料库
Keywords
computer application
Chinese information processing
natural language processing
language data resources
language knowledge-base
electronic dictionary
corpus
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
罗塞塔石碑与机器翻译
被引量:
7
4
作者
冯志伟
机构
杭州师范大学
出处
《外语学刊》
CSSCI
北大核心
2020年第1期1-17,共17页
文摘
解读Rosetta石碑依据的平行语料库方法是非常具有启发性的,这样的方法现在已经成为当代机器翻译方法的基础,它既是统计机器翻译方法的基础,也是神经机器翻译方法的基础。神经机器翻译需要大规模语言数据资源的支持,语言数据资源的匮乏是当前神经机器翻译面临的一个难题。
关键词
Rosetta石碑
语言数据资源
统计机器翻译
噪声信道模型
神经机器翻译
神经网络
数据
资源
匮乏
Keywords
Rosetta Stone
data resource of languages
Statistic Machine Translation
noisy channel model
Neural Machine Translation
neural network
poverty of data resources
分类号
H319.5 [语言文字—英语]
下载PDF
职称材料
题名
下一站在哪里?
被引量:
3
5
作者
董振东
董强
郝长伶
机构
中科院计算机与语言工程中心
Canada Keentime Inc.
出处
《中文信息学报》
CSCD
北大核心
2011年第6期3-11,共9页
文摘
该文简要回顾了中文信息处理30年的主要成果,以及近20年来中文信息处理中的计算语言学研究的状况。该文分析了汉语与英语的主要差异,讨论了语言的共性与个性。该文表示了对于中文大规模语料的词性标注、树库建设的质疑。该文提出未来的中文语言资源建设的一些设想,期望一些新的尝试,提出以语义取代现有的句法,以深度标注取代现有的浅层标注,具体将包括标注的目标的定点化,内容的多样化,步骤的阶段化,标注人员的大众化、群体化。文章还提出了未来发展的关键点:技术的融合,人本计算。
关键词
中文信息处理
语言数据资源
语料标注
句法
语义
Keywords
Chinese information processing
linguistic data resources
annotation
syntax
semantics
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
从语料记音看当代常德方言吟诵的传承与发展
6
作者
方雨露
熊慧
马连菊
机构
湖南文理学院文史与法学学院
出处
《美化生活》
2021年第9期22-24,共3页
文摘
常德市位于湖南省的西北部,其方言归属于北方方言分支的西南官话,是湖南西南官话的一个重要代表。而常德方言的吟诵语料记音与常德地区的本土文化紧密结合,具有其独特的地域文化价值,其语料研究价值和潜在历史文化价值有待进一步挖掘。在普通话全面推广的时代背景下,地方方言的生存空间受到其官方语言的强势侵蚀,其方言的传承与发展问题迫在眉睫。围绕相关问题,本文对常德方言吟诵进行系统探讨,探求其保存现有的常德方言语料吟诵记音与建设语言资源有声数据库的有效途径,对探索常德方言语料记音的创新发展道路起到一定的示范启发作用。
关键词
常德方言
语料记音
吟诵
语言
资源
有声
数据
库
分类号
G0 [文化科学]
下载PDF
职称材料
题名
面向计算的构式研究:现状、问题与展望
7
作者
詹卫东
王佳骏
机构
北京大学
出处
《语言学研究》
2022年第1期39-51,共13页
基金
国家科技创新2030“新一代人工智能”重大项目(2020AAA0106701)
教育部人文社科基地2015年度重大项目(15JJD740002)的支持
文摘
本文首先概要介绍面向计算的构式相关研究工作,包括面向计算的形式化构式语法理论模型的构建,以及面向计算的构式语言数据资源建设工作。在此基础上,结合我们所做的现代汉语构式知识库建设和构式语料标注工作,本文提出将构式的句法语义分析与传统的“词库+短语规则”语言知识系统融合的思路,并指出当前面向自然语言处理的构式研究的重点任务是构式数据资源的建设。
关键词
构式知识库
语料库标注
形式化表征
语言数据资源
建设
自然
语言
处理
Keywords
construction
corpus annotation
formal representation
linguistic resources
natural language processing
分类号
H314 [语言文字—英语]
原文传递
题名
作者
出处
发文年
被引量
操作
1
语言数据资源建设中的关键问题及对策
钱小飞
《语料库语言学》
2021
2
下载PDF
职称材料
2
基于语言资源理念的语言规划——以“语言资源监测研究”和“中国语言资源有声数据库建设”为例
王铁琨
《陕西师范大学学报(哲学社会科学版)》
CSSCI
北大核心
2010
28
下载PDF
职称材料
3
综合型语言知识库的建设与利用
俞士汶
段慧明
朱学锋
张化瑞
《中文信息学报》
CSCD
北大核心
2004
29
下载PDF
职称材料
4
罗塞塔石碑与机器翻译
冯志伟
《外语学刊》
CSSCI
北大核心
2020
7
下载PDF
职称材料
5
下一站在哪里?
董振东
董强
郝长伶
《中文信息学报》
CSCD
北大核心
2011
3
下载PDF
职称材料
6
从语料记音看当代常德方言吟诵的传承与发展
方雨露
熊慧
马连菊
《美化生活》
2021
0
下载PDF
职称材料
7
面向计算的构式研究:现状、问题与展望
詹卫东
王佳骏
《语言学研究》
2022
0
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部