印地语自然语言处理研究进展

Advances in Hindi Natural Language Processing

下载PDF

导出

摘要与西方语言相比,印地语是东南亚地区的一种低资源语言。由于缺少相应的语料、标注规范及计算模型,当前印地语自然语言处理工作并未得到重视,也不能较好地迁移通用语种研究中的前沿方法。该文在进行文献调研和计量分析的基础上,回顾了印地语自然语言处理研究在基础资源建设、词性标注、命名实体识别、句法分析、词义消歧、信息检索、机器翻译、情感分析以及自动摘要等方面的研究进展,最后提出了该领域研究可能面临的问题及挑战,并展望未来发展趋势。 Compared with western languages,Hindi is a low resource language in Southeast Asia.Due to the lack of corpus,annotation specifications and computational modeling practices,the studies on Hindi natural language processing have not been well addressed.This paper reviews the research progresses in Hindi natural language processing in terms of the resource construction,part of speech tagging,named entity recognition,syntactic analysis,word sense disambiguation,as well as information retrieval,machine translation,sentiment analysis and automatic summarization.This paper also reveals the issues and challenges in Hindi natural language processing,and outlooks the future development trend.

作者王连喜林楠铠蒋盛益邓致妍 WANG Lianxi;LIN Nankai;JIANG Shengyi;DENG Zhiyan(Guangzhou Key Laboratory of Multilingual Intelligent Processing,Guangzhou,Guangdong 5100o6,China;School of Information Science and Technology,Guangdong University of Foreign Studies,Guangzhou,Guangdong 510006,China;Faculty of Asian and African studies,Guangdong University of Foreign Studies,Guangzhou,Guangdong 510006,China)

机构地区广州市非通用语种智能处理重点实验室广东外语外贸大学信息科学与技术学院广东外语外贸大学亚非语言文化学院

出处《中文信息学报》 CSCD 北大核心 2023年第5期53-69,共17页 Journal of Chinese Information Processing

基金广东省科技计划项目(2019A101002108) 广州市科技计划项目(202002030227) 广东省普通高校重点领域项目(2019KZDZX1016)。

关键词印地语自然语言处理低资源语言 Hindi natural language processing resource-scarce language

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1王连喜,钟准,丁曾强,邓致妍,李霞.融合深度神经网络与统计学习的印地语词性标注方法研究[J].湖南工业大学学报,2020,34(3):17-22. 被引量：3

二级参考文献2

1帕力旦.吐尔逊,房鼎益.融合形态特征的最大熵维吾尔语词性标注[J].西北大学学报（自然科学版）,2015,45(5):721-726. 被引量：1
2金国哲,崔荣一.一种新的朝鲜语词性标注方法[J].中文信息学报,2018,32(10):53-58. 被引量：4

共引文献2

1冯建英,吴丹丹,王博,王智,穆维松.中文在线评论文本分析对生鲜农产品电商影响研究综述[J].农业机械学报,2021,52(S01):504-512. 被引量：7
2张航,文斌.基于HMM+CRF词性标注的实体抽取方法[J].计算机与数字工程,2023,51(12):2929-2933. 被引量：2

1张明菊.“双减” 背景下初中语文单元作业设计探究[J].炫动漫,2022(11):52-54.
2Sergio Maduro,荀伟(翻译).《白鹿原》:现代中国文学的经典作品[J].孔子学院（中葡文对照版）,2022(4):40-45.
3编辑信箱[J].新周刊,2020(17):3-3.
4《中华医学遗传学杂志》编辑部.关于修订中华系列杂志作者署名与工作单位标注规范的通知[J].中华医学遗传学杂志,2023,40(8):932-932.
5耿兴岩.纸质文献保护修复中的干式清洁方法综述[J].文物保护与考古科学,2023,35(4):150-158. 被引量：1
6柴唤友,陈丽,郑勤华,王辞晓,王怀波.技术赋能学生综合素质评价:进展、挑战与路向[J].现代远程教育研究,2023,35(3):40-46. 被引量：15
7曹渝昆,金成坤,唐艺嘉,魏子越,李云峰.结合知识图谱和文本层次结构的词义消歧方法[J].计算机工程与应用,2023,59(14):158-165.
8李启正,胡崴琳,王成龙.织物整理专业术语词义消歧与热点趋势研究[J].染整技术,2023,45(5):6-10.
9张文兰,白若微,向双.西部农村小学生对信息化学习感知与理解的绘画分析研究[J].电化教育研究,2023,44(6):45-53. 被引量：1
10孙载明.“银杏之父”话银杏[J].晚晴,2023(5):82-83.

中文信息学报

2023年第5期

浏览历史

内容加载中请稍等...

印地语自然语言处理研究进展

参考文献1

二级参考文献2

共引文献2

相关作者

相关机构

相关主题

浏览历史