面向互联网的藏文实体关系模板获取技术研究被引量：1

Study on Extraction of Tibetan Entity Relation Templates from the Internet

下载PDF

导出

摘要确定实体之间的关系有助于更好的理解文本内容,通过实体关系模板可以从海量无结构的文本中获取大量的实体关系,并予以结构化.本文针对互联网藏文文本的特点,通过对藏文实体进行模板表示,采用基于word2vec的无监督词义相似度计算方法,构建近义词资源,实现了藏文词义相似度计算系统,最终构建一种基于相似度计算的实体关系模板获取模型.通过网络爬虫抓取青海湖藏文网的语料进行试验,实验结果表明本文提出的藏文实体关系模板抽取方法较为有效,达到了较好的实验效果. Extracting entity relations is benefcial to understand the meanings of text. By the entity relation templates, we can get a lot of entity relation and structured data from the massive unstructured text. According to the characteristics of Tibetan text from the internet, the paper studies the Tibetan template representations, and implements an unsupervised Tibetan semantic similarity system based on word2vec, finally implement a Tibetan entity relation templates extraction model based on similarity calculation model. We studies the mode by crawling the amdotibet. The experimental results show that our model is effective, and achieved a good results.

作者马宁李亚超于槐加羊吉

机构地区西北民族大学甘肃省民族语言智能处理重点实验室

出处《中央民族大学学报（自然科学版）》 2015年第1期35-39,共5页 Journal of Minzu University of China(Natural Sciences Edition)

基金国家自然科学基金(No.61262052 No.61262054) 中央高校基本科研业务费专项资金资助项目(No.31920140064)

关键词藏文实体关系模板互联网 tibetan entity relations templates Internet

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1吴学军.面向信息抽取的命名实体识别与模块获取技术研究[D].沈阳:东北大学,2004.
2陈晓颖,胡熠,陆汝占.实体关系模板的获取技术[J].计算机工程,2007,33(21):199-201. 被引量：3
3珠杰,欧珠,格桑多吉.基于DOM修剪的藏文Web信息提取[J].计算机工程,2008,34(24):58-60. 被引量：7
4万福成,李冬晨,何向真,徐涛.面向信息检索的藏文文本索引策略研究[J].计算机工程与应用,2014,50(7):208-211. 被引量：1
5李亚超,加羊吉,宗成庆,于洪志.基于条件随机场的藏语自动分词方法研究与实现[J].中文信息学报,2013,27(4):52-58. 被引量：27
6加羊吉,李亚超,宗成庆,于洪志.最大熵和条件随机场模型相融合的藏文人名识别[J].中文信息学报,2014,28(1):107-112. 被引量：21

二级参考文献49

1张素香,高国洋,戚银城.基于条件随机场的中国人名识别方法[J].郑州大学学报（理学版）,2009,41(2):40-43. 被引量：7
2王长青.信息检索中快速索引文件的设计研究[J].佳木斯教育学院学报,2011(2):427-427. 被引量：1
3翁惠玉,马范援,朱义军,杨传厚.网络搜索引擎的现状分析[J].情报学报,1999,18(S1):105-107. 被引量：25
4欧阳柳波,李学勇,李国徽,王鑫.专业搜索引擎搜索策略综述[J].计算机工程,2004,30(13):32-33. 被引量：34
5王琦,唐世渭,杨冬青,王腾蛟.基于DOM的网页主题信息自动提取[J].计算机研究与发展,2004,41(10):1786-1792. 被引量：81
6扎西次仁.《中华大藏经·丹珠尔》藏文对勘本字频统计分析[J].中国藏学,1997(2):122-133. 被引量：18
7张慧颖,曲著伟.基于子树匹配的交互式Web数据抽取方法[J].计算机工程,2006,32(9):78-80. 被引量：8
8钱晶,张杰,张涛.基于最大熵的汉语人名地名识别方法研究[J].小型微型计算机系统,2006,27(9):1761-1765. 被引量：26
9李中国,刘颖.边界模板和局部统计相结合的中国人名识别[J].中文信息学报,2006,20(5):44-50. 被引量：13
10祁坤钰.信息处理用藏文自动分词研究[J].西北民族大学学报（哲学社会科学版）,2006(4):92-97. 被引量：34

共引文献56

1陈晓颖,胡熠,陆汝占.实体关系模板的获取技术[J].计算机工程,2007,33(21):199-201. 被引量：3
2刘杰.基于规则和统计相结合的地名实体识别的研究[J].佳木斯大学学报（自然科学版）,2009,27(4):520-522. 被引量：1
3刘杰.基于统计的中文机构名实体识别的研究[J].佳木斯大学学报（自然科学版）,2010,28(3):349-351. 被引量：1
4珠杰,罗潘.基于HTML Parser的网页信息提取技术研究[J].西藏大学学报（社会科学版）,2010,25(3):41-44. 被引量：3
5周晶.基于条件随机域模型的中文实体关系抽取[J].计算机工程,2010,36(24):192-194. 被引量：2
6李妩可,郭赛球,尹艳.命名实体关系抽取算法的改进[J].计算机工程,2010,36(24):289-290. 被引量：2
7春燕,曲珍.藏文文本编码识别方法研究[J].计算机工程与应用,2013,49(1):141-144. 被引量：1
8珠杰,欧珠,格桑多吉,扎西加,高红梅.藏文音节规则库的建立与应用分析[J].中文信息学报,2013,27(2):103-111. 被引量：14
9万福成,李冬晨,何向真,徐涛.面向信息检索的藏文文本索引策略研究[J].计算机工程与应用,2014,50(7):208-211. 被引量：1
10江涛,江静,戴玉刚,李艾林.藏文舆情云分析系统平台研究[J].信息网络安全,2014(9):92-94. 被引量：1

同被引文献5

1罗镭贾,宋柔,朱小杰.藏族人名汉译名识别研究[J].情报学报,2009,28(3):475-480. 被引量：3
2金明,杨欢欢,单广荣.藏语命名实体识别研究[J].西北民族大学学报（自然科学版）,2010,31(3):49-52. 被引量：11
3华却才让,姜文斌,赵海兴,刘群.基于感知机模型藏文命名实体识别[J].计算机工程与应用,2014,50(15):172-176. 被引量：26
4刘飞飞,王志娟.基于层次特征的藏文人名识别研究[J].计算机应用研究,2018,35(9):2583-2587. 被引量：10
5何鸿业,郑瑾,张祖平.结合词性特征与卷积神经网络的文本情感分析[J].计算机工程,2018,44(11):209-214. 被引量：14

引证文献1

1夏天赐,孙媛.基于联合模型的藏文实体关系抽取方法研究[J].中文信息学报,2018,32(12):76-83. 被引量：10

二级引证文献10

1德吉措,安见才让.基于双向GRU神经网络的藏文人物关系抽取方法[J].信息化研究,2023,49(4):43-47.
2任建龙,杨立,孔维一,左春.面向聊天机器人的多注意力记忆网络[J].计算机系统应用,2019,28(9):18-24.
3王丽客,孙媛,夏天赐.基于远程监督的藏文实体关系抽取[J].中文信息学报,2020,34(3):72-79. 被引量：6
4沈利言,姜海燕,胡滨,谢元澄.水稻病虫草害与药剂实体关系联合抽取算法[J].南京农业大学学报,2020,43(6):1151-1161. 被引量：13
5王丽客,孙媛,刘思思.基于多级注意力融合机制的藏文实体关系抽取[J].智能科学与技术学报,2021,3(4):466-473. 被引量：2
6孙媛,旦正错,刘思思,赵小兵.面向机器阅读理解的藏文数据集TibetanQA[J].中国科学数据（中英文网络版）,2022,7(2):30-38.
7于韬,尼玛次仁,拥措,尼玛扎西.基于藏文Albert预训练语言模型的图采样与聚合实体关系抽取[J].中文信息学报,2022,36(10):63-72. 被引量：7
8孙媛,刘思思,陈超凡,旦正错,赵小兵.面向机器阅读理解的高质量藏语数据集构建[J].中文信息学报,2024,38(3):56-64.
9孙媛,梁家亚,陈安东,赵小兵.JCapsR:一种联合胶囊神经网络的藏语知识图谱表示学习模型[J].中文信息学报,2024,38(4):69-77.
10周青,拥措,拉毛东只,尼玛扎西.基于预训练的藏医药实体关系抽取[J].中文信息学报,2024,38(8):76-83.

1陈晓颖,胡熠,陆汝占.实体关系模板的获取技术[J].计算机工程,2007,33(21):199-201. 被引量：3
2邓箴,包宏.基于词汇链的多文档自动文摘研究[J].计算机与应用化学,2012,29(11):1384-1386.
3刘路,李弼程,张先飞.基于正反例训练的SVM命名实体关系抽取[J].计算机应用,2008,28(6):1444-1446. 被引量：4
4刘雪琴,杨媛,李洁,宋焕生.一种基于特征点的快速跟踪算法[J].电视技术,2014,38(5):34-37. 被引量：1
5韩兴邦,毛峡.一种改进的词义相似度算法[J].中国科技论文,2016,11(2):202-207. 被引量：1
6邬明强,单广荣,李亚超,孙浩蒸.基于语料库的藏文词义相似度计算方法[J].网友世界,2014,0(17):196-196. 被引量：1
7赵军,黄昌宁.基于复杂特征的VN结构模板获取模型[J].软件学报,1999,10(1):92-99. 被引量：5
8焦莉娟,宗春梅.基于类别覆盖集的改进蚁群算法研究[J].软件导刊,2017,16(3):54-55.
9王年,范益政,梁栋,韦穗.一种基于平面模板的摄像机自定标方法[J].机器人,2004,26(6):538-542. 被引量：3
10曹治国,鄢睿丞,宋喆.利用模糊形状上下文关系的红外与可见光图像匹配方法[J].红外与激光工程,2008,37(6):1095-1100. 被引量：11

中央民族大学学报（自然科学版）

2015年第1期

浏览历史

内容加载中请稍等...

面向互联网的藏文实体关系模板获取技术研究被引量：1

参考文献6

二级参考文献49

共引文献56

同被引文献5

引证文献1

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

面向互联网的藏文实体关系模板获取技术研究 被引量：1

参考文献6

二级参考文献49

共引文献56

同被引文献5

引证文献1

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

面向互联网的藏文实体关系模板获取技术研究被引量：1