期刊文献+

基于BERT的高校图书馆微信信息服务的命名实体识别方法 被引量:2

Named Entity Recognition Method of the University Library Wechat Information Service Based on BERT
下载PDF
导出
摘要 [目的/意义]微信服务推文信息的命名实体识别是高校图书馆智慧服务领域的重要研究方向。在目前微信服务推文的命名实体识别领域中,存在高校图书馆微信服务领域的实体名称多样、特征信息提取不明确等问题。[方法/过程]针对以上问题,本文通过挖掘高校图书馆服务领域的微信服务推文文本,采用现有知识库和词典规则扩充句子语义信息,并在领域专家的指导下构建了一种高校图书馆微信服务推文文本的命名实体语料集ULICNER,实验数据集包含36035条文本语料数据,7大类16个小类。采用基于BERT-BiLSTM-CRF的模型研究高校图书馆微信推文文本的命名实体识别方法。该模型利用BERT网络将大规模文本生成具有语义特征的字符向量,接着对输入文本序列通过BiLSTM获取文本特征,最后连接CRF获得最佳的序列标记输出。[结果/结论]实验结果表明,本文模型在构建的数据集上取得良好的效果,其F1值为98.75%,准确率值为98.59%,召回率值为98.91%,模型可以运用于高校图书馆信息服务的实体识别任务。 [Purpose/Significance]Named entity Recognition(NER)of Wechat service information is an important research direction in the field of intelligent service of university libraries.At present,in the field of NER of Wechat service s tweets,there are insufficient problems such as entity name and feature information extraction in the field of the university library Wechat service.[Method/Process]For the above problems,this paper used the knowledge base and dictionary rules to expand the sentence semantic information by mining the wechat service tweet text in the field of university library service.Under the guidance of the experts,which constructed a corpus set of university library wechat service s NER of the ULICNER.The data set contained 36035 pieces of text corpus data,including 7 categories and 16 subcategories.Then,the model used BERT network to generate character vectors with semantic features from large-scale text,then obtained text features from the input text sequence through BiLSTM,and finally connected CRF to obtain the optimal output of sequence tags.[Result/Conclusion]The experimental results show that the model in this paper achieves good results on the constructed data set.The F1 value is 98.75%,the accuracy value is 98.59%and the recall rate is 98.91%.Finally,the model in this paper can be applied to the named entity recognition of university library information service.
作者 李东升 鲍玉来 刘建华 陈德旺 Li Dongsheng;Bao Yulai;Liu Jianhua;Chen Dewang(Library,Fujian University of Technology,Fuzhou 350118,China;School of Computer Science and Mathematics,Fujian University of Technology,Fuzhou 350118,China;Research Center for Intelligent Information Processing,Fujian University of Technology,Fuzhou 350118,China;School of Computer Science and Mathematics,Fuzhou University,Fuzhou 350108,China)
出处 《现代情报》 2023年第4期64-76,共13页 Journal of Modern Information
基金 福建省教育厅中青年教育科研项目A类社会科学研究课题“区域高校移动图书馆的服务与需求研究”(项目编号:JZ170328) 国家自然科学基金项目“大规模复杂本体匹配问题研究”(项目编号:62172095) 教育部人文社会科学规划基金项目“海峡两岸图书馆标准规范体系语义互联及知识库构建研究”(项目编号:20YJA870001) 福建省科技厅项目“基于预训练语言模型的公共事件UGC资源知识组织研究”(项目编号:2020J01889)。
关键词 命名实体识别 高校图书馆 微信服务 BERT 双向长短记忆网络 条件随机场 Name Entity Recognition university library WeChat service BERT bidirectional long short-term memory networks conditional random field
  • 相关文献

参考文献11

二级参考文献98

共引文献206

同被引文献37

引证文献2

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部