目的对国内外近20年来发表的涉及自然语言处理(NLP)智能技术应用于中医术语识别或标注方面的文献进行计量分析与评价,探讨NLP智能技术在中医术语标准研究中的应用和发展前景。方法检索收集2003年1月至2023年10月期间,中国知网、维普中...目的对国内外近20年来发表的涉及自然语言处理(NLP)智能技术应用于中医术语识别或标注方面的文献进行计量分析与评价,探讨NLP智能技术在中医术语标准研究中的应用和发展前景。方法检索收集2003年1月至2023年10月期间,中国知网、维普中文科技期刊数据库、万方数据知识服务平台、中国生物医学文献服务系统及Web of Science等中英文数据库中的相关文献。采用Excel vba、Gephi、PyCharm等数据处理和统计分析工具,应用频数统计、Apriori关联分析、词云统计等文献计量学方法,对相关研究热点进行可视化分析。结果①经筛选,符合研究标准的文献共442篇,其中中文文献320篇、英文文献122篇。②2016年以后,相关发文量呈现持续增长的趋势。③发文国家主要集中在中国。④中文文献中硕博士学位论文比重较大,其中发文量最高的是北京交通大学。⑤中文文献发文机构以中国中医科学院发文量最高;英文文献发文机构以北京科技大学发文量最高;中医机构与计算机相关机构合作频繁。⑥基于BERT的命名实体识别算法在中医术语研究中的应用效果最为显著。⑦中医文献类的数据占比较大。结论基于NLP智能技术的中医术语标准化研究仍处于探索阶段,现有研究表现出技术应用的多样性,但缺乏系统性。鉴于NLP智能技术在中医术语识别和标注方面的潜力,未来研究需进一步加强,以期实现中医术语标准研究的系统化、智能化与广泛应用。展开更多
文摘目的对国内外近20年来发表的涉及自然语言处理(NLP)智能技术应用于中医术语识别或标注方面的文献进行计量分析与评价,探讨NLP智能技术在中医术语标准研究中的应用和发展前景。方法检索收集2003年1月至2023年10月期间,中国知网、维普中文科技期刊数据库、万方数据知识服务平台、中国生物医学文献服务系统及Web of Science等中英文数据库中的相关文献。采用Excel vba、Gephi、PyCharm等数据处理和统计分析工具,应用频数统计、Apriori关联分析、词云统计等文献计量学方法,对相关研究热点进行可视化分析。结果①经筛选,符合研究标准的文献共442篇,其中中文文献320篇、英文文献122篇。②2016年以后,相关发文量呈现持续增长的趋势。③发文国家主要集中在中国。④中文文献中硕博士学位论文比重较大,其中发文量最高的是北京交通大学。⑤中文文献发文机构以中国中医科学院发文量最高;英文文献发文机构以北京科技大学发文量最高;中医机构与计算机相关机构合作频繁。⑥基于BERT的命名实体识别算法在中医术语研究中的应用效果最为显著。⑦中医文献类的数据占比较大。结论基于NLP智能技术的中医术语标准化研究仍处于探索阶段,现有研究表现出技术应用的多样性,但缺乏系统性。鉴于NLP智能技术在中医术语识别和标注方面的潜力,未来研究需进一步加强,以期实现中医术语标准研究的系统化、智能化与广泛应用。