-
题名基于规则的图书适用对象提取
被引量:1
- 1
-
-
作者
林鑫
龙存钰
杜莹
-
机构
中国科学技术信息研究所
华中师范大学信息管理学院
-
出处
《情报理论与实践》
CSSCI
北大核心
2021年第6期112-117,163,共7页
-
基金
国家社会科学基金青年项目“社会网络中基于用户认知结构的知识标注研究”的成果之一,项目编号:17CTQ024。
-
文摘
[目的/意义]提取图书适用对象信息,有助于深化图书信息的组织,为用户搜寻和选择图书提供支持。[方法/过程]以图书简介和主题词为基础数据,首先通过抽取规则和映射规则分别实现适用对象信息的初步提取,并进行整合归并;同时,结合数据特征进行抽取与映射规则库构建策略设计。[结果/结论]实验表明,抽取规则的覆盖率为89.52%,准确率为100%;映射规则覆盖率为99.07%,而且不存在映射结果错误的情况。该方法在召回率和准确率方面均表现良好,且大幅降低了数据标注成本。[局限]适用对象提取模型仅使用抽取和映射的规则提取策略,抽取规则所提取的适用对象信息规范性不足,映射规则获取的适用对象信息不够细致,后续需要进一步完善。
-
关键词
自动标引
图书适用对象
规则
抽取模型
-
Keywords
automatic indexing
book’s target readership
rules
extraction model
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-