-
题名古农文语义检索模型构建及其应用研究
被引量:2
- 1
-
-
作者
刘楠竹
崔运鹏
王末
-
机构
中国农业科学院农业信息研究所
农业农村部农业大数据重点实验室
-
出处
《农业图书情报学报》
2023年第7期52-62,共11页
-
基金
国家社会科学基金重大项目“中国古农书的搜集、整理与研究”(21&ZD332)。
-
文摘
[目的/意义]构建能实现以白话文作为查询,系统自动返回与输入最相关的古农文段落的语义检索模型,为学者提供更加便利的古代农业知识检索方式和古代农业知识溯源方式。[方法/过程]使用基于四库全书作为训练语料的SikuBERT作为基础模型,基于对比学习的方法,使用自建的古农文数据集对模型进行继续训练,得到能够支持使用白话文作为查询,返回与查询语义最相似的古农文段落的语义检索模型。[结果/结论]古农文语义检索模型的Spearman系数在测试集上的表现能够达到86.51%,较基线模型在测试集上的表现83.69%有一定程度的提升,在自建的古农文检索测试集上的召回情况(recall@k)较基线模型有一定程度提升,模型在古农文上能够有比较好的检索效果。但受限于古农文训练语料规模,模型的训练效果还有很大提升空间。
-
关键词
古农文
语义检索
对比学习
模型构建
深度学习
-
Keywords
ancient agricultural script
semantic retrieval
comparative learning
model building
deep learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名淄博市网格员协助农业基础数据采集的思考
- 2
-
-
作者
侯祥英
崔运鹏
刘娟
王婷
刘楠竹
-
机构
淄博市农业科学研究院
中国农业科学院农业信息研究所/农业农村部农业大数据重点实验室
-
出处
《农业展望》
2022年第1期124-128,共5页
-
文摘
农业基础数据是中国实现智慧农业的必要前提,农业基础数据的高质量采集成为当下急需解决的问题。然而,当前中国农业基础数据采集面临配置完备性不足、采集地域范围有限、整合渠道不通畅、采集人员专业性缺失等诸多问题。网格员作为社区网格化服务管理模式下的新生力量,在地域覆盖、年龄、身份、经济基础和职业前景多方面具有协助农业基础数据采集的优势,能够在保证本职工作完成质量的前提下高质高效地进行农业基础数据的采集。基于对这些问题和现象的深入讨论和分析,提出一种依托城市社区网格化背景,以淄博市为试点区域,通过网格员协助农业基础数据采集的设想。同时,从设置公平合理的薪酬激励、构建科学高效的任务规划、建立健全完备的培训体系、制定严格规范的考核指标等多个角度提出可行性较强的建议。最后,对网格员协助农业基础数据采集的发展前景进行了展望。
-
关键词
农业基础数据
网格员
数据采集
-
Keywords
agricultural basic data
grid member
data collection
-
分类号
F327
[经济管理—产业经济]
F49
[经济管理—产业经济]
-