-
题名领域语言模型及其在中文输入系统中的应用
- 1
-
-
作者
孙晓
李培峰
-
机构
苏州大学计算机科学与技术学院
-
出处
《计算机应用与软件》
CSCD
北大核心
2012年第8期46-48,81,共4页
-
基金
国家自然科学基金项目(90920004
60970056
+2 种基金
60873150)
江苏省自然科学基金项目(BK2008160)
江苏省高校自然科学重大基础研究项目(08KJA520002)
-
文摘
提出一种构建领域语言模型的策略,并基于余弦相似度提出一种模型融合的方法,以便将领域语言模型融入动态自学习语言模型,该语言模型可应用于中文输入系统。实验表明,加载了领域语言模型的中文输入系统不仅降低了平均码长,而且显著提高了首字命中率。
-
关键词
领域语言模型
相似度
模型融合
动态自适应语言模型
中文输入系统
-
Keywords
Special-domain language model Similarity Model fusion Dynamic self-adaptive language model Chinese input system
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于动态自适应语言模型的中文输入系统的设计与实现
- 2
-
-
作者
孙晓
李培峰
刁红军
-
机构
苏州大学计算机科学与技术学院
江苏省计算机信息处理技术重点实验室
-
出处
《苏州大学学报(自然科学版)》
CAS
2011年第2期29-35,共7页
-
基金
国家自然科学基金(90920004
60970056
+2 种基金
60873150)
江苏省自然科学基金(BK2008160)
江苏省高校自然科学重大基础研究项目(08KJA520002)
-
文摘
首先介绍采用平滑算法构建通用语言模型、领域语言模型和用户语言模型的方法;然后提出了一种模型融合方法,形成了一个动态自适应语言模型.最后,将此模型与输入系统实现技术相结合,实现了一个基于动态自适应语言模型的中文输入系统.实验表明,应用该模型的输入系统不仅降低了平均码长,而且显著提高了首字命中率.
-
关键词
领域语言模型
用户语言模型
模型融合
动态自适应语言模型
中文输入系统
-
Keywords
special-domain language model
special-user language model
model fusion
dynamic self-adaptation language model
Chinese input system
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于自然语言处理的产业链知识图谱构建
被引量:15
- 3
-
-
作者
毛瑞彬
朱菁
李爱文
周倚文
潘斌强
岳琳
-
机构
武汉大学信息资源研究中心
深圳证券信息有限公司
天津大学管理与经济学部
-
出处
《情报学报》
CSSCI
CSCD
北大核心
2022年第3期287-299,共13页
-
基金
国家重点研发计划项目“亿级节点时序图谱实时智能分析关键技术与系统”课题五“金融时序知识图谱查询与分析平台及应用验证”(2020AAA0108505)。
-
文摘
产业链知识图谱在金融领域应用较为广泛,但目前多数研究是面向单一产业的知识图谱构建或面向产业竞争情报服务,并没有把产业链和知识图谱有机地结合起来。本文从产业链应用角度出发,对产业链知识图谱的构建方法进行研究。首先提出了产业链知识图谱的构建流程和本体库,再基于领域语言模型,实现知识分类、抽取、融合等金融领域文本处理方法,对海量的领域文本进行知识抽取和融合,最终成功构建产业链知识图谱。根据本文方法构建的产业链知识图谱系统,覆盖产业链78个,细分行业7629个,已经应用到投融资、监管和产业规划等多个重要场景中。
-
关键词
产业链
知识图谱
领域语言模型
实体和关系联合抽取
-
Keywords
industry chain
knowledge graph
domain language model
entity and relation joint extraction
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
F124
[经济管理—世界经济]
-
-
题名数智化视角下高校图书馆古籍保护与服务工作变革研究
- 4
-
-
作者
任书俊
王咏梅
马巍巍
方千平
程新
邓勇
-
机构
安徽中医药大学图书馆
合肥师范学院计算机与人工智能学院
巢湖学院图书馆
-
出处
《大学图书情报学刊》
2024年第6期83-88,共6页
-
基金
2021年度安徽省教育厅科学研究重点项目“安徽中医药古籍书目提要数据库建设研究”(KJ2021A0903)
2022年度合肥师范学院校级重点科研项目“神经网络的超参数优化方法研究”(2022KJZD07)
2023年度安徽省社会科学创新发展研究课题“基于AIGC的数字人文涉皖诗词语料库构建及涉皖诗词生成研究”(2023KY016)。
-
文摘
为积极响应国家“提高古籍保护水平,提升古籍工作质量”的号召,文章基于数智化视角,从古籍的原生性保护、再生性保护和创生性保护三个方面阐述了数智化技术给古籍保护带来的变革,从古籍服务内容生产方式、服务空间和古籍集成化服务方式三个方向探讨了数智化给古籍服务工作带来的变革。进而对高校图书馆古籍保护与服务工作提出构建服务平台、构建服务生态、提供特色服务和培养数智化人才等展望。
-
关键词
数智化
古籍保护与服务
AIGC
知识服务
垂直领域大语言模型
-
Keywords
digitalization
protection and service of ancient book
AIGC
knowledge service
Vertical Domain Big Language Model
-
分类号
G255.1
[文化科学—图书馆学]
G258.6
[文化科学—图书馆学]
-