目的探索利用点阵(lattice)长短期记忆(long short term mermory network,LSTM)神经网络构建命名实体识别(named entity recognition,NER)模型解决中文医学文本的信息提取问题。方法利用Lattice LSTM来表征句子中的词汇词(lexiconword)...目的探索利用点阵(lattice)长短期记忆(long short term mermory network,LSTM)神经网络构建命名实体识别(named entity recognition,NER)模型解决中文医学文本的信息提取问题。方法利用Lattice LSTM来表征句子中的词汇词(lexiconword),从而将潜在词信息整合到基于字符的长短期记忆网络—条件随机场(long short term memory-conditional random?eld,LSTM-CRF)模型中。进一步使用一个大型自动获取的词典来匹配句子,进而构建基于词的Lattice。利用Lattice LSTM结构自动控制从句子开头至结尾的信息流。结果门控单元可用于将来自不同路径的信息动态传送到每个字符。在NER数据基础上进行训练后,LatticeLSTM能够学会从语境中自动找到更有用的词汇,以取得更好的NER性能。结论与基于字符和词的NER方法相比,本文所提出的模型优势在于利用显性词汇信息而不是字符序列进行标注,同时较少出现分词误差。展开更多
第六届中国健康信息处理会议(China Conference on Health Information Processing,CHIP2020)组织了中文医疗信息处理方面的6个评测任务,其中任务1为中文医学文本命名实体识别任务,该任务的主要目标是自动识别医学文本中的医学命名实体...第六届中国健康信息处理会议(China Conference on Health Information Processing,CHIP2020)组织了中文医疗信息处理方面的6个评测任务,其中任务1为中文医学文本命名实体识别任务,该任务的主要目标是自动识别医学文本中的医学命名实体。共有253支队伍报名参加评测,最终37支队伍提交了80组结果,该评测以微平均F_(1)值作为最终评估标准,提交结果中最高值达68.35%。展开更多
第六届中国健康信息处理会议(China conference on Health Information Processing,CHIP 2020)组织了中文医疗信息处理方面的6个评测任务,其中任务2为中文医学文本实体关系抽取任务,该任务的主要目标为自动抽取中文医学文本中的实体关...第六届中国健康信息处理会议(China conference on Health Information Processing,CHIP 2020)组织了中文医疗信息处理方面的6个评测任务,其中任务2为中文医学文本实体关系抽取任务,该任务的主要目标为自动抽取中文医学文本中的实体关系三元组。共有174支队伍参加了评测任务,最终17支队伍提交了42组结果,该任务以微平均F_(1)值为最终评估标准,提交结果中F_(1)最高值达0.6486。展开更多
文摘目的探索利用点阵(lattice)长短期记忆(long short term mermory network,LSTM)神经网络构建命名实体识别(named entity recognition,NER)模型解决中文医学文本的信息提取问题。方法利用Lattice LSTM来表征句子中的词汇词(lexiconword),从而将潜在词信息整合到基于字符的长短期记忆网络—条件随机场(long short term memory-conditional random?eld,LSTM-CRF)模型中。进一步使用一个大型自动获取的词典来匹配句子,进而构建基于词的Lattice。利用Lattice LSTM结构自动控制从句子开头至结尾的信息流。结果门控单元可用于将来自不同路径的信息动态传送到每个字符。在NER数据基础上进行训练后,LatticeLSTM能够学会从语境中自动找到更有用的词汇,以取得更好的NER性能。结论与基于字符和词的NER方法相比,本文所提出的模型优势在于利用显性词汇信息而不是字符序列进行标注,同时较少出现分词误差。
文摘第六届中国健康信息处理会议(China Conference on Health Information Processing,CHIP2020)组织了中文医疗信息处理方面的6个评测任务,其中任务1为中文医学文本命名实体识别任务,该任务的主要目标是自动识别医学文本中的医学命名实体。共有253支队伍报名参加评测,最终37支队伍提交了80组结果,该评测以微平均F_(1)值作为最终评估标准,提交结果中最高值达68.35%。
文摘第六届中国健康信息处理会议(China conference on Health Information Processing,CHIP 2020)组织了中文医疗信息处理方面的6个评测任务,其中任务2为中文医学文本实体关系抽取任务,该任务的主要目标为自动抽取中文医学文本中的实体关系三元组。共有174支队伍参加了评测任务,最终17支队伍提交了42组结果,该任务以微平均F_(1)值为最终评估标准,提交结果中F_(1)最高值达0.6486。