为实现英文文本标题的自动化生成,研究一套基于长短期记忆网络的句子级LSTM编码策略,并在标题生成模型中引入注意力机制来获取英文文本的上下文向量,保留文本中的重要信息。在此基础上,通过负对数似然函数来对模型加以训练。最后通过Byt...为实现英文文本标题的自动化生成,研究一套基于长短期记忆网络的句子级LSTM编码策略,并在标题生成模型中引入注意力机制来获取英文文本的上下文向量,保留文本中的重要信息。在此基础上,通过负对数似然函数来对模型加以训练。最后通过Byte Cup 2018数据集对本文提出的英语标题自动生成算法进行实验,并通过过ROUGE-N指标对标题生成质量加以评价。实验研究发现,所提出的句子级LSTM编码方案在英文文本标题生成准确性方面相比于其他常规摘要生成模型来说具有显著优势。展开更多
分析中外地质工程领域代表性期刊论文标题的语言特征,为提升论文标题的写作质量和规范中国科技期刊标题提供思路和建议,选取2020—2021年Web of Science数据库中地质工程领域Q1区的10种代表性期刊的论文标题,建立语料库,利用Jamovi统计...分析中外地质工程领域代表性期刊论文标题的语言特征,为提升论文标题的写作质量和规范中国科技期刊标题提供思路和建议,选取2020—2021年Web of Science数据库中地质工程领域Q1区的10种代表性期刊的论文标题,建立语料库,利用Jamovi统计软件和AntConc数据库检索工具,统计论文标题长度、标点符号、结构、高频词和搭配,分析论文标题的语言特征。结果表明,地质工程类期刊标题长度相似度较高,平均长度为11~15个单词;标点符号中逗号和冒号使用频率最高;高频词以虚词为主,其中介词使用频率最高;标题结构以名词短语为主,其中名词短语+介词短语的结构使用频率最高。研究可为地质工程领域的作者和编辑撰写或修改论文标题提供参考,从而规范标题写作,提升论文的可读性与吸引力。展开更多
文摘为实现英文文本标题的自动化生成,研究一套基于长短期记忆网络的句子级LSTM编码策略,并在标题生成模型中引入注意力机制来获取英文文本的上下文向量,保留文本中的重要信息。在此基础上,通过负对数似然函数来对模型加以训练。最后通过Byte Cup 2018数据集对本文提出的英语标题自动生成算法进行实验,并通过过ROUGE-N指标对标题生成质量加以评价。实验研究发现,所提出的句子级LSTM编码方案在英文文本标题生成准确性方面相比于其他常规摘要生成模型来说具有显著优势。
文摘分析中外地质工程领域代表性期刊论文标题的语言特征,为提升论文标题的写作质量和规范中国科技期刊标题提供思路和建议,选取2020—2021年Web of Science数据库中地质工程领域Q1区的10种代表性期刊的论文标题,建立语料库,利用Jamovi统计软件和AntConc数据库检索工具,统计论文标题长度、标点符号、结构、高频词和搭配,分析论文标题的语言特征。结果表明,地质工程类期刊标题长度相似度较高,平均长度为11~15个单词;标点符号中逗号和冒号使用频率最高;高频词以虚词为主,其中介词使用频率最高;标题结构以名词短语为主,其中名词短语+介词短语的结构使用频率最高。研究可为地质工程领域的作者和编辑撰写或修改论文标题提供参考,从而规范标题写作,提升论文的可读性与吸引力。