期刊文献+
共找到840篇文章
< 1 2 42 >
每页显示 20 50 100
Next Words Prediction and Sentence Completion in Bangla Language Using GRU-Based RNN on N-Gram Language Model
1
作者 Afranul Hoque Busrat Jahan +3 位作者 Shaikat Chandra Paul Zinat Ara Zabu Rakhi Mondal Papeya Akter 《Journal of Data Analysis and Information Processing》 2023年第4期388-399,共12页
We use a lot of devices in our daily life to communicate with others. In this modern world, people use email, Facebook, Twitter, and many other social network sites for exchanging information. People lose their valuab... We use a lot of devices in our daily life to communicate with others. In this modern world, people use email, Facebook, Twitter, and many other social network sites for exchanging information. People lose their valuable time misspelling and retyping, and some people are not happy to type large sentences because they face unnecessary words or grammatical issues. So, for this reason, word predictive systems help to exchange textual information more quickly, easier, and comfortably for all people. These systems predict the next most probable words and give users to choose of the needed word from these suggested words. Word prediction can help the writer by predicting the next word and helping complete the sentence correctly. This research aims to forecast the most suitable next word to complete a sentence for any given context. In this research, we have worked on the Bangla language. We have presented a process that can expect the next maximum probable and proper words and suggest a complete sentence using predicted words. In this research, GRU-based RNN has been used on the N-gram dataset to develop the proposed model. We collected a large dataset using multiple sources in the Bangla language and also compared it to the other approaches that have been used such as LSTM, and Naive Bayes. But this suggested approach provides excellent exactness than others. Here, the Unigram model provides 88.22%, Bi-gram model is 99.24%, Tri-gram model is 97.69%, and 4-gram and 5-gram models provide 99.43% and 99.78% on average accurateness. We think that our proposed method profound impression on Bangla search engines. 展开更多
关键词 Bangla Language words Prediction sentence Completion GRU RNN Corpus N-Gram
下载PDF
Markedness and UG in Chinese Children's Acquisition of One-word and Negative Sentences 被引量:1
2
作者 Yu Shanzhi Department of Foreign LanguagesHenan University Kadeng 475001P. R. China< sZyu@mail.henu.edu.cn>Zhang Xinhong Faculty Of English Language and Culture Guangdong University of Foreign Studies Guangzhou 510420P. R. China or < bbjohnson@ ]63.net > 《现代外语》 CSSCI 北大核心 1999年第4期379-381,共3页
Thepresentstudyisaninvestigationandanalysisoftherelationshipbetweenmarkednessandfirstlanguageacquisitionsequence,asshowninthecasesofone-wordandnegativesentences.Hereourobjectivesaretoargueforthepriorityofunmarkednesso... Thepresentstudyisaninvestigationandanalysisoftherelationshipbetweenmarkednessandfirstlanguageacquisitionsequence,asshowninthecasesofone-wordandnegativesentences.Hereourobjectivesaretoargueforthepriorityofunmarkednessovermarkednessintheacquisitionsequ... 展开更多
关键词 MARKEDNESS UG ACQUISITION one-word sentence negative sentence.
下载PDF
基于TF-IDF与word2vec的台词文本分类研究 被引量:4
3
作者 但宇豪 黄继风 +1 位作者 杨琳 高海 《上海师范大学学报(自然科学版)》 2020年第1期89-95,共7页
为提高文本分类的准确性,针对健康节目台词文本各类别之间样本数量及各样本之间词数不平衡的特点,提出了一种基于word2vec均值算法及改进的词频-逆文本频率(TFIDF)算法的分类方法.该方法通过引入信息熵及修正因子,缓解了数据不平衡对分... 为提高文本分类的准确性,针对健康节目台词文本各类别之间样本数量及各样本之间词数不平衡的特点,提出了一种基于word2vec均值算法及改进的词频-逆文本频率(TFIDF)算法的分类方法.该方法通过引入信息熵及修正因子,缓解了数据不平衡对分类准确率及召回率造成的不良影响.实验结果表明:所提出的分类方法在准确率及召回率上与word2vec均值模型相比,分别提高7.3%及10.5%. 展开更多
关键词 词频-逆文本频率(TF-IDF) word2vec 信息熵 文本分类 机器学习 加权
下载PDF
基于SentencePiece的中医学分词模型建模研究 被引量:1
4
作者 刘双巧 周璐 +7 位作者 李彩艳 袁慧敏 张异卓 李昱达 刘锦钢 郑丰杰 孙燕 李宇航 《世界中医药》 CAS 2021年第6期981-985,990,共6页
目的:探索构建适用于中医学领域的分词模型。方法:采用基于SentencePiece的无监督学习分词方法,提出利用出版教材、名家著作及中医临床病历这3种不同类型的文献构建中医学分词模型;选择中医临床病历、名医医案作为测试集进行模型测试。... 目的:探索构建适用于中医学领域的分词模型。方法:采用基于SentencePiece的无监督学习分词方法,提出利用出版教材、名家著作及中医临床病历这3种不同类型的文献构建中医学分词模型;选择中医临床病历、名医医案作为测试集进行模型测试。结果:中医学分词模型在测试集中的Kappa系数为0.79(一致性程度很高),准确率为0.84,宏观精确率为0.84,宏观召回率为0.83,宏观f1得分为0.83。结论:所构建的分词模型对于中医学专业术语有着较好的切分效果,表明该方法可运用于中医学领域的分词模型的构建,可为进一步地研究中医学分词提供方法学参考。 展开更多
关键词 分词 中文分词 分词模型 无监督学习 无监督分词 sentencePiece
下载PDF
WORD NEWS IN BRIEF(February 16-28, 1993)
5
《国际展望》 北大核心 1993年第5期32-32,共1页
In his first speech on February 17 to a joint session of Congress, US President Bill Clinton outlined his wision of smaller deficits through higher income taxes on the wealthy, increased energy taxes and selected spen... In his first speech on February 17 to a joint session of Congress, US President Bill Clinton outlined his wision of smaller deficits through higher income taxes on the wealthy, increased energy taxes and selected spending cuts including a one-year freeze on federal pay. US Secretary of State Warren Christopher arrived in Cairo on February 18 to start his six nation Middle East tour which will also take him to Jordan, Syria, Saudi Arahia, Kuwait, Israel and Lebanon. 展开更多
关键词 CLINTON SPENDING session SECRETARY INCOME FEBRUARY 16-28 Israel word Warren Jordan
下载PDF
WORD NEWS IN BRIEF(April 16-30, 1992)
6
《国际展望》 北大核心 1992年第9期32-32,共1页
China announced on April 16 its decision to send military observers and engineers to join UN transitional authorities in Cambodia. The contingent left Beijing on the same day. On April 21, Peruvian President Alberto F... China announced on April 16 its decision to send military observers and engineers to join UN transitional authorities in Cambodia. The contingent left Beijing on the same day. On April 21, Peruvian President Alberto Fujimori announced a 12-month plan to return Peru to democracy. He said he never intended to create a dictatorship when he launched his militarybacked crackdown on April 5 aimed at fighting corruption, 展开更多
关键词 NEWS word NEWS IN BRIEF April 16-30
下载PDF
KEY WORDS INDEX, 《RICE SCIENCE》, VOL. 12, NO. 1-4, 2005
7
《Rice science》 SCIE 2005年第4期I0007-I0009,共3页
关键词 VOL KEY wordS INDEX RICE SCIENCE VOL.12 NO.1-4 2005 NO
下载PDF
KEY WORDS INDEX, RICE SCIENCE, VOL. 16, NOS. 1-4, 2009
8
《Rice science》 SCIE 2009年第4期I0005-I0006,共2页
关键词 gene NOS KEY wordS INDEX RICE SCIENCE VOL.16 NOS.1-4 2009 VOL
下载PDF
KEY WORDS INDEX, RICE SCIENCE, VOL. 14, NOS. 1-4, 2007
9
《Rice science》 SCIE 2007年第4期I0005-I0006,共2页
关键词 VOL KEY wordS INDEX RICE SCIENCE VOL.14 NOS.1-4 2007 gene NOS
下载PDF
KEY WORDS INDEX, RICE SCIENCE, VOL. 13, NO. 1-4, 2006
10
《Rice science》 SCIE 2006年第4期I0005-I0006,共2页
关键词 VOL KEY wordS INDEX RICE SCIENCE VOL.13 NO.1-4 2006 NO
下载PDF
Research of Paraphrasing for Chinese Complex Sentences Based on Templates
11
作者 Zhongjian Wang Ling Wang 《Modern Electronic Technology》 2022年第1期38-42,共5页
Based on the paraphrasing of Chinese simple sentences,the complex sen­tence paraphrasing by using templates are studied.Through the classifica­tion of complex sentences,syntactic analysis and structural anal... Based on the paraphrasing of Chinese simple sentences,the complex sen­tence paraphrasing by using templates are studied.Through the classifica­tion of complex sentences,syntactic analysis and structural analysis,the proposed methods construct complex sentence paraphrasing templates that the associated words are as the core.The part of speech tagging is used in the calculation of the similarity between the paraphrasing sentences and the paraphrasing template.The joint complex sentence can be divided into parallel relationship,sequence relationship,selection relationship,progres­sive relationship,and interpretive relationship’s complex sentences.The subordinate complex sentence can be divided into transition relationship,conditional relationship,hypothesis relationship,causal relationship and objective relationship’s complex sentences.Joint complex sentence and subordinate complex sentence are divided to associated words.By using pretreated sentences,the preliminary experiment is carried out to decide the threshold between the paraphrasing sentence and the template.A small scale paraphrase experiment shows the method is availability,acquire the coverage rate of paraphrasing template 40.20%and the paraphrase correct rate 62.61%. 展开更多
关键词 Complex sentence Associated word Paraphrasing template
下载PDF
应急语言独语句的发展钩沉与应用展望
12
作者 杜小红 《长春大学学报》 2024年第7期49-53,共5页
应急语言建设是当前国家语言战略研究的重要课题。因简洁高效,独语句在应急语言服务中使用日趋广泛,形成了数量众多的“应急语言独语句”,但相关研究尚未引起重视。文章在梳理应急语言独语句发展的基础上,对应急语言独语句进行了概念界... 应急语言建设是当前国家语言战略研究的重要课题。因简洁高效,独语句在应急语言服务中使用日趋广泛,形成了数量众多的“应急语言独语句”,但相关研究尚未引起重视。文章在梳理应急语言独语句发展的基础上,对应急语言独语句进行了概念界定,在此基础上对独语句在应急服务中的应用前景进行初步探讨,旨在弥补国家应急话语建设在独语句研究方面之不足,为国家应急用语的研制和编纂提供参考。 展开更多
关键词 应急语言 独语句 应用展望
下载PDF
WordNet和词向量相结合的句子检索方法 被引量:3
13
作者 刘欣 席耀一 +1 位作者 王波 魏晗 《信息工程大学学报》 2017年第4期486-491,共6页
针对当前句子检索方法中因数据稀疏而存在的"词不匹配"问题,提出了一种Word Net和词向量相结合的句子检索方法。首先在Word Net语义关系图中应用个性化PageRank算法计算与查询项最相关的同义词集合,实现查询项扩展,从而在一... 针对当前句子检索方法中因数据稀疏而存在的"词不匹配"问题,提出了一种Word Net和词向量相结合的句子检索方法。首先在Word Net语义关系图中应用个性化PageRank算法计算与查询项最相关的同义词集合,实现查询项扩展,从而在一定程度上解决了查询项数据稀疏的问题;然后利用在大规模语料中训练神经网络语言模型获取的词向量对查询项和句子进行表示;最后引入WMD(word mover's distance)计算查询项与句子的语义相似度,从而利用语义信息进一步降低"词不匹配"问题带来的影响,将句子按相似度值从高到低排序作为句子检索结果。文章方法在TREC2003和TREC2004会议的项目中进行评测,MAP和R-Precision值相较于次优结果分别提高了13.29%和13.54%。 展开更多
关键词 wordNET 查询项扩展 词向量 语义相似度 句子检索
下载PDF
基于BERT字句向量与差异注意力的短文本语义匹配策略
14
作者 王钦晨 段利国 +2 位作者 王君山 张昊妍 郜浩 《计算机工程与科学》 CSCD 北大核心 2024年第7期1321-1330,共10页
短文本语义匹配是自然语言处理领域中的一个核心问题,可广泛应用于自动问答、搜索引擎等领域。过去的工作大多只考虑文本之间的相似部分,忽略了文本之间的差异部分,从而使模型无法充分利用到决定文本之间是否匹配的关键信息。针对上述问... 短文本语义匹配是自然语言处理领域中的一个核心问题,可广泛应用于自动问答、搜索引擎等领域。过去的工作大多只考虑文本之间的相似部分,忽略了文本之间的差异部分,从而使模型无法充分利用到决定文本之间是否匹配的关键信息。针对上述问题,提出一种基于BERT字句向量与差异注意力的短文本语义匹配策略,利用BERT对句子对进行向量化表示,使用BiLSTM并引入多头差异注意力机制获取当前字向量与文本全局语义信息之间表征意图差异的注意力权重,结合一维卷积神经网络对句子对的语义特征向量进行降维,最后拼接字句向量并送入全连接层计算出2个句子之间的语义匹配度。通过在LCQMC和BQ Corpus数据集上的实验表明,该策略可以有效提取文本语义差异信息,从而使模型表现出更好的效果。 展开更多
关键词 短文本语义匹配 字句向量 表征意图 差异注意
下载PDF
基于句信息增强词信息的方面级情感分类
15
作者 李怡霖 孙成胜 +1 位作者 罗林 琚生根 《计算机科学》 CSCD 北大核心 2024年第6期299-308,共10页
方面级情感分类属于细粒度的情感分类,旨在判断句子中指定方面词的情感极性。近年来,句法知识在方面级情感分类任务中得到了广泛应用。目前主流的模型利用句法依存树和图卷积神经网络进行情感极性的分类。然而,此类模型着眼于利用聚合... 方面级情感分类属于细粒度的情感分类,旨在判断句子中指定方面词的情感极性。近年来,句法知识在方面级情感分类任务中得到了广泛应用。目前主流的模型利用句法依存树和图卷积神经网络进行情感极性的分类。然而,此类模型着眼于利用聚合后的方面词信息来判断情感极性,很少关注句子的全局信息对情感极性的影响,从而导致情感极性分类结果出现偏差。为了解决这一问题,提出了一种基于句信息增强词信息的方面级情感分类模型,该模型通过对比学习对句向量进行表示学习,以减小句向量对比损失为目标调整词向量的特征表示,最后通过图卷积神经网络聚合意见词信息得出情感分类结果。在SemEval2014数据集和Twitter数据集上进行实验,结果表明,所提模型可以提高分类的准确性,综合验证了该方法的有效性。 展开更多
关键词 方面级情感分类 句信息 词信息 对比学习 图卷积神经网络
下载PDF
中古汉语VP-neg式疑问句句末否定词的虚化问题 被引量:10
16
作者 刘开骅 《南京师范大学文学院学报》 2006年第4期166-171,共6页
VP-neg是中古汉语反复问句的主要形式,对句末否定词Neg的虚化问题学术界存在不同看法。文章系统考察中古时期这一语法现象,结论是:1否定式问句末尾的否定词已经虚化;2带反诘语气副词的反诘问句末尾的否定词一般已经虚化;3选择问句里选... VP-neg是中古汉语反复问句的主要形式,对句末否定词Neg的虚化问题学术界存在不同看法。文章系统考察中古时期这一语法现象,结论是:1否定式问句末尾的否定词已经虚化;2带反诘语气副词的反诘问句末尾的否定词一般已经虚化;3选择问句里选择项末的否定词已经虚化;4带测度副词的测度问句末尾的否定词已经虚化;5带疑问语气副词“宁”的反复问句末尾的否定词没有虚化;6除前四种情况,反复问句“VP不”中的“不”没有虚化。 展开更多
关键词 中古汉语 反复问句 句末否定词 虚化
下载PDF
词典-语法-教材的链接 被引量:1
17
作者 郑定欧 《汉语学习》 CSSCI 北大核心 2021年第1期76-84,共9页
本文认为传统的词表不再适应当前对外汉语教研发展的需要,应该通过词典—语法—教材三链接的框架构建双语扩容词表,当中依次包含等级、词类、等值、范例、句法特征、子集代码以及双语化处理标识等内容。
关键词 词表 句本位 基础研究
下载PDF
基于核特征和tag-rank的商品图像句子标注(英文)
18
作者 张红斌 姬东鸿 +2 位作者 尹兰 任亚峰 殷依 《Journal of Southeast University(English Edition)》 EI CAS 2016年第2期170-176,共7页
针对商品图像句子标注中图像特征单一、关键词受噪声干扰等问题,提出一种聚焦图像特征学习和关键词摘取的商品图像句子标注模型.从梯度、形状和颜色3个角度抽取图像核特征,并在多核学习模型内进行后融合.利用tag-rank模型中的绝对排序... 针对商品图像句子标注中图像特征单一、关键词受噪声干扰等问题,提出一种聚焦图像特征学习和关键词摘取的商品图像句子标注模型.从梯度、形状和颜色3个角度抽取图像核特征,并在多核学习模型内进行后融合.利用tag-rank模型中的绝对排序和相对排序特征提升关键词权重,设计词序列拼积木算法把关键词拼装成N元词序列.基于N元词序列和模板生成句子.实验表明:句子的BLEU-1和BLEU-2评分优于对比模型. 展开更多
关键词 商品图像 句子标注 核特征 tag-rank 词序列拼积木 N元词序列
下载PDF
母语为哈萨克语的汉语学习者陈述句语序偏误分析——以哈萨克斯坦阿布莱汗孔子学院为例
19
作者 王璟璇 Akymbek Sezd 《文化创新比较研究》 2024年第13期31-36,共6页
哈萨克语陈述句表示描述、告知、叙述事实等含义,哈萨克语基本语序为主—宾—谓结构(SOV),与汉语基本语序主—谓—宾结构(SVO)不同。两者在句法、形态和语义上存在明显差异。哈萨克语可通过词形变化,如词尾后缀的变化形式来表达不同含义... 哈萨克语陈述句表示描述、告知、叙述事实等含义,哈萨克语基本语序为主—宾—谓结构(SOV),与汉语基本语序主—谓—宾结构(SVO)不同。两者在句法、形态和语义上存在明显差异。哈萨克语可通过词形变化,如词尾后缀的变化形式来表达不同含义,语法显性,而汉语作为孤立语,语法隐性,需要通过语义判断分析。该文以哈萨克斯坦地区母语为哈萨克语的汉语学习者为研究对象,从哈萨克语的角度出发,结合所收集的陈述句语料分析语序偏误产生的原因,并总结针对母语为哈萨克语的汉语学习者的教学对策,希望对于汉语教师有一定的借鉴意义,促进哈萨克斯坦地区学习者汉语学习的发展。 展开更多
关键词 哈萨克语 陈述句 语序 偏误分析 国际中文教育 教学对策
下载PDF
基于BiLSTM-CRF的古汉语自动断句与词法分析一体化研究 被引量:16
20
作者 程宁 李斌 +2 位作者 葛四嘉 郝星月 冯敏萱 《中文信息学报》 CSCD 北大核心 2020年第4期1-9,共9页
古汉语信息处理的基础任务包括自动断句、自动分词、词性标注、专名识别等。大量的古汉语文本未经标点断句,所以词法分析等任务首先需要建立在断句基础之上。然而,分步处理容易造成错误的多级扩散,该文设计实现了古汉语断句与词法分析... 古汉语信息处理的基础任务包括自动断句、自动分词、词性标注、专名识别等。大量的古汉语文本未经标点断句,所以词法分析等任务首先需要建立在断句基础之上。然而,分步处理容易造成错误的多级扩散,该文设计实现了古汉语断句与词法分析一体化的标注方法,基于BiLSTM-CRF神经网络模型在四种跨时代的测试集上验证了不同标注层次下模型对断句、词法分析的效果以及对不同时代文本标注的泛化能力。研究表明,一体化的标注方法对古汉语的断句、分词及词性标注任务的F1值均有提升。综合各测试集的实验结果,断句任务F1值达到78.95%,平均提升了3.5%;分词任务F1值达到85.73%,平均提升了0.18%;词性标注任务F1值达到72.65%,平均提升了0.35%。 展开更多
关键词 古文断句 分词 词性标注 BiLSTM-CRF 古汉语信息处理
下载PDF
上一页 1 2 42 下一页 到第
使用帮助 返回顶部