期刊文献+
共找到836篇文章
< 1 2 42 >
每页显示 20 50 100
Next Words Prediction and Sentence Completion in Bangla Language Using GRU-Based RNN on N-Gram Language Model
1
作者 Afranul Hoque Busrat Jahan +3 位作者 Shaikat Chandra Paul Zinat Ara Zabu Rakhi Mondal Papeya Akter 《Journal of Data Analysis and Information Processing》 2023年第4期388-399,共12页
We use a lot of devices in our daily life to communicate with others. In this modern world, people use email, Facebook, Twitter, and many other social network sites for exchanging information. People lose their valuab... We use a lot of devices in our daily life to communicate with others. In this modern world, people use email, Facebook, Twitter, and many other social network sites for exchanging information. People lose their valuable time misspelling and retyping, and some people are not happy to type large sentences because they face unnecessary words or grammatical issues. So, for this reason, word predictive systems help to exchange textual information more quickly, easier, and comfortably for all people. These systems predict the next most probable words and give users to choose of the needed word from these suggested words. Word prediction can help the writer by predicting the next word and helping complete the sentence correctly. This research aims to forecast the most suitable next word to complete a sentence for any given context. In this research, we have worked on the Bangla language. We have presented a process that can expect the next maximum probable and proper words and suggest a complete sentence using predicted words. In this research, GRU-based RNN has been used on the N-gram dataset to develop the proposed model. We collected a large dataset using multiple sources in the Bangla language and also compared it to the other approaches that have been used such as LSTM, and Naive Bayes. But this suggested approach provides excellent exactness than others. Here, the Unigram model provides 88.22%, Bi-gram model is 99.24%, Tri-gram model is 97.69%, and 4-gram and 5-gram models provide 99.43% and 99.78% on average accurateness. We think that our proposed method profound impression on Bangla search engines. 展开更多
关键词 Bangla Language words Prediction sentence Completion GRU RNN Corpus N-Gram
下载PDF
Markedness and UG in Chinese Children's Acquisition of One-word and Negative Sentences 被引量:1
2
作者 Yu Shanzhi Department of Foreign LanguagesHenan University Kadeng 475001P. R. China< sZyu@mail.henu.edu.cn>Zhang Xinhong Faculty Of English Language and Culture Guangdong University of Foreign Studies Guangzhou 510420P. R. China or < bbjohnson@ ]63.net > 《现代外语》 CSSCI 北大核心 1999年第4期379-381,共3页
Thepresentstudyisaninvestigationandanalysisoftherelationshipbetweenmarkednessandfirstlanguageacquisitionsequence,asshowninthecasesofone-wordandnegativesentences.Hereourobjectivesaretoargueforthepriorityofunmarkednesso... Thepresentstudyisaninvestigationandanalysisoftherelationshipbetweenmarkednessandfirstlanguageacquisitionsequence,asshowninthecasesofone-wordandnegativesentences.Hereourobjectivesaretoargueforthepriorityofunmarkednessovermarkednessintheacquisitionsequ... 展开更多
关键词 MARKEDNESS UG ACQUISITION one-word sentence negative sentence.
下载PDF
Product image sentence annotation based on kernel descriptors and tag-rank
3
作者 张红斌 姬东鸿 +2 位作者 尹兰 任亚峰 殷依 《Journal of Southeast University(English Edition)》 EI CAS 2016年第2期170-176,共7页
Dealing with issues such as too simple image features and word noise inference in product image sentence anmotation, a product image sentence annotation model focusing on image feature learning and key words summariza... Dealing with issues such as too simple image features and word noise inference in product image sentence anmotation, a product image sentence annotation model focusing on image feature learning and key words summarization is described. Three kernel descriptors such as gradient, shape, and color are extracted, respectively. Feature late-fusion is executed in turn by the multiple kernel learning model to obtain more discriminant image features. Absolute rank and relative rank of the tag-rank model are used to boost the key words' weights. A new word integration algorithm named word sequence blocks building (WSBB) is designed to create N-gram word sequences. Sentences are generated according to the N-gram word sequences and predefined templates. Experimental results show that both the BLEU-1 scores and BLEU-2 scores of the sentences are superior to those of the state-of-art baselines. 展开更多
关键词 product image sentence annotation kerneldescriptors tag-rank word sequence blocks building(WSBB) N-gram word sequences
下载PDF
An Abstractive Summarization Technique with Variable Length Keywords as per Document Diversity 被引量:1
4
作者 Muhammad Yahya Saeed Muhammad Awais +4 位作者 Muhammad Younas Muhammad Arif Shah Atif Khan M.Irfan Uddin Marwan Mahmoud 《Computers, Materials & Continua》 SCIE EI 2021年第3期2409-2423,共15页
Text Summarization is an essential area in text mining,which has procedures for text extraction.In natural language processing,text summarization maps the documents to a representative set of descriptive words.Therefo... Text Summarization is an essential area in text mining,which has procedures for text extraction.In natural language processing,text summarization maps the documents to a representative set of descriptive words.Therefore,the objective of text extraction is to attain reduced expressive contents from the text documents.Text summarization has two main areas such as abstractive,and extractive summarization.Extractive text summarization has further two approaches,in which the first approach applies the sentence score algorithm,and the second approach follows the word embedding principles.All such text extractions have limitations in providing the basic theme of the underlying documents.In this paper,we have employed text summarization by TF-IDF with PageRank keywords,sentence score algorithm,and Word2Vec word embedding.The study compared these forms of the text summarizations with the actual text,by calculating cosine similarities.Furthermore,TF-IDF based PageRank keywords are extracted from the other two extractive summarizations.An intersection over these three types of TD-IDF keywords to generate the more representative set of keywords for each text document is performed.This technique generates variable-length keywords as per document diversity instead of selecting fixedlength keywords for each document.This form of abstractive summarization improves metadata similarity to the original text compared to all other forms of summarized text.It also solves the issue of deciding the number of representative keywords for a specific text document.To evaluate the technique,the study used a sample of more than eighteen hundred text documents.The abstractive summarization follows the principles of deep learning to create uniform similarity of extracted words with actual text and all other forms of text summarization.The proposed technique provides a stable measure of similarity as compared to existing forms of text summarization. 展开更多
关键词 METADATA page rank sentence score word2vec cosine similarity This
下载PDF
基于SentencePiece的中医学分词模型建模研究 被引量:1
5
作者 刘双巧 周璐 +7 位作者 李彩艳 袁慧敏 张异卓 李昱达 刘锦钢 郑丰杰 孙燕 李宇航 《世界中医药》 CAS 2021年第6期981-985,990,共6页
目的:探索构建适用于中医学领域的分词模型。方法:采用基于SentencePiece的无监督学习分词方法,提出利用出版教材、名家著作及中医临床病历这3种不同类型的文献构建中医学分词模型;选择中医临床病历、名医医案作为测试集进行模型测试。... 目的:探索构建适用于中医学领域的分词模型。方法:采用基于SentencePiece的无监督学习分词方法,提出利用出版教材、名家著作及中医临床病历这3种不同类型的文献构建中医学分词模型;选择中医临床病历、名医医案作为测试集进行模型测试。结果:中医学分词模型在测试集中的Kappa系数为0.79(一致性程度很高),准确率为0.84,宏观精确率为0.84,宏观召回率为0.83,宏观f1得分为0.83。结论:所构建的分词模型对于中医学专业术语有着较好的切分效果,表明该方法可运用于中医学领域的分词模型的构建,可为进一步地研究中医学分词提供方法学参考。 展开更多
关键词 分词 中文分词 分词模型 无监督学习 无监督分词 sentencePiece
下载PDF
Research of Paraphrasing for Chinese Complex Sentences Based on Templates
6
作者 Zhongjian Wang Ling Wang 《Modern Electronic Technology》 2022年第1期38-42,共5页
Based on the paraphrasing of Chinese simple sentences,the complex sen­tence paraphrasing by using templates are studied.Through the classifica­tion of complex sentences,syntactic analysis and structural anal... Based on the paraphrasing of Chinese simple sentences,the complex sen­tence paraphrasing by using templates are studied.Through the classifica­tion of complex sentences,syntactic analysis and structural analysis,the proposed methods construct complex sentence paraphrasing templates that the associated words are as the core.The part of speech tagging is used in the calculation of the similarity between the paraphrasing sentences and the paraphrasing template.The joint complex sentence can be divided into parallel relationship,sequence relationship,selection relationship,progres­sive relationship,and interpretive relationship’s complex sentences.The subordinate complex sentence can be divided into transition relationship,conditional relationship,hypothesis relationship,causal relationship and objective relationship’s complex sentences.Joint complex sentence and subordinate complex sentence are divided to associated words.By using pretreated sentences,the preliminary experiment is carried out to decide the threshold between the paraphrasing sentence and the template.A small scale paraphrase experiment shows the method is availability,acquire the coverage rate of paraphrasing template 40.20%and the paraphrase correct rate 62.61%. 展开更多
关键词 Complex sentence Associated word Paraphrasing template
下载PDF
WordNet和词向量相结合的句子检索方法 被引量:3
7
作者 刘欣 席耀一 +1 位作者 王波 魏晗 《信息工程大学学报》 2017年第4期486-491,共6页
针对当前句子检索方法中因数据稀疏而存在的"词不匹配"问题,提出了一种Word Net和词向量相结合的句子检索方法。首先在Word Net语义关系图中应用个性化PageRank算法计算与查询项最相关的同义词集合,实现查询项扩展,从而在一... 针对当前句子检索方法中因数据稀疏而存在的"词不匹配"问题,提出了一种Word Net和词向量相结合的句子检索方法。首先在Word Net语义关系图中应用个性化PageRank算法计算与查询项最相关的同义词集合,实现查询项扩展,从而在一定程度上解决了查询项数据稀疏的问题;然后利用在大规模语料中训练神经网络语言模型获取的词向量对查询项和句子进行表示;最后引入WMD(word mover's distance)计算查询项与句子的语义相似度,从而利用语义信息进一步降低"词不匹配"问题带来的影响,将句子按相似度值从高到低排序作为句子检索结果。文章方法在TREC2003和TREC2004会议的项目中进行评测,MAP和R-Precision值相较于次优结果分别提高了13.29%和13.54%。 展开更多
关键词 wordNET 查询项扩展 词向量 语义相似度 句子检索
下载PDF
A Contrastive Study of Word Order in Chinese and English
8
作者 刘俊 《海外英语》 2012年第20期169-170,180,共3页
The present paper attempts to make a contrastive study on Chinese and English word order with a view of identifying the discrepancies and propose its significance to mutual translation.As to the research methodology,q... The present paper attempts to make a contrastive study on Chinese and English word order with a view of identifying the discrepancies and propose its significance to mutual translation.As to the research methodology,qualitative analysis and com parative analysis are adopted when the similarities and differences of the word order of English and Chinese are explained.It can be concluded that Chinese and English word order differs at the phrase level and sentence level:in terms of the discrepancies in phrase structure,they are mainly manifested in adverbial and attributive phrases;as to the discrepancies in sentence structure,they are reflected in simple,complex and special sentences. 展开更多
关键词 word order PHRASE SIMPLE sentenceS complex sentenc
下载PDF
应急语言独语句的发展钩沉与应用展望
9
作者 杜小红 《长春大学学报》 2024年第7期49-53,共5页
应急语言建设是当前国家语言战略研究的重要课题。因简洁高效,独语句在应急语言服务中使用日趋广泛,形成了数量众多的“应急语言独语句”,但相关研究尚未引起重视。文章在梳理应急语言独语句发展的基础上,对应急语言独语句进行了概念界... 应急语言建设是当前国家语言战略研究的重要课题。因简洁高效,独语句在应急语言服务中使用日趋广泛,形成了数量众多的“应急语言独语句”,但相关研究尚未引起重视。文章在梳理应急语言独语句发展的基础上,对应急语言独语句进行了概念界定,在此基础上对独语句在应急服务中的应用前景进行初步探讨,旨在弥补国家应急话语建设在独语句研究方面之不足,为国家应急用语的研制和编纂提供参考。 展开更多
关键词 应急语言 独语句 应用展望
下载PDF
应急语言独语句的语义建构研究
10
作者 杜小红 苑趁趁 《现代语文》 2024年第8期63-67,共5页
独语句在应急语言中使用广泛,并形成了数量众多的应急语言独语句。从认知突显视角出发,对应急语言独语句的语义建构进行学理阐释。研究显示,应急语言独语句是概念化者在应急语境下以经济方式进行的语言编码,其本质是将应急场景中最为突... 独语句在应急语言中使用广泛,并形成了数量众多的应急语言独语句。从认知突显视角出发,对应急语言独语句的语义建构进行学理阐释。研究显示,应急语言独语句是概念化者在应急语境下以经济方式进行的语言编码,其本质是将应急场景中最为突显的部分前景化,促使听者能够迅速捕捉到言者所要传达的核心信息,以实现应急交际的目的。这一研究结果,不仅可以在一定程度上弥补应急语言服务对独语句研究的不足,也可以为应急语言的研制提供参考,从而更好地服务于国家应急语言建设。 展开更多
关键词 独语句 应急语言 语义建构 认知突显 前景化
下载PDF
基于节点词全句共现的动态词义消歧研究
11
作者 闫亚亚 邢红兵 《语言科学》 CSSCI 北大核心 2024年第4期354-364,共11页
文章根据词义消歧即将词义回归语境这一特性,提出了一种基于节点词全句共现的动态词义消歧方法。该方法首先以全句为窗口限定节点词的使用语境,其次使用互信息(MI)、卡方检验(χ^(2)检验)和相对词序比(RRWR)等统计方法抽取节点词的语义... 文章根据词义消歧即将词义回归语境这一特性,提出了一种基于节点词全句共现的动态词义消歧方法。该方法首先以全句为窗口限定节点词的使用语境,其次使用互信息(MI)、卡方检验(χ^(2)检验)和相对词序比(RRWR)等统计方法抽取节点词的语义相关词,并参照《同义词词林》构建相关词语义范畴库,最后以共现频数作为加权系数,依靠单义词语义聚类分布率对中低频共现多义词进行消歧。采用该方法对与“美丽”共现的1030个小于7义类的多义词进行消歧的测试试验中取得了85.2%的正确率。 展开更多
关键词 节点词 全句共现 词义消歧 语义聚类 无指导学习
下载PDF
基于BERT字句向量与差异注意力的短文本语义匹配策略
12
作者 王钦晨 段利国 +2 位作者 王君山 张昊妍 郜浩 《计算机工程与科学》 CSCD 北大核心 2024年第7期1321-1330,共10页
短文本语义匹配是自然语言处理领域中的一个核心问题,可广泛应用于自动问答、搜索引擎等领域。过去的工作大多只考虑文本之间的相似部分,忽略了文本之间的差异部分,从而使模型无法充分利用到决定文本之间是否匹配的关键信息。针对上述问... 短文本语义匹配是自然语言处理领域中的一个核心问题,可广泛应用于自动问答、搜索引擎等领域。过去的工作大多只考虑文本之间的相似部分,忽略了文本之间的差异部分,从而使模型无法充分利用到决定文本之间是否匹配的关键信息。针对上述问题,提出一种基于BERT字句向量与差异注意力的短文本语义匹配策略,利用BERT对句子对进行向量化表示,使用BiLSTM并引入多头差异注意力机制获取当前字向量与文本全局语义信息之间表征意图差异的注意力权重,结合一维卷积神经网络对句子对的语义特征向量进行降维,最后拼接字句向量并送入全连接层计算出2个句子之间的语义匹配度。通过在LCQMC和BQ Corpus数据集上的实验表明,该策略可以有效提取文本语义差异信息,从而使模型表现出更好的效果。 展开更多
关键词 短文本语义匹配 字句向量 表征意图 差异注意
下载PDF
基于句信息增强词信息的方面级情感分类
13
作者 李怡霖 孙成胜 +1 位作者 罗林 琚生根 《计算机科学》 CSCD 北大核心 2024年第6期299-308,共10页
方面级情感分类属于细粒度的情感分类,旨在判断句子中指定方面词的情感极性。近年来,句法知识在方面级情感分类任务中得到了广泛应用。目前主流的模型利用句法依存树和图卷积神经网络进行情感极性的分类。然而,此类模型着眼于利用聚合... 方面级情感分类属于细粒度的情感分类,旨在判断句子中指定方面词的情感极性。近年来,句法知识在方面级情感分类任务中得到了广泛应用。目前主流的模型利用句法依存树和图卷积神经网络进行情感极性的分类。然而,此类模型着眼于利用聚合后的方面词信息来判断情感极性,很少关注句子的全局信息对情感极性的影响,从而导致情感极性分类结果出现偏差。为了解决这一问题,提出了一种基于句信息增强词信息的方面级情感分类模型,该模型通过对比学习对句向量进行表示学习,以减小句向量对比损失为目标调整词向量的特征表示,最后通过图卷积神经网络聚合意见词信息得出情感分类结果。在SemEval2014数据集和Twitter数据集上进行实验,结果表明,所提模型可以提高分类的准确性,综合验证了该方法的有效性。 展开更多
关键词 方面级情感分类 句信息 词信息 对比学习 图卷积神经网络
下载PDF
Improving neural sentence alignment with word translation 被引量:2
14
作者 Ying DING Junhui LI +1 位作者 Zhengxian GONG Guodong ZHOU 《Frontiers of Computer Science》 SCIE EI CSCD 2021年第1期81-90,共10页
Sentence alignment is a basic task in natural lan-guage processing which aims to extract high-quality paral-lel sentences automatically.Motivated by the observation that aligned sentence pairs contain a larger number ... Sentence alignment is a basic task in natural lan-guage processing which aims to extract high-quality paral-lel sentences automatically.Motivated by the observation that aligned sentence pairs contain a larger number of aligned words than unaligned ones,we treat word translation as one of the most useful external knowledge.In this paper,we show how to explicitly integrate word translation into neural sentence alignment.Specifically,this paper proposes three cross-lingual encoders to incorporate word translation:1)Mixed Encoder that learns words and their translation annotation vectors over sequences where words and their translations are mixed alterma-tively;2)Factored Encoder that views word translations as fea-tures and encodes words and their translations by concatenating their embeddings;and 3)Gated Encoder that uses gate mechanism to selectively control the amount of word translations moving forward.Experimentation on NIST MT and Opensub-titles Chinese-English datasets on both non-monotonicity and monotonicity scenarios demonstrates that all the proposed encoders significantly improve sentence alignment performance. 展开更多
关键词 sentence alignment word translation mixeden coder factored encoder gated encoder
原文传递
虞廷十六字心传辨正及思想变迁——基于欲望的认知及治疗视角
15
作者 张昭炜 《中州学刊》 CSSCI 北大核心 2024年第11期118-126,共9页
出自《尚书·大禹谟》的虞廷十六字心传是宋明理学的重要基础。基于人心之欲与道心之理的二元对立,理学家发展出存理遏欲的欲望治疗方案。在明清之际反理学的思潮下,阎若璩质疑十六字心传是后人袭用《荀子》伪作,这对于宋明理学无... 出自《尚书·大禹谟》的虞廷十六字心传是宋明理学的重要基础。基于人心之欲与道心之理的二元对立,理学家发展出存理遏欲的欲望治疗方案。在明清之际反理学的思潮下,阎若璩质疑十六字心传是后人袭用《荀子》伪作,这对于宋明理学无疑是釜底抽薪。考辨阎若璩所论可知,其论点与论证均不足以支撑其论断,反而可以说明荀子继承发挥了十六字心传,并影响了宋明理学。十六字心传是尧舜禹所传的外王政治之道。结合《尚书·大禹谟》十六字心传的上下文,通过尧舜禹的为君治民之法、大禹伐有苗,引入汉唐的权威注疏,可判别出道心、人心、允中为三元关系,属于允许欲望适度释放的治疗方案。综合中国哲学形成发展史,宋明理学的欲望认知及治疗与荀子具有相似性,并受佛教禁欲刺激,发展出存理遏欲的观点,侧重于个体修身的内圣;三代尧舜禹、汉唐权威注疏倾向于欲望的适度释放,侧重于国家政治的外王。尽管内圣与外王具有一致性,但是两者属于不同的欲望治疗方案,且应用场景亦不同。 展开更多
关键词 十六字心传 《荀子·解蔽》 存理遏欲 阎若璩 欲望治疗
下载PDF
网络内容的去重算法与语义量化研究
16
作者 谢志豪 杨贤 《现代计算机》 2024年第17期1-6,12,共7页
为降低网站对用户的影响,同时提升去除重复的能力,设计了一种能够应用在大型网站的去除重复的创新方案。首先,利用文本预处理技术提取网页正文内容关键词和长句特征码;其次,使用Simhash算法把特征码映射成指纹,并构建关键词指向文档的... 为降低网站对用户的影响,同时提升去除重复的能力,设计了一种能够应用在大型网站的去除重复的创新方案。首先,利用文本预处理技术提取网页正文内容关键词和长句特征码;其次,使用Simhash算法把特征码映射成指纹,并构建关键词指向文档的倒排索引;最后,通过关键词快速找到与待测文档高度相似的文档,接着只需比较待测文档与相似文档的指纹,即可判断网页是否重复。结果显示,该算法识别率较高,实用性良好。 展开更多
关键词 网页去重 语义量化 特征指纹 长句 关键词
下载PDF
母语为哈萨克语的汉语学习者陈述句语序偏误分析——以哈萨克斯坦阿布莱汗孔子学院为例
17
作者 王璟璇 Akymbek Sezd 《文化创新比较研究》 2024年第13期31-36,共6页
哈萨克语陈述句表示描述、告知、叙述事实等含义,哈萨克语基本语序为主—宾—谓结构(SOV),与汉语基本语序主—谓—宾结构(SVO)不同。两者在句法、形态和语义上存在明显差异。哈萨克语可通过词形变化,如词尾后缀的变化形式来表达不同含义... 哈萨克语陈述句表示描述、告知、叙述事实等含义,哈萨克语基本语序为主—宾—谓结构(SOV),与汉语基本语序主—谓—宾结构(SVO)不同。两者在句法、形态和语义上存在明显差异。哈萨克语可通过词形变化,如词尾后缀的变化形式来表达不同含义,语法显性,而汉语作为孤立语,语法隐性,需要通过语义判断分析。该文以哈萨克斯坦地区母语为哈萨克语的汉语学习者为研究对象,从哈萨克语的角度出发,结合所收集的陈述句语料分析语序偏误产生的原因,并总结针对母语为哈萨克语的汉语学习者的教学对策,希望对于汉语教师有一定的借鉴意义,促进哈萨克斯坦地区学习者汉语学习的发展。 展开更多
关键词 哈萨克语 陈述句 语序 偏误分析 国际中文教育 教学对策
下载PDF
基于清华汉语树库的复句关系词识别与分类研究 被引量:19
18
作者 李艳翠 孙静 +1 位作者 周国栋 冯文贺 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第1期118-124,共7页
根据清华汉语树库的标注方法,利用规则从中提取复句关系词并标注其类别,然后分别抽取带功能标记和不带功能标记的自动句法树的句法、词法、位置特征,进行复句关系词的识别和分类。实验结果表明,复句关系词判断准确率达95.7%,复句关系词... 根据清华汉语树库的标注方法,利用规则从中提取复句关系词并标注其类别,然后分别抽取带功能标记和不带功能标记的自动句法树的句法、词法、位置特征,进行复句关系词的识别和分类。实验结果表明,复句关系词判断准确率达95.7%,复句关系词类别判断F1值为77.2%。 展开更多
关键词 复句关系词 清华汉语树库 关系词识别 关系词分类
下载PDF
基于主题词权重和句子特征的自动文摘 被引量:17
19
作者 蒋昌金 彭宏 +1 位作者 陈建超 马千里 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2010年第7期50-55,共6页
为获得高质量的自动文摘,在组合词识别算法的基础上,充分考虑词的频率、词性、词的位置、词长等因素,构建了一个词语权重计算公式,该公式能使表达主题的词和短语具有较高的权重.对句子权重的计算,则考虑了句子的内容、位置以及线索词的... 为获得高质量的自动文摘,在组合词识别算法的基础上,充分考虑词的频率、词性、词的位置、词长等因素,构建了一个词语权重计算公式,该公式能使表达主题的词和短语具有较高的权重.对句子权重的计算,则考虑了句子的内容、位置以及线索词的作用和用户偏好等.摘要的生成充分考虑了候选文摘句的相似性,避免了冗余信息的加入.对摘要的评估进行了从句子粒度到词语粒度的改进,提出了一种基于词语粒度的准确率和召回率计算方法.实验证明,该算法生成的自动文摘有着较高的质量,平均准确率达到77.1%. 展开更多
关键词 主题词 自动文摘 组合词 权重计算 句子特征
下载PDF
三个层面的中文文本主题自动提取研究 被引量:13
20
作者 韩客松 王永成 +1 位作者 沈洲 吴芳芳 《中文信息学报》 CSCD 北大核心 2001年第4期20-27,共8页
为适应Internet时代和大规模文献处理的需要 ,以中文文本为处理对象 ,研究了从主题词、主题概念和主题句三个不同层面自动抽取文本主题的方法 ,着重讨论了加权体系和一些经验值的获取方法。对新闻类文献做了实验 。
关键词 主题词 主题概念 主题句 加权 中文文本 主题提取 文本处理
下载PDF
上一页 1 2 42 下一页 到第
使用帮助 返回顶部