题名 基于论坛话题段落划分的答案识别
被引量:7
1
作者
王宝勋
刘秉权
孙承杰
王晓龙
孙林
机构
哈尔滨工业大学计算机科学与技术学院
出处
《自动化学报》
EI
CSCD
北大核心
2013年第1期11-20,共10页
基金
国家自然科学基金(60973076
61100094)
+1 种基金
语言语音教育部-微软重点实验室开放基金(HIT.KLOF.2010061)
哈尔滨市科技创新人才研究专项资金项目(2010RFXXG003)资助~~
文摘
在论坛话题中识别答案是面向论坛的问答对挖掘中的核心问题.在论坛话题的讨论中通常存在隐式的结构,这种结构信息非常有助于最佳答案的定位和识别.本文提出了一种基于中文论坛话题段落划分的答案识别方法:首先将论坛话题重新组织为若干段落的集合,并基于此划分提取一组能够反映话题讨论逻辑结构的特征.在此基础上给出了一种可以根据候选答案所在段落类别实现模型选择的答案识别策略,从而避免了噪声信息对模型预测的误导.实验结果表明本文的答案识别方法非常适用于面向在线论坛的问答资源挖掘工作.
关键词
话题段落划分
非文本特征
答案识别
在线论坛
问答对挖掘
Keywords
Thread segmentation, non-textual feature, answer detection, online forum, question-answer (QA) pairmining
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
题名 基于CRF的百科全书文本段落划分
被引量:3
2
作者
许勇
宋柔
机构
北京工业大学计算机科学学院
北京语言大学计算机科学系
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第10期16-18,共3页
基金
国家自然科学基金资助项目(60272055)
国家"863"计划基金资助项目(2001AA110372-1)
文摘
CRF模型是标注、切分序列数据的较新的概率模型,在信息抽取等文本处理领域广受关注。该文介绍了CRF方法,并将其应用到百科全书文本段落的划分上,利用CRF的特征表述机制加入了文本单元序列中的长距离约束,取得了比传统的隐马尔科夫方法更好的结果。
关键词
文本段落划分
条件随机域模型
隐马尔科夫模型
Keywords
Topic segmentation
Conditional random fields(CRF)
Hidden Markov model(HMM)
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 基于半CRF模型的百科全书文本段落划分
被引量:2
3
作者
许勇
宋柔
机构
北京工业大学计算机学院
北京语言大学计算机系
出处
《北京工业大学学报》
CAS
CSCD
北大核心
2008年第2期204-210,共7页
基金
国家自然科学基金(60272055)
国家“八六三”计划资助项目(2001AA114111)
文摘
介绍了基于半条件随机域(semi-Markov conditional random fields,简称semi-CRFs)模型的百科全书文本段落划分方法.为了克服单纯的HMM模型和CRF模型的段落类型重复问题,以经过整理的HMM模型状态的后验分布为基本依据,使用了基于词汇语义本体知识库的段落开始特征以及针对特定段落类型的提示性特征来进一步适应目标文本的特点.实验结果表明,该划分方法可以综合利用各种不同类型的信息,比较适合百科全书文本的段落结构,可以取得比单纯的HMM模型和CRF模型更好的性能.
关键词
自然语言处理
机器学习
隐马尔科夫模型
文本段落划分
半条件随机域模型
Keywords
natural language processing systems
machine learning
hidden markov models
topic segmentation
semi-Markov CRF
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 试析英汉说明文段落划分的相同性
被引量:2
4
作者
廖开洪
机构
暨南大学外语教学中心
出处
《外语教学》
北大核心
2000年第2期26-31,共6页
文摘
本文根据 Van Dijk的篇章语义宏观结构理论对英汉说明文中的段落切分问题进行探讨 ,以期发现英汉说明文中段落划分的共同规律。通过分析由 50篇英文和 50篇中文说明文组成的语料库 ,发现英汉说明文在段落划分方面存在着共性 ,英汉段落划分主要遵循六条原则 :主题与次主题 ,时间顺序 ,空间顺序 ,并列安排 ,强调和过渡。了解英汉段落划分的规律能有效地提高阅读与写作水平。
关键词
宏观结构
段落划分
主题
相同性
Keywords
similarities
macrostructure
paragraphing
topic
分类号
H0
[语言文字—语言学]
题名 英汉文章段落划分差异及对策
5
作者
李玲
机构
湖北文理学院外国语学院
出处
《湖北文理学院学报》
2016年第4期68-70,共3页
文摘
英汉两种语言属于不同的语系,英汉文章段落的划分存在差异。英语里大多数自然段等同于意义段,且遵循"单一性"的原则,即一个段落只阐述一个主题。文章探讨英汉段落划分的差异,提出提高学生阅读能力、英文段落写作能力之对策:培养学生语言差异的敏感性;读写结合,草拟大纲;充分利用学生自身的力量。
关键词
英文写作
篇章写作
段落划分
Keywords
English Writing
Writing of sections and chapters
Paragraph deviding
分类号
H05
[语言文字—语言学]
题名 汉英议论文段落划分模式及其理据的比较研究
6
作者
廖慈惠
机构
广东技术师范学院大学英语部
出处
《广东技术师范学院学报》
2005年第2期51-54,共4页
文摘
汉英议论文的段落划分模式都有三种,即一个自然段一个主题句,两个或多个自然段来论证一个主题句,以及自然段“主题句隐含”,但前者还有一个段落内含两个或多个主题意义的情况,后者则段落主题意义必须单一。从理据上分析,汉英议论文各自的段落划分受思维单元、认知、情感、社会因素和传统思维方式的不同作用。汉英议论文段落划分模式大同小异,并呈现出相互影响互为容纳的表征,有共向演进的趋势。
关键词
汉英议论文
段落划分
模式
理据
比较
Keywords
Chinese and English argumentative essays
paragraph division
modes
motivation
a comparative study
分类号
H31
[语言文字—英语]
题名 重拾“段落划分”
7
作者
丁庆军
机构
江苏省盐城市第一小学教育集团
出处
《江苏教育(小学教学)》
2013年第11期29-30,共2页
文摘
“段落划分”,虽然在新课标中没有明确提出,却在教材中以不同形式出现.基于对苏教版教材的分析,采用合适的教学策略,借助切割法、突破法等方法指导学生划分段落,从而帮助学生有效阅读、习得语言,提升综合能力.
关键词
段落划分
教材体现
教学策略
分类号
G623.5
[文化科学—教育学]
题名 英汉说明文段落划分差异研究
被引量:6
8
作者
廖开宏
机构
暨南大学
出处
《外语与外语教学》
CSSCI
北大核心
1999年第8期30-32,共3页
关键词
段落划分
说明文
自然段
意义段
段落 标记
过渡段
语料库
超声波接收器
超声波发射器
英文
分类号
H3
[语言文字]
题名 评《春秋左传集解》标点本的段落划分
被引量:1
9
作者
陈煦
出处
《史学史研究》
1982年第4期59-63,共5页
文摘
上海人民出版社《春秋左传集解》标点本,在篇章结构的区分上,有不少地方是可以商榷的。文章的篇章结构,是事物发展的阶段性和系统性在作品中的反映。正确区分段落层次,不仅有助于对文章所表达的事物能有正确深入的理解,而且还可以加强我们的逻辑思维能力。《左传》这部书,是一部极其重要的史册。其文雅驯雄健,变幻超忽。叙论谋篇,简洁严谨。欲穷秘奥而识脉络,舍究篇章而莫由。标点本对某些篇章,或混章节以为一,或分段落而欠允。其无线索可寻,固非一二见也。是书流传既广,实有待于修订。特撰此文,意在商讨。例凡二十有五。
关键词
标点本
春秋左传
文字
篇章结构
段落划分
自成
战役过程
大段
逻辑思维能力
段落 层次
分类号
K09
[历史地理—历史学]
题名 段落划分:重结果,更要重过程
被引量:1
10
作者
滕衍平
机构
江苏徐州市铜山区三堡实验小学
出处
《教学与管理(小学版)》
2012年第3期27-28,共2页
文摘
以前的小学语文教学大纲强调分段理解课文、梳理文章结构,并把划分段落、归纳段意当作教学重点;而新课标颁布以后,不再明确提出划分段落的要求,由于怕被扣上违背课改的帽子,因此,课堂上便很难见到教师指导学生划分段落。于是,阅读教学从一个极端走向了另一个极端。课标之所以淡化段落的划分与概括段意的训练,
关键词
段落划分
语文教学大纲
文章结构
教学重点
教师指导
阅读教学
新课标
段意
分类号
G623.2
[文化科学—教育学]
题名 《阿长与<山海经>》段落划分质疑
11
作者
沈雅源
机构
湖南浏阳龙伏中学
出处
《学语文》
2002年第6期18-18,共1页
文摘
初中语文第3册《阿长与〈山海经〉》一文是鲁迅先生写女工阿长的回忆性散文。课文对人物欲扬先抑的写法,对选材详略得当的剪辑以及生动形象的细节描写都是值得我们好好揣摩的。鲁迅先生的文章,一向被人们奉为经典,褒奖有加,却很少读到指误的文字。我在反复品读第3段时总觉得段落划分有些不妥。
关键词
《阿长与〈山海经〉》
初中
语文教材
鲁迅
回忆性散文
段落划分
分类号
G633.3
[文化科学—教育学]
题名 关于三篇记叙文的段落划分
12
作者
王毓新
机构
甘肃省教科所
出处
《甘肃教育》
1999年第5期23-23,共1页
文摘
给文章划分段落,是小学语文教学中促使学生准确迅速地掌握文章主要内容,培养提高他们分析概括能力的重要途径。素质教育特别关注学生的发展,把“怎样学习”和“怎样思考”定为教学的主要内容。而“怎样思考”,即思维能力又是构成智力的核心。因此,实施素质教育,达到...
关键词
记叙文
主要内容
中间部分
周总理
段落划分
小学语文
读写例话
重点内容
《颐和园》
分析概括能力
分类号
G623.2
[文化科学—教育学]
题名 无砟轨道底座板段落划分
13
作者
程道财
机构
中交二航局第六分公司
出处
《黑龙江科技信息》
2014年第8期236-236,共1页
文摘
本文简要介绍CRTSII型板式无砟轨道底座板段落划分,总结了一些经验和教训,对今后类似工程有一定的借鉴作用。
关键词
底座板段落划分
临时端刺
常规区后浇带
分类号
U213.244
[交通运输工程—道路与铁道工程]
题名 《荷塘月色》段落划分异议
14
作者
黄浙军
出处
《中学语文(大语文论坛)(下旬)》
2001年第9期26-27,共2页
文摘
《荷塘月色》的段落划分似乎早有定论,《中国现代散文欣赏辞典》(汉语大辞典出版社1990年版,作者金志华)如是分析:“文章三大部分之间的转接,十分妥贴。第一部分(1至3自然段)写夜赏的缘由,用‘我且受用这无边的荷香月色好了’。
关键词
段落划分
荷塘月色
中国现代散文
自然段
作者心境
情感发展
辞典
欣赏
异议
宁静
分类号
G634.3
[文化科学—教育学]
题名 多特征下的科研论文段落自动划分与构成要素识别研究
被引量:1
15
作者
刘伙玉
王东波
苏新宁
机构
南京大学信息管理学院
南京农业大学信息科学技术学院
江苏省数据工程与知识服务重点实验室
出处
《情报学报》
CSSCI
北大核心
2015年第4期388-397,共10页
基金
国家自然科学基金管理学部青年项目“基于CSSCI的句法级汉英平行语料库构建及知识挖掘研究”(项目编号:71303120)中的成果之一
文摘
本文为科研论文的结构化处理提供了一种有价值的方法。本文采用条件随机场模型,综合原始语料中科研论文的局部与整体特征,使用复杂特征模板对段落进行自动划分以及对构成要素进行自动识别。在开放测试中,F值最高分别达88%和92%。同时本文对CRFs和ME在段落自动划分与构成要素识别实验中进行了比较分析,认为CRFs在付出更大的时间复杂度的代价下,其处理效果明显优于ME。
关键词
条件随机场
CRFS
段落划分
要素识别
特征模板
Keywords
conditional random fields, CRFs, paragraphs segmentation, elements recognition, feature template
分类号
G254
[文化科学—图书馆学]
题名 制约幼儿故事叙事语篇段落划分的因素
被引量:1
16
作者
李晋霞
机构
北京师范大学文学院
出处
《华中学术》
CSSCI
2017年第1期122-134,共13页
基金
教育部人文社会科学研究规划基金项目“篇章视野下的汉语复句研究”【15YJA740029】
教育部人文社会科学重点研究基地重大项目“基于小句中枢理论的有标复句层次关系自动识别研究”【16JJD740013】阶段性成果
文摘
本文采用问卷调查的方法,从幼儿故事入手,尝试分析汉语叙事语篇段落划分的制约因素。幼儿故事叙事语篇段落划分的制约因素主要有五个:(1)叙事语篇的篇章结构;(2)语篇结构单位的复杂度;(3)被试的段落感知的模块大小;(4)被试的段落习得的特定模式;(5)被试的语篇理解的独特性。段落划分既受语篇客观结构层次的制约,同时又受语篇加工者主观因素的影响。段落划分表面上的随意性并不能掩盖段落划分的一般规律。
关键词
幼儿故事
叙事语篇
段落划分
分类号
H152.1
[语言文字—汉语]
I207.8
[文学—中国文学]
题名 谈地方志书竖写单元的段落划分
17
作者
金雄波
机构
《萧山市志》编辑部
出处
《广东史志》
2012年第4期10-12,共3页
文摘
在编修二轮志书过程中,翻阅了几十部已出版的第二轮县(市、区)志书,发现有的志书竖写单元的段落存在没有规则、不该划分段落的年份划分了段落、该划分段落的年份不划分段落的问题,直接影响了志书质量。现就地方志书竖写单元的段落划分问题谈点看法,与同仁共商。
关键词
段落划分
地方志书
志书质量
编修
出版
分类号
G220
[文化科学]
题名 段落,文章的仪表——考场作文段落安排例说
18
作者
张兴武
机构
湖北省松滋一中
出处
《课堂内外(创新作文)(高中版)》
2018年第3期64-65,共2页
文摘
“段落划分恰当”是高考作文基础等级分表达项“结构严谨”的主体内容,可以毫不夸张地说,段落就是文章的仪表.段落恰当,文章就会自然地呈现出一种形式美.
关键词
段落划分
考场作文
文章
仪表
基础等级分
高考作文
形式美
分类号
G633.34
[文化科学—教育学]
题名 巴托克《第三弦乐四重奏》第一乐章结构划分解析
19
作者
郑刚
机构
淄博师范高等专科学校艺体教育系
出处
《淄博师专学报》
2008年第2期46-49,共4页
文摘
音乐总是要有段落划分的,如果对曲式结构清楚了,对音乐的理解自然也就很容易更加深入了,在传统音乐中其重要标志便是和声终止式。但是在巴托克《第三弦乐四重奏》这样的20世纪现代音乐的代表作中,是不再采用大小调体系的,传统的和声终止式因而也就不存在了。那么,这第一乐章的结构是怎样的以及由哪些因素影响了这一乐章的段落划分便是对此乐章进行研究的切入点。
关键词
巴托克
弦乐四重奏
段落划分
第一乐章
Keywords
Bartok
String Quartet
paragraph division
the first movement
分类号
J605
[艺术—音乐]
题名 新闻段落略论
20
作者
许清茂
出处
《厦门大学学报(哲学社会科学版)》
1988年第2期120-125,132,共7页
文摘
段落既是语言学研究的对象,又是文章学研究的对象。我国以往的研究较多地探讨段落的内部构造段落之间的彼此联系,基本上没有摆脱“句有数以连章,章有体以成篇”,”因字生句,积句而为章,积章而成篇”的窠臼,即由分到总:组词成句,连句成殿,缀段成篇。六十年代后期在许多国家出现的篇章语言学认为,篇章中语言是爱篇章制约的,因此研究语言不仅要研究由分到总,而且要研究由总到分,就是从篇章向下研究。
关键词
六十年代
篇章语言学
语言学研究
表现形式
段落划分
文章学
基本结构形式
语言研究
新闻文体
句子
分类号
C55
[社会学]