-
题名视频中滚动字幕的检测与跟踪
- 1
-
-
作者
李钦瑞
吕学强
李卓
刘坤
-
机构
北京信息科技大学网络文化与数字传播北京市重点实验室
北京拓尔思信息技术股份有限公司
-
出处
《小型微型计算机系统》
CSCD
北大核心
2015年第3期631-636,共6页
-
基金
国家自然科学基金项目(61171159
61271304)资助
+2 种基金
北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目(KZ201311232037)资助
北京市属高等学校创新团队建设与教师职业发展计划项目(IDHT20130519)资助
北京信息科技大学网络文化与数字传播北京市重点实验室开放课题(ICDD201303)资助
-
文摘
视频中滚动字幕通常表达一段完整信息,对其进行检测与跟踪是字幕识别与应用的重要前提.通过分析视频中滚动字幕的特征,在Sobel边缘检测的基础上,提出规则和统计结合的字幕检测方法及垂直边缘特征最小差平方和的字幕跟踪方法.从视频全局角度出发,对相邻帧的边缘图像进行差分,选取水平边缘特征并根据规则检测字幕区域的候选边界,通过统计边界出现频数,定位滚动字幕区域;计算相邻滚动字幕条在不同偏移值下垂直边缘特征差平方和,取其最小值作为相邻字幕的偏移量,从而实现字幕的跟踪.实验结果显示,该文方法从含有多种字幕类型的视频中检测出滚动字幕的准确率可达96.61%、字幕跟踪的准确率达99.43%,充分说明文中方法的有效性.
-
关键词
滚动字幕
字幕检测
字幕跟踪
边缘特征
规则与统计
-
Keywords
rolling caption
caption detection
caption tracking
edge feature
rules and statistics
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于模板匹配及曲线拟合的视频字幕细化研究
- 2
-
-
作者
李钦瑞
都云程
刘坤
吕学强
-
机构
北京信息科技大学网络文化与数字传播北京市重点实验室
北京拓尔思信息技术股份有限公司
-
出处
《计算机应用与软件》
CSCD
北大核心
2014年第1期144-147,共4页
-
基金
国家自然科学基金项目(61171159)
北京市教委科技发展计划项目(KM201110772021
+2 种基金
KM201211232023)
国家科技支撑计划课题(2011BAH11B03)
北京信息科技大学网络文化与数字传播北京市重点实验室开放课题(ICDD201103)
-
文摘
在视频字幕识别过程中,由于字幕像素比较低,使得二值化后,汉字边缘出现不规整的锯齿。针对该类汉字的细化,提出基于模板匹配及曲线拟合的方法。用角度为0°、45°、90°、135°的线段作为模板,分别匹配汉字中"横"、"撇"、"竖"、"捺"笔划,实现笔划提取;用二次Bezier曲线拟合"撇"、"捺"笔划,实现笔划重绘。对比实验表明,该方法对视频字幕的细化是有效的,且结果可以更好地被识别。
-
关键词
视频字幕汉字细化
笔划
模板匹配
二次Bezier曲线
-
Keywords
Video caption Thinning of Chinese characters Strokes. Template matching Quadratic Bezier curve
-
分类号
N391
[自然科学总论]
-
-
题名谈心理的实质
被引量:1
- 3
-
-
作者
李钦瑞
-
出处
《宁波大学学报(教育科学版)》
1987年第2期72-76,共5页
-
文摘
人的心理现象,如认识、情感和意志等现象,是人们能觉察又熟悉的现象。至于这些现象究竟是什么东西?是怎样发生发展的?在生活实践中又有什么作用?那就涉及人的心理实质的问题,也就是心理学在哲学上的根本问题(存在和思维,即物质和精神的关系问题)。历史上长期以来,为了弄清楚这个问题,主要的曾经有过唯心主义和唯物主义两派心理观。他们猜测不一,争论不休,始终不能正确理解人的心理实质。
-
关键词
心理实质
存在和思维
近代科学
反映形式
心理现象
布洛卡区
感应性
个性倾向
生下来
社会生活条件
-
分类号
G6
[文化科学—教育学]
-
-
题名小学入学新生智力发展调查研究
- 4
-
-
作者
李钦瑞
杨心德
-
出处
《宁波大学学报(教育科学版)》
1982年第1期23-30,共8页
-
文摘
一、调查研究的目的发展学生的智力是教学的基本任务之一。要发展学生的智力,首先必须了解他们的智力发展水平,然后在教学过程,才能有针对性地扬长避短,发挥优势,做到统一要求与因材施教相结合,以促进学生的智力顺利地发展。为此,我们试图通过有关的测量,了解小学初入学新生智力发展的水平,为教学提供心理学的依据。目前对于智力的定义和结构,尚无统一的认识。
-
关键词
智力测量
学习动机
智力发展水平
学习态度
发展调查
儿童智力
评分标准
太阳下山了
智力结构
家庭条件
-
分类号
G6
[文化科学—教育学]
-
-
题名Logistic视频字幕增强模型
被引量:1
- 5
-
-
作者
李钦瑞
吕学强
李卓
刘坤
-
机构
北京信息科技大学网络文化与数字传播北京市重点实验室
北京拓尔思信息技术股份有限公司
-
出处
《中国图象图形学报》
CSCD
北大核心
2014年第5期683-692,共10页
-
基金
国家自然科学基金项目(61171159
61271304)
+2 种基金
北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目(KZ201311232037)
北京市属高等学校创新团队建设与教师职业发展计划项目(IDHT20130519)
北京信息科技大学网络文化与数字传播北京市重点实验室开放课题(ICDD201303)
-
文摘
目的为提高复杂背景下的视频字幕在光学字符识别(OCR)中的识别率,需要对提取的视频字幕进行有效地字幕增强。首次将Logistic模型应用到视频字幕增强中,提出了基于Logistic模型的融合多帧信息的视频字幕增强方法。方法对字幕进行检测与跟踪,将出现在连续多帧中的同一字幕片段进行对齐;通过分析字幕片段在多帧中信息,提出字幕背景在时域上的变化特征、背景和字幕文本的固有特征,并将3个特征进行量化与融合,构建适用于字幕增强的Logistic模型,实现对视频字幕的增强。结果对含阴影或描边效果的特殊复杂背景字幕、普通复杂背景字幕、单一背景字幕分别进行实验,增强后的字幕在OCR软件中的识别正确率分别为81.76%、97.13%、98.19%,与对比方法比较均有一定的提高。结论实验结果表明,本文方法既可以降低字幕背景的复杂度,又可以提高字幕背景与文本的对比度,从而可以对复杂背景和单一背景下的视频字幕进行有效地增强。
-
关键词
复杂背景
字幕增强
LOGISTIC模型
字幕检测与跟踪
时域特征
-
Keywords
complex background
caption enhancement
Logistic model
caption detection and tracking
time domain feature
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名逆作法在某既改下沉广场项目中的设计与应用
被引量:3
- 6
-
-
作者
李洪求
徐越
吴增良
李钦瑞
-
机构
北京维拓时代建筑设计股份有限公司
建研地基基础工程有限责任公司
-
出处
《建筑结构》
CSCD
北大核心
2019年第16期55-58,132,共5页
-
文摘
某既改项目新增一层下沉广场,下沉广场四周均是既有建筑的地下室。经过多方论证,采用逆作法施工下沉广场能最大程度节省工期,提高业主周转效率。介绍了该工程逆作法施工的设计及要点;重点描述了采用支护和挡墙一体设计的桩墙来代替地下连续墙作为基坑支护的设计做法以及采用钢筋混凝土复合柱代替型钢格构柱的设计做法,此做法的施工难度低于传统施工做法;并介绍了采用钢管桩对原有结构柱进行托换的技术。
-
关键词
逆作法
支护挡墙一体
柱托换
灌注桩
-
Keywords
top-down construction method
dual-purpose pile wall
column transfer
bored pile
-
分类号
TU753
[建筑科学—建筑技术科学]
-