-
题名基于三维人体语义模型的人行为自然语言描述
被引量:3
- 1
-
-
作者
李敏
刘恒
-
机构
中国工程物理研究院五所
西南科技大学信息工程学院
-
出处
《计算机应用与软件》
CSCD
北大核心
2014年第2期177-181,共5页
-
基金
国家自然科学基金项目(61105020)
-
文摘
研究视频场景中人体行为自然语言描述的实现方法。首先建立三维人体的语义模型和主要的关节点运动模型,并建立人体运动语义描述基本数据库。应用图像自动场景标注技术来描述背景图像。通过人体简单动作的语义逻辑运算,得到人的组合动作和相互动作。将人的行为动作组合场景语义,从而准确描述出人在复杂场景的语义行为。最后建立简单的中文语法规则,得到人在场景中行为的自然语言描述。实验结果表明:与传统的二维模型相比,三维模型结合了场景语义并能解决遮挡问题,可以准确表达更为复杂的人类行为。
-
关键词
三维人体语义模型
图像自动标注技术
人体运动
人行为自然语言描述
-
Keywords
3D semantic human body model
Automatic image annotation technology
Human body motion
Natural language description of human behaviour
-
分类号
TP24
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名基于八元组视频语义模型的人体行为理解方法
- 2
-
-
作者
李敏
刘恒
-
机构
中国工程物理研究院五所
绵阳师范学院数学与计算机科学学院
西南科技大学信息学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2013年第12期4267-4272,共6页
-
基金
国家自然基金项目(61105020)
-
文摘
目前的人体行为理解技术存在对噪声敏感,运算量大,没有关注场景敏感度,未进行事件整体描述的缺陷,并且存在理解结果与人类认知之间的语义鸿沟。一种八元组视频语义模型被提出,该模型既考虑了场景层次语义的理解,又融入了三维人体语义模型,引入了分析和综合的方法来实现视频事件的整体描述。实验结果显示:该方法在识别率和整体性能上都优于基于上下文无关(CFG)的行为识别方法,并在一定程度上解决了语义鸿沟问题。
-
关键词
八元组视频语义模型
三维人体语义模型
场景层次语义
行为理解
视频事件整体描述
-
Keywords
eight tuples video semantic
3D human body semantic model
scene level semantic
behavior recognition
whole video affair description
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-