视频分割算法的研究与实现

VIP免费
3.0 高德中 2024-11-19 5 4 2.77MB 60 页 15积分
侵权投诉
摘 要
视频中运动目标的分割是从视频中分割出含有一定语义特征的部分,广泛的
应用在军事、医学、公共安全等领域。由于视频的多样性和不确定性,使得准确
可靠的分割出运动目标有一定的难度。视频中运动目标分割主要分为像素域和压
缩域两类,像素域包含了很多种有效信息,可以很准确的分割出运动目标,但是
由于其计算量大的缺点,分割速度较慢,近几年视频对象分割方法的重心转向压
缩域。
H.264 编解码方法近年来得到广泛使用,其压缩域的运动目标分割方法也引
起了很多学者的关注。H.264 编解码方法是对残差块进行 DCT 变换,得到的 DCT
系数不能很好的描述原视频的纹理特征,H.264 压缩域分割大多利用运动矢量场
信息。运动矢量场是根据预测代价的计算得到的,并不能代表真正的运动区域,
如何从压缩域得到准确的运动区域也是一个难点。
本文对视频中运动目标分割算法进行了研究,论文的主要工作如下:
第一、针对静止摄像头拍摄的视频,根据经典的混合高斯背景建模方法,提
出了一种改进的周期性更新权重的方法,提高了分割效率,然后又对含有阴影的
运动目标进行阴影抑制,准确的分割出运动目标。
第二、根据 H.264 压缩域的运动矢量场信息,对得到的稀疏运动矢量场进行
累积,得到粗略的运动目标区域,然后利用像素域的纹理信息对运动目标进行准
确分割,在准确分割运动目标的同时提高了分割效率。
本文利用 Matlab 仿真实验平台和 JM17.2 对上述研究进行了验证和分析。实
验结果证明,本文两个算法都可以既保证分割效果,又提高工作效率。
关键字:运动目标分割 混合高斯背景建模 运动矢量场 局部二值模
ABSTRACT
Segmentation of video moving object, which is widely used in military, medical and
public security field, is to extract certain semantic area from video sequence. Due to
the diversity and uncertainty of videos, it is difficult to segment moving objects
accurately and efficiently. Moving object segmentation has two branches, pixel domain
and compressed domain. There are a lot of useful informations in pixel domain, which
helps to segment the moving object exactly, but it also leads to problems such as great
amount of calculation and slow segmentation speed. Therefore, researches on video
moving object are focus on compressed domain in recent years.
Segmentation in H.264 compressed domain has aroused a great concern from the
whole society for the widely develpment of H.264. Since DCT coefficients in H.264
compressed domain are based on residual, which cann’t describe the texture
information of the frame well, so we can only use Motion Vectors (MV) which is
extracted from H.264 compressed stream. However, MV is calculated based on least
prediction cost and can not represent exact motion area information, which makes it a
significant problem to ensure the correctness and reliability to extract motion
information from the compressed domain.
This dissertation studies how to segment the moving object from a video sequence,
the main research work are summarized as follows:
1A new weights updating method, where the weights are updated once during a
certain period, is proposed based on the study of classical Gaussian Mixture Model,
which greatly improves the segmentation efficiency. Then, a shadow removing
algorithm is proposed and a precise segmentation of moving object is obtained.
2On the basis of MV which are extracted from H.264 compressed stream, a rough
moving region can be obtained through accumulation in MV field. Then, texture
information in pixel domain is used to realize the moving object segmentation, this
algorithm can improve the segmenting efficiency.
In this dissertation, the research was verified and analyzed by Matlab and JM17.2
platform. The results have proved, both of the two algorithms in this paper could make
precise segmentations with high effciency.
Key words: Video moving objects segmentation Gaussian Mixture
ModelMotion VectorMVLocal Binary Pattern
目录
第一章 绪 论..................................................................................................................................1
§1.1 选题的背景及意义 .............................................................................................................1
§1.2 国内外研究现状与分类 .....................................................................................................2
§1.2.1 像素域分割研究现状 ..............................................................................................2
§1.2.2 压缩域分割研究现状 ..............................................................................................4
§1.3 论文工作和内容安排 .........................................................................................................5
第二章 视频对象分割算法关键技术 ......................................................................................7
§2.1 像素域视频对象分割技术 .................................................................................................7
§2.1.1 光流法 ......................................................................................................................7
§2.1.2 帧差法 ......................................................................................................................8
§2.1.3 背景差分..............................................................................................................9
§2.2 压缩域视频分割技术 ....................................................................................................... 11
§2.2.1 基于 DCT 系数的分..........................................................................................11
§2.2.2 基于运动矢量信息的分....................................................................................12
§2.2.3 基于 DCT 系数和运动矢量信息的分割 ............................................................. 13
§2.3 H.264/AVC 压缩域视频对象的提取 ...............................................................................13
§2.3.1 H.264/AVC 编解码框架 ........................................................................................14
§2.3.2 运动矢量场的预处理 ............................................................................................15
§2.4 本章小结 ...........................................................................................................................17
第三章 改进的混合高斯背景建模方法...............................................................................19
§3.1 经典的混合高斯模型建模方.......................................................................................19
§3.1.1 混合高斯背景模型描述 ........................................................................................19
§3.1.2 混合高斯背景模型初始化和自适应更新 ........................................................... 20
§3.2 改进的背景更新方法 .......................................................................................................21
§3.3 阴影抑制 ...........................................................................................................................23
§3.4 实验结果比较分析 ...........................................................................................................24
§3.5 本章小结 ...........................................................................................................................27
第四章 结合 H.264 压缩域和像素域运动目标分割 ........................................................29
§4.1 算法概要 ...........................................................................................................................29
§4.2 压缩域分割 .......................................................................................................................30
§4.2.1 运动信息的获取 ....................................................................................................30
§4.2.2 运动矢量场处理 ....................................................................................................31
§4.2.3 运动对象区域标记 ................................................................................................32
§4.3 像素域的分割 ...................................................................................................................33
§4.3.1 LBP 算子基本原理及应用 ................................................................................... 33
§4.3.2 基于 LBP 算子的运动目标分割算法 .................................................................. 38
§4.4 实验结果分析 ...................................................................................................................41
§4.5 本章小结 ...........................................................................................................................43
第五章 网络视频监控系统设.............................................................................................45
§5.1 系统框架 ...........................................................................................................................45
§5.2 模块功能 ...........................................................................................................................46
§5.2.1 视频的采............................................................................................................46
§5.2.2 视频传输 ................................................................................................................46
§5.2.3 视频解码分割与显示 ............................................................................................48
§5.3 本章小结 ...........................................................................................................................48
第六章 总结与展....................................................................................................................49
§6.1 总结 ................................................................................................................................... 49
§6.2 展望 ................................................................................................................................... 49
参考文献 ........................................................................................................................................... 51
在读期间公开发表的论文和承担科研项目及取得成果................................................... 57
致 谢................................................................................................................................................59
第一章 绪 论
1
第一章 绪 论
§1.1 选题的背景及意
视频分割是视频中运动目标分割的简称,一段视频中的运动目标一般都会
是我们关注的焦点,在视频中准确的分割出运动目标是运动分析和运动跟踪的
基础,是后续处理准确性的保证。因为视频场景的不确定性,场景中的运动目
标也许会在一定时间后成为背景,或者原本是背景的会变成运动目标,光照、
阴影以及背景中运动的物体例如摇晃的树叶等都会给运动目标的准确分割增加
难度,如何高效准确的分割出运动目标是本文的重点研究内容。
数字图像处理技术始于 20 世纪 20 年代,由于遥感等领域的应用,使得
像处理技术受到广泛的关注并得到相应的发展,第三代计算机出现之后,数字
图像处理技术开始得到迅速发展和普遍应用[1] 。像素域的视频可以看成一定长
度的图像序列,每一帧都可以视为一副图像,相邻帧通常在时域上具有内容上
的连贯性,通过对视频中运动目标的分割处理,可以达到视频检索、智能监控、
模式识别等目的。视频片断比图像包含更加丰富的内容,对视频感知的研究更
有意义。在一段连续的画面中,人们往往对于其中的运动目标更感兴趣,较于
静态的背景,运动目标包含了更多有用有效的信息。人类可以很轻松的获取这
些有效信息,但是对于计算机视觉,视频中运动目标的分割与分析就成为了一
个重要的研究对象。
视频中运动目标的分割在我们的生活中、科学理论研究和工程应用中都有
着广阔的前景[2] 。在军事上,导弹飞机等军事运动目标的监视、检测;在工业
[3] ,可用于进行工业控制、自主导航等方面;在医学上,可用于生物组织的
运动分析;在交通管理中,可用于交通速度、车流密度、路面状况等数据的观
测、提取和分析,从而使交通管理更加智能化。
计算机视觉系统具有智能性,用成像系统代替人眼,用计算机代替人脑,
从而像人类一样,可以自动对拍摄到的视频进行分割[4] 但是,正如前文所述,
实际场景中很多无法预测的状态存在[5] [6] ,这些都会给自动检测和分割带来困
难和障碍。如果在检测和分割的过程中做了很多的工作,必然会消耗大量的时
间,这与分割的实时性的要求又产生了矛盾。我们需要的是快速且准确的运动
目标分割方法。目前,对此领域的研究虽然取得了一定的进展,但是很多方面
还不够成熟,因此,我们还要对此领域做更深入的研究。
视频分割算法的研究与实现
2
§1.2 国内外研究现状与分类
视频分割与特征提取是视频分析与检索领域最为关键的技术,涉及到计算
机视觉、人工智能、模式识别等诸多研究领域。早在上世纪八十年代末九十年
代初,视频分割就引起了许多学者的兴趣[7] ,随着视频数据量的增多,压缩编
码标准的发展,越来越多的人开始关注压缩域的运动目标分割方法。
§1.2.1 像素域分割研究现状
近些年,很多科研院校及机构对视频分割进行了积极探索,希望取得一种
更加快速的,更加有效的视频分割算法,对目前视频对象从不同目的以及各种
视角去分析去研究。像素域视频可以看做一帧一帧连续的图像,有以下几种分
类方式。
从对视频运动目标分割角度上看,可以分为自动分割和交互式分割两种。
对于交互式目标分割方法,文献[8]提出了一种将学习分类以及支持向量机的目
标分割方法,对于一些静止摄像头拍摄的视频序列,MomMother&Daughter
中,可以得到很好的分割效果,而对于另一些视频序列,它们的背景是运动的,
对于这种情况,我们则需要通过大量的视频序列来学习,这样的话,对目标的
分割就比较复杂。而文献[9]提出了一种可以将无论是在运动背景还是静止背景
下都能很好的分割出目标的方法,但是,这种算法的缺陷是需要人去对每一帧
进行判断,因此在实际应用中是不可行的。由此可见,视频分割将向自动分割
的方向发展,这是一种必然的趋势。
从模型化角度,可以将对运动目标的分割分为模型化和非模型化两种分割
算法。对于模型化的运动目标分割方法,是将图像序列的时域或者空域建立对
应模型,使其模块化,例如,文献[10]提到的在空域的角度建立起马尔可夫随
型,[11]提到了在时域的角度建立了贝叶斯基跟踪模型,文[12]
提到了提到了一种模糊神经网络模型法用于对人体进行分割等。上述提到的这
些模型为我们后来的视频分割算法提供了丰富的理论基础,这些数学模型在如
今已经广泛应用于各种视频目标分割中。
从空间或时间信息利用的角度,可以将对运动目标的分割分为时域分割算
法、空域分割算法以及时空域结合的分割算法。对于空域分割算法常见的有形
态学分水岭变换[13] 最短扫描树形算法[14] 以及区域增长算法[15] 等,对于上述
这些空域分割算法,是将视频序列中的每一帧分割成不同的纹理一致区域,这
种方法可以用标示目标对象的轮廓和初始位置,这样就可以将背景图像与前景
目标的边界标示出来。但是,这种方法的不足之处是,纯粹的用空域分割算法
去分割目标对象,对于大家感兴趣的对象定义信息则很难获得,因此,这种方
摘要:

摘要视频中运动目标的分割是从视频中分割出含有一定语义特征的部分,广泛的应用在军事、医学、公共安全等领域。由于视频的多样性和不确定性,使得准确可靠的分割出运动目标有一定的难度。视频中运动目标分割主要分为像素域和压缩域两类,像素域包含了很多种有效信息,可以很准确的分割出运动目标,但是由于其计算量大的缺点,分割速度较慢,近几年视频对象分割方法的重心转向压缩域。H.264编解码方法近年来得到广泛使用,其压缩域的运动目标分割方法也引起了很多学者的关注。H.264编解码方法是对残差块进行DCT变换,得到的DCT系数不能很好的描述原视频的纹理特征,H.264压缩域分割大多利用运动矢量场信息。运动矢量场是根据...

展开>> 收起<<
视频分割算法的研究与实现.pdf

共60页,预览6页

还剩页未读, 继续阅读

作者:高德中 分类:高等教育资料 价格:15积分 属性:60 页 大小:2.77MB 格式:PDF 时间:2024-11-19

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 60
客服
关注