视频检索技术不断升级提升到10ms响应

时间:2015-06-04信息来源:慧聪网作者:

目前,从视频数据中提取有效信息的技术已基本解决,主要面临的是提高从海量数据提取信息的速度。视频数据检索的提述经历了三个阶段:一、有效视频数据提取;二、基于智能视频分析算法的检索;三、基于视频数据的元数据的检索。

有效视频数据提取

该方法的技术基石是图像分析技术中的移动侦测技术。该技术在业界已经比较成熟。移动侦测我们可以在前端设备中完成,也可以通过后端处理来执行。以24小时录像来说,闹市区场景的录像可能有1/3左右的录像是无运动目标;而郊区场景的录像可能有2/3左右的录像是无运动目标,在检索视频数据时,我们只需要观看有运动目标的视频数据即可,无论是1/3或2/3,均能显著降低所需检索视频数据的大小。

基于智能视频分析算法的检索

前面提到,一段24小时的录像,人工查看即使用4倍速查看也需要6小时,而利用计算机通过智能视频分析算法进行视频的自动检索,检索的速度则取决于视频解码和分析算法的运行速度。我们以对4cif的视频数据执行周界防范算法为例,一帧视频数据解码加上算法执行的平均时间可以控制在10ms左右,也就是相当于4倍速。同样四倍速,一个是不知疲倦的计算机,一个是极易疲倦和出错的人脑。孰优孰劣,一目了然。

如果我们把1段24小时的录像,经过解码,智能分析,把获取到的智能元数据都存储下来,对元数据的查询速度可以达到十秒的量级。

一段24小时录像文件的查询速度提升过程:人工,正常速度查询,24小时;人工,四倍速查询,6小时;视频浓缩后,人工四倍速查询,3小时左右;视频浓缩后,基于智能分析算法查询,3小时左右;基于视频数据的元数据查询,十秒量级。

可以看到,最后一步才是质的提升,检索速度量级的飞跃。尽管如此,视频数据的元数据的检索也并不是完美无缺的,仍有一些问题等待解决。

移动侦测算法虽然比较成熟,但对于飞虫干扰、灯光干扰、树叶抖动等问题目前还没有特别有效的解决办法;基于智能分析算法的检索,比如车牌识别、人脸识别,对视频数据的场景要求比较高,普通的治安监控视频基本无法执行这种分析。对于视频场景适应性相对较好的周界防范,行为分析算法来说,虽然能较为准确分析出目标,但是对于目标进一步的分类,比如人、物、非机动车、机动车、目标的属性特征,比如颜色、纹理、形状等,目前还是业界面临的技术难题。

虽然有上述两大难题,随着元数据的标准化,以及前端设备实时产生元数据和后处理产生元数据两种机制和产品的并存,基于元数据的检索必然会成为海量视频数据检索的主流。


返回原图
/