现如今,可能我们每一个生活在大城市的人都会有这样的印象,那就是每天无论是走在大街小巷,还是开车、乘坐交通工具,又或是出入办公大楼、到商场购物、餐馆就餐等等总会看见各种大大小小的摄像头在俯视着我们。据相关统计,生活在城市里的人们,平均每天可能会“偶遇”监控摄像头多达数百次。
当然,也正是多亏了这些或是在角落、或是在高处默默奉献的监控探头,我们城市才会变得更加安全。这些遍布城市大街小巷每个角落的监控摄像头,把他们联网起来便组成了当前智慧城市的基础神经网络。每一个摄像头就像是一个个安全卫士的眼睛,时时刻刻在保护在城市的安全。
但是,由于早期技术等因素的限制,目前的很多视频监控摄像头都存在着清晰度不够、不联网、不智能等问题,已经无法满足当前社会经济发展的需求。虽然“眼睛”遍布大街小巷,但是因为这些种种因素,使得城市管理者往往看不见、看不清、看不全、看不懂,让智慧城市变得“有眼无珠”。
众所周知,大脑的进化很大程度取决眼睛。我们人类大脑要处理信息,首先得需要通过我们的眼睛、耳朵、鼻子、手脚等器官采集到外界的信息。如果眼睛没有看到信息,那么大脑也就不会做相应的处理。对于智慧城市来说,每一个摄像头就是它的眼睛,如果眼睛看不清、不联网、不具备智能分析功能,那么系统就无法进行相应的图像数据分析处理。所以,“有眼无珠”这里的“珠”更确切的说指的是“脑”。
中国工程程院院士、北京大学教授高文在2018年人工智能安防峰会时表示,智慧城市系统基于视频监控系统,但是早期的视频监控系统基本上都是为了存储和事后给人看,没有统一的时间戳、也没有准确的地理信息。还有,云端存储的压缩视频是按照图像帧结构组织的,若要分析和识别必须先进行解码,无法在压缩数据上直接检索分析。
解码处理会耗费计算资源,同时会有明显的延迟。同时,为了传输与存储,大量的视频在压缩的时候必然会导致很多图像细节特征的丢失,从而导致识别率更低。因此,也造成了目前视频监控数据利用率极低的现象。因为目前的很多监控系统是为了存储数据再由人工离线检查而设计,大部分数据在其生存期内一次都没有用过。因此,数据大并不等于大数据。
高文院士表示,城市大脑需要智慧之眼。“通过监控摄像头让城市变得更智智慧,不仅仅是单一的视频检索和计算机视觉问题,而是在面临海量信息和突发事件时,能否能迅速做出反应、能否降低计算量、能否有效识别和检索等一系列庞大的系统工程。”
高文院士还在大会中提出了“数字视网膜”的概念,他指出“承载数字视网膜的摄像头需做两件事:首先做好编码;其次为后面的识别,提取出所需的信息。数字视网膜与人的眼睛既具有影像重构(精细编码视觉内容),又具备特征提取(面向识别理解)的功能。”基于结构化的大数据,融合底层视觉特征与深度学习,可以更加丰富数据的内在信息,提升分类、检索或预测的准确性。
当然,由于当前人工智能等技术短板限制,泛安防+人工智能仍有许多难点需要突破。例如,在海量视频数据中寻找目标,“天网”视频监控系统每天产生的大量图像视频,对于寻找目标人与车辆犹如大海捞针。
其次,传输受限制预警不实时。尤其是高清、超高清摄像机的大量应用,采集的数据量非常大,传输成本非常高,而且很难在第一时间汇集到数据总平台,造成全局预警与搜索的困难。此外,针对交通拥堵情况,当前的交通大数据主要还是以导航地图、共享出行软件等为主,视频智能分析数据应用还是比较少等等。
但是我们相信,随着传统安防企业在人工智能技术研发的持续投入,大量人工智能技术创业团队的加入,以及AI技术在安防行业应用的不断验证与优化改进,我们的城市大脑肯定会变得越来越聪明,我们的城市也将变得越来越安全。
(源自千家网:人工智能技术升级“城市大脑”)