以人为中心的数据收敛和智能研判——视频数据为警务研判带来的飞跃
公安机关性质与任务决定了中心工作都是围绕人来开展,“人”是案件或者事件的主体。案件发生后,公安机关首先需要研判的“谁”是作案嫌疑人,而“谁”需要“ID”来唯一标识。在日常生活工作中, “姓名”可以来唯一指向一个对象,但是“姓名”ID标识因重名存在缺陷。警务工作中,常用的ID更为广泛,笔者认为大致可以分为三类:第一类是人体生物特征,比如指纹、虹膜、DNA等;第二类是主体人经常使用的,比如身份证号码、手机号码等;第三类是互联网的虚拟身份,包括微信、QQ、支付宝、抖音等各种APP的账号。不同的ID有不同的优劣势,比如第一类相对准确真实,但是采集困难;第二类最普及,但是伪装性强;第三类为新型ID,随着互联网特别是移动互联网的兴起,警务工作能够采集的线索(含ID)也急速扩张,特别是在APP需要手机号码唯一注册后,与主体“人”的关联性在逐步增强。APP里的内容也隐藏了大量的线索,比如微信的聊天记录可能透露嫌疑人的位置,抖音的视频获取嫌疑人的头像等等。出于数据安全考虑,互联网APP的虚拟身份和内容一般都经过了加密处理。
通过ID唯一指向嫌疑人,然后围绕ID,依托人事物、地点组织、关系、生物特征、电子轨迹、活动轨迹等多维数据,对嫌疑人展开静态属性、动态属性、规律属性等“属性分析”,以得知嫌疑人住在哪里,去了什么地方,甚至预测嫌疑人将要去什么地方,会有什么动作等,发挥大数据最核心的价值——预警预判,真正实现情报主导警务。如下图所示:
公安内网的业务数据(如车管所数据、人口库数据等)采集的是人的静态属性,得知“对象是谁”;物联网中的视频数据(以及互联网数据)采集的主要是人的动态属性,得知“对象在哪”。可通过多维数据时间和空间上的叠加构建算法模型,得知“对象规律”。
传统警务大数据的特点是准确性和丰富性,那么视频大数据的特点是真实性和可视化。传统警务大数据省级体量往往在1PB左右,数据种类多至上百种。数据准确高;而视频数据的采集往往是在群众不被告知的情况下被动采集,所以数据往往真实性高,但是因为受限于算法精度、安装环境等因素,视频数据的准确性不高。比如,同一款人脸智能摄像机,安装的合理,捕获和识别率可以到95%以上,不合理,则可能到不了50%。
可视化是视频数据的另一个特点。公安机关特别是基层民警在警务工作中,经常需要调阅视频,因为视频记录还原了那一刻“最真实的事实”,而且最直观。但是非结构化的视频是不能用于大数据分析挖掘的,需要经过智能视频算法提取视频中的结构化内容,包括人车对象、异常行为等;视频数据种类相对比较少,导致在视频结构化变成数据过程中,损失了大量的价值信息,比如案发当天下暴雨(室外),步态异常(室内)等。所以目前,原始视频必须被按一定期限保留,保留价值最全的数据载体。
视频对象结构化数据根据价值梯度分为三个圈,如下图所示。第一个圈内的数据(车牌号码、人脸模型、车辆模型、人体模型)具有ID属性,价值最高;第二个圈内的数据(人脸属性、车辆属性等)不具有ID唯一指向对象的属性,价值相对较低,但是具有缩小嫌疑对象范围的能力;第三个圈内的数据是系统稳定可靠运行的支撑。
第一个圈内的数据价值最大,但是具有不同的优势特点。从易读性、准确性等维度对比如下(附加移动终端特征和RFID):
ID属性对比 人脸模型 人体模型 车牌号码 车辆模型 移动终端特征 RFID
(人眼)易读性 弱 弱 强 弱 弱 强
(ID)准确性 中 弱 强 中 强 强
(场景)丰富度 弱 强 强 强 强 强
(与人)匹配度 强 弱 弱 弱 弱 中
(ID)伪装力 强 弱 强 弱 强 弱
(ID)易损性 弱 弱 强 弱 弱 强
(人眼)易读性:模型数据作为半结构化数据,无法用人类语言表述出来,导致民警无法进行口语描述和文字传递(比如全文检索),而车牌号码就可以由案发现场的A民警告知办案中心的B民警,再由B民警将车牌号码录入布控中心,发起全城布控,此业务场景就是ID易读性带来的优势。
(ID)准确性:受限于算法精度和安装环境等因素限制,模型数据的识别率通常不高,而人体模型因为ID特征点不明显,建模困难,企业研发投入相对不足等原因,准确率相比车牌号码低很多,而且不稳定。
(场景)丰富度:目前,摄像头的布建,越来越依托业务场景,即有目的性
的去采集视频中的对象和行为,所以两者(场景和对象ID)耦合度不断增强。比如人脸对象的采集:因为算法对人脸像素和人脸角度的要求比较高,所以适合安装人脸智能IPC的场景并不多,局限于狭长式的人员通道、规则的人员出入口等。但是捕获人体的场景就相对丰富,大部分室外开放式的场景都合适,对人脸像素和人脸角度基本无要求。结合(ID)准确性这项,可以得知人体模型是弱ID,但是场景丰富,适合采集对象人的轨迹。
(与人)匹配度:本文一开始提到警务工作是围绕“人”为中心展开的,所以不同的ID最终是需要关联到“人”,因为“人脸模型”是直接采集的人身上自带的ID,所以和主体“人”的匹配度最高,采集人脸图像建模后和公安内网的人口库作比对实现身份确认。对于车辆对象,因为特定时间的司机不一定是车主(车主信息可以由公安内网车管所获得),所以车牌号码和车辆模型两个ID和“人”的匹配度是相对低的,特别是真实的案件中,嫌疑人往往不会使用自己名下登记的车辆。
(ID)伪装力:真实案件中,嫌疑人经常会带上口罩,嫌疑车的车牌号码被遮挡污损或者直接套牌无牌等,容易伪装。但是对于人体模型和车辆模型两个ID,一方面难以伪装,另一方面目前的作案人员还没有这个意识去针对这两种ID进行伪装,所以伪装力弱,已采集。
(ID)易损性:人脸、人体、车辆等模型数据,因为直接附着在对象身上,所以嫌疑对象不会自己主动发起破坏,比如把自己的脸刮伤,把车给砸坏等,基本不太可能。但是比如车牌号码、或者RFID等电子标签,因为成本低,相对容易被故意损耗和破坏。
综上可以看出,不同的视频类ID具有不同的优劣势,如果在警务实战过程中将不同ID的优势进行互补,强强结合,将发挥出1+1>2的实战价值,这也是大数据战略中非常关键的一环。
应用场景:(1)调取现场视频监控,锁定嫌疑人;(2)结构化大量视频,提取人体模型,对嫌疑人构建丰富的轨迹;(3)利用轨迹中多维智能抓拍机同时捕获清晰正面人脸和人体,将人脸模型和人体模型进行关联,人脸模型和公安业务人口库比对确认嫌疑人身份和登记住处;(4)通过人体模型形成的轨迹,分析嫌疑人的落脚点,和登记的住处相吻合,最终捕获嫌疑人。案例侦破中,结合利用了人脸模型(与人)匹配度高和人体模型的(场景)丰富度高两个不同的优势,通过人脸模型知道“是谁”,通过人体模型知道“在哪”。
未来,随着越来越多的数据汇聚到大数据池中,通过“数据拼图”,构建“数据魔方”,形成能力倍增器,为各警种提供易懂、可视、高度共享的价值链。
本文来源:《企业科技与发展》:http://www.zzqklm.com/w/qk/21223.html
- 2025年中科院分区表已公布!Scientific Reports降至三区
- 2023JCR影响因子正式公布!
- 国内核心期刊分级情况概览及说明!本篇适用人群:需要发南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的学者
- 我用了一个很复杂的图,帮你们解释下“23版最新北大核心目录有效期问题”。
- CSSCI官方早就公布了最新南核目录,有心的人已经拿到并且投入使用!附南核目录新增期刊!
- 北大核心期刊目录换届,我们应该熟知的10个知识点。
- 注意,最新期刊论文格式标准已发布,论文写作规则发生重大变化!文字版GB/T 7713.2—2022 学术论文编写规则
- 盘点那些评职称超管用的资源,1,3和5已经“绝种”了
- 职称话题| 为什么党校更认可省市级党报?是否有什么说据?还有哪些机构认可党报?
- 《农业经济》论文投稿解析,难度指数四颗星,附好发选题!