配网10kV环境 - 遥测数据分析报告
数据来源: dms_data_gzdy 表,基于TimescaleDB存储。
总量: 23,700,027 条记录
无效数据 (关键字段全是0): 18,971,244 条记录
有效数据: 4,728,783 条记录
结论: 统计结果显示,约 80.05% 的遥测数据为无效数据(关键遥测字段如电流、电压均为0)。这表明数据质量存在严重问题,需要重点关注数据采集、传输和存储过程中的数据完整性校验。
以下是采样5天的数据量统计,展示了不同日期的上报情况。
| 日期 | 每日记录数 | 备注 |
|---|---|---|
| 2025-09-17 | 2,528,782 | |
| 2025-09-18 | 9,424,916 | 正常数据量 |
| 2025-09-19 | 9,476,710 | 正常数据量 |
| 2025-09-20 | 2,236,724 | 数据量偏低 |
| 2025-09-22 | 32,895 | 数据量异常低 |
观察: 9月18日和19日的数据量接近950万,被认为是正常水平,符合预期。其他日期数据量显著偏低,尤其22日几乎没有数据,可能存在采集或传输异常,需要进一步排查。
以下是电压(voltage_uab)在不同区间的分布情况。总记录数:23,700,027。
| 电压区间 | 记录数 | 占比 |
|---|---|---|
| > 10000V | 106,262 | 0.45% |
| 5000-10000V | 2,965 | 0.01% |
| 1000-5000V | 19,097 | 0.08% |
| 500-1000V | 1,805 | 0.01% |
| 100-500V | 62,635 | 0.26% |
| 50-100V | 10,892 | 0.05% |
| < 50V (>0V) | 3,264,493 | 13.77% |
| 总计 (非零值) | 3,468,149 | 14.63% |
| 零值 (voltage_uab = 0) | 20,231,878 | 85.37% |
关键发现与疑问:
326万条记录集中在 < 50V 区间,其中大部分值是 10。根据咨询,这可能代表一次侧的 10kV 数据(被缩小了1000倍)。10万多条记录。怀疑单位是 V 而非 kV,表明数据上报单位不统一。6万多条记录。怀疑单位是 V,且可能代表二次侧数据。以下是电流(current_a)在不同区间的分布情况。总记录数:23,700,027。
| 电流区间 | 记录数 | 占比 |
|---|---|---|
| > 5000A | 3,659 | 0.02% |
| 1000-5000A | 2,973 | 0.01% |
| 500-1000A | 9,179 | 0.04% |
| 100-500A | 240,220 | 1.01% |
| 0-100A (>0A) | 3,447,852 | 14.55% |
| 总计 (非零值) | 3,703,883 | 15.63% |
| 零值 (current_a = 0) | 19,996,144 | 84.37% |
结论: 对于10kV配网环境,几十安到几百安的电流值是正常的。统计结果显示,绝大多数非零电流数据(约 344万 条)集中在 0-100A 范围内,100-500A 也有 24万 条,这符合预期。1000A 以内的数据占据绝大多数,可以认为是正常指标。极少数超高电流值可能需要进一步分析是否为异常事件或数据错误。
设备总数: 32,981 台不同设备上报了数据。
以下是2025年9月19日上报次数最多的前10个设备。
| 设备ID (switch_oid) | 上报次数 (dd) | 备注 |
|---|---|---|
| 6473929439379457 | 289 | 符合5分钟一次频率 (24小时 * 60分钟 / 5分钟 = 288次/天) |
| 6473929449209857 | 289 | 符合5分钟一次频率 |
| 6473929107570689 | 289 | 符合5分钟一次频率 |
| 6473924986929154 | 288 | 符合5分钟一次频率 |
| 6473928923545601 | 288 | 符合5分钟一次频率 |
| 6473928080621569 | 288 | 符合5分钟一次频率 |
| 6473925528453121 | 288 | 符合5分钟一次频率 |
| 6473928403189761 | 288 | 符合5分钟一次频率 |
| 6473929051734017 | 288 | 符合5分钟一次频率 |
| 6473927330824193 | 288 | 符合5分钟一次频率 |
结论: 大部分设备的上报频率基本符合预定的5分钟一次(每天288次)的频率,表明设备数据传输机制运作正常,数据采集的周期性得到保障。
以下是根据设备上报的电压(voltage_uab)数据,对 32,981 台设备进行的分类统计。
| 电压类型 | 设备数量 | 占比 |
|---|---|---|
| 僵尸设备 (电压恒为0) | 28,113 | 85.24% |
| 单位kV (0.05-50) | 4,463 | 13.53% |
| 其他/异常值 | 191 | 0.58% |
| 单位V (>8000) | 150 | 0.45% |
| 疑似二次侧 (50-200) | 64 | 0.19% |
分析与建议:
13.53% 的设备平均电压值在 0.05-50 之间。结合之前的分析,这很可能对应于一次侧 10kV 的数据,但被缩小了 1000 倍上报(例如,10kV 报为 10)。这是目前最主要的有效数据来源。V 为单位的 >8000 值,而另一些设备上报的 50-200V 值可能代表二次侧数据。这表明设备配置和数据标准不统一。以下是电流值(current_a)出现频率最高的数值及其计数。
| 电流值 (ee) | 记录数 (dd) |
|---|---|
| 0 | 20,157,318 |
| 1 | 208,697 |
| 2 | 207,605 |
| 3 | 185,886 |
| 4 | 157,454 |
| 5 | 143,520 |
| 6 | 132,931 |
| 7 | 112,467 |
| 8 | 104,088 |
| 9 | 89,632 |
| 10 | 89,278 |
| 12 | 88,262 |
| 11 | 78,322 |
| 13 | 65,157 |
| 14 | 63,464 |
| 18 | 62,707 |
| 15 | 59,991 |
| 16 | 55,104 |
| 17 | 51,611 |
| 19 | 45,672 |
| 20 | 44,366 |
| 21 | 43,702 |
| 24 | 41,812 |
| 22 | 39,735 |
| 23 | 39,619 |
| 30 | 36,821 |
| 25 | 34,367 |
| 26 | 34,341 |
| 27 | 31,447 |
| 31 | 31,272 |
| 29 | 30,707 |
| 36 | 29,951 |
| 28 | 29,348 |
| 34 | 26,887 |
| 32 | 26,566 |
| 42 | 25,923 |
| 38 | 25,083 |
| 33 | 24,940 |
| 35 | 23,510 |
| 37 | 22,667 |
| 40 | 21,330 |
| 41 | 21,083 |
| 39 | 20,493 |
| 44 | 19,889 |
| 43 | 19,844 |
| 48 | 19,549 |
| 45 | 18,744 |
| 46 | 18,346 |
| 60 | 17,921 |
观察: 电流值 0 的记录数高达 2015万,再次印证了大量无效数据的问题。在非零值中,小电流值(如1A到几十A)占据了绝大多数,这与电流区间分布的结论一致,表明实际运行中大部分设备的电流处于较低水平。
以下是电压值(voltage_uab)出现频率最高的数值及其计数。
| 电压值 (ee) | 记录数 (dd) |
|---|---|
| 0 | 20,333,263 |
| 10 | 2,529,822 |
| 11 | 524,076 |
| 9 | 23,246 |
| 6 | 16,929 |
| 5 | 14,538 |
| 1 | 11,784 |
| 104 | 10,904 |
| 103 | 8,120 |
| 4 | 5,573 |
| 2 | 5,084 |
| 106 | 4,502 |
| 7 | 4,377 |
| 23 | 3,890 |
| 12 | 3,877 |
| 14 | 3,738 |
| 105 | 3,262 |
| 19 | 2,822 |
| 60 | 2,754 |
| 102 | 2,640 |
| 236 | 2,605 |
| 8 | 2,474 |
| 233 | 1,959 |
| 101 | 1,821 |
| 3 | 1,483 |
| 52 | 1,442 |
| 43 | 1,442 |
| -1 | 1,442 |
| 1064 | 1,440 |
| 54 | 1,440 |
| 234 | 1,206 |
| 225 | 1,187 |
| 243 | 1,109 |
| 22 | 1,094 |
| 107 | 1,077 |
| 228 | 1,036 |
| 244 | 1,029 |
| 230 | 971 |
| 13 | 971 |
| 250 | 959 |
| 229 | 931 |
| 237 | 928 |
| 251 | 879 |
| 240 | 863 |
| 100 | 857 |
| 227 | 810 |
| 1048 | 810 |
| 1044 | 798 |
| 23191 | 794 |
观察: 电压值 0 的记录数高达 2033万,再次强调了无效数据的问题。非零值中,10 出现频率最高,有 252万 条,这与电压区间分布中 < 50V (其中大部分是10) 的发现一致,进一步支持了 10kV 一次侧数据被缩小上报的推测。同时,100 附近的数值(如104, 103, 106, 105, 102, 101, 100)也出现较多,可能对应二次侧数据。此外,存在少量 -1 和 23191 等异常值,需要检查数据源或传感器校准问题。