遥测数据概览

配网10kV环境 - 遥测数据分析报告

1. 数据总量与有效性

数据来源: dms_data_gzdy 表,基于TimescaleDB存储。

总量: 23,700,027 条记录

无效数据 (关键字段全是0): 18,971,244 条记录

有效数据: 4,728,783 条记录

有效数据占比分析

有效数据 (19.95%)
无效数据 (80.05%)

结论: 统计结果显示,约 80.05% 的遥测数据为无效数据(关键遥测字段如电流、电压均为0)。这表明数据质量存在严重问题,需要重点关注数据采集、传输和存储过程中的数据完整性校验。

2. 每日数据量统计

以下是采样5天的数据量统计,展示了不同日期的上报情况。

日期 每日记录数 备注
2025-09-172,528,782
2025-09-189,424,916正常数据量
2025-09-199,476,710正常数据量
2025-09-202,236,724数据量偏低
2025-09-2232,895数据量异常低

每日数据量趋势

2025-09-17
2,528,782
2025-09-18
9,424,916
2025-09-19
9,476,710
2025-09-20
2,236,724
2025-09-22
32,895

观察: 9月18日和19日的数据量接近950万,被认为是正常水平,符合预期。其他日期数据量显著偏低,尤其22日几乎没有数据,可能存在采集或传输异常,需要进一步排查。

3. 电压值区间分布

以下是电压(voltage_uab)在不同区间的分布情况。总记录数:23,700,027

电压区间 记录数 占比
> 10000V106,2620.45%
5000-10000V2,9650.01%
1000-5000V19,0970.08%
500-1000V1,8050.01%
100-500V62,6350.26%
50-100V10,8920.05%
< 50V (>0V)3,264,49313.77%
总计 (非零值)3,468,14914.63%
零值 (voltage_uab = 0)20,231,87885.37%

电压区间分布图 (非零值)

> 10000V
106,262
5000-10000V
2,965
1000-5000V
19,097
500-1000V
1,805
100-500V
62,635
50-100V
10,892
< 50V (>0V)
3,264,493

关键发现与疑问:

  • 大量低压数据 (< 50V): 326万条记录集中在 < 50V 区间,其中大部分值是 10。根据咨询,这可能代表一次侧的 10kV 数据(被缩小了1000倍)。
  • 高压数据 (> 10000V): 10万多条记录。怀疑单位是 V 而非 kV,表明数据上报单位不统一。
  • 中低压数据 (100-500V): 6万多条记录。怀疑单位是 V,且可能代表二次侧数据。
  • 数据混乱: 电压数据同时存在一次侧和二次侧数据,且单位可能混淆 (V/kV),导致数据解读困难。这严重影响了数据的可用性和准确性,需要明确数据采集规范和单位转换机制。

4. 电流值区间分布

以下是电流(current_a)在不同区间的分布情况。总记录数:23,700,027

电流区间 记录数 占比
> 5000A3,6590.02%
1000-5000A2,9730.01%
500-1000A9,1790.04%
100-500A240,2201.01%
0-100A (>0A)3,447,85214.55%
总计 (非零值)3,703,88315.63%
零值 (current_a = 0)19,996,14484.37%

电流区间分布图 (非零值)

> 5000A
3,659
1000-5000A
2,973
500-1000A
9,179
100-500A
240,220
0-100A (>0A)
3,447,852

结论: 对于10kV配网环境,几十安到几百安的电流值是正常的。统计结果显示,绝大多数非零电流数据(约 344万 条)集中在 0-100A 范围内,100-500A 也有 24万 条,这符合预期。1000A 以内的数据占据绝大多数,可以认为是正常指标。极少数超高电流值可能需要进一步分析是否为异常事件或数据错误。

5. 设备总数

设备总数: 32,981 台不同设备上报了数据。

单个设备上报频率 (以2025-09-19为例)

以下是2025年9月19日上报次数最多的前10个设备。

设备ID (switch_oid) 上报次数 (dd) 备注
6473929439379457289符合5分钟一次频率 (24小时 * 60分钟 / 5分钟 = 288次/天)
6473929449209857289符合5分钟一次频率
6473929107570689289符合5分钟一次频率
6473924986929154288符合5分钟一次频率
6473928923545601288符合5分钟一次频率
6473928080621569288符合5分钟一次频率
6473925528453121288符合5分钟一次频率
6473928403189761288符合5分钟一次频率
6473929051734017288符合5分钟一次频率
6473927330824193288符合5分钟一次频率

结论: 大部分设备的上报频率基本符合预定的5分钟一次(每天288次)的频率,表明设备数据传输机制运作正常,数据采集的周期性得到保障。

6. 设备电压类型分布

以下是根据设备上报的电压(voltage_uab)数据,对 32,981 台设备进行的分类统计。

电压类型 设备数量 占比
僵尸设备 (电压恒为0)28,11385.24%
单位kV (0.05-50)4,46313.53%
其他/异常值1910.58%
单位V (>8000)1500.45%
疑似二次侧 (50-200)640.19%

设备电压类型分布图

僵尸设备 (电压恒为0)
28,113
单位kV (0.05-50)
4,463
其他/异常值
191
单位V (>8000)
150
疑似二次侧 (50-200)
64

分析与建议:

  • 僵尸设备比例惊人: 85.24% 的设备被判定为“僵尸设备”,即其上报的电压数据始终为0。这与整体数据有效性分析结果高度吻合,强烈表明绝大部分设备可能存在故障、未接入、配置错误或数据上报机制异常。这部分设备的数据是完全无效的,需要立即进行排查和处理。
  • 单位kV (0.05-50) 占比较高: 13.53% 的设备平均电压值在 0.05-50 之间。结合之前的分析,这很可能对应于一次侧 10kV 的数据,但被缩小了 1000 倍上报(例如,10kV 报为 10)。这是目前最主要的有效数据来源。
  • 单位V (>8000) 和疑似二次侧 (50-200) 数量较少: 这两类设备数量较少,进一步印证了电压数据上报的混乱。部分设备直接上报 V 为单位的 >8000 值,而另一些设备上报的 50-200V 值可能代表二次侧数据。这表明设备配置和数据标准不统一。
  • 其他/异常值: 这部分设备的数据无法归类,可能包含各种格式错误或异常读数,需要进一步的详细分析。
  • 总结: 设备的电压数据上报存在严重的标准化问题和大量“僵尸”状态。必须统一数据上报规范,明确单位(V/kV)和量纲,并对大量僵尸设备进行现场核查和修复,以提升数据质量和系统可靠性。

7. 头部电流值分布

以下是电流值(current_a)出现频率最高的数值及其计数。

电流值 (ee) 记录数 (dd)
020,157,318
1208,697
2207,605
3185,886
4157,454
5143,520
6132,931
7112,467
8104,088
989,632
1089,278
1288,262
1178,322
1365,157
1463,464
1862,707
1559,991
1655,104
1751,611
1945,672
2044,366
2143,702
2441,812
2239,735
2339,619
3036,821
2534,367
2634,341
2731,447
3131,272
2930,707
3629,951
2829,348
3426,887
3226,566
4225,923
3825,083
3324,940
3523,510
3722,667
4021,330
4121,083
3920,493
4419,889
4319,844
4819,549
4518,744
4618,346
6017,921

观察: 电流值 0 的记录数高达 2015万,再次印证了大量无效数据的问题。在非零值中,小电流值(如1A到几十A)占据了绝大多数,这与电流区间分布的结论一致,表明实际运行中大部分设备的电流处于较低水平。

8. 头部电压值分布

以下是电压值(voltage_uab)出现频率最高的数值及其计数。

电压值 (ee) 记录数 (dd)
020,333,263
102,529,822
11524,076
923,246
616,929
514,538
111,784
10410,904
1038,120
45,573
25,084
1064,502
74,377
233,890
123,877
143,738
1053,262
192,822
602,754
1022,640
2362,605
82,474
2331,959
1011,821
31,483
521,442
431,442
-11,442
10641,440
541,440
2341,206
2251,187
2431,109
221,094
1071,077
2281,036
2441,029
230971
13971
250959
229931
237928
251879
240863
100857
227810
1048810
1044798
23191794

观察: 电压值 0 的记录数高达 2033万,再次强调了无效数据的问题。非零值中,10 出现频率最高,有 252万 条,这与电压区间分布中 < 50V (其中大部分是10) 的发现一致,进一步支持了 10kV 一次侧数据被缩小上报的推测。同时,100 附近的数值(如104, 103, 106, 105, 102, 101, 100)也出现较多,可能对应二次侧数据。此外,存在少量 -123191 等异常值,需要检查数据源或传感器校准问题。