文档目的: 针对省网基建部提出的两项AI需求,细化业务场景案例,明确技术实现路径及潜在难点,为内部评审提供决策依据。
当前痛点: 每年配网基建项目数以千计。设计院提交的图纸(CAD/PDF)和说明书,主要靠基建部专责人工审核。存在“漏看错看”、“标准记忆偏差”、“重复劳动”等问题。
为解决“非结构化图纸解析”这一核心难点,建议采取“规则引擎(保底线) + 大模型(做推理)”的混合架构。
| 模块 | 技术实现细节 |
|---|---|
| 图纸解析层 (最难点) |
1. CAD解析:不直接把CAD当图片看。使用ezdxf等工具库读取CAD底层数据,提取设备属性、坐标、连接关系,转化为结构化JSON数据。2. OCR识别:针对PDF/图片图纸,使用高精度OCR识别图例表和文字说明。 |
| 知识库构建 (RAG架构) |
将国标、行标、反措规定进行切片向量化。对于带参数的条款(如距离、线径),需人工提取为结构化规则表,不能只靠AI模糊搜索。 |
| 智能评审引擎 |
1. 确定性校验:对于“安全距离”、“设备选型”等硬指标,使用Python脚本比对解析出的CAD数据与规则表(确保100%准确)。 2. 语义性审查:对于“设计合理性”、“文字描述错误”,将文档内容投喂给LLM(大模型),让AI以专家身份给出建议。 |
当前痛点: 项目经理报物资计划往往依赖经验或照搬旧项目,导致“报多了积压,报少了停工”。且物资名称填写不规范,导致库存明明有货却匹配不上。
核心不在于复杂的深度学习,而在于数据治理和业务规则的数字化。
| 模块 | 技术实现细节 |
|---|---|
| 数据清洗 (NLP) |
利用BERT类模型训练一个“物资实体对齐模型”。解决“10kV”、“10千伏”、“10KV”写法不一的问题,将历史脏数据清洗为标准ID,这是预测的基础。 |
| 预测模型 (Predictive) |
构建“BOM推荐引擎”。
输入特征:项目类型、电压等级、地理环境、线路长度、变压器容量。 算法:使用XGBoost或随机森林回归,根据历史已完结项目的实际消耗量,预测新项目的标准物料清单。 |
| 异常检测 (风控) |
利用孤立森林(Isolation Forest)算法检测离群点。如果某个项目的申报清单与主流模式差异过大(例如:申报了变压器却没申报对应的跌落式熔断器),系统自动触发逻辑风险预警。 |