目录
高质量的数据是 Higg Index 和 Worldly 平台最有价值的组成部分。为了维持高质量的数据,识别并纠正任何异常值至关重要。
异常值是与我们的历史观察和预期显著不同的数据点或计算。
在提交您的评估之前,您可能会看到一条消息,提示您审核异常值。点击审核异常值查看您需要检查的项目。
访问异常值检测
异常值检测面板将从屏幕右侧出现,它将指导您查看评估中检测到的任何异常值。
在文本下方,您将看到提示您查看输入内容的超链接。例如,在下面的截图中,您被提示查看成品组装和查看产量。点击链接将带您到评估中疑似异常值所在的部分。
异常值检测识别任何异常值,或显著不同的数据点/计算,您可以将其忽略。这些会以黄色高亮显示。
例如,在下面的截图中,该工厂类型的标准化能源使用量看起来很高。在继续之前,您必须检查所有能源来源是否有错误,包括报告的生产量。如果您已经审核了数据并且可以确认其准确性,请勾选"我已审核,看起来正确"旁边的复选框。您也可以选择稍后审核来忽略这个异常值。
- 选择我已审核,看起来正确将打开一个文本框,您可以在其中添加关于忽略标记的评论。
点击保存将把异常值移至已审核列表。它将显示谁标记了异常值为正确,以及标记为正确的日期。选择异常值旁边的箭头可跳转至评估中的特定问题。 - 选择稍后审核将保持该标记在待审核列表中。点击黄色标签访问异常值列表。
在您完成评估的过程中,您可以点击黄色标签来检查任何仍需要审核的内容。
一旦没有更多需要审查的异常值,黄色标签就会变成绿色。
验证,以红色高亮显示,标识出您必须解决且无法忽略的任何错误。
例如,在下面的截图中,报告年度内购买蒸汽的能源组合需要加起来等于100%。在审核并更改该值之前,您将无法提交评估。
看到此消息后,您可以发布您的评估。
注意:FDM和FEM在发布前需要进行异常值检查。
点击此处,查看常见问题解答中更多关于异常值检测和验证的示例。
[#$tu336]
Worldly平台在工厂自我评估过程中自动运行以下数据检查。
| 检查 | 类型 |
描述 | FEM2023 | FEM2024 | 即将于2025年2月推出 |
成品组装数量 |
验证 |
成品组装的年度数量必须是整数 | 是 |
是 |
是 |
生物质来源组合 |
验证 |
所有可持续采购并获得认证的生物质百分比 = 100 | 是 |
是 |
是 |
蒸汽来源组合 |
验证 |
所有蒸汽来源的百分比 = 100 | 是 |
是 |
是 |
蒸汽检查 |
验证 |
输入的温度和压力值无法产生蒸汽。 | 是 |
是 |
是 |
区域供暖温度检查 |
验证 |
区域供暖水的出口温度大于或等于入口温度。 | 是 |
是 |
是 |
车辆能源来源 |
验证 |
已选择车辆能源来源,但没有公司拥有或控制的车辆。 | 是 |
是 |
是 |
低总能源 |
验证 |
报告的总生产量或综合能源使用量必须大于美国家庭年平均用电量。如果工厂报告跟踪其所有能源来源,则能源总量 < 38574 兆焦耳。 | 否 |
2024年新功能 |
是 |
高总能源 |
验证 |
该工厂报告的总能源超过10,000,000,000兆焦耳。 | 否 |
2024年新功能 |
是 |
高总量 LNG |
验证 |
工厂报告的LNG总量超过1,000,000,000兆焦耳 | 否 |
2024年新功能 |
是 |
报告的雨水使用和雨水收集的答案不匹配 |
验证 |
报告的雨水使用总量与报告的最大雨水收集能力值不匹配,而且工厂回应称他们已经利用了工厂内可行的最大屋顶/地面面积进行雨水收集。 | 是 |
是 |
是 |
总用水量较低 |
验证 |
工厂报告的总用水量必须大于0升。FEM不会接受为0或负数的数值。 | 否 |
否 |
2025 年新品 |
总用水量高 |
验证 |
工厂报告的用水总量不得超过 1e+11(千亿)升。 | 否 |
否 |
2025 年新品 |
高柴油百分比 |
异常值检测 |
柴油能源的使用量超过了报告的总能源的90%。 | 是 |
是 |
是 |
高 LNG 百分比 |
异常值检测 |
LNG能源的使用量超过了报告的总能源的90%。 | 是 |
是 |
是 |
低购买电力百分比 |
异常值检测 |
购买电力的能源量少于报告的总能源的50%。 | 是 |
已移除 |
已移除 |
每位员工低能耗 |
异常值检测 |
每位员工每个工作日的总报告能源使用量较低。 | 是 |
已移除 |
已移除 |
每位员工的低用水量 |
异常值检测 |
每位员工每个工作日的总报告用水量较低。 | 是 |
已移除 |
已移除 |
高废水 |
异常值检测 |
报告的废水总量很高。 | 是 |
是 |
是 |
忽略高用户输入的自定义排放因子 |
计算 |
用户可以为自定义排放因子输入任何数值。在 FEM 2023 中,当计算温室气体(GHG)排放时,超出燃料源预期正常排放因子范围(0 到 1.6 之间)的值将被忽略。在 FEM 2023 中,这些用户输入的值不会用于任何计算。 | 是 |
是 |
是 |
高能源使用量 |
异常值检测 |
各个来源:在能源总量的背景下,个别能源来源(例如煤炭)的使用量很高。 总计:工厂类型中所有报告的能源来源总和很高。 |
否 |
是 |
是 |
高用水量 |
异常值检测 |
各个来源:在能源总量的背景下,个别水源(例如雨水)的使用量很高。 总计:某一工厂类型中所有报告的水源总和很高。 |
否 |
是 |
是 |
高标准化能源使用量 |
异常值检测 |
总计:工厂类型中所有报告的能源来源的标准化总和很高。 | 否 |
是 |
是 |
高标准化用水量 |
异常值检测 |
总计:某一工厂类型中所有报告的水源总和很高。 | 否 |
是 |
是 |
同比能源使用的显著变化 |
异常值检测 |
与 FEM2023 相比,单个能源使用量和总能源使用量显著增加或减少。 | 否 |
是 |
是 |
同比用水量的显著变化 |
异常值检测 |
与 FEM2023 相比,单个水源用水量和总用水量显著增加或减少。 | 否 |
是 |
是 |
Higg FEM 异常值检测方法
要了解有关异常值检测的更多信息,请阅读Worldly 的 Higg FEM 异常值检测方法。
摘要:关于何时触发异常值检测以及其含义的高级概述。
数据异常值的定义:错误异常值与真实异常值之间有什么区别?
初始数据集:Cascale和Worldly使用完整的FEM23评估集来建立用于FEM24评估的异常值阈值。
识别异常值的方法:了解如何使用标准统计方法四分位距来识别异常值。
单年同比变化:了解同比比较如何标记异常大的数值以及此功能的开发过程。
总能源/水异常值阈值:查看这两个表格以了解能源和水异常值的阈值。
我可以从异常值检测中期待什么?
异常值检测于2025年2月19日发布。如果工厂的Higg FEM评估在该日期之前发布,工厂需要等到这个日期之后才能利用数据检查功能。
此外,只要他们尚未开始与验证机构验证数据,并且在2025年4月30日之前,工厂可以取消发布其评估,使用数据检查来查找其回复中的异常值,然后再重新发布评估。
例如,如果一个工厂在2025年1月31日发布了他们的评估,他们需要在2025年2月19日至4月30日期间执行以下操作:
- 取消发布他们的评估
- 使用异常值检测来检查他们的评估数据
- 重新发布他们的评估
同比异常检测也将于三月中旬推出。
什么被视为异常值?
- 错误的异常值是在数据收集、记录、计算或输入过程中由于错误而产生的数据点。它们代表不准确性,不能反映数据中真实的潜在模式。例如,将一个人的年龄错误地记录为250岁而不是25岁的打字错误就是一个错误的异常值,因为它不符合现实值。同样,在没有转换的情况下以错误的单位记录能源值(例如,以兆焦耳(MJ)为单位的值被分配为千瓦时(kWh)单位)也会导致错误的异常值。这种"错误数据"必须被识别并处理——通常是通过删除或纠正(例如,通过验证或用推算值替换)——以维护分析的完整性。
- 真实异常值是合法的数据点,它们在统计上很少见但并非错误。它们自然存在于数据中,反映了真实的现象或事件。真实异常值通常提供关于不寻常但有效的行为或事件的宝贵信息。例如,工厂能源使用的异常增加可能对应于热浪期间增加的制冷需求。真实异常值可以揭示关键趋势、风险或机会,不应在未经分析的情况下被忽视。
FDM 到 FEM 异常值检测
FEM 和 FEM 都需要在发布前进行异常值检测。
请注意,虽然导入到FEM的FDM数据在传输过程中不会被检查,但FEM会在评估发布之前对导入的数据运行异常值检测。