DPE - Diagnostic de Performance Energétique

Sujet dédié aux discussions aux DPE (produit par l’ADEME et prédit par URBS) et à l’intégration de ces données dans la base IMOPE

:information_source: À propos des DPE produits par l’ADEME

Nom : DPE-ADEME - Diagnostic de Performance Energetique
Source : ADEME
Thématique : énergie
Actualisation par URBS : deux fois par an
Emprise : france
Licence : Licence Ouverte
Qualité : +++
Lien(s) :
:arrow_down: Téléchargement
:open_book: Documentation


:information_source: À propos des DPE prédits par URBS

Nom : DPE Prédits
Source : URBS
Thématique : énergie
Actualisation par URBS : deux fois par an
Emprise : france
Licence : Contraint
Qualité :
Lien(s) :
:film_projector: Regarder sur Youtube le webinaire consacré aux DPE

Foire aux questions

Généralités

Quelle différence entre DPE réel et DPE prédit ?

:gear: Réponse, en bref
L’indicateur « DPE réel » est issue de la base de données des DPE (Diagnostics de Performance Energétique) de l’ADEME. Il s’agit du DPE réellement établi à ce jour sur le bâtiment. Cela concerne uniquement les DPE établis selon l’ancienne méthode de calcul DPE. La nouvelle méthode de calcul DPE a été modifiée en 2021, et sera prochainement intégrée par nos soins.

L’attribut « DPE prédit », disponible dans la version augmentée,** **IMOPE, est calculé par apprentissage machine, il s’agit ici d’un modèle mathématique prédictif qui apprend des données du bâtiment et des données DPE des bâtiments aux caractéristiques similaires. Cette prédiction est réalisée à partir de ce que nous connaissons du bâtiment : son degré de fiabilité est donc directement lié à la quantité et la qualité de données disponibles du ou des logements de l’adresse concernée, et de la complétude des données sur le territoire. La qualité varie donc fortement d’un bâtiment à l’autre et d’un territoire à l’autre. A noter que cet indicateur est purement informatif et n’a pas de caractère officiel (il ne peut pas être utilisé lors d’une transaction, vente ou location).

A noter que nous travaillons à l’amélioration continue de ces méthodes prédictives, notamment à travers un programme de R&D avec le soutien du Ministère de la Recherche et de l’Innovation, et de Mines St-Etienne

Les DPE sont-ils uniquement prédit sur les bâtiments d'habitation ou également sur les bâtiments tertiaires ?

:gear: Réponse, en bref
Pour le moment, nous réalisons uniquement des prédictions pour les DPE logements. Les DPE tertiaires ne sont donc pas produits à ce stade.

Nos prédictions se basent sur les données existantes. Il est également important de noter que, pour le tertiaire, la base des DPE disponibles est significativement plus réduite que celle du résidentiel, ce qui peut limiter les possibilités de modélisation dans ce domaine.

Pour en savoir + : IMOPE tertiaire, base de données du parc bâti tertiaire

Dans le tableau de bord adresse, comment savoir si un DPE est réel ou prédit ?

:gear: Réponse, en bref
Il suffit de cliquer sur le bouton information « i ». Les métadonnées précisent alors la source et la méthode d’acquisition de l’attribut. Il est également possible de distinguer les deux attributs dans le tableau de bord en ajoutant de nouvelles données.

Accès aux métadonnées depuis le tableau de bord adresse

Sélection des attributs DPE réels et DPE prédit

:heavy_plus_sign: Pour aller plus loin

:open_book: Tutoriel tableau de bord adresse

Concernant les DPE réels, avons nous accès au DPE Collectif des copropriétés ?

:gear: Réponse, en bref
Oui, les DPE collectifs (DPE au bâtiment) sont bien en base. Si ce dernier est disponible il constitue alors le DPE de référence pour l’adresse considérée. Si aucun DPE bâtiment n’est présent le DPE de référence sera sélectionné parmi la liste des DPE au logement pour cette adresse. Notons que via l’ONB+ vous disposez de l’historique des DPE à l’adresse et ce depuis l’application du nouvel arrête en 2021.

Traitement des DPE réels

Quels sont les limites des DPE réels ?

:gear: Réponse, en bref
La base des DPE de l’ADEME nécessite un travail de nettoyage, correction et géolocalisation des DPE.

L’interprétation de ces données doit être faite avec précaution. En effet, le DPE est obligatoire seulement pour une vente, une location ou à l’achèvement de toute nouvelle construction. Ainsi, tous les biens ne sont pas dotés d’un DPE. A ce titre, la base de données DPE ne couvre pas l’ensemble du parc immobilier et elle n’en est pas représentative.

Dans la base des DPE, comment traitez vous les DPE manifestement faux pour entrainer vos modèles?

:gear: Réponse, en bref
Tous les DPE ne sont pas sélectionnés pour alimenter le modèle. Notamment, les outliers sont écartés afin de limiter les biais dans les prédictions.

Cela dit, la notion de « manifestement faux » mériterait d’être discutée pour élaborer une méthode consensuelle et rigoureuse de détection. Il convient également de rappeler que les DPE sont opposables et, dès qu’ils sont remontés à l’ADEME, ils deviennent la valeur officielle de référence.

Pour les DPE « Faux » on voit bien des erreurs dans les données remontées (des sommes qui ne se font pas, des incohérences si on relance les calculs en sens inverse avec les mêmes paramètres d’entrées en respectant la méthode 3CL etc.)

:gear: Réponse, en bref
En effet, l’analyse de certains DPE peut révéler des incohérences. Le développement de modèles d’analyse spécifiques permettrait de détecter la « qualité » des DPE, ce qui serait bénéfique pour nos modèles. Cela permettrait notamment de sélectionner les DPE les plus qualitatifs, améliorant ainsi la fiabilité des prédictions.

Méthodologie de prédiction des DPE

Où pouvons nous trouver quelques détail sur la méthode d’IA utilisé ? notamment sur la précision des modèles ?

:gear: Réponse, en bref
Les algorithmes d’IA développés par U.R.B.S ont fait l’objet de publications scientifiques dans des articles « rankés » et de ce fait ont bénéficié d’une relecture/validation par les pairs. Tous les éléments sont disponibles dans ces articles.

Voici quelques références :
:open_book: Projet de recherche avec l’École des Mines de Saint-Étienne / thèse de Marc Grossouvre
:link: Article : Enhancing buildings’ energy efficiency prediction through advanced data fusion and fuzzy classification
:link: Article : Predicting missing Energy Performance Certificates: Spatial interpolation of mixture distributions

Notons la pertinence de votre question, car sur les sujets IA, si la communication est omniprésente chez nos confères, les garanties scientifiques sont souvent édulcorées voire inventées : peu de transparence sur les éléments méthodologiques, peu d’informations sont mises à disposition publiquement par les acteurs producteurs de données prédites.

L’appariement à l’adresse des DPE est aussi lié à l’identifiant BAN directement disponible dans les fichiers XML envoyés à l’ADEME. Ces données ne sont pas exploitables ?

:gear: Réponse, en bref
En effet. Toutefois, à notre connaissance, les adresses des DPE dans la base ADEME ne font pas l’objet d’un nettoyage préalable. Cela peut donc impacter la qualité du lien avec la BAN.

C’est pourquoi nous n’utilisons pas directement le lien fourni par la BAN. Nous restructurons les adresses et régénérons un lien avec la BAN après un processus de standardisation et de redressement. Ce lien peut donc différer du lien initial.

Nos études comparatives montrent néanmoins une nette amélioration de la qualité et de la fiabilité des appariements grâce à notre processus en amont.

Dans votre méthode prédictive, vous n’avez pas accès à la consommation des logements qui permettrait d’être au plus juste? En effet, si un logement proche a fait l’objet d’un DPE récent avec une bonne valeur de DPE alors que le logement d’à côté est à l’abandon, on va l’estimer à bonne car le plus proche voisin est bon.

:gear: Réponse, en bref
Les données de consommations réelles ne sont malheureusement pas accessibles pour tous les bâtiments en France. Dans le secteur résidentiel, par exemple, il est nécessaire de disposer d’au moins 9 Points de Livraison (PDL) pour obtenir des données réelles de consommation. Par conséquent, seules les structures de logement collectif peuvent bénéficier d’un apprentissage basé sur ces données.

Par ailleurs, le concept de « plus proche voisin » dans le modèle ne repose pas uniquement sur une proximité géographique. Par exemple, si un bien est abandonné, il sera probablement classé comme vacant et/ou associé à un mauvais indice d’insalubrité. Le modèle est conçu pour détecter ces différences et ajuster les prédictions en conséquence.

Comment les rénovations énergétiques sont elles prises en compte ?

:gear: Réponse, en bref
À ce jour, il n’existe pas de base de données publiques recensant la réalisation de rénovations pour un logement, ni le détail de ces rénovations.

L’accès à ce type de données serait particulièrement pertinent, notamment pour améliorer l’efficacité et la précision de notre modèle prédictif.

Est ce que l’épaisseur des murs est prise en compte maintenant entre un murs de 10cm et un murs de 60 - 80 cm ?

:gear: Réponse, en bref
L’épaisseur des murs n’est pas une donnée disponible à grande échelle. Cependant, deux bâtiments qui présentent des similitudes importantes selon les variables mentionnées peuvent être considérés comme proches sur le plan structurel.

Fiabilité des prédictions

Quelle est la fiabilité des DPE reconstruits ?

:gear: Réponse, en bref
La prédiction des DPE manquants issue de méthodes brevetées et validées par :

  • un travail de R&D sur le sujet depuis 2017
  • les paires scientifiques, via la publication d’articles de recherche
  • le terrain et le déploiement en contexte opérationnel (amélioration continue des modèles en apprenant des données locales/terrain)

Les niveaux de fiabilité varient légèrement selon les territoires, puisque nos modèles s’adaptent aux spécificités régionales. Nous retrouvons en moyenne les résultats suivants :

  • 86% de fiabilité (+/- 1 étiquette)
  • 96% de fiabilité (+/- 2 étiquettes)
Dans votre modèle DPE IA, vous donnez toujours une note quelque soit votre taux de confiance, ou bien avez vous une catégorie « non prédis »? Donnez vous le taux de confiance pour une prédiction donnée?

:gear: Réponse, en bref
Le modèle prédit une probabilité d’appartenance à chacune des étiquettes (A à G). L’étiquette ayant la probabilité la plus élevée est considérée comme la plus représentative de l’adresse étudiée.

Pour chaque prédiction, nous fournissons également ce degré d’appartenance, permettant une meilleure compréhension de la précision et de la fiabilité des résultats.

Positionnement des données d’URBS par rapport à la concurrence

Comment les données DPE générées par l’IA se positionnent-elles par rapport aux autres offres commerciales qui émergent sur ce sujet ? Quels sont les avantages des données U.R.B.S par rapport aux concurrents ?**

:gear: Réponse, en bref
Les confrères ne rendent pas disponibles leurs résultats (ou ne le font que sur des périmètres très ciblés, ce qui fausse l’analyse à échelle nationale). De même aucune validation scientifique ou littérature scientifique ne permettent d’analyser la qualité de leur travail. il nous est donc impossible à ce stade de comparer objectivement et scientifiquement la qualité des modèles par rapport à ceux proposés par U.R.B.S.