Sujet dédié aux discussions sur les DPE (produit par l’ADEME et prédit par URBS) et à l’intégration de ces données dans la base IMOPE
Contexte
Le Diagnostic de Performance Énergétique (DPE) est devenu un enjeu central pour les propriétaires et investisseurs. Avec l’entrée en vigueur des restrictions sur la location des passoires thermiques, il est crucial de maîtriser les subtilités de ces informations et comprendre comment la donnée peut accompagner ces enjeux.
Dans ce contexte, U.R.B.S. met à disposition deux attributs dans l’ONB : le DPE de référence officiel et le DPE de référence enrichi.
Les DPE de référence - officiels
Les DPE de référence - officiels sont issues de l’ADEME. Nous les actualisons deux fois par an sur tout le territoire métropolitain. Ils sont disponibles gratuitement dans l’ONB. Nous présentons pour chaque adresse possédant un DPE, un DPE dit de référence c’est à dire le DPE bâtiment s’il existe ou, à défaut, le DPE logement le plus récent. Dans la version premium nous proposons pour chaque adresse la liste et le détail des DPE réalisés. Dans les deux cas, U.R.B.S apporte son expertise pour fiabiliser, nettoyer et standardiser les adresses associées aux DPE afin que ceux-ci puissent être croisés avec toutes les données de la base IMOPE.
Accès à la documentation détaillée sur le site de l’ADEME
Les DPE de référence - enrichis
Les DPE de référence enrichis sont des données premium complétées par U.R.B.S : si un DPE officiel existe, il est conservé, sinon nous le simulons à l’aide d’algorithme d’apprentissage machine.
Une approche qui s’appuie sur des travaux validés et publiés**
Chez U.R.B.S, nous avons toujours fait le choix de la rigueur scientifique, de la validation par les pairs, et d’une démarche qui se veut intègre et robuste. Notre approche s’appuie sur un programme de recherche et des travaux validés et publiés :
Programme de recherche avec l’École des Mines de Saint-Etienne (Institut Mines Telecom) depuis 2016
Publications scientifiques reconnues et évaluées par des pairs :
Autres ressources
Regarder sur Youtube le webinaire consacré aux DPE
Fiche descriptive
Quelle fiabilité leur accorder ?
Dans un monde où l’IA façonne de plus en plus notre quotidien, nombreux sont les acteurs qui vantent la performance de leurs modèles. Pourtant, peu d’entre eux partagent ouvertement les détails de leurs modèles prédictifs ou la validité scientifique des méthodologies employées.
Les niveaux de fiabilité varient légèrement selon les territoires, puisque nos modèles s’adaptent aux spécificités régionales. Nous retrouvons en moyenne les résultats suivants :
- 78% de fiabilité (+/- 1 étiquette)
- 93% de fiabilité (+/- 2 étiquettes)
Ces chiffres correspondent à l’exactitude (accuracy) c’est à dire au taux global de bonnes prédictions.
À l’échelle nationale notre modèle à les performances suivantes. Elles sont présentés ici en comparaison de celles obtenues par le CSTB. Notez que nos méthodologies sont assez différentes : le CSTB se base selon nos informations sur une méthode de prédiction physique simplifié tandis que nous nous basons sur une méthode géostatistique.
Sensibilité par étiquette
La sensibilité (recall) de A est le taux de A bien prédits par rapport à l’ensemble des vrais A. C’est ce que voit le prédicteur.
Etiquette | URBS | CSTB |
---|---|---|
Recall A | 0.533 | 0.200 |
Recall B | 0.224 | 0.185 |
Recall C | 0.450 | 0.685 |
Recall D | 0.456 | 0.483 |
Recall E | 0.355 | 0.321 |
Recall F | 0.192 | 0.111 |
Recall G | 0.207 | 0.229 |
Recall AB | 0.513 | 0.219 |
Recall CDE | 0.862 | 0.914 |
Recall FG | 0.348 | 0.299 |
La sensibilité montre l’effort d’URBS pour mieux prédire les étiquettes extrêmes. Celles-ci sont particulièrement importantes notamment pour l’identification des passoires thermiques.
On remarque que les prédictions sur les groupes d’étiquettes AB et FG sont particulièrement performantes chez URBS.
Précision
La précision (precision) de A est le taux de A bien prédits par rapport à l’ensemble des A prédits. C’est ce que voit l’utilisateur.
Etiquette | URBS | CSTB |
---|---|---|
Precision A | 0.545 | 0.250 |
Precision B | 0.289 | 0.250 |
Precision C | 0.454 | 0.565 |
Precision D | 0.419 | 0.459 |
Precision E | 0.340 | 0.410 |
Precision F | 0.223 | 0.205 |
Precision G | 0.254 | 0.160 |
Precision AB | 0.589 | 0.292 |
Precision CDE | 0.823 | 0.887 |
Precision FG | 0.414 | 0.360 |
Du point de vue utilisateur, URBS surperforme aussi pour les étiquettes A, B, F, G et pour le groupes AB et FG.
Distribution des DPE
Nous avons pu réaliser une comparaison à l’échelle nationale entre les prédictions réalisées par le CSTB et celles réalisées par URBS. Notez que les données publiées par le CSTB sont sous forme de pourcentage ce qui rend cette comparaison peu précise. À l’échelle France, la distribution que nous obtenons chez URBS nous semble plus réaliste tant dans les DPE prédit que dans ceux observés en particulier sur les classes extrêmes (A et B et dans une moindre mesure F et G).
Ce qui nous différencie véritablement
Nos algorithmes ne se limitent pas à prédire les DPE : ils reconstruisent également les sources d’énergie et les types de chauffage des bâtiments non diagnostiqués (90% des adresses avec des données manquantes), offrant ainsi une visibilité complète sur l’ensemble du parc immobilier français (99-100% d’adresses qualifiées).
Ces méthodologies ne sont pas de simples « boîtes noires » : elles sont publiées, validées et documentées garantissant une transparence totale à nos utilisateurs et partenaires.
Foire aux questions
Généralités
Quelle différence entre DPE réel et DPE prédit ?
Réponse, en bref
L’indicateur « DPE réel » est issue de la base de données des DPE (Diagnostics de Performance Energétique) de l’ADEME. Il s’agit du DPE réellement établi à ce jour sur le bâtiment. Cela concerne uniquement les DPE établis selon la méthode en vigueur depuis 2021. Les DPE établis avant cette date ne sont plus pris en compte car difficilement comparables à ceux établis depuis la réforme. Nous réfléchissons néanmoins à explorer les anciens DPE afin de récupérer d’autres informations lesquelles peuvent permettre de compléter la connaissance du bâti.
L’attribut « DPE prédit », disponible dans la version augmentée, est calculé par apprentissage machine, il s’agit ici d’un modèle mathématique prédictif qui apprend des données du bâtiment et des données DPE des bâtiments aux caractéristiques similaires. Cette prédiction est réalisée à partir de ce que nous connaissons du bâtiment : son degré de fiabilité est donc directement lié à la quantité et la qualité de données disponibles du ou des logements de l’adresse concernée, et de la complétude des données sur le territoire. La qualité varie donc fortement d’un bâtiment à l’autre et d’un territoire à l’autre. A noter que cet indicateur est purement informatif et n’a pas de caractère officiel (il ne peut pas être utilisé lors d’une transaction, vente ou location).
A noter que nous travaillons à l’amélioration continue de ces méthodes prédictives, notamment à travers un programme de R&D avec le soutien du Ministère de la Recherche et de l’Innovation, et de Mines St-Etienne
Qu'est ce que le DPE de référence ?
Réponse, en bref Pour chaque adresse, nous faisons le choix d’un DPE de référence lorsqu’il en existe au moins un. Il s’agit soit du DPE logement le plus récent ou s’il existe du DPE de la copropriété. Dans la version ONB+ il est possible d’avoir accès à toute la liste des DPE réalisés depuis 2021.
Ce choix peut avoir un impact sur les autres indicateurs issus des DPE. Par exemple, pour les déperditions thermiques il est possible qu’elles apparaissent comme nulles dans le cas ou le DPE de référence est celui d’un logement situé au centre de l’immeuble (i.e. non en toiture ou en rez-de-chaussée). Dans cet exemple il n’y a pas de déchange thermique entre des zones chauffées dans le cadre du calcul du DPE.
Les DPE sont-ils uniquement prédit sur les bâtiments d'habitation ou également sur les bâtiments tertiaires ?
Réponse, en bref
Pour le moment, nous réalisons uniquement des prédictions pour les DPE logements. Les DPE tertiaires ne sont donc pas produits à ce stade.
Nos prédictions se basent sur les données existantes. Il est également important de noter que, pour le tertiaire, la base des DPE disponibles est significativement plus réduite que celle du résidentiel, ce qui peut limiter les possibilités de modélisation dans ce domaine.
Pour en savoir + : IMOPE tertiaire, base de données du parc bâti tertiaire
Dans le tableau de bord adresse, comment savoir si un DPE est réel ou prédit ?
Réponse, en bref
Cela est clairement notifié via un bandeau ou la mention « DPE réel » ou « DPE prédit ». À défaut vous pouvez cliquer sur les petits (i). Les métadonnées précisent alors la source et la méthode d’acquisition de l’attribut.
Dans les autres fonctionnalités (cartographie, tableau de bord territoire et outil de ciblage et de prospection), deux attributs existent : DPE de référence - officiel pour les DPE réels et « DPE de référence - enrichi » pour les DPE réels et simulés.
Pour aller plus loin
Concernant les DPE réels, avons nous accès au DPE Collectif des copropriétés ?
Réponse, en bref
Oui, les DPE collectifs (DPE au bâtiment) sont bien en base. Si ce dernier est disponible il constitue alors le DPE de référence pour l’adresse considérée. Cela est indiqué directement dans l’interface du tableau de bord adresse.
Si aucun DPE bâtiment n’est présent le DPE de référence sera sélectionné parmi la liste des DPE au logement pour cette adresse : nous prenons alors le plus récent. Notons que via l’ONB+ vous disposez de l’historique des DPE à l’adresse et ce depuis l’application du nouvel arrête en 2021.
Traitement des DPE réels
Quels sont les limites des DPE réels ?
Réponse, en bref
La base des DPE de l’ADEME nécessite un travail de nettoyage, correction et géolocalisation des DPE notamment via l’adresse renseignée. Ce nettoyage fait, le DPE peut être croisé avec toutes les autres données de la base IMOPE. C’est ici la plus-value du travail réalisé par U.R.B.S et mis à disposition dans l’ONB.
L’interprétation de ces données doit être faite avec précaution. En effet, le DPE est obligatoire seulement pour une vente, une location ou à l’achèvement de toute nouvelle construction. Ainsi, tous les biens ne sont pas dotés d’un DPE. A ce titre, la base de données DPE ne couvre pas l’ensemble du parc immobilier et elle n’en est pas représentative.
Dans la base des DPE, comment traitez vous les DPE manifestement faux pour entrainer vos modèles?
Réponse, en bref
Tous les DPE ne sont pas sélectionnés pour alimenter le modèle. Notamment, les outliers sont écartés afin de limiter les biais dans les prédictions.
Cela dit, la notion de « manifestement faux » mériterait d’être discutée pour élaborer une méthode consensuelle et rigoureuse de détection. Il convient également de rappeler que les DPE sont opposables et, dès qu’ils sont remontés à l’ADEME, ils deviennent la valeur officielle de référence.
Pour les DPE « Faux » on voit bien des erreurs dans les données remontées (des sommes qui ne se font pas, des incohérences si on relance les calculs en sens inverse avec les mêmes paramètres d’entrées en respectant la méthode 3CL etc.)
Réponse, en bref
En effet, l’analyse de certains DPE peut révéler des incohérences. Le développement de modèles d’analyse spécifiques permettrait de détecter la « qualité » des DPE, ce qui serait bénéfique pour nos modèles. Cela permettrait notamment de sélectionner les DPE les plus qualitatifs, améliorant ainsi la fiabilité des prédictions.
Méthodologie de prédiction des DPE
Où pouvons nous trouver quelques détail sur la méthode d’IA utilisé ? notamment sur la précision des modèles ?
Réponse, en bref
Les algorithmes d’IA développés par U.R.B.S ont fait l’objet de publications scientifiques dans des articles « rankés » et de ce fait ont bénéficié d’une relecture/validation par les pairs. Tous les éléments sont disponibles dans ces articles.
Voici quelques références :
Projet de recherche avec l’École des Mines de Saint-Étienne / thèse de Marc Grossouvre
Article : Enhancing buildings’ energy efficiency prediction through advanced data fusion and fuzzy classification
Article : Predicting missing Energy Performance Certificates: Spatial interpolation of mixture distributions
Notons la pertinence de votre question, car sur les sujets IA, si la communication est omniprésente chez nos confères, les garanties scientifiques sont souvent édulcorées voire inventées : peu de transparence sur les éléments méthodologiques, peu d’informations sont mises à disposition publiquement par les acteurs producteurs de données prédites.
L’appariement à l’adresse des DPE est aussi lié à l’identifiant BAN directement disponible dans les fichiers XML envoyés à l’ADEME. Ces données ne sont pas exploitables ?
Réponse, en bref
En effet. Toutefois, à notre connaissance, les adresses des DPE dans la base ADEME ne font pas l’objet d’un nettoyage préalable. Cela peut donc impacter la qualité du lien avec la BAN.
C’est pourquoi nous n’utilisons pas directement le lien fourni par la BAN. Nous restructurons les adresses et régénérons un lien avec la BAN après un processus de standardisation et de redressement. Ce lien peut donc différer du lien initial.
Nos études comparatives montrent néanmoins une nette amélioration de la qualité et de la fiabilité des appariements grâce à notre processus en amont.
Dans votre méthode prédictive, vous n’avez pas accès à la consommation des logements qui permettrait d’être au plus juste? En effet, si un logement proche a fait l’objet d’un DPE récent avec une bonne valeur de DPE alors que le logement d’à côté est à l’abandon, on va l’estimer à bonne car le plus proche voisin est bon.
Réponse, en bref
Les données de consommations réelles ne sont malheureusement pas accessibles pour tous les bâtiments en France. Dans le secteur résidentiel, par exemple, il est nécessaire de disposer d’au moins 9 Points de Livraison (PDL) pour obtenir des données réelles de consommation. Par conséquent, seules les structures de logement collectif peuvent bénéficier d’un apprentissage basé sur ces données.
Par ailleurs, le concept de « plus proche voisin » dans le modèle ne repose pas uniquement sur une proximité géographique. Par exemple, si un bien est abandonné, il sera probablement classé comme vacant et/ou associé à un mauvais indice d’insalubrité. Le modèle est conçu pour détecter ces différences et ajuster les prédictions en conséquence.
Comment les rénovations énergétiques sont elles prises en compte ?
Réponse, en bref
À ce jour, il n’existe pas de base de données publiques recensant la réalisation de rénovations pour un logement, ni le détail de ces rénovations.
L’accès à ce type de données serait particulièrement pertinent, notamment pour améliorer l’efficacité et la précision de notre modèle prédictif.
Est ce que l’épaisseur des murs est prise en compte maintenant entre un murs de 10cm et un murs de 60 - 80 cm ?
Réponse, en bref
L’épaisseur des murs n’est pas une donnée disponible à grande échelle. Cependant, deux bâtiments qui présentent des similitudes importantes selon les variables mentionnées peuvent être considérés comme proches sur le plan structurel.
Fiabilité des DPE réels et des prédictions
Quelle est la fiabilité des DPE réels ?
Réponse, en bref
Concernant les DPE réels et contrairement à d’autres sources telles que les données du CEREMA (notamment les fichiers fonciers), il n’existe pas de fiabilité native.
Cependant, chez URBS, nous attribuons un haut niveau de fiabilité (+++) aux données issues des DPE. Cela s’explique par plusieurs raisons :
- Les DPE sont réalisés par des diagnostiqueurs certifiés,
- Ils sont (en principe) fondés sur des visites de terrain avec relevés,
- Ils sont opposables juridiquement,
- Ils sont regroupés par l’ADEME,
- Et ils sont utilisés au niveau national par différents ministères à des fins statistiques.
Ainsi, en tant que données officielles caractérisant la performance énergétique d’un bâtiment, leur opposabilité leur confère une valeur probante, tant pour l’acheteur que pour le vendeur. C’est pourquoi nous ne remettons pas en cause leur fiabilité en tant que donnée officielle faisant fois.
Par ailleurs, une étude menée en novembre 2024 par l’entreprise KRNO révèle que moins de 3 % des DPE présentent des irrégularités. Cela signifie que 97 % des diagnostics peuvent être considérés comme fiables.
Quelle est la fiabilité des DPE reconstruits ?
Réponse, en bref
La prédiction des DPE manquants issue de méthodes brevetées et validées par :
- un travail de R&D sur le sujet depuis 2017
- les paires scientifiques, via la publication d’articles de recherche
- le terrain et le déploiement en contexte opérationnel (amélioration continue des modèles en apprenant des données locales/terrain)
Les niveaux de fiabilité varient légèrement selon les territoires, puisque nos modèles s’adaptent aux spécificités régionales. Nous retrouvons en moyenne les résultats suivants :
- 78% de fiabilité (+/- 1 étiquette)
- 93% de fiabilité (+/- 2 étiquettes)
Dans votre modèle DPE IA, vous donnez toujours une note quelque soit votre taux de confiance, ou bien avez vous une catégorie « non prédis »? Donnez vous le taux de confiance pour une prédiction donnée?
Réponse, en bref
Le modèle prédit une probabilité d’appartenance à chacune des étiquettes (A à G). L’étiquette ayant la probabilité la plus élevée est considérée comme la plus représentative de l’adresse étudiée.
Pour chaque prédiction, nous fournissons également ce degré d’appartenance, permettant une meilleure compréhension de la précision et de la fiabilité des résultats.
Positionnement des données d’URBS par rapport à la concurrence
Comment les données DPE générées par l’IA se positionnent-elles par rapport aux autres offres commerciales qui émergent sur ce sujet ? Quels sont les avantages des données U.R.B.S par rapport aux concurrents ?
Réponse, en bref
Les confrères ne rendent pas toujours disponibles leurs résultats (ou ne le font que sur des périmètres très ciblés, ce qui fausse l’analyse à échelle nationale).
Récemment nous avons pu réaliser une comparaison entre les données produites par U.R.B.S et celles produites par le CSTB. Nos méthodologies sont assez différentes : le CSTB se base selon nos informations sur une méthode de prédiction physique simplifié tandis que nous nous basons sur une méthode géostatistique.
Nous avons pu réaliser une comparaison à l’échelle nationale entre les prédictions réalisées par le CSTB et celles réalisées par URBS. Notez que les données publiées par le CSTB sont sous forme de pourcentage ce qui rend cette comparaison peu précise. À l’échelle France, la distribution que nous obtenons chez URBS nous semble plus réaliste tant dans les DPE prédit que dans ceux observés en particulier sur les classes extrêmes (A et B et dans une moindre mesure F et G).