En résumé :
Au sein de la base IMOPE et dans les outils qui l’utilisent nous intégrons les Diagnostics de Performance Energétique ainsi que les informations qui leurs sont associées. Comme les DPE ne couvrent pas toutes les adresses du territoire métropolitain, nous les complétons grâce des algorithmes de prédiction.
Méthodologie
Contexte
Le Diagnostic de Performance Énergétique (DPE) est devenu un enjeu central pour les propriétaires et investisseurs. Avec l’entrée en vigueur des restrictions sur la location des passoires thermiques, il est crucial de maîtriser les subtilités de ces informations et comprendre comment la donnée peut accompagner ces enjeux.
Dans ce contexte, U.R.B.S. met à disposition deux attributs dans l’ONB : le DPE de référence officiel et le DPE de référence enrichi. L’information est complétée par l’historique des DPE, ou encore les données de conductance thermiques ou les coefficients U.
Les DPE de référence - officiels
Les DPE de référence - officiels sont issus de l’ADEME. Nous les actualisons deux fois par an sur tout le territoire métropolitain. Ils sont disponibles gratuitement dans l’ONB.
Nous présentons pour chaque adresse possédant un DPE, un DPE dit de référence c’est à dire le DPE bâtiment s’il existe ou, à défaut, le DPE logement le plus récent. Dans la version premium nous proposons pour chaque adresse la liste et le détail des DPE réalisés.
Nous opérons plusieurs traitements pour fiabiliser, nettoyer et standardiser les adresses associées aux DPE afin que ceux-ci puissent être croisés avec toutes les données de la base IMOPE. Ce processus de fiabilisation et de standardisation des adresses constitue une étape indispensable pour l’intégration des DPE au sein de la base IMOPE et leur croisement avec les autres bases de données. Une bonne qualité d’appariement est également un préalable à la construction d’un modèle prédictif.
Les DPE de référence - enrichis
Les DPE de référence enrichis sont des données premium complétées par U.R.B.S : si un DPE officiel existe, il est conservé, sinon nous le simulons à l’aide d’algorithme d’apprentissage machine.
La prédiction de ces données est importante car les DPE réels ne couvrent que 13% des adresses pour 30% des logements (millésime 2025). Ce sont souvent les mêmes logements qui sont mis en location ou qui sont vendus et qui font donc l’objet d’un DPE. La complétion de cette donnée, utilisée de bien des politiques en lien avec l’amélioration des performances énergétiques des logement est donc essentielle.
Une approche qui s’appuie sur des travaux validés et publiés**
Notre approche se base sur une démarche qui se veut intègre et robuste et qui a fait l’objet d’une validation par les pairs. Elle s’appuie sur un programme de recherche et des travaux validés et publiés :
- Programme de recherche avec l’École des Mines de Saint-Etienne (Institut Mines Telecom) depuis 2016
- Publications scientifiques reconnues et évaluées par des pairs :
Marc Grossouvre, Didier Rullière, Jonathan Villot. Enhancing buildings’ energy efficiency prediction through advanced data fusion and fuzzy classification. Energy and Buildings, 2024, 313, pp.114243.
Marc Grossouvre, Didier Rullière, Jonathan Villot. Predicting missing Energy Performance Certificates: Spatial interpolation of mixture distributions. Energy and IA, 2024, 16, pp.100339.
Méthodologie
Il existe trois grande familles de modèle pour prédire les DPE :
- les modèles physiques (e.g. méthode réglementaire 3CL) qui utilisent les caractéristiques physiques de bâtiments. Ces modèles sont difficilement généralisables car ils nécessitent des données précises récoltées sur le terrain. Il est donc difficile de les généraliser à grande échelle à tout le parc de logements.
- les modèles hybrides qui proposent une approche simplifiée du modèle physique nécessitant moins de données d’entrée. Ce type de modèle permet la simulation de scénario mais nécessite d’estimer de nombreuses données d’entrée entrainant une propagation des incertitudes.
- les modèles statistiques, modèle que l’on met en œuvre chez U.R.B.S., dans lequel on se base sur des algorithmes d’intelligence artificielle afin d’établir des liens statistiques entre les informations connus sur le bâtiment et son DPE. Dans ce type de modèle on valorise tout type d’information : aussi bien des informations techniques que géographique ou sociologique. Les attributs de la base IMOPE sont ici pleinement mobilisés. Dans ce type de modèle, il n’y a pas de données à estimer. L’inconvénient de ce type de modèle est que la simulation de scénario est difficile et qu’il nécessite un grand échantillon d’apprentissage. Cependant, la base des DPE réels étant suffisamment grande, cette dernière limite n’en est pas vraiment une.
Chez U.R.B.S., nous utilisons un modèle de la famille des modèles statistique. Plus précisément nous utilisons un modèle de classification floue de type KNN (k plus proches voisins). Selon la proximité des différentes caractéristiques étudiées, on donne un poids à chacune des étiquettes DPE. Ce poids représente la proximité entre l’individu (ici un bâtiment) pour lequel on souhaite prédire l’étiquette) et les k plus proches voisins. On obtient ainsi un degré d’appartenance à une étiquette. Pour prédire une étiquette on conserve celle ayant le degré d’appartenance le plus élevé.
Dans notre algorithme, les variables utilisés sont : l’altitude, la latitude, la longitude, le type de chauffage et la source d’énergie, l’âge du bâtiment, les matériaux des murs et du toit, l’état d’entretien, le fait qu’il s’agisse ou non d’un logement HLM, le nombre d’étages, le nombre de logements, le niveau de confort, le nombre de propriétaires occupants, le nombre de logements vacants, la présence d’un branchement gaz, la typologie d’occupation, la typologie de propriétaire … Chaque variable a un poids différent dans le modèle final.
Pour aller plus loin :
Regarder le webinaire consacré aux DPE sur Youtube
Fiabilité des prédictions
Les niveaux de fiabilité varient légèrement selon les territoires, puisque nos modèles s’adaptent aux spécificités régionales. Nous retrouvons en moyenne les résultats suivants (modèle 2025) :
- 40% de fiabilité (+/- 0 étiquette)
- 78% de fiabilité (+/- 1 étiquette)
- 93% de fiabilité (+/- 2 étiquettes)
Ces chiffres correspondent à l’exactitude (accuracy) c’est à dire au taux global de bonnes prédictions.
À l’échelle nationale notre modèle à les performances suivantes. Elles sont présentés ici en comparaison de celles obtenues par le CSTB. Notez que nos méthodologies sont assez différentes : le CSTB se base selon nos informations sur une méthode de prédiction physique simplifié tandis que nous nous basons sur une méthode géostatistique.
Sensibilité par étiquette
La sensibilité (recall) de A est le taux de A bien prédits par rapport à l’ensemble des vrais A. C’est ce que voit le prédicteur.
| Etiquette | URBS | CSTB |
|---|---|---|
| Recall A | 0.533 | 0.200 |
| Recall B | 0.224 | 0.185 |
| Recall C | 0.450 | 0.685 |
| Recall D | 0.456 | 0.483 |
| Recall E | 0.355 | 0.321 |
| Recall F | 0.192 | 0.111 |
| Recall G | 0.207 | 0.229 |
| Recall AB | 0.513 | 0.219 |
| Recall CDE | 0.862 | 0.914 |
| Recall FG | 0.348 | 0.299 |
La sensibilité montre l’effort d’URBS pour mieux prédire les étiquettes extrêmes. Celles-ci sont particulièrement importantes notamment pour l’identification des passoires thermiques.
On remarque que les prédictions sur les groupes d’étiquettes AB et FG sont particulièrement performantes chez URBS. Ce point est plutôt important car pour l’amélioration des performances du parc bâti le focus se fait en priorité sur les bâtiments les moins performants c’est à dire ceux ayant une étiquette F ou G.
Précision
La précision (precision) de A est le taux de A bien prédits par rapport à l’ensemble des A prédits. C’est ce que voit l’utilisateur.
| Etiquette | URBS | CSTB |
|---|---|---|
| Precision A | 0.545 | 0.250 |
| Precision B | 0.289 | 0.250 |
| Precision C | 0.454 | 0.565 |
| Precision D | 0.419 | 0.459 |
| Precision E | 0.340 | 0.410 |
| Precision F | 0.223 | 0.205 |
| Precision G | 0.254 | 0.160 |
| Precision AB | 0.589 | 0.292 |
| Precision CDE | 0.823 | 0.887 |
| Precision FG | 0.414 | 0.360 |
Du point de vue utilisateur, URBS surperforme aussi pour les étiquettes A, B, F, G et pour le groupes AB et FG.
Distribution des DPE
Nous avons pu réaliser une comparaison à l’échelle nationale entre les prédictions réalisées par le CSTB et celles réalisées par URBS. Notez que les données publiées par le CSTB sont sous forme de pourcentage ce qui rend cette comparaison peu précise. À l’échelle France, la distribution que nous obtenons chez URBS nous semble plus réaliste tant dans les DPE prédits que dans ceux observés en particulier sur les classes extrêmes (A et B et dans une moindre mesure F et G).
Pour aller plus loin
Nos algorithmes ne se limitent pas à prédire les DPE : ils reconstruisent également les sources d’énergie et les types de chauffage des bâtiments non diagnostiqués (90% des adresses avec des données manquantes), offrant ainsi une visibilité complète sur l’ensemble du parc immobilier français (99-100% d’adresses qualifiées).
Variable(s)
À l’adresse (table adresse)
dpe |
|
|---|---|
| Définition : Etiquette énergie provenant du DPE le plus récent à l’adresse | |
| Taux de complétude : 15.87% des adresses avec logement d’habitation | |
| Catégorie : DPE | Disponibilité : |
| Unité : NA | Fiabilité : +++ |
| Millésime : 2025 | Source : ADEME |
dpeurbs |
|
|---|---|
| Définition : Etiquette énergie provenant du DPE le plus récent à l’adresse, sinon l’étiquette est issue de modèles prédictifs | |
| Taux de complétude : 100% des adresses avec logement d’habitation | |
| Catégorie : DPE | Disponibilité : |
| Unité : NA | Fiabilité : + |
| Millésime : 2025 | Source : U.R.B.S |
date_dpe |
|
|---|---|
| Définition : Date d’établissement du dernier DPE | |
| Taux de complétude : 15.87% des adresses avec logement d’habitation | |
| Catégorie : DPE | Disponibilité : |
| Unité : NA | Fiabilité : +++ |
| Millésime : 2025 | Source : ADEME |
energieecs |
|
|---|---|
| Définition : Source d’énergie pour l’eau chaude sanitaire provenant de données réelles | |
| Taux de complétude : 14.85% des adresses avec logement d’habitation | |
| Catégorie : DPE | Disponibilité : |
| Unité : NA | Fiabilité : +++ |
| Millésime : 2025 | Source : ADEME |
inertie |
|
|---|---|
| Définition : Classe d’inertie du bâtiment | |
| Taux de complétude : 15.27% des adresses avec logement d’habitation | |
| Catégorie : DPE | Disponibilité : |
| Unité : NA | Fiabilité : +++ |
| Millésime : 2025 | Source : ADEME |
ndpe |
|
|---|---|
| Définition : Valeur de consommation en énergie primaire issue du DPE le plus récent réalisé à l’adresse | |
| Taux de complétude : 15.87% des adresses avec logement d’habitation | |
| Catégorie : DPE | Disponibilité : |
| Unité : kWhep/m²/an | Fiabilité : +++ |
| Millésime : 2025 | Source : ADEME |
ndpeurbs |
|
|---|---|
| Définition : Valeur de consommation en énergie primaire issue du DPE le plus récent réalisé à l’adresse, sinon, la valeur est prédite par un modèle prédictif | |
| Taux de complétude : 100% des adresses avec logement d’habitation | |
| Catégorie : DPE | Disponibilité : |
| Unité : kWhep/m²/an | Fiabilité : + |
| Millésime : 2025 | Source : U.R.B.S |
numero_dpe |
|
|---|---|
| Définition : NA | |
| Taux de complétude : 15.87% des adresses avec logement d’habitation | |
| Catégorie : DPE | Disponibilité : |
| Unité : NA | Fiabilité : +++ |
| Millésime : 2025 | Source : ADEME |
typeecs |
|
|---|---|
| Définition : Type de système de l’eau chaude sanitaire issu de données réelles | |
| Taux de complétude : 14.86% des adresses avec logement d’habitation | |
| Catégorie : DPE | Disponibilité : |
| Unité : NA | Fiabilité : +++ |
| Millésime : 2025 | Source : ADEME |
ubat |
|
|---|---|
| Définition : Conductance du bâtiment donnant une information sur la performance globale de l’enveloppe | |
| Taux de complétude : 15.87% des adresses avec logement d’habitation | |
| Catégorie : DPE | Disponibilité : |
| Unité : NA | Fiabilité : +++ |
| Millésime : 2025 | Source : ADEME |
Dernière mise à jour des métadonnées : 2025-10-24 16:46:17
Disponibilité dans les outils
Les données réelles relatives aux DPE sont disponibles gratuitement pour tous dans l’ONB. Les données prédites ainsi que l’historique des DPE nécessitent une licence. Le DPE de référence est disponible dans l’ONB dans tous les outils : cartographie, tableaux de bord et outil de ciblage et de prospection.
Cas d’usage
Les DPE réels et prédits sont mobilisé dans le domaine de l’amélioration des performance énergétique des bâtiments. Plusieurs cas d’usage sont documentés sur le forum :
- Intégration des DPE prédits au sein des outils métier - Métropole d’Aix-Marseille Provence
- La performance énergétique du parc résidentiel privé - Communauté urbaine Le Havre Seine Métropole
- Repérer les ménages potentiellement en situation de précarité énergétique
- Repérer les logements potentiellement interdits à la location dans moins de 10 ans
- La performance énergétique des logements appartenant aux communes
- Identifier le potentiel de décarbonation des sources de chauffage
- Un tiers des logements interdits à la location dans moins de 10 ans ? - URBS
Votre contribution est la bienvenue pour compléter cette section ! N’hésitez pas à partager vos cas d’usage en réponse à ce message.
Source(s)
Documentation détaillée des DPE sur le site de l’ADEME
Marc Grossouvre, Didier Rullière, Jonathan Villot. Enhancing buildings’ energy efficiency prediction through advanced data fusion and fuzzy classification. Energy and Buildings, 2024, 313, pp.114243.
Marc Grossouvre, Didier Rullière, Jonathan Villot. Predicting missing Energy Performance Certificates: Spatial interpolation of mixture distributions. Energy and IA, 2024, 16, pp.100339.
Regarder sur Youtube le webinaire consacré aux DPE
Foire aux questions
Généralités
Quelle différence entre DPE réel et DPE prédit ?
Réponse, en bref
L’indicateur « DPE réel » est issue de la base de données des DPE (Diagnostics de Performance Energétique) de l’ADEME. Il s’agit du DPE réellement établi à ce jour sur le bâtiment. Cela concerne uniquement les DPE établis selon la méthode en vigueur depuis 2021. Les DPE établis avant cette date ne sont plus pris en compte car difficilement comparables à ceux établis depuis la réforme. Nous réfléchissons néanmoins à explorer les anciens DPE afin de récupérer d’autres informations lesquelles peuvent permettre de compléter la connaissance du bâti.
L’attribut « DPE prédit », disponible dans la version augmentée, est calculé par apprentissage machine, il s’agit ici d’un modèle mathématique prédictif qui apprend des données du bâtiment et des données DPE des bâtiments aux caractéristiques similaires. Cette prédiction est réalisée à partir de ce que nous connaissons du bâtiment : son degré de fiabilité est donc directement lié à la quantité et la qualité de données disponibles du ou des logements de l’adresse concernée, et de la complétude des données sur le territoire. La qualité varie donc fortement d’un bâtiment à l’autre et d’un territoire à l’autre. A noter que cet indicateur est purement informatif et n’a pas de caractère officiel (il ne peut pas être utilisé lors d’une transaction, vente ou location).
A noter que nous travaillons à l’amélioration continue de ces méthodes prédictives, notamment à travers un programme de R&D avec le soutien du Ministère de la Recherche et de l’Innovation, et de Mines St-Etienne
Qu'est ce que le DPE de référence ?
Réponse, en bref Pour chaque adresse, nous faisons le choix d’un DPE de référence lorsqu’il en existe au moins un. Il s’agit soit du DPE logement le plus récent ou s’il existe du DPE de la copropriété. Dans la version ONB+ il est possible d’avoir accès à toute la liste des DPE réalisés depuis 2021.
Ce choix peut avoir un impact sur les autres indicateurs issus des DPE. Par exemple, pour les déperditions thermiques il est possible qu’elles apparaissent comme nulles dans le cas ou le DPE de référence est celui d’un logement situé au centre de l’immeuble (i.e. non en toiture ou en rez-de-chaussée). Dans cet exemple il n’y a pas de déchange thermique entre des zones chauffées dans le cadre du calcul du DPE.
Les DPE sont-ils uniquement prédit sur les bâtiments d'habitation ou également sur les bâtiments tertiaires ?
Réponse, en bref
Pour le moment, nous réalisons uniquement des prédictions pour les DPE logements. Les DPE tertiaires ne sont donc pas produits à ce stade.
Nos prédictions se basent sur les données existantes. Il est également important de noter que, pour le tertiaire, la base des DPE disponibles est significativement plus réduite que celle du résidentiel, ce qui peut limiter les possibilités de modélisation dans ce domaine.
Pour en savoir + : IMOPE tertiaire, base de données du parc bâti tertiaire
Dans le tableau de bord adresse, comment savoir si un DPE est réel ou prédit ?
Réponse, en bref
Cela est clairement notifié via un bandeau ou la mention « DPE réel » ou « DPE prédit ». À défaut vous pouvez cliquer sur les petits (i). Les métadonnées précisent alors la source et la méthode d’acquisition de l’attribut.
Dans les autres fonctionnalités (cartographie, tableau de bord territoire et outil de ciblage et de prospection), deux attributs existent : DPE de référence - officiel pour les DPE réels et « DPE de référence - enrichi » pour les DPE réels et simulés.
Pour aller plus loin
Concernant les DPE réels, avons nous accès au DPE Collectif des copropriétés ?
Réponse, en bref
Oui, les DPE collectifs (DPE au bâtiment) sont bien en base. Si ce dernier est disponible il constitue alors le DPE de référence pour l’adresse considérée. Cela est indiqué directement dans l’interface du tableau de bord adresse.
Si aucun DPE bâtiment n’est présent le DPE de référence sera sélectionné parmi la liste des DPE au logement pour cette adresse : nous prenons alors le plus récent. Notons que via l’ONB+ vous disposez de l’historique des DPE à l’adresse et ce depuis l’application du nouvel arrête en 2021.
Traitement des DPE réels
Quels sont les limites des DPE réels ?
Réponse, en bref
La base des DPE de l’ADEME nécessite un travail de nettoyage, correction et géolocalisation des DPE notamment via l’adresse renseignée. Ce nettoyage fait, le DPE peut être croisé avec toutes les autres données de la base IMOPE. C’est ici la plus-value du travail réalisé par U.R.B.S et mis à disposition dans l’ONB.
L’interprétation de ces données doit être faite avec précaution. En effet, le DPE est obligatoire seulement pour une vente, une location ou à l’achèvement de toute nouvelle construction. Ainsi, tous les biens ne sont pas dotés d’un DPE. A ce titre, la base de données DPE ne couvre pas l’ensemble du parc immobilier et elle n’en est pas représentative.
Dans la base des DPE, comment traitez vous les DPE manifestement faux pour entrainer vos modèles?
Réponse, en bref
Tous les DPE ne sont pas sélectionnés pour alimenter le modèle. Notamment, les outliers sont écartés afin de limiter les biais dans les prédictions.
Cela dit, la notion de « manifestement faux » mériterait d’être discutée pour élaborer une méthode consensuelle et rigoureuse de détection. Il convient également de rappeler que les DPE sont opposables et, dès qu’ils sont remontés à l’ADEME, ils deviennent la valeur officielle de référence.
Pour les DPE « Faux » on voit bien des erreurs dans les données remontées (des sommes qui ne se font pas, des incohérences si on relance les calculs en sens inverse avec les mêmes paramètres d’entrées en respectant la méthode 3CL etc.)
Réponse, en bref
En effet, l’analyse de certains DPE peut révéler des incohérences. Le développement de modèles d’analyse spécifiques permettrait de détecter la « qualité » des DPE, ce qui serait bénéfique pour nos modèles. Cela permettrait notamment de sélectionner les DPE les plus qualitatifs, améliorant ainsi la fiabilité des prédictions.
Quelle est la fréquence de mise à jour des DPE réels ?
Réponse, en bref
Notre base de données DPE était jusqu’à présent mise à jour une fois par an au printemps. Elle intégrait donc les DPE extrait en début d’année (courant janvier ou février selon les millésimes).
Dès 2026, nous passerons à une fréquence de mise à jour trimestrielle, afin de vous proposer des informations toujours plus actuelles.
A noter que ces durées s’expliquent par les traitements approfondis que nous appliquons aux données brutes de l’ADEME (fournisseur des DPE). En effet, leur qualité initiale nécessite des corrections et des enrichissements, notamment pour garantir une localisation précise des diagnostics.
Méthodologie de prédiction des DPE
Où pouvons nous trouver quelques détail sur la méthode d’IA utilisé ? notamment sur la précision des modèles ?
Réponse, en bref
Les algorithmes d’IA développés par U.R.B.S ont fait l’objet de publications scientifiques dans des articles « rankés » et de ce fait ont bénéficié d’une relecture/validation par les pairs. Tous les éléments sont disponibles dans ces articles.
Voici quelques références :
Projet de recherche avec l’École des Mines de Saint-Étienne / thèse de Marc Grossouvre
Article : Enhancing buildings’ energy efficiency prediction through advanced data fusion and fuzzy classification
Article : Predicting missing Energy Performance Certificates: Spatial interpolation of mixture distributions
Notons la pertinence de votre question, car sur les sujets IA, si la communication est omniprésente chez nos confères, les garanties scientifiques sont souvent édulcorées voire inventées : peu de transparence sur les éléments méthodologiques, peu d’informations sont mises à disposition publiquement par les acteurs producteurs de données prédites.
L’appariement à l’adresse des DPE est aussi lié à l’identifiant BAN directement disponible dans les fichiers XML envoyés à l’ADEME. Ces données ne sont pas exploitables ?
Réponse, en bref
En effet. Toutefois, à notre connaissance, les adresses des DPE dans la base ADEME ne font pas l’objet d’un nettoyage préalable. Cela peut donc impacter la qualité du lien avec la BAN.
C’est pourquoi nous n’utilisons pas directement le lien fourni par la BAN. Nous restructurons les adresses et régénérons un lien avec la BAN après un processus de standardisation et de redressement. Ce lien peut donc différer du lien initial.
Nos études comparatives montrent néanmoins une nette amélioration de la qualité et de la fiabilité des appariements grâce à notre processus en amont.
Dans votre méthode prédictive, vous n’avez pas accès à la consommation des logements qui permettrait d’être au plus juste? En effet, si un logement proche a fait l’objet d’un DPE récent avec une bonne valeur de DPE alors que le logement d’à côté est à l’abandon, on va l’estimer à bonne car le plus proche voisin est bon.
Réponse, en bref
Les données de consommations réelles ne sont malheureusement pas accessibles pour tous les bâtiments en France. Dans le secteur résidentiel, par exemple, il est nécessaire de disposer d’au moins 9 Points de Livraison (PDL) pour obtenir des données réelles de consommation. Par conséquent, seules les structures de logement collectif peuvent bénéficier d’un apprentissage basé sur ces données.
Par ailleurs, le concept de « plus proche voisin » dans le modèle ne repose pas uniquement sur une proximité géographique. Par exemple, si un bien est abandonné, il sera probablement classé comme vacant et/ou associé à un mauvais indice d’insalubrité. Le modèle est conçu pour détecter ces différences et ajuster les prédictions en conséquence.
Comment les rénovations énergétiques sont elles prises en compte ?
Réponse, en bref
À ce jour, il n’existe pas de base de données publiques recensant la réalisation de rénovations pour un logement, ni le détail de ces rénovations.
L’accès à ce type de données serait particulièrement pertinent, notamment pour améliorer l’efficacité et la précision de notre modèle prédictif.
Est ce que l’épaisseur des murs est prise en compte maintenant entre un murs de 10cm et un murs de 60 - 80 cm ?
Réponse, en bref
L’épaisseur des murs n’est pas une donnée disponible à grande échelle. Cependant, deux bâtiments qui présentent des similitudes importantes selon les variables mentionnées peuvent être considérés comme proches sur le plan structurel.
Fiabilité des DPE réels et des prédictions
Quelle est la fiabilité des DPE réels ?
Réponse, en bref
Concernant les DPE réels et contrairement à d’autres sources telles que les données du CEREMA (notamment les fichiers fonciers), il n’existe pas de fiabilité native.
Cependant, chez URBS, nous attribuons un haut niveau de fiabilité (+++) aux données issues des DPE. Cela s’explique par plusieurs raisons :
- Les DPE sont réalisés par des diagnostiqueurs certifiés,
- Ils sont (en principe) fondés sur des visites de terrain avec relevés,
- Ils sont opposables juridiquement,
- Ils sont regroupés par l’ADEME,
- Et ils sont utilisés au niveau national par différents ministères à des fins statistiques.
Ainsi, en tant que données officielles caractérisant la performance énergétique d’un bâtiment, leur opposabilité leur confère une valeur probante, tant pour l’acheteur que pour le vendeur. C’est pourquoi nous ne remettons pas en cause leur fiabilité en tant que donnée officielle faisant fois.
Par ailleurs, une étude menée en novembre 2024 par l’entreprise KRNO révèle que moins de 3 % des DPE présentent des irrégularités. Cela signifie que 97 % des diagnostics peuvent être considérés comme fiables.
Quelle est la fiabilité des DPE reconstruits ?
Réponse, en bref
La prédiction des DPE manquants issue de méthodes brevetées et validées par :
- un travail de R&D sur le sujet depuis 2017
- les paires scientifiques, via la publication d’articles de recherche
- le terrain et le déploiement en contexte opérationnel (amélioration continue des modèles en apprenant des données locales/terrain)
Les niveaux de fiabilité varient légèrement selon les territoires, puisque nos modèles s’adaptent aux spécificités régionales. Nous retrouvons en moyenne les résultats suivants :
- 78% de fiabilité (+/- 1 étiquette)
- 93% de fiabilité (+/- 2 étiquettes)
Dans votre modèle DPE IA, vous donnez toujours une note quelque soit votre taux de confiance, ou bien avez vous une catégorie « non prédis »? Donnez vous le taux de confiance pour une prédiction donnée?
Réponse, en bref
Le modèle prédit une probabilité d’appartenance à chacune des étiquettes (A à G). L’étiquette ayant la probabilité la plus élevée est considérée comme la plus représentative de l’adresse étudiée.
Pour chaque prédiction, nous fournissons également ce degré d’appartenance, permettant une meilleure compréhension de la précision et de la fiabilité des résultats.
Positionnement des données d’URBS par rapport à la concurrence
Comment les données DPE générées par l’IA se positionnent-elles par rapport aux autres offres commerciales qui émergent sur ce sujet ? Quels sont les avantages des données U.R.B.S par rapport aux concurrents ?
Réponse, en bref
Les confrères ne rendent pas toujours disponibles leurs résultats (ou ne le font que sur des périmètres très ciblés, ce qui fausse l’analyse à échelle nationale).
Récemment nous avons pu réaliser une comparaison entre les données produites par U.R.B.S et celles produites par le CSTB. Nos méthodologies sont assez différentes : le CSTB se base selon nos informations sur une méthode de prédiction physique simplifié tandis que nous nous basons sur une méthode géostatistique.
Nous avons pu réaliser une comparaison à l’échelle nationale entre les prédictions réalisées par le CSTB et celles réalisées par URBS. Notez que les données publiées par le CSTB sont sous forme de pourcentage ce qui rend cette comparaison peu précise. À l’échelle France, la distribution que nous obtenons chez URBS nous semble plus réaliste tant dans les DPE prédit que dans ceux observés en particulier sur les classes extrêmes (A et B et dans une moindre mesure F et G).
Une suggestion ? Une question ? Nous sommes preneurs ! N’hésitez pas à partager vos remarques et à enrichir cette fiche descriptive avec vos questions en réponse à ce message.





