Prix de vente et écarts aux prix du marché (DVF)

:bulb: En résumé :
Les indicateurs de la thématique « valeur foncière » permettre de caractériser les adresses selon leur prix de vente (réel ou estimé) et selon le nombre de transaction ayant été réalisées. Les données sont issues de la base DVF ou reconstruire par URBS grâce à des algorithmes prédictifs.

Méthodologie

Traitement de la base DVF par URBS

Les prix de vente et plus généralement toutes les informations sur les transactions proviennent des données DVF publiées par Etalab. Elles sont elles même construites à partir de la BNDP, des données MAJIC et de la base FIDJI. Les données DVF sont disponibles en opendata mais nécessitent de nombreux traitements pour être exploitables.

La base DVF est un inventaire des mutations à titre onéreux : vente, échange, expropriation ou adjudications. Dans notre nous nous intéressons plus particulièrement aux données de date de mutation, de prix net vendeur, de surface réelle bâtie et de surface de terrain et au type de bien vendu. L’intérêt est de pouvoir identifier au sein de cet inventaire les ventes de logements qu’il s’agisse de maisons ou d’appartements.

À noter que la remontée des données des mutations dans DVF est très lente. Des mutation s’étant déroulé une année n-1 peuvent pas avoir été remontées une année n mais pourrons l’être dans les millésimes suivants. Seules les ventes s’étant déroulées depuis 2014 sont présentes dans cette base et aucune vente n’est remontée pour les départements du Bas-Rhin, du Haut-Rhin et de la Moselle.

Les prix issus de la base DVF correspondent aux prix net vendeur (TVA incluse). Ces valeurs n’incluent pas les frais de notaires, d’agences ou prix des meubles. Par conséquent, les prix ensuite reportés dans la base IMOPE ne correspondent pas à la valeur vénale d’un bien.

Les données DVF sont complexes. Par exemple (voir ci-dessous), une même mutation peut être décrite sur 36 lignes différentes du tableau. DVF, c’est 35 millions de lignes pour 14 millions de mutations distinctes (millésime 2025). Nous opérons donc un retraitement de cette base afin d’identifier un maximum de ventes de logements et ce dans pour plusieurs finalités :

  • Identifier les mutations intéressantes à présenter pour chaque adresse d’habitation du territoire
  • Alimenter nos modèles de prédiction pour les adresses qui n’auraient pas de données réelles
  • Calculer les prix du marché

Afin de constituer une base de données cohérente nous avons établit plusieurs critères permettant d’identifier les monoventes homogènes de logements d’habitation. Nous excluons de cette manière les ventes extrêmes pour lesquelles les prix au m² ne sont pas représentatifs.

Critère Valeur
Nombre de dépendances max 5
Surface réelle bâtie min 10m²
Surface réelle bâtie max 350m²
Surface max ni sols ni jardins 5 000m²
Surface terrain max 10 000m²

Actualisation des prix et écarts aux prix du marché

Afin d’actualiser les prix et également réaliser les prédiction des valeurs manquantes, nous calculons les prix du marché. Un marché immobilier est une notion complexe et pouvant être définie de multiples façons. Chez URBS, nous retenons plusieurs critères pour définir un marché :

  • Critère géographique : commune, EPCI, département
  • Caractéristiques du bien : maison/appartement ; neuf/ancien
  • Critère de l’offre : zone ABC (A, Abis, B1, B2, C) qui caractérise l’équilibre ou le déséquilibre entre l’offre et la demande, aussi appelées zones de tension immobilière.
  • Critère chronologique : année de mutation

Pour chaque année de mutation on définit un ensemble de marchés selon la nomenclature suivante :

Collectivité Marché Type de bien Âge du bien Nombre de marchés par an
Commune maison/appartement neuf/ancien 4
EPCI zone ABC maison/appartement neuf/ancien 20
Département zone ABC maison/appartement neuf/ancien 20
Département zone ABC neuf/ancien 12
Département zone ABC 5

Dans certains cas on fusionne des marchés pour tenir compte des biens rares. À titre d’exemple sur le département 42, on définit environ 1500 marchés par an.

On définit ensuite le prix du marché à l’année n-k associé à une adresse comme le prix médian du plus petit marché dans lequel se situe le bien comprenant plus de 25 observations et qui est actif à l’année n.

De cette manière nous actualisons ensuite les prix antérieurs en fonction de la dynamique du marché entre l’année de la vente et l’année n.

Prédiction des prix

Dans les cas où aucune vente n’est disponible à une adresse, le prix de vente est calculé par un algorithme de prédiction développé par URBS se basant sur les données DVF réelles. Cette opération est nécessaire car seulement 16% des adresses (pour 26% des logements) ont une valeur foncière historique au sein de la base DVF (millésime 2025). En effet, ce sont souvent les mêmes logements qui sont vendus et donc qui sont référencés dans la base DVF.

Nous utilisons la même notion de marché et de prix actualisés que précédemment pour réaliser les prédictions. Nous excluons néanmoins les ventes se trouvant dans les 1% les plus chères ou les moins chères de chaque marché.

À partir de ces prix actualisés, on a un ensemble d’observation pour chaque région. En mobilisant le reste de la base IMOPE, nous apprenons de ces observations afin de prédire les prix de ventes pour toutes les adresses n’en possédant pas.

Nous apprenons des caractéristiques géographiques (latitude, longitude, altitude, zone ABC, zone QPV, périmètre de monument historique …), des caractéristiques techniques (nombre de logements, nombre de niveaux, surface moyenne, âge du logement, DPE, …) et des caractéristiques socio-économiques (niveau de confort, nombre de logements sociaux, revenu moyen du carreau, prix du marché à l’année n…).

La prédiction se fait à partir d’un modèle statistique créé pour chaque région en sélectionnant les variables les plus pertinentes pour chaque région (via l’algorithme VSURF, Variable Selection Using Random Forest) couplé avec l’algorithme Ranger (variante de Random Forest).

Pour chaque région, l’apprentissage est réalisé sur 20 000 adresses et la validation sur 50 000 adresses. On produit pour chaque adresse une estimation du prix médian au m², un prix minimal et un prix maximal (respectivement 1er et 9ème déciles).

Les erreurs moyennes constatées dans notre modèle sont autour de 10%. Cette erreur est dans les mêmes ordre de grandeur que les aléas constatés sur les prix. Les sources de ces aléas sont multiples : marge de négociation (entre 0 et 20% du prix avec une moyenne de 8%), variation saisonnières (3% en moyenne) ou des évènement historiques (COVID par exemple). Il y a une incertitude irréductible sur les prix de vente, laquelle se retrouve dans les erreurs moyennes constatées.

Variable(s)

À l’adresse (table adresse)

:black_medium_small_square: prix
Définition : Prix de vente moyen des logements d’habitation de l’adresse issue des données réelles
Taux de complétude : 16.82% des adresses avec logement d’habitation
Catégorie : Valeur foncière Disponibilité : :onbplus: Sous licence
Unité : €/m² Fiabilité : +++
Millésime : 2025 Source : U.R.B.S
:black_medium_small_square: prixurbs
Définition : Prix de vente moyen des logements d’habitation de l’adresse issue des données réelles, sinon de données prédites
Taux de complétude : 96% des adresses avec logement d’habitation
Catégorie : Valeur foncière Disponibilité : :onbplus: Sous licence
Unité : €/m² Fiabilité : +
Millésime : 2025 Source : U.R.B.S
:black_medium_small_square: prixmax
Définition : Valeur maximale de prix de vente constatée à l’adresse
Taux de complétude : 82.9% des adresses avec logement d’habitation
Catégorie : Valeur foncière Disponibilité : :onbplus: Sous licence
Unité : €/m² Fiabilité : +
Millésime : 2025 Source : U.R.B.S
:black_medium_small_square: prixmin
Définition : Valeur minimale de prix de vente constatée à l’adresse
Taux de complétude : 82.9% des adresses avec logement d’habitation
Catégorie : Valeur foncière Disponibilité : :onbplus: Sous licence
Unité : €/m² Fiabilité : +
Millésime : 2025 Source : U.R.B.S
:black_medium_small_square: diffprixpct
Définition : Ecart au prix du marché de la valeur du prix de vente immobilière
Taux de complétude : 95.99% des adresses avec logement d’habitation
Catégorie : Valeur foncière Disponibilité : :onbplus: Sous licence
Unité : % Fiabilité : +++
Millésime : 2025 Source : U.R.B.S
:black_medium_small_square: turn2a_pct
Définition : Part de logements ayant été vendus au moins une fois sur les deux dernières années à l’adresse
Taux de complétude : 22.53% des adresses avec logement d’habitation
Catégorie : Valeur foncière Disponibilité : :onbplus: Sous licence
Unité : % Fiabilité : +
Millésime : 2014 à 2024 Source : ETALAB
:black_medium_small_square: turn5a_pct
Définition : Part de logements ayant été vendus au moins une fois sur les cinq dernières années à l’adresse
Taux de complétude : 22.53% des adresses avec logement d’habitation
Catégorie : Valeur foncière Disponibilité : :onbplus: Sous licence
Unité : % Fiabilité : +
Millésime : 2014 à 2024 Source : ETALAB
:black_medium_small_square: turn10a_pct
Définition : Part de logements ayant été vendus au moins une fois sur les dix dernières années à l’adresse
Taux de complétude : 22.53% des adresses avec logement d’habitation
Catégorie : Valeur foncière Disponibilité : :onbplus: Sous licence
Unité : % Fiabilité : +
Millésime : 2014 à 2024 Source : ETALAB

Dernière mise à jour des métadonnées : 2025-10-21 15:33:50

À la parcelle (table bati)

:black_medium_small_square: prix
Définition : Prix de vente moyen des logements d’habitation issue des données réelles
Taux de complétude : 15.99% des parcelles avec logement d’habitation
Catégorie : Valeur foncière Disponibilité : :onbplus: Sous licence
Unité : NA Fiabilité : NA
Millésime : 2025 Source : U.R.B.S
:black_medium_small_square: prixurbs
Définition : Prix de vente moyen des logements d’habitation de la parcelle issue des données réelles, sinon de données prédites
Taux de complétude : 94.95% des parcelles avec logement d’habitation
Catégorie : Valeur foncière Disponibilité : :onbplus: Sous licence
Unité : NA Fiabilité : NA
Millésime : 2025 Source : U.R.B.S
:black_medium_small_square: prixmax
Définition : NA
Taux de complétude : 82.67% des parcelles avec logement d’habitation
Catégorie : Valeur foncière Disponibilité : :onbplus: Sous licence
Unité : NA Fiabilité : +
Millésime : 2025 Source : U.R.B.S
:black_medium_small_square: prixmin
Définition : NA
Taux de complétude : 82.67% des parcelles avec logement d’habitation
Catégorie : Valeur foncière Disponibilité : :onbplus: Sous licence
Unité : NA Fiabilité : +
Millésime : 2025 Source : U.R.B.S
:black_medium_small_square: diffprixpct
Définition : Ecart au prix du marché de la valeur du prix de vente immobilière
Taux de complétude : 94.95% des parcelles avec logement d’habitation
Catégorie : Valeur foncière Disponibilité : :onbplus: Sous licence
Unité : NA Fiabilité : NA
Millésime : 2025 Source : U.R.B.S
:black_medium_small_square: turn2a_pct
Définition : Part de logements ayant été vendus au moins une fois sur les deux dernières années à la parcelle
Taux de complétude : 22.66% des parcelles avec logement d’habitation
Catégorie : Valeur foncière Disponibilité : :onbplus: Sous licence
Unité : NA Fiabilité : +
Millésime : 2014 à 2024 Source : ETALAB
:black_medium_small_square: turn5a_pct
Définition : Part de logements ayant été vendus au moins une fois sur les cinq dernières années à la parcelle
Taux de complétude : 22.66% des parcelles avec logement d’habitation
Catégorie : Valeur foncière Disponibilité : :onbplus: Sous licence
Unité : NA Fiabilité : +
Millésime : 2014 à 2024 Source : ETALAB
:black_medium_small_square: turn10a_pct
Définition : Part de logements ayant été vendus au moins une fois sur les dix dernières années à la parcelle
Taux de complétude : 22.66% des parcelles avec logement d’habitation
Catégorie : Valeur foncière Disponibilité : :onbplus: Sous licence
Unité : NA Fiabilité : +
Millésime : 2014 à 2024 Source : ETALAB

Dernière mise à jour des métadonnées : 2025-10-21 15:33:50

Disponibilité dans les outils

Les attributs en lien avec la valeur foncière sont des attributs sous licence. Ils sont disponibles dans l’ONB dans tous les outils : cartographie, tableaux de bord et outil de ciblage et de prospection.

Cas d’usage

Les prix de vente peuvent être mobilisés dans différents cas et notamment pour repérer les logements en mauvais état ou potentiellement indignes en ciblant les prix inférieurs à ceux du marché :

:grey_exclamation: Votre contribution est la bienvenue pour compléter cette section ! N’hésitez pas à partager vos cas d’usage en réponse à ce message.

Source(s)

:arrow_down: Téléchargement de la base DVF
:page_facing_up: Documentation de la base DVF
:bookmark_tabs: Boris Mericskay et Florent Demoraes (2022), « Préparer et analyser les données de « Demandes de valeurs foncières » en open data : proposition d’une méthodologie reproductible », Cybergeo: European Journal of Geography. DOI : https://doi.org/10.4000/cybergeo.39583
:film_strip: Webinaire consacré aux valeurs foncières

Foire aux questions

La valeur immobilière dépend de nombreux paramètres, et notamment du marché de l'immobilier (attractivité du territoire, augmentation des taux d'intérêt, disponibilité foncière, etc.). Votre modèle de prédiction est-il en capacité d'intégrer ces indicateurs ? Au même titre que pour les DPE, avez-vous pu calculer un pourcentage de fiabilité ?

:gear: Réponse, en bref
Le modèle actuel est un algorithme prédictif apprenant de la valeur immobilière des logements de même typologies et dans un environnement proche. Nous mettons également à disposition un indicateur d’écart du prix au marché.

:heavy_plus_sign: Pour aller plus loin
:link: Fiche descriptive de l’attribut « valeur foncière »
:open_book: Documentation du DVF

Quelle antériorité sur les transactions immobilières ?

:gear: Réponse, en bref
Seules les transactions immobilières depuis 2014 sont affichées dans le tableau de bord adresse.

Est il possible d’imaginer qu’un jour vous aurez accès au valeurs locatives réelles?

:gear: Réponse, en bref
Si ces données sont un jour produites et libérées, oui. Notons que ces données sont accessibles à la maille communale et pourrait, dans l’attente de données plus fine (adresse), être intégrée au sein de l’ONB+. N’hésitez pas à nous indiquer via ce forum votre intérêt pour ce type de données.

Les conditions d’utilisation de DVF empêchent l’identification des personnes via cette source. Comment contournez vous cette limite pour permettre à ONB+ d’en faire un outil de prospection ?

:gear: Réponse, en bref
Les données sont anonymisées pour respecter le cadre législatif qui encadre la protection des données.

Ni ces données ni l’ONB+ ne fournissent d’informations nominatives (noms des vendeurs ou des acheteurs) et ce afin de respecter la vie privée des individus, la protection des données et ce comme l’impose l’article R112 A-3 du Livre des procédures fiscales.

Vous pouvez donc les utiliser en l’état à travers l’ONB+ pour de la prospection de bâtiment dont les transactions immobilières sont connues (ou actualisées / prédites par nos soins). Cependant seule l’adresse vous sera transmise et non l’identité des individus.

:grey_exclamation: Une suggestion ? Une question ? Nous sommes preneurs ! N’hésitez pas à partager vos remarques et à enrichir cette fiche descriptive avec vos questions en réponse à ce message.