Retour au blog
NetFisc5 min de lecture

Le CFVR — Ciblage de la Fraude et Valorisation des Requêtes

Présentation complète du CFVR, l'outil d'intelligence artificielle central de la DGFiP pour le contrôle fiscal : fonctionnement, bases de données exploitées et impact opérationnel.

Le CVFR (parfois orthographié CFVR dans certains documents officiels) est le Ciblage de la Fraude et Valorisation des Requêtes, l’outil d’intelligence artificielle central de la DGFiP pour le contrôle fiscal. Voici une présentation complète et structurée.

1. Définition et origine

Depuis 2013, la DGFiP a développé le projet « Ciblage de la Fraude et Valorisation des Requêtes » (CFVR), qui vise à automatiser un raisonnement de fraude fiscale. Ce projet d’envergure, développé dès 2014, a pour ambition d’améliorer l’efficacité des opérations de contrôle fiscal et s’inscrit dans le cadre de la modernisation des travaux d’analyse de données et de ciblage. Sur le plan budgétaire, le projet CFVR, estimé à 34,5 millions d’euros au total, a abouti en 2023. Il avait bénéficié en 2017 d’un financement par le Fonds de Transformation de l’Action Publique (FTAP) de 5 millions d’euros.

2. Fonctionnement technique : le datamining

Le mode de fonctionnement du CFVR résulte d’un programme se basant sur des équations mathématiques de probabilité. Analysant les données issues de plusieurs traitements mis en œuvre par la DGFiP, ce dispositif utilise une technique dite de « datamining » consistant en une fouille approfondie des données s’appuyant sur des méthodes exploratoires basées sur des algorithmes, notamment statistiques, de nature à permettre de modéliser des comportements frauduleux. Le CFVR explore les informations de 11 bases de données, comme Sirius-Pro, le logiciel de contrôle fiscal de la DGFiP, ou le Bulletin officiel des annonces civiles et commerciales (BODACC), permettant d’identifier de façon automatique des cas de fraudes fiscales possibles. Le datamining s’appuie également sur les applications patrimoniales, professionnelles et personnelles de la DGFiP, notamment les fichiers FICOBA (comptes bancaires), FICOVIE (contrats de capitalisation et d’assurance-vie), le référentiel PERS des personnes physiques et morales, ADONIS le compte fiscal des particuliers, ou la base nationale des données patrimoniales (BNDP). L’ensemble de ces données sont réunies dans un entrepôt unique (data lake).

3. Organisation administrative

C’est un bureau de l’administration centrale de la DGFiP (bureau de la programmation et de l’analyse de données) qui est mobilisé à travers une équipe pluridisciplinaire — fiscalistes, statisticiens, data-scientists — qui prend en charge ces travaux informatiques complexes. Cette équipe s’appuie sur des pôles de programmation mis en place au niveau interrégional dans les directions interrégionales de contrôle fiscal (DIRCOFI). Sur le plan organisationnel, la Mission Requêtes et Valorisation (MRV) a été créée en 2014 pour mettre en œuvre ces travaux de ciblage. Elle a été remplacée en octobre 2020 par le bureau SJCF-1D, au sein du service de la sécurité juridique et du contrôle fiscal (SJCF).

4. Périmètre des données exploitées : extension aux particuliers et aux réseaux sociaux

Si les entreprises et leurs dirigeants constituaient les premières cibles du CFVR, le dispositif s’est étendu aux particuliers. À titre expérimental, la loi a autorisé l’administration fiscale, à des fins de recherche d’infractions limitativement énumérées, à collecter et à exploiter les contenus librement accessibles et manifestement rendus publics par les utilisateurs sur les plateformes et les réseaux sociaux (article 154 de la loi n° 2019-1479 du 28 décembre 2019 de finances pour 2020).

5. Impact opérationnel : un contrôle fiscal sur deux issu du datamining

D’après le rapport de la DGFiP paru en mai 2022, les productions issues du projet de datamining CFVR représentaient, fin décembre 2021, plus de 44 % de la programmation du contrôle fiscal, avec un objectif de 50 % en 2022. En 2019, ce sont près de 100 000 dossiers qui ont été envoyés dans les services pour examen : 60 000 concernaient les particuliers, 40 000 les entreprises. Par ailleurs, une centaine de modèles statistiques ou de requêtes correspondant à autant de risques fiscaux ont été construits et permettent de détecter des entreprises et des particuliers dont la situation fiscale pose question, qu’il s’agisse de fraudes graves, d’incohérences ou d’erreurs.

6. Encadrement juridique : la CNIL comme garde-fou

Le CFVR est encadré par des arrêtés successifs soumis à l’avis de la Commission nationale de l’informatique et des libertés (CNIL). Les principaux textes sont les suivants :

  • Arrêté du 21 février 2014 portant création du traitement CFVR (avis CNIL n° 2014-045 du 30 janvier 2014) ;
  • Délibération CNIL n° 2015-186 du 25 juin 2015 portant avis sur la modification de l’arrêté de 2014 ;
  • Délibération CNIL n° 2017-226 du 20 juillet 2017 autorisant l’extension du dispositif aux particuliers ;
  • Délibération CNIL n° 2023-150 du 14 décembre 2023 portant avis sur un nouveau projet d’arrêté modificatif. La CNIL a notamment précisé que le traitement CFVR fait appel, d’une part, à l’agrégation de plusieurs bases de données internes à la DGFiP, comme FICOBA et FICOVIE, et externes, telles que certaines données des URSSAF. La CNIL considère que les modifications envisagées dans le projet d’arrêté de 2023 sont légitimes, tout en rappelant la nécessité de respecter les principes de protection des données « par conception » et « par défaut ».

7. Portée limitée : un outil d’aide à la décision, non de substitution à l’agent

Il convient de souligner que, le traitement CFVR ne constitue qu’un outil d’aide et d’orientation des travaux des agents. Chaque résultat est examiné puis exploité par un agent. Ce traitement n’a pas pour but de remplacer l’analyse des agents, mais vise un meilleur ciblage du contrôle des particuliers et des professionnels qui pourraient se trouver en situation de manquement ou de fraude.

En synthèse, le CFVR est l’outil algorithmique central par lequel la DGFiP transforme structurellement sa politique de programmation des contrôles fiscaux. Pour vos clients faisant l’objet d’un contrôle, la connaissance de ce dispositif est stratégiquement utile : l’origine algorithmique du ciblage ne dispense pas l’administration de respecter l’ensemble des garanties procédurales (Charte du contribuable, droits de la défense), et la décision finale demeure toujours celle d’un agent humain responsable.​​​​​​​​​​​​​​​​