Camille lance son activité de conseil et veut contacter les PME industrielles de sa région. Elle tape « liste entreprises France » dans son moteur de recherche et tombe sur des dizaines d'offres : annuaires gratuits, fichiers payants à plusieurs centaines d'euros, registres officiels aux noms obscurs (Sirene, RNE, BODACC). Avant de dépenser le moindre euro, elle se pose la bonne question : qu'est-ce qu'une base de données d'entreprises, au juste, et d'où viennent réellement ces données ?
C'est une question plus structurante qu'elle n'en a l'air. Comprendre ce qu'est une base d'entreprises, quelles sont ses sources officielles, ce qui relève de l'open data et ce qui relève de la donnée personnelle vous évite à la fois de payer pour de l'information publique et de vous mettre en faute avec le RGPD. Ce guide pose les définitions, cartographie les sources françaises et explique comment constituer une liste fiable et à jour.
Définition : qu'est-ce qu'une base de données d'entreprises ?
Une base de données d'entreprises est un ensemble structuré d'informations décrivant des personnes morales et leurs établissements : raison sociale, numéro d'identification (SIREN, SIRET), adresse, secteur d'activité, forme juridique, dirigeants, et parfois coordonnées de contact. Chaque entreprise y constitue un enregistrement, interrogeable par filtres (zone géographique, code d'activité, taille).
Concrètement, une base d'entreprises répond à des questions du type « quelles sociétés exercent telle activité, dans telle commune, sous telle forme juridique ? ». On distingue deux grandes familles : les registres administratifs officiels, qui recensent l'existence légale des entreprises (et que l'État met à disposition gratuitement), et les fichiers de prospection commerciale, qui ajoutent des données de contact pour démarcher. Les premiers sont une source ; les seconds en sont une exploitation. Cette distinction est la clé pour ne pas confondre une base de données d'entreprises avec un simple « fichier acheté ».
Une base d'entreprises se mesure aussi à sa fraîcheur. Des sociétés se créent, déménagent ou cessent leur activité chaque jour. Une base figée à un instant T se périme vite ; une base reliée à une source mise à jour quotidiennement reste fiable. C'est pourquoi la question « d'où viennent les données ? » prime toujours sur « combien de lignes y a-t-il ? ».
D'où viennent les données ? Les quatre sources officielles françaises
En France, l'immense majorité des données d'entreprises provient de quatre sources publiques officielles, toutes accessibles gratuitement en open data : la base Sirene de l'INSEE, le Registre national des entreprises (RNE) de l'INPI, le portail data.gouv.fr, et le BODACC. Ce sont les sources « primaires » dont dérivent la plupart des annuaires que vous croisez sur le web — y compris ceux qu'on vous fait payer.
La base Sirene, gérée par l'INSEE, est le socle. Elle donne accès aux données concernant près de 25 millions d'entreprises et 36 millions d'établissements enregistrés depuis 1973, mises à jour quotidiennement et diffusées gratuitement (INSEE, 2026). On y trouve l'identité de l'entreprise, son code d'activité (APE), son adresse normalisée et sa tranche d'effectifs. Elle est diffusée en open data depuis janvier 2017 (INSEE, 2026), en téléchargement complet ou via API.
Le Registre national des entreprises (RNE), opéré par l'INPI, complète Sirene sur le volet juridique. Obligatoire depuis le 1er janvier 2023, il remplace le RNCS, le répertoire des métiers et le registre des actifs agricoles, et diffuse gratuitement les données publiques au format JSON (INPI, 2026) : forme juridique, capital, dirigeants, comptes annuels. Le BODACC (Bulletin officiel des annonces civiles et commerciales) publie quant à lui les événements de vie des sociétés (créations, modifications, procédures collectives) ; ses données sont réutilisables gratuitement sous licence ouverte. Enfin, data.gouv.fr est la plateforme qui centralise les données publiques de l'État, dont celles des entreprises — plus de 70 000 jeux de données y sont référencés.
L'Annuaire des Entreprises : la porte d'entrée publique gratuite
Si vous voulez vérifier une entreprise précise sans télécharger un fichier de plusieurs gigaoctets, l'outil officiel est l'Annuaire des Entreprises. C'est un moteur de recherche public et gratuit, développé par l'État, qui consolide en un seul endroit les données légales issues de Sirene, du RNE et d'autres registres.
Opéré par la Direction interministérielle du numérique (DINUM), l'Annuaire des Entreprises (data.gouv.fr, 2026) permet de retrouver les informations légales d'une société à partir de son nom, de son SIREN/SIRET, du nom d'un dirigeant ou d'une zone géographique. Vous y lisez la forme juridique, la date de clôture des comptes, l'adresse et l'état (active ou cessée).
C'est l'outil idéal pour qualifier une ligne déjà collectée — confirmer qu'une entreprise existe toujours, vérifier son secteur ou son dirigeant. En revanche, comme tous les registres publics, il ne fournit ni email ni téléphone de prospection : ces données ne figurent pas dans les fichiers administratifs. C'est précisément là que se situe la frontière entre la donnée publique et la donnée à construire soi-même.
Open data vs bases payantes : que paie-t-on réellement ?
L'open data fournit gratuitement la donnée légale et administrative ; les bases payantes (annuaires commerciaux, fichiers de prospection) facturent surtout le travail d'agrégation, d'enrichissement et de mise à jour par-dessus ces sources publiques. Autrement dit, vous ne payez presque jamais la donnée brute : vous payez de ne pas avoir eu à aller la chercher vous-même.
Un vendeur de fichiers part le plus souvent de Sirene et du RNE, puis y ajoute des emails, des téléphones, des effectifs précis ou des « signaux business ». Cette valeur ajoutée a un coût et un intérêt réels — à condition de savoir ce que vous achetez et de ne pas payer une seconde fois une donnée que l'État diffuse librement.
| Critère | Sources open data (Sirene, RNE, BODACC) | Bases / fichiers payants |
|---|---|---|
| Coût | Gratuit | Payant (souvent au volume ou à l'abonnement) |
| Identité légale (SIREN, forme, dirigeants) | Oui | Oui (repris de l'open data) |
| Email / téléphone de prospection | Non | Variable, à vérifier |
| Fraîcheur | Mise à jour quotidienne à la source | Dépend du fournisseur, parfois figée |
| Travail restant pour vous | Enrichissement et qualification à faire | Variable selon l'offre |
Le piège classique des bases payantes « toutes faites » est le vieillissement : un fichier acheté est une photo à un instant donné, alors que le tissu d'entreprises bouge en permanence. Avant de comparer des offres, il est utile de comprendre ce qu'est l'enrichissement de données — le procédé qui transforme une liste brute issue des registres en fichier exploitable. Pour situer les acteurs, des comparatifs détaillés comme OutSend vs Societeinfo ou OutSend vs Manageo montrent où se joue réellement la différence de prix.
Données d'entreprise vs données personnelles : le cadre RGPD
La donnée d'une entreprise (raison sociale, SIREN, adresse du siège, secteur) est une donnée professionnelle, librement réutilisable. En revanche, dès qu'une information permet d'identifier une personne physique — le nom d'un dirigeant, son email nominatif, son numéro direct — elle devient une donnée personnelle soumise au RGPD, même dans un contexte purement professionnel.
Pour la prospection B2B, la CNIL ne réclame pas de consentement préalable : la sollicitation peut reposer sur l'intérêt légitime, à condition que son objet soit en rapport avec la profession de la personne contactée. La CNIL précise (CNIL, 2026) que la personne doit avoir été informée de l'usage possible de ses coordonnées à des fins de prospection et pouvoir s'y opposer facilement et gratuitement, à chaque message.
En pratique, cela signifie trois réflexes : cibler des contacts cohérents avec votre offre, indiquer clairement votre identité et un moyen simple de se désinscrire, et respecter immédiatement toute opposition. Pour structurer un fichier propre dès le départ, nos guides sur l'enrichissement automatique SIRET/SIREN/TVA/RCS et sur les données légales pour qualifier une liste détaillent comment garder la traçabilité de vos sources, élément central de la conformité.
Comment constituer votre propre liste à jour
La méthode la plus fiable consiste à partir d'un ciblage précis (un métier et une zone), à récupérer les entreprises correspondantes, puis à enrichir et qualifier chaque ligne. C'est ce qui distingue une liste vivante, construite à la demande, d'une base figée achetée une fois pour toutes et qui se périme.
Plusieurs chemins existent. Vous pouvez télécharger les fichiers Sirene et les croiser vous-même avec le RNE — solution robuste mais technique. Vous pouvez interroger l'Annuaire des Entreprises ou des API publiques pour des recherches ponctuelles. Ou vous pouvez utiliser un outil qui construit la liste pour vous à partir d'une requête métier + zone, puis enchaîne automatiquement la recherche d'emails, la vérification de délivrabilité et l'ajout des données légales.
C'est l'approche d'OutSend : plutôt que de revendre une base mondiale figée, l'outil bâtit votre liste à la demande sur la zone que vous visez, à partir de sources publiques, puis enchaîne l'enrichissement et la qualification dans une seule chaîne. Vous obtenez un fichier frais, traçable et adapté à votre cible, sans empiler quatre abonnements. Pour aller plus loin selon votre besoin, voyez comment constituer une liste de 500 entreprises ciblées ou explorez le pipeline de prospection no-code qui chaîne ces étapes.
FAQ — base de données d'entreprises et sources open data
Où trouver une base de données d'entreprises gratuite en France ?
Les sources gratuites officielles sont la base Sirene de l'INSEE, le Registre national des entreprises de l'INPI, le BODACC et le portail data.gouv.fr, qui référence plus de 70 000 jeux de données publics. Pour une recherche simple, l'Annuaire des Entreprises est le point d'entrée le plus accessible.
Quelle est la différence entre Sirene et le RNE ?
La base Sirene (INSEE) est le répertoire statistique qui identifie les entreprises et établissements via leurs numéros SIREN/SIRET, leur activité et leur adresse. Le RNE (INPI) ajoute la dimension juridique : forme sociale, capital, dirigeants, comptes annuels. Les deux sont complémentaires et gratuits en open data.
Les données d'entreprises sont-elles soumises au RGPD ?
La donnée de l'entreprise elle-même (raison sociale, SIREN, adresse du siège) n'est pas une donnée personnelle. En revanche, le nom d'un dirigeant, un email nominatif ou un numéro direct identifient une personne physique et relèvent du RGPD, même en contexte professionnel.
Peut-on faire de la prospection B2B sans consentement ?
Oui. La CNIL admet la prospection B2B par email sur la base de l'intérêt légitime, sans consentement préalable, à condition que l'objet soit lié à la profession du destinataire, que celui-ci ait été informé et qu'il puisse s'opposer facilement et gratuitement à chaque sollicitation.
Pourquoi payer un fichier d'entreprises si les données sont publiques ?
Parce que les bases payantes ne facturent généralement pas la donnée brute (publique), mais le travail d'agrégation, d'enrichissement (emails, téléphones) et de mise à jour par-dessus les sources officielles. L'intérêt dépend de la fraîcheur et de la qualité réelle de cet enrichissement.
Comment garder une base d'entreprises à jour ?
En la reliant à une source mise à jour fréquemment plutôt qu'en achetant un fichier figé. La base Sirene est rafraîchie quotidiennement. Reconstruire ou réenrichir votre liste régulièrement, par zone et par métier, évite le vieillissement inévitable d'un fichier acheté une seule fois.
Tester OutSend gratuitement
Construisez votre propre liste d'entreprises à la demande, par métier et par zone, à partir de sources publiques — puis enrichissez emails, données légales et coordonnées dans une seule chaîne. OutSend est en alpha gratuite sur candidature, FR-native et pensée pour les solos, freelances et PME.
Demander un accès alpha gratuit