Tu valides une idée de produit, tu lances une activité de freelance, ou tu veux contacter en direct des partenaires potentiels. Dans tous ces cas, tu as besoin d'une liste structurée d'entreprises : nom officiel, adresse, secteur, taille, et idéalement un contact direct. Le problème, c'est qu'à peine tu commences à chercher, tu te retrouves devant une page Pages Jaunes Pro qui te demande 33 € par mois minimum avec engagement annuel, ou un Kompass qui ne communique même pas ses tarifs en clair.
Pourtant, la France est l'un des pays au monde où les données d'entreprises sont les plus ouvertes. Le répertoire Sirene de l'INSEE est gratuit, public, et contient les informations administratives d'environ 30 millions d'établissements. Avec un peu de méthode, tu peux construire une liste de 500 entreprises ciblées en une heure, sans abonnement.
La base : Sirene de l'INSEE, gratuite et exhaustive
Le répertoire Sirene est un fichier public mis à disposition par l'INSEE depuis 1973. Il contient pour chaque entreprise française le numéro SIREN, le nom officiel, l'adresse, le code NAF (qui définit l'activité principale), l'effectif déclaré, la date de création. Il est téléchargeable librement sur data.gouv.fr, mis à jour quotidiennement.
Pour les volumes raisonnables (jusqu'à quelques milliers de lignes), tu n'as même pas besoin de télécharger le fichier complet. Plusieurs outils web permettent de filtrer Sirene en ligne : Pappers, societe.com, l'API Entreprise officielle. Tous gratuits sur les usages personnels et les volumes limités.
Ce que Sirene ne contient pas : les emails, les sites web, les téléphones (sauf parfois pour quelques cas particuliers). Pour ces données, tu vas croiser avec d'autres sources publiques.
Filtrer par secteur précis avec les codes NAF
Le code NAF est la clé pour cibler précisément. "Coiffeurs", c'est NAF 96.02A. "Plombiers", c'est 43.22A. "Cabinets d'avocats", c'est 69.10Z. La liste complète des 732 codes NAF est publiée par l'INSEE.
L'avantage : tu peux croiser deux ou trois codes NAF pour obtenir une liste très ciblée. "Boulangeries-pâtisseries en Île-de-France" = NAF 10.71B + département 75/77/78/91/92/93/94/95. Résultat : quelques milliers d'établissements, dédupliqués, avec adresse exacte.
L'inconvénient : pour les activités peu codifiées (par exemple, "agences de marketing digital" qui peuvent être en 73.11Z mais aussi en 70.22Z ou 62.02A selon comment elles se sont déclarées), tu loupes une partie de la cible. Solution : croiser plusieurs codes ou compléter avec d'autres sources.
Compléter avec Google Maps pour les contacts et sites web
Sirene te donne l'adresse postale. Google Maps te donne en plus le téléphone, le site web, parfois l'email, les horaires, les avis clients, le nombre d'avis. Pour une démarche de lead generation ciblée, ces données complémentaires changent tout.
Trois méthodes pour récupérer ces infos.
La première, manuelle, consiste à chercher chaque entreprise une à une sur Google Maps et copier-coller les infos. À 30 secondes par fiche, 500 entreprises = 4 heures. Faisable mais pénible.
La deuxième utilise une extension Chrome de scraping Google Maps gratuite. Elles sont nombreuses, fonctionnent par ouverture batch des résultats, et sortent un CSV. Inconvénient : qualité variable, beaucoup font du tracking pas net, et la plupart ont des limites de 50-100 entrées par session gratuite.
La troisième passe par un outil dédié de scraping Google Maps. Plusieurs options en France : Scrap.io (49 €/mois, 7 jours d'essai), Smappen (~30 €/mois), ou des outils tout-en-un en candidature alpha qui regroupent extraction + enrichissement + vérification dans un seul flux.
Croiser et nettoyer : l'étape qui sépare une liste utile d'une liste poubelle
Quand tu agrèges Sirene + Google Maps + une troisième source, tu te retrouves vite avec des doublons (la même boulangerie listée trois fois sous des noms légèrement différents), des fermetures non mises à jour (entreprise radiée), et des données contradictoires (deux téléphones différents pour le même SIRET).
Le nettoyage prend autant de temps que l'extraction si tu le fais à la main. Trois règles pour aller vite.
Première règle : déduplique sur le SIREN, pas sur le nom. Deux noms peuvent désigner la même entité. Le SIREN est unique.
Deuxième règle : élimine les entreprises radiées. Sirene marque les radiations, mais Google Maps les laisse souvent en ligne. Croiser avec la date de radiation Sirene évite de contacter une boîte fermée.
Troisième règle : vérifie au moins l'effectif. Une "agence de communication" déclarée à 0 salarié, c'est un indépendant, pas une agence — pertinent pour certaines démarches, à exclure pour d'autres.
Les sources qu'on ignore mais qui changent tout
Au-delà de Sirene et Google Maps, trois sources moins connues sont précieuses selon ton ciblage.
L'INPI (Institut national de la propriété industrielle) publie les marques déposées. Si tu cherches "toutes les boîtes qui ont déposé une marque dans la cosmétique en 2025", c'est là.
Le Bulletin officiel des annonces civiles et commerciales (BODACC) liste les créations, modifications, dépôts de bilan. Utile pour cibler les entreprises récemment créées (souvent en recherche de premiers fournisseurs ou prestataires).
Pôle Emploi/France Travail publie les offres d'emploi en open data. Une boîte qui recrute activement est en croissance — signal exploitable pour des démarches commerciales ou des candidatures spontanées ciblées.
L'arbitrage : combien de temps ça vaut vraiment
Pour 500 entreprises ciblées avec nom, adresse, téléphone et site web, en méthode 100 % manuelle (Sirene + Google Maps un par un + nettoyage), compte 6 à 10 heures.
Avec un outil de scraping Google Maps payant (Scrap.io ou équivalent), compte 1 à 2 heures pour 500 lignes, mais ajoute 49 €/mois d'abonnement.
Avec un outil tout-en-un en candidature alpha qui regroupe extraction Sirene + Google Maps + vérification d'emails + dédoublonnage, compte 30 minutes à une heure, sans abonnement (juste candidater à l'accès alpha). C'est exactement ce que outsend propose en alpha.
Tester outsend gratuitement
Tout-en-un. Beaucoup moins cher que tous les concurrents. Accès alpha sur candidature.
Demander un accès alpha gratuitFAQ — Construire une liste d'entreprises ciblées
Où trouver une liste gratuite des entreprises françaises ?
Le répertoire Sirene de l'INSEE, accessible librement sur data.gouv.fr, contient le nom, l'adresse, le code NAF et l'effectif des établissements français. Téléchargement libre, mises à jour quotidiennes. Pour des volumes raisonnables, des interfaces web comme Pappers ou societe.com permettent de filtrer en ligne sans télécharger le fichier.
Comment exporter une liste depuis Sirene ?
Trois options : télécharger le stock complet en CSV depuis data.gouv.fr (plusieurs Go, à ouvrir avec un outil capable de traiter de gros fichiers), passer par l'API Entreprise officielle (gratuite, limitée à quelques milliers de requêtes par jour), ou utiliser une interface comme Pappers qui permet d'exporter des sous-ensembles filtrés en CSV.
Quelle est la différence entre Sirene, Pages Jaunes Pro et Kompass ?
Sirene est gratuit, public, exhaustif, mais ne contient que les données administratives (pas de site web, pas d'email, pas d'avis). Pages Jaunes Pro ajoute les sites web, téléphones et catégories métiers, contre 33 à 78 € HT/mois avec engagement. Kompass propose une base internationale enrichie avec données financières, sur devis (tarifs estimés autour de 1 490 €/an minimum). Pour 95 % des cas d'usage en France, Sirene + un complément suffisent.
Combien d'entreprises peut-on extraire de Google Maps gratuitement ?
Sans outil, en cherchant manuellement, tu peux récupérer ce que tu veux mais le rythme est lent. Avec une extension Chrome gratuite, tu plafonnes généralement à 50-100 entrées par session. Au-delà, Google bloque ton IP. Les outils dédiés (Scrap.io, Outscraper, ou des solutions tout-en-un en alpha) gèrent la rotation IP et permettent des volumes de plusieurs milliers.
Le scraping de Google Maps est-il légal ?
Oui, dans le cadre du scraping de données publiques. Selon la CNIL, la collecte de données publiquement accessibles est licite si la finalité est légitime, si la personne peut s'opposer (opt-out), et si les conditions d'utilisation du site ne l'interdisent pas explicitement. Pour Google Maps, la situation est nuancée : les Conditions d'utilisation interdisent l'extraction automatisée, mais la jurisprudence européenne reconnaît la primauté du droit à l'information sur des restrictions contractuelles unilatérales.
Combien de temps pour construire une liste de 500 entreprises ciblées ?
En méthode 100 % manuelle (Sirene web + Google Maps un par un), compte 6 à 10 heures pour 500 fiches enrichies. Avec un outil de scraping dédié, 1 à 2 heures plus le temps de nettoyage. Avec un outil tout-en-un qui gère extraction et dédoublonnage, 30 minutes à 1 heure.