Vous avez une liste d'entreprises. Le nom, l'adresse, parfois le site web, parfois le téléphone — tout ce qu'un scraping d'établissements remonte naturellement. Et puis vient le moment d'en faire quelque chose de sérieux : établir une facture, dédoublonner deux lignes qui désignent peut-être la même société, vérifier qu'une enseigne existe juridiquement avant de l'engager. Là, la colonne qui manque devient bloquante. Sans SIRET, votre comptabilité refuse la facture. Sans SIREN, votre outil de dédoublonnage compare des chaînes de caractères approximatives. Une liste de noms n'est pas une base d'entreprises : c'est un annuaire, et un annuaire ne se facture pas.
Le raccrochage manuel est connu de toute équipe qui a manipulé un fichier d'établissements : copier le nom, le coller dans l'annuaire des entreprises, retrouver le bon établissement, recopier le SIRET, ligne après ligne. Pour 80 fiches, c'est une demi-journée. Pour 800, personne ne le fait — la base reste inexploitable, ou se fait enrichir au coup par coup.
Module legal_ids — enrichissement identifiants légaux
Nom + adresse + site → SIRET / SIREN → RCS → clé TVA
Une liste d'établissements scrapée, sans identifiant légal, ressort avec une colonne SIRET, une colonne SIREN et leur source vérifiable. Validation par l'algorithme de Luhn pour écarter les faux positifs.
La feature legal_ids d'outsend.xyz, en alpha gratuite, automatise précisément ce raccrochage. Voici ce que sont ces identifiants, comment le module les retrouve, et comment dériver la clé TVA intracommunautaire à partir du SIREN avec la formule administrative officielle.
Une liste de noms ne se facture pas : le vrai problème
Quatre opérations courantes butent toutes sur le même mur. Facturer : une facture conforme exige le SIRET de l'établissement (et le numéro de TVA intracommunautaire dès qu'il y a échange intra-UE). Dédoublonner : « Boulangerie Martin » et « SARL Martin » sont deux libellés, un seul SIREN — sans l'identifiant, le dédoublonnage se fait à la louche. Qualifier : vérifier qu'une enseigne correspond bien à une entité immatriculée, et non à un site fantôme, suppose de tenir son SIREN. Préparer un mandat ou un contrat : les coordonnées légales (forme juridique, RCS, SIRET du siège) y sont obligatoires.
Le point commun : ces opérations ont besoin d'un identifiant stable, pas d'un nom. Le nom change d'orthographe, l'adresse a trois variantes, le site web tombe en panne. Le SIREN, lui, est unique et permanent. Coller cet identifiant sur chaque ligne, c'est transformer un fichier décoratif en base de travail.
SIRET, SIREN, RCS, TVA : à quoi sert chaque identifiant
Les quatre identifiants ne sont pas interchangeables. Chacun répond à un usage précis, et confondre l'établissement avec l'entreprise est l'erreur classique qui fait rebondir une facture.
Le SIREN est le numéro unique d'identification d'une entreprise, composé de 9 chiffres, attribué par l'INSEE à l'immatriculation (impots.gouv.fr — les numéros d'identification). Une entreprise a un seul SIREN, à vie.
Le SIRET identifie un établissement précis de cette entreprise. Il fait 14 chiffres : les 9 du SIREN, suivis d'un NIC (numéro interne de classement) de 5 chiffres propre à chaque lieu (Annuaire des Entreprises, data.gouv.fr). Une société qui a trois boutiques a un SIREN et trois SIRET. C'est le SIRET qui figure sur une facture, car il localise l'établissement concerné.
Le RCS (Registre du commerce et des sociétés) est la mention d'immatriculation au greffe, typiquement écrite « RCS Lyon 404 833 048 » — le numéro qui suit la ville est le SIREN. C'est une mention légale obligatoire sur les documents commerciaux d'une société commerciale.
Le numéro de TVA intracommunautaire est dérivé du SIREN. En France, sa structure est FR + une clé informatique à 2 chiffres + les 9 chiffres du SIREN (economie.gouv.fr). Il est exigé dès qu'il y a une opération commerciale entre assujettis de pays différents de l'UE.
| Identifiant | Format | Désigne | Usage principal |
|---|---|---|---|
| SIREN | 9 chiffres | l'entreprise (l'unité légale) | dédoublonner, vérifier l'existence juridique, calculer la TVA |
| SIRET | 14 chiffres (SIREN + NIC) | un établissement précis | facturer, localiser le bon site, gérer les multi-établissements |
| RCS | « RCS Ville + SIREN » | l'immatriculation au greffe | mentions légales, contrats, mandats |
| TVA intra. | FR + clé 2 chiffres + SIREN | l'assujetti à la TVA | facturation intra-UE, déclarations |
Toutes ces données sont publiques. La base de référence est la base Sirene de l'INSEE, diffusée en open data sous Licence Ouverte 2.0, et labellisée « données de forte valeur ».
Comment le module legal_ids enrichit une liste automatiquement
Le principe : vous fournissez une liste d'établissements (nom, adresse, site web — typiquement la sortie d'un scraping Google Maps exporté en CSV), et le module remonte les identifiants légaux ligne par ligne. La source primaire exploitée est le site web de chaque entreprise lui-même, parce qu'en France, le SIRET y est presque toujours présent : la loi impose les mentions légales, et c'est là que le numéro est inscrit.
Concrètement, pour chaque ligne disposant d'un site web, le module visite dans l'ordre les pages les plus susceptibles de contenir l'information — /mentions-legales, /legal, /mentions, /cgv, puis la page d'accueil — et s'arrête dès qu'un SIRET valide est trouvé. Il repère les suites de 14 chiffres (SIRET) et de 9 chiffres (SIREN), même séparées par des espaces ou des points, et donne plus de poids à un numéro situé près d'un mot-clé comme « SIRET », « SIREN » ou « RCS ».
Le garde-fou décisif est la validation par l'algorithme de Luhn. Un numéro de téléphone formaté en trois groupes de chiffres ressemble à un SIREN ; une référence interne aussi. Le SIREN et le SIRET, eux, respectent la clé de contrôle de Luhn. Le module rejette tout numéro qui ne la valide pas — c'est ce qui évite de coller un faux SIRET extrait d'un pavé de texte. Chaque identifiant retenu est accompagné de son URL source (la page exacte où il a été lu), pour que la donnée reste traçable et vérifiable.
En sortie, votre liste repart avec les colonnes siret, siren, siren_valid et legal_id_source_url, exportables en CSV. Le même principe d'enrichissement en lot que la détection de tech stack s'applique : vous donnez une liste, vous récupérez une liste plus riche.
Démo — situation → action → résultat
Situation. Une liste de 80 restaurants scrapés sur une zone : nom, adresse, site web, aucun identifiant légal. Inexploitable pour facturer ou dédoublonner.
Action. La liste passe par le module legal_ids. Pour chaque restaurant disposant d'un site, le module lit les mentions légales, extrait le SIRET, le valide par Luhn et conserve l'URL source.
Résultat. Les lignes dont le site exposait ses mentions légales ressortent avec un SIRET et un SIREN vérifiés. Sur ces lignes, la clé TVA se calcule immédiatement depuis le SIREN (voir plus bas) — prêtes à facturer, à dédoublonner par SIREN, à recouper.
Limite honnête : les fiches sans site web, ou dont le site ne publie pas ses mentions légales, ne ressortent pas enrichies par cette voie. Le matching direct nom + adresse contre la base Sirene est sur la feuille de route pour couvrir ces cas.
Pour les entreprises multi-établissements, le SIRET lu sur le site correspond généralement au siège ou à l'établissement principal mentionné ; le SIREN, lui, est commun à tous les établissements et sert de clé de regroupement fiable dès que vous voulez consolider plusieurs lignes.
L'accès se fait en alpha gratuite, sur candidature : vous décrivez votre cas d'usage et vous commencez à enrichir vos listes. Demander un accès alpha prend une minute.
Calculer la clé TVA intracommunautaire depuis le SIREN
Une fois le SIREN obtenu et validé, le numéro de TVA intracommunautaire français se déduit par calcul — pas besoin d'interroger un service supplémentaire. Sa structure officielle est FR + une clé à 2 chiffres + le SIREN (impots.gouv.fr). Seule la clé est à calculer.
La formule administrative de la clé de contrôle est :
clé = [ 12 + 3 × ( SIREN mod 97 ) ] mod 97
où « SIREN mod 97 » est le reste de la division du SIREN par 97. La clé est toujours sur 2 chiffres (avec un zéro de tête si nécessaire).
Exemple vérifiable avec le SIREN 404 833 048 : 404833048 mod 97 = 56 ; puis (12 + 3 × 56) mod 97 = 180 mod 97 = 83. La clé est donc 83, et le numéro de TVA intracommunautaire est FR 83 404833048.
Cette formule ne fonctionne que pour les SIREN « classiques » (la quasi-totalité des entreprises). Quelques cas particuliers historiques utilisent une clé alphanumérique différente : pour ceux-là, et pour toute facturation engageante, la vérification se fait via le système officiel européen VIES de la Commission européenne, qui confirme la validité d'un numéro de TVA intra-UE.
Quatre cas d'usage concrets
Préparer la facturation. Une équipe qui doit facturer une zone de prospects locaux a besoin du SIRET de chaque établissement. Le module le récupère depuis les mentions légales, et la clé TVA se calcule dans la foulée pour les clients soumis à TVA intra-UE.
Dédoublonner par SIREN. Deux lignes au libellé proche mais à l'orthographe différente ? Une fois le SIREN collé, le dédoublonnage devient exact : même SIREN = même entreprise, point. Plus de comparaison floue de chaînes de caractères.
Vérifier l'existence juridique. Avant d'engager une dépense ou un partenariat, tenir un SIRET valide (validé Luhn, source URL à l'appui) écarte les enseignes sans entité immatriculée derrière. C'est une qualification de base avant tout démarchage ou contrat.
Enrichir une base de contacts existante. Si vous avez déjà un fichier d'entreprises avec leurs sites web, le module ajoute la couche légale par-dessus, sans repartir de zéro — utile en complément d'un enrichissement emails ou d'un nettoyage des URL mortes avant d'attaquer les sites.
Données légales = données publiques ouvertes
Les identifiants traités ici sont des données légales publiques. Le SIRET, le SIREN et le RCS sont des mentions que la loi impose d'afficher publiquement sur un site commercial — les lire revient à consulter une information que l'entreprise est tenue de rendre visible. La base de référence, la base Sirene, est elle-même diffusée en open data par l'INSEE sous Licence Ouverte 2.0.
Une réserve à garder en tête : la base Sirene contient des données personnelles pour les entrepreneurs individuels (le nom de la personne est aussi celui de l'entreprise), et le droit d'opposition à la diffusion existe (statut de « non-diffusion »). L'enrichissement par identifiants légaux d'établissements n'est pas du démarchage en soi — la conformité d'une éventuelle prospection ensuite dépend de vos finalités et reste à votre charge.
Côté limites du module : il enrichit les lignes dont le site web expose effectivement ses mentions légales. Une fiche sans site, ou avec un site qui ne publie pas son SIRET, ne ressort pas par cette voie — c'est précisément ce que le matching nom + adresse contre la base Sirene, sur la feuille de route, viendra compléter. Et le module ne calcule pas à votre place les données société élargies (forme juridique, NAF, effectif, dirigeants) : c'est un autre module d'enrichissement, distinct.
Tester outsend gratuitement
Tout-en-un, FR-natif. Accès alpha gratuit sur candidature.
Demander un accès alpha gratuitFAQ — Enrichir une base avec SIRET, SIREN, TVA et RCS
Quelle est la différence entre SIRET et SIREN ?
Le SIREN (9 chiffres) identifie l'entreprise, une seule fois et à vie. Le SIRET (14 chiffres) identifie un établissement précis : c'est le SIREN suivi d'un NIC de 5 chiffres propre au lieu. Une entreprise a un SIREN unique et autant de SIRET que d'établissements actifs. C'est le SIRET qui figure sur une facture.
Comment retrouver le SIRET d'une entreprise à partir de son nom ?
Le module legal_ids part de la liste que vous fournissez (nom, adresse, site web) et lit le SIRET directement sur le site de l'entreprise, dans ses mentions légales, où il est légalement publié. Le numéro est ensuite validé par l'algorithme de Luhn pour écarter les faux positifs, et l'URL source est conservée pour traçabilité.
Comment calculer le numéro de TVA intracommunautaire ?
En France : FR + une clé à 2 chiffres + le SIREN. La clé se calcule par la formule [12 + 3 × (SIREN mod 97)] mod 97. Pour le SIREN 404833048, la clé est 83, soit FR 83 404833048. Pour toute facturation engageante, la validité se confirme via le service européen VIES.
Le numéro RCS est-il le même que le SIREN ?
Le RCS s'écrit « RCS Ville + numéro » et le numéro qui suit la ville est précisément le SIREN. Le RCS ajoute donc l'information de la ville d'immatriculation au greffe, par-dessus le SIREN. C'est une mention légale obligatoire pour les sociétés commerciales.
Ces données sont-elles légales à collecter et à utiliser ?
Le SIRET, le SIREN et le RCS sont des mentions publiques obligatoires sur les documents et sites commerciaux, et la base Sirene est diffusée par l'INSEE en open data sous Licence Ouverte 2.0. Les lire et les coller sur votre base est légitime. La conformité d'une prospection ultérieure dépend de vos finalités et reste de votre responsabilité, notamment pour les entrepreneurs individuels en non-diffusion.
Que se passe-t-il pour une entreprise avec plusieurs établissements ?
Le SIRET lu sur le site correspond généralement au siège ou à l'établissement principal cité. Le SIREN, lui, est commun à tous les établissements : il sert de clé de regroupement fiable quand vous voulez consolider plusieurs lignes qui appartiennent à la même entreprise.