Mentions légales d'un site web en 2026 : ce qu'il faut vérifier avant de prospecter

Vous voulez démarcher 200 sites e-commerce de Lyon pour leur proposer un service. Vous avez extrait les URLs. Reste à savoir qui est vraiment derrière chaque site : la marque que vous voyez en page d'accueil n'est pas toujours la société qui décide. Une boutique "Lyon Déco" peut en réalité être éditée par une SASU à Paris dirigée par un investisseur qui en gère trente autres. Sans la vraie identité, vous écrivez à personne.

Les mentions légales sont la carte d'identité publique de chaque site web français. Elles sont obligatoires depuis la LCEN (loi pour la confiance dans l'économie numérique, article 6-III) et listent l'éditeur, le directeur de publication, l'hébergeur, le numéro RCS et de TVA pour les entreprises. Les extraire à l'échelle d'une liste de prospects révèle l'organigramme réel derrière les sites visités — info que ni Google ni LinkedIn ne donnent gratuitement.

Ce que vous devez trouver sur chaque site (légalement)

Personne physique : nom, prénom, adresse. Personne morale : dénomination, forme juridique, capital social, adresse du siège, numéro de téléphone, e-mail de contact, RCS + ville d'immatriculation, numéro de TVA intracommunautaire si assujetti, nom du directeur de publication, identité de l'hébergeur avec son adresse.

Pourquoi la mention légale est plus utile que le whois pour la prospection

Un whois donne le propriétaire administratif d'un nom de domaine — mais 95 % des particuliers et 60 % des entreprises masquent ces données via un service de proxy registrar (GoDaddy Privacy, NameCheap WhoisGuard, OVH anonymisation). Les mentions légales, elles, ne se masquent pas légalement : c'est une obligation déclarative qui pèse sur l'éditeur, pas sur le registrar. La société derrière le site doit s'identifier publiquement, sous peine d'un an d'emprisonnement et 75 000 € d'amende pour personnes physiques, 375 000 € pour personnes morales (LCEN article 6-VI).

Pour un commercial qui prospecte 300 e-commerces, les mentions légales donnent en une page : nom officiel de l'entreprise, SIREN, dirigeant légal, contact direct. Trois informations qui changent tout pour la suite : à qui adresser le message, sur quelle base juridique vérifier la solvabilité (extrait Kbis via Pappers ou societe.com), et quel mail utiliser pour la première approche professionnelle.

Les 4 cas typiques de désalignement marque / éditeur

Sur 100 sites de prospection examinés, on trouve toujours ces patterns :

  1. Marque commerciale ≠ raison sociale. Le site "Lyon Déco" est édité par "SARL Aménagement Habitat". Le décideur s'appelle Pierre Martin, dirigeant de la SARL, pas un "service commercial Lyon Déco" inexistant.
  2. Groupe holding qui possède 30 marques. Le site est édité par une SASU dont le dirigeant gère 30 autres SASU. Mail générique sur 30 sites = même décideur. Tu personnalises 30 fois pour rien si tu n'as pas vu le pattern.
  3. Site en franchise ou licence de marque. "Pizzeria Bella Vita - Toulouse" est franchisé indépendant. Le décideur n'est pas le siège de Bella Vita, c'est le franchisé local. Mention légale = le bon contact.
  4. Auto-entrepreneur derrière site corporate. Le site semble "agence digitale" avec équipe et bureau, la mention légale révèle un EI avec adresse résidentielle. Stratégie commerciale et tarification à adapter.

Méthode manuelle : 3 minutes par site

Pour un site donné, le chemin est presque toujours le même :

  • Footer du site → lien "Mentions légales" ou "Mentions" ou "Legal" ou "Informations légales" (parfois "À propos" qui contient la mention)
  • Ouvrir la page, copier dans un éditeur de texte propre
  • Extraire : dénomination, forme juridique, SIREN/SIRET, RCS+ville, capital, adresse, dirigeant, e-mail, téléphone, hébergeur
  • Cross-check le SIREN sur annuaire-entreprises.data.gouv.fr (source primaire INSEE Sirene) pour confirmer existence et activité

3 minutes par site, c'est tenable pour 10 prospects. Inadapté pour 300.

Pourquoi l'extraction automatique est compliquée

Les mentions légales sont obligatoires mais leur format n'est pas normalisé. Chaque site a sa page, son chemin d'accès, sa hiérarchie, son vocabulaire. Quatre obstacles techniques :

Obstacle Difficulté
Trouver l'URL de la page mentions sans liste pré-établie Crawler le site, identifier le lien "mentions" parmi 50 liens du footer
Page mentions cachée dans un PDF Extraire le texte d'un PDF parfois mal structuré
Mentions en images (rare mais existe sur sites anciens) OCR avec qualité variable
Structure libre du contenu "SIREN 123 456 789" peut s'écrire "n° SIREN : 123456789", "RCS Paris B 123 456 789", "siren 123456789 RCS Paris"

Pour 300 sites, l'extraction manuelle coûte 15 heures. L'extraction par regex naïve échoue sur 30 % des cas (PDF, structures atypiques, mots-clés français manqués). La fiabilisation passe par un parseur HTML couplé à un modèle qui reconnaît les patterns français (SIREN, RCS, SAS, SARL, SCI, EURL, SASU, EI, micro-entrepreneur).

Ce que fait le module legal_mentions d'outsend

À partir d'une liste de domaines (CSV, ou liste extraite via le module scraping Google Maps), outsend visite chaque site, identifie automatiquement la page mentions légales, en extrait les champs structurés :

  • Dénomination sociale et nom commercial (si différent)
  • Forme juridique (SARL, SAS, SASU, EURL, SCI, EI, association loi 1901)
  • SIREN / SIRET extrait et validé (l'algorithme de Luhn confirme la cohérence du numéro)
  • RCS et ville d'immatriculation
  • Capital social en euros
  • Adresse complète du siège
  • E-mail de contact (souvent générique contact@, parfois nominatif)
  • Numéro de téléphone
  • Identité du directeur de publication (souvent dirigeant légal)
  • Hébergeur (utile pour qualifier la maturité tech d'un site : OVH/Gandi vs Wix/Shopify)

Export CSV/XLSX ou enrichissement direct d'une liste existante. Le module signale les sites non conformes (mentions absentes ou incomplètes) — donnée commerciale intéressante puisque l'éditeur est techniquement en infraction LCEN, ce qui peut être un angle d'approche pour vendre un service de mise en conformité.

Cas d'usage concrets

Démarchage B2B local — Une agence web qui cible 500 e-commerces de Bourgogne extrait les mentions de chaque site, identifie les 80 sans page mentions complètes (signal de maturité bas, prospect chaud pour service de mise en conformité), et personnalise un mail au dirigeant nommé par son prénom.

Veille concurrentielle — Un prestataire SaaS extrait les mentions de tous les sites qui utilisent un concurrent (détecté via le module tech-stack). Croise par groupe holding : si 10 sites différents sont édités par la même SASU, c'est un compte stratégique à approcher au niveau central, pas filiale par filiale.

Qualification de fichier acheté — Quand vous récupérez un fichier de prospection externe, valider les mentions des sites de chaque entreprise listée révèle les listes anciennes (sites disparus, dirigeants partis, raisons sociales changées). 20-30 % des fichiers vendus sur le marché contiennent des informations périmées de plus de 18 mois.

Conformité RGPD du processus d'extraction

Les mentions légales sont des données publiques par obligation déclarative. Les collecter ne constitue pas un traitement de données personnelles au sens RGPD pour la partie société (raison sociale, SIREN, adresse du siège). En revanche, le nom du dirigeant et l'email de contact sont des données personnelles dès lors qu'ils identifient une personne physique. La CNIL rappelle que la prospection B2B est possible sur base d'intérêt légitime, sous réserve que la personne contactée ait été informée et puisse s'opposer facilement.

Concrètement : vous pouvez collecter et utiliser ces données pour une première approche commerciale ciblée, à condition que votre premier mail mentionne l'origine des données (mentions légales du site) et propose un lien de désinscription simple. La conservation des données doit être limitée à la durée nécessaire à la prospection — la CNIL recommande 3 ans après le dernier contact pour les prospects qui n'ont pas répondu.

FAQ

Les sites WordPress et Shopify ont-ils des mentions légales par défaut ?

Non. WordPress et Shopify proposent des thèmes qui peuvent inclure une page "Legal" mais ne génèrent rien automatiquement. Un site monté en 30 minutes a souvent une page mentions vide ou copiée d'un template. Le module legal_mentions le détecte et le signale.

L'extraction fonctionne-t-elle pour les sites étrangers ?

Le module est calibré sur le cadre légal français (LCEN). Il extrait quand même les champs équivalents sur sites européens (Impressum allemand, Aviso legal espagnol, etc.) mais avec une fiabilité inférieure. Pour la prospection internationale, prévoir une étape de validation manuelle.

Combien coûte cette extraction chez les concurrents ?

Les acteurs spécialisés (sociétés de fichiers B2B) facturent généralement à la donnée enrichie. L'extraction de mentions légales est rarement vendue en self-service — elle est intégrée dans des offres globales d'enrichissement à 0,30-1,50 € par contact qualifié.

Que faire si un site n'a pas de mentions légales ?

C'est une infraction LCEN article 6-VI sanctionnable. Pour la prospection, signaler ces sites comme "non conformes" et les exclure d'un démarchage classique — ou en faire la cible d'un démarchage spécialisé (service de mise en conformité). Pour porter plainte, c'est la DGCCRF qui est compétente.

L'hébergeur peut-il être utile pour la prospection ?

Oui — qualifier la stack technique. Un site hébergé chez OVH ou Gandi suggère une équipe ou freelance tech FR. Un site sur Wix/Squarespace suggère un fondateur non-technique. Un site sur AWS/GCP suggère une équipe tech mature. Le ciblage commercial s'adapte à cette maturité.

Les mentions légales suffisent-elles pour qualifier un prospect ?

Non. Elles donnent l'identité juridique mais pas le besoin. Couplez avec : extraction du texte de la page d'accueil (positionnement marché), détection de la tech stack (besoin technique), avis Google Maps (santé commerciale), tout dispo dans outsend.

Tester outsend gratuitement

Tout-en-un, FR-natif. Accès alpha gratuit sur candidature.

Demander un accès alpha gratuit

outsend.xyz — Plateforme française de scraping et prospection en alpha. Candidature gratuite sur /demander-acces.

Tester outsend gratuitement

Tout-en-un. Beaucoup moins cher que tous les concurrents. Accès alpha sur candidature.

Demander un accès alpha gratuit