Extraction de prix concurrents : automatiser une veille tarifaire sur 500 sites

Vous gérez un e-commerce de pièces auto. Vingt concurrents proposent vos 50 références phares avec des prix qui bougent toutes les semaines. Vendredi soir vous ouvrez vingt onglets Chrome, vous copiez les prix dans un Google Sheet, vous comparez. Lundi matin, trois concurrents ont déjà ajusté. Vous recommencez vendredi. Huit heures par semaine englouties dans une tâche qui pourrait tourner toute seule.

La veille tarifaire automatisée n'est ni illégale ni technique réservée aux grands groupes. Un module qui visite chaque page produit, extrait le prix affiché et le stocke dans une base historique permet de détecter en quelques minutes ce qu'un humain mettrait une demi-journée à constater : qui a baissé, qui a monté, qui a mis en rupture, qui a sorti une promo flash.

~8h
par semaine — veille manuelle 20 concurrents × 50 produits
~12 min
extraction automatisée hebdo
3 jours
délai moyen avant qu'un humain détecte un ajustement concurrent sans veille auto

Pourquoi la veille tarifaire est légale en France

Les prix affichés publiquement sur un site marchand sont des données accessibles sans authentification, mises en ligne par l'éditeur du site à destination de tout visiteur. Les collecter par un automate ne constitue pas une infraction. La DGCCRF (Direction Générale de la Concurrence, de la Consommation et de la Répression des Fraudes) encourage même la transparence tarifaire au profit du consommateur.

Deux limites à respecter :

  • Conditions générales d'utilisation du site cible. Certains CGU interdisent le scraping. Le respect des CGU est une obligation contractuelle, pas légale en soi, mais leur violation peut donner lieu à blocage IP et à des contestations civiles. Le seuil de tolérance dépend du volume et de l'agressivité du crawl.
  • Charge serveur respectueuse. Visiter 500 pages à 10 requêtes/seconde ressemble à une attaque légère. Espacer les requêtes (5-30 secondes entre deux pages d'un même site), respecter le fichier robots.txt, identifier proprement son user-agent — ces bonnes pratiques techniques évitent les blocages.

Pour un usage de veille concurrentielle ciblée sur quelques dizaines à quelques centaines de pages, ces deux contraintes ne posent pas de problème pratique. Pour du scraping massif de marketplaces, la complexité augmente.

Les 4 niveaux de difficulté technique d'une page produit

Toutes les pages produit ne se valent pas. L'extraction de prix se calibre selon la nature du site :

Type de site Difficulté Spécificité
Boutique WordPress / WooCommerce ★ Facile Prix dans des balises HTML stables (classe woocommerce-Price-amount). Extraction directe.
Boutique Shopify ★ Facile Templates standards, JSON-LD Product avec offers.price systématique.
Prestashop / Magento / sites custom ★★ Moyen Structure variable selon la thématique du marchand. Parfois prix en JavaScript chargé après l'HTML initial.
Marketplaces (Amazon, Cdiscount, Leroy Merlin) ★★★ Difficile Anti-bot agressif, JS-heavy, prix dynamiques (variables selon localisation et historique visiteur). Nécessite un navigateur réel et des proxies rotatifs.

Pour une veille B2B classique (concurrents directs sur sites e-commerce ou catalogue), 80 % des cas sont en niveau 1-2. Les marketplaces sont un projet à part entière.

Méthode pour construire sa propre veille

  1. Lister les URLs à surveiller. Une URL par produit par concurrent. Si vous suivez 50 produits chez 20 concurrents = 1000 URLs. Construire cette liste prend une demi-journée si elle n'existe pas.
  2. Identifier le sélecteur CSS du prix sur chaque concurrent. Clic droit sur le prix → Inspecter → repérer la balise et la classe. À faire 20 fois (une fois par concurrent).
  3. Mettre en place le crawl. Cron qui visite chaque URL une fois par semaine (ou plus selon l'enjeu), extrait le prix, le compare au précédent, stocke historique.
  4. Alerter sur variations. Notification mail ou Slack quand un prix bouge de plus de X % ou tombe sous un seuil.
  5. Tableau de bord. Vue mensuelle des courbes de prix par produit, par concurrent, avec moyenne et écart-type.

L'étape 2 (identifier les sélecteurs) est la plus chronophage : 20 concurrents = 20 calibrations distinctes. Une fois faite, l'infrastructure tourne quasi-sans intervention.

Ce que fait le module pricing d'outsend

À partir d'une liste d'URLs produits, le module visite chaque page, extrait le prix affiché, et restitue un tableau structuré. Trois caractéristiques opérationnelles :

  • Détection automatique du prix. Le module reconnaît les formats français (12,90 €, 12.90 EUR, 12€90, 12,90 €/HT, 12.90 € TTC) sur la plupart des CMS marchands standards (Shopify, WooCommerce, Prestashop, Magento, sites custom à structure cohérente).
  • Métadonnées contextuelles. En plus du prix, le module extrait quand disponibles : la mention de promotion (-20 %, soldes), le prix barré comparatif, la disponibilité (en stock / épuisé / sur commande), la date de dernière mise à jour si exposée par le site.
  • Historique conservé. Chaque extraction est datée et stockée. Sur 12 semaines de suivi, on peut tracer la courbe de prix de chaque produit chez chaque concurrent et identifier les patterns (qui ajuste mensuellement, qui fait des promos calendaires, qui ne bouge jamais).

Export CSV/XLSX standard. Pas d'intégration directe avec un ERP en alpha — l'export est le format de référence, à recharger dans votre outil d'analyse (Excel, Google Sheets, Power BI, Metabase).

Cas d'usage qui changent la donne

Repricing dynamique e-commerce. Un marchand auto qui suit 200 références chez 15 concurrents ajuste ses prix tous les jeudis matin sur la base du dernier crawl. Gain estimé typique d'une veille bien menée : 3-7 % de marge récupérée sur les références où le concurrent baisse pour vous "voler" la place dans les comparateurs.

Veille négociation fournisseur. Vous voulez négocier vos achats. Vous extrayez les prix publics chez 30 distributeurs sur 50 références. Vous arrivez en réunion avec un benchmark factuel, pas avec "j'ai entendu dire que".

Détection de promotions concurrentielles. Alerte hebdo sur les concurrents qui démarrent des soldes ou des opérations flash. Réactivité commerciale améliorée — vous ne découvrez plus la promo concurrent par hasard via un client qui vous l'envoie.

Étude de marché pré-lancement. Avant de lancer un produit, mapper les prix réels du marché évite les positionnements à côté. Un fondateur qui vend "20 % moins cher que la concurrence" sans avoir scrappé les prix réels se retrouve souvent à découvrir qu'il est 5 % plus cher que le moins-disant du marché.

Ce que la veille tarifaire ne fait pas

Pour cadrer les attentes : un module d'extraction de prix ne détecte pas les baisses cachées (codes promos, ristournes contractuelles, prix négociés en BtoB qui ne sont pas affichés). Il extrait ce qui est public.

Il ne prédit pas les futurs ajustements concurrents — pour ça, un modèle d'analyse historique avec saisonnalité serait nécessaire (pas inclus dans le module pricing actuel d'outsend, c'est un travail post-export à faire dans son outil d'analyse).

Il ne remplace pas la connaissance terrain d'un commercial qui appelle ses clients pour comprendre pourquoi un concurrent baisse (déstockage, rupture amont, repositionnement stratégique). Le chiffre dit "quoi", l'humain explique "pourquoi".

FAQ

Combien de pages produit peut-on surveiller en alpha outsend ?

Pas de plafond technique imposé en alpha. La limite pratique vient des concurrents qui bloquent les IPs trop agressives — 500-2000 pages par session espacées de quelques secondes passent partout, au-delà il faut des proxies rotatifs et un rythme adapté par site.

Comment gérer un site qui affiche les prix uniquement après connexion ?

Le module pricing d'outsend en alpha n'inclut pas la connexion à des comptes utilisateurs concurrents — c'est une zone juridiquement floue (violation de CGU presque certaine). Pour les prix réservés aux pros connectés, la veille passe par un commercial qui se crée un compte légitimement et exporte manuellement.

Quelle fréquence d'extraction est raisonnable ?

Hebdo suffit pour 90 % des veilles e-commerce classiques. Quotidien pertinent uniquement en période de soldes ou pour produits hyper-volatils (énergie, matières premières, billetterie événementielle).

Le prix affiché TTC ou HT, comment le module les distingue ?

Le module capture le prix affiché tel quel et marque la mention si elle est explicite (TTC / HT / TVA incluse). À l'export, vous filtrez selon vos besoins. Pour la comparaison sites B2B (HT) vs sites B2C (TTC), retraitement nécessaire en aval.

L'extraction fonctionne sur sites étrangers (Amazon.de, Cdiscount.it, etc.) ?

Techniquement oui, mais les marketplaces internationales activent des anti-bot agressifs qui dégradent fortement le taux de succès. Pour de la veille multi-pays, prévoir un setup avec proxies géolocalisés et un rythme très étalé.

Comment outsend gère les pages produits avec variantes (taille, couleur) ?

Le module extrait le prix par défaut affiché à l'arrivée sur la page. Pour les variantes, il faut une URL par variante (souvent une URL distincte chez WooCommerce, query string chez Shopify). Le module n'explore pas automatiquement le sélecteur de variantes — c'est à la liste d'URLs en entrée de les distinguer.

Tester outsend gratuitement

Tout-en-un, FR-natif. Accès alpha gratuit sur candidature.

Demander un accès alpha gratuit

outsend.xyz — Plateforme française de scraping et prospection en alpha. Candidature gratuite sur /demander-acces.

Tester outsend gratuitement

Tout-en-un. Beaucoup moins cher que tous les concurrents. Accès alpha sur candidature.

Demander un accès alpha gratuit