DealMonitor Logo
Back to Blog
Comment l'IA detecte les prix sur n'importe quel site

Comment l'IA detecte les prix sur n'importe quel site

·by DealMonitor Team·6 min de lecture
aitechnology

Le defi de la detection de prix sur le web

Internet regorge de sites marchands, et chacun affiche ses prix a sa maniere. Certains utilisent de grandes polices colorees, d'autres integrent le prix dans un tableau comparatif, et certains le cachent presque derriere des options de configuration. Pour un etre humain, identifier le prix d'un produit est generalement intuitif. Pour une machine, c'est un probleme d'une complexite redoutable.

Les methodes traditionnelles d'extraction de prix reposent sur des regles codees en dur pour chaque site : chercher tel element HTML, a tel endroit de la page, avec telle balise. Cette approche fonctionne tant que le site ne change pas sa structure, ce qui arrive regulierement. A chaque modification, les regles deviennent obsoletes et le systeme cesse de fonctionner.

C'est la que l'intelligence artificielle entre en jeu.

L'approche traditionnelle et ses limites

Le scraping base sur des regles

Le web scraping classique consiste a ecrire des selecteurs CSS ou XPath specifiques a chaque site. Par exemple, on peut dire au programme : sur Amazon, le prix se trouve dans l'element avec la classe a-price-whole.

Cette methode presente plusieurs problemes majeurs :

  • Il faut ecrire et maintenir des regles pour chaque site individuellement
  • Un simple redesign du site casse toutes les regles existantes
  • Les sites qui utilisent du rendu JavaScript complexe sont difficiles a traiter
  • Les prix dynamiques (qui changent selon les options choisies) echappent souvent aux selecteurs statiques
  • L'echelle est limitee : impossible de couvrir des milliers de sites differents

Les expressions regulieres

Une autre approche consiste a chercher des motifs de prix dans le texte de la page (par exemple, tout ce qui ressemble a un nombre suivi d'un symbole de devise). Mais une page web contient generalement des dizaines de nombres qui ressemblent a des prix : frais de port, prix barres, prix d'accessoires, numeros de reference contenant des virgules. Distinguer le vrai prix du produit parmi tous ces candidats est un defi que les expressions regulieres seules ne peuvent pas relever.

L'intelligence artificielle au service de la detection de prix

DealMonitor utilise une approche radicalement differente, basee sur le machine learning. Au lieu de programmer des regles pour chaque site, nous avons entraine un modele capable d'apprendre a reconnaitre les prix par lui-meme.

L'extraction des candidats

La premiere etape consiste a analyser la page web et a identifier tous les elements qui pourraient etre un prix. Le systeme examine le code HTML et repere chaque nombre accompagne d'un indicateur de devise. A ce stade, il peut trouver des dizaines de candidats sur une seule page.

L'analyse des caracteristiques

Pour chaque candidat, le modele calcule un ensemble de caracteristiques (features en anglais) qui decrivent le contexte dans lequel ce nombre apparait :

  • Position sur la page : le prix principal est generalement dans le premier tiers de la page, pres de l'image du produit
  • Taille et mise en forme : le prix est souvent affiche en plus grand que le texte environnant
  • Contexte semantique : les mots autour du prix (panier, ajouter, total, a partir de) donnent des indices precieux
  • Structure HTML : certaines balises et attributs sont typiquement associes aux prix
  • Relations avec d'autres elements : la proximite avec un bouton d'achat ou une image de produit est un signal fort

La prediction par le modele

Le modele de machine learning a ete entraine sur des milliers de pages web annotees manuellement. Il a appris a combiner toutes ces caracteristiques pour attribuer un score de probabilite a chaque candidat. Le candidat avec le score le plus eleve est selectionne comme le prix du produit.

Cette approche est fondamentalement differente des regles codees en dur. Le modele ne cherche pas un element precis a un endroit precis : il comprend ce qui fait qu'un nombre sur une page web est probablement le prix du produit principal.

Les avantages de la detection par IA

Universalite

Le principal avantage est l'universalite. Le modele fonctionne sur pratiquement n'importe quel site e-commerce, y compris ceux qu'il n'a jamais vus auparavant. Tant que la page affiche un prix de maniere visuellement identifiable par un humain, le modele a de bonnes chances de le trouver.

Resilience aux changements

Quand un site modifie son design, les caracteristiques fondamentales du prix (sa taille, sa position, son contexte) restent generalement similaires. Le modele continue donc a fonctionner meme apres un redesign, la ou un systeme base sur des regles echouerait immediatement.

Gestion des cas complexes

L'IA gere naturellement les situations ambigues que les approches traditionnelles traitent mal :

  • Prix barres a cote de prix promotionnels : le modele apprend a preferer le prix effectif
  • Plusieurs variantes de produit : il identifie le prix correspondant a la configuration par defaut
  • Prix affiches en differentes devises : il detecte la devise pertinente selon le contexte geographique

Les limites actuelles et les solutions

Aucun systeme n'est parfait. La detection par IA rencontre encore des difficultes dans certains cas :

  • Les sites qui masquent completement le prix tant qu'on n'a pas selectionne des options obligatoires
  • Les pages avec de tres nombreux produits (catalogues) ou aucun prix ne se distingue clairement
  • Les sites qui affichent le prix uniquement via JavaScript apres une interaction utilisateur

Pour pallier ces limites, DealMonitor combine la detection IA avec un navigateur headless capable de simuler un vrai utilisateur. Le navigateur charge la page completement, execute le JavaScript, et presente au modele une page dans son etat final, telle qu'un visiteur la verrait.

L'impact concret pour le suivi de prix

Grace a cette technologie, vous pouvez suivre les prix de produits sur des centaines de sites differents sans vous soucier de la compatibilite. Ajoutez n'importe quelle URL de produit et le systeme se charge du reste. Combinez cela avec nos strategies d'alertes de prix pour maximiser vos economies.

Pret a essayer ? Creez votre compte et testez la detection de prix sur vos produits favoris. L'IA travaille pour vous, 24 heures sur 24.

Ready to Never Miss a Deal Again?

Start tracking prices in seconds. No credit card required.

Start for Free

Related Posts

Comment l'IA detecte les prix sur n'importe quel site