In het kort. Scraping gaat over het automatisch verzamelen van data van websites, vaak via scripts of tools die pagina’s razendsnel doorlopen en de relevante informatie eruit filteren. Scraping bestaat al sinds het begin van het internet en wordt gebruikt voor verschillende doeleinden, zoals SEO-monitoring, prijsvergelijking en marktonderzoek. Ook de meeste AI-modellen worden door een groot stuk getraind op een database van gescrapete publieke webpagina’s.
Terwijl veel bedrijven zelf web scraping gebruiken om concurrenten of marktontwikkelingen in de gaten te houden, proberen anderen – zoals LinkedIn en Meta – hun platformen net te beschermen tegen iedereen die hun (publieke) data probeert te ontfutselen. Prospecting Tools die bedrijfs- en contactgegevens aanbieden, hebben hun uitgebreide datasets grotendeels te danken aan zeer geavanceerde web scraping, waarbij LinkedIn hun belangrijkste doelwit is.
De juridische geschiedenis tussen sociale netwerksites en web scrapers gaat dan ook al even mee. Meta verloor in 2023 een rechtszaak tegen Bright Data – dat publieke Instagrampagina’s scrapet en doorverkoopt – terwijl een rechter in 2022 LinkedIn het voordeel van de twijfel gaf tegenover de web scrapers van HiQ Labs.
Dat de Franse overheid Kaspr een boete opgelegd heeft voor het verbreken van GDPR-regels, toont aan dat prospecting tools het langs verschillende fronten te verduren krijgen. De toenemende druk op deze gewilde databronnen zorgt ervoor dat sommige spelers creatieve manieren zoeken om hun diensten te kunnen blijven aanbieden.
Veel van de populaire prospecting tools die vandaag worden gebruikt, maken op één of andere manier gebruik van gescrapete data. Lusha biedt directe toegang tot e-mailadressen en telefoonnummers, vaak gebaseerd op LinkedIn-profielen. Apollo combineert scraping met enrichment en sequencing, en Clay integreert scraping met AI om data te verrijken, te segmenteren en te activeren in verschillende tools.
Hoewel deze tools niet altijd expliciet toegeven dat ze scrapen, blijft het een grijs gebied. Daarnaast gebruiken ze vaak vage omschrijvingen waardoor de herkomst niet nauw te bepalen is. Lusha stelt bijvoorbeeld data uit drie verschillende bronnen te halen: externe datapartners, publieke websites en hun Community program.
Het ‘community program’ bestaat uit gebruikers die Lusha toestemming geven om hun e-mails te scannen en zo Lusha laat speuren naar nieuwe contactgegevens, in ruil voor gratis of goedkopere toegang tot hun platform. Hoewel niet alle prospecting tools hier even transparant over zijn, zijn dergelijke netwerken ook een belangrijke bron van gegevens voor Apollo en ZoomInfo.
Alle drie claimen ze GDPR-compliant te zijn. Dat houdt onder andere in dat betrokkenen expliciet geïnformeerd moeten worden dat hun gegevens verkocht worden – iets waarvoor Kaspr in 2024 nog op de vingers werd getikt.
Nu de regels rond data privacy wereldwijd strikter en robuuster worden, lijkt het speelveld voor prospecting tools en web scrapers steeds kleiner te worden. Of toch niet?
Dat data het nieuwe goud is, klopt vandaag meer dan ooit. Dankzij de opmars van AI evolueren prospecting tools van passieve databases naar intelligente systemen. AI wordt niet alleen gebruikt om websites efficiënter te scrapen, maar ook om bestaande data automatisch te verrijken, te segmenteren en te analyseren.
Tools als Clay, Apollo en Bizzy maken gebruik van algoritmes die nieuwsartikelen, sociale media en jaarrapporten doorspitten om koopintentie te detecteren. In plaats van te werken met statische lijsten, kunnen salesprofessionals nu vertrouwen op dynamische inzichten die quasi real-time geüpdatet worden.
Dat laat toe om minder te focussen op kwantiteit, en prospectie écht te laten draaien rond timing, context en relevantie. AI maakt het mogelijk om net die accounts naar boven te halen die écht potentieel tonen – op basis van gedrag en signalen, in plaats van enkel jobtitels of sectorcodes.
We staan nog maar aan het begin van dit verhaal. Maar als de evolutie zich in dit tempo voortzet, ziet de sales funnel er binnenkort slanker en gerichter uit dan ooit.
De discussie rond scraping en databeschikbaarheid is nog lang niet beslecht. Voor de ene partij is het pure innovatie, voor de andere digitale piraterij. Maar voor salesprofessionals is het vooral dagelijkse realiteit: ze hebben data nodig om hun job goed te doen. Het landschap van prospecting tools verandert razendsnel, met AI als nieuwe katalysator, en regelgeving die steeds strenger toekijkt.
De echte vraag is dus niet of scraping legaal of illegaal is, maar hoe jij als sales professional slim, verantwoord en toekomstgericht met data omgaat. Vertrouw je blind op wat een tool je voorschotelt, of durf je ook kritisch te kijken naar de herkomst?
In een markt waar het vertrouwen van de klant cruciaal wordt, is weten waar je data vandaan komt even belangrijk als wat je ermee doet.
Sales draait vandaag niet meer om volume, maar om timing, relevantie en transparantie. Wie die drie elementen weet te verenigen, heeft een voorsprong die geen enkele tool je zomaar geeft.
Benieuwd naar hoe jij data kan inzetten om efficiënter te prospecteren? Wij gaan graag in dialoog!