Wat is screen scraping, wat is web scraping en wat kan er met RPA?

1/5/2023 16:02

Screen scraping is, net als web scraping, een techniek die gebruikt wordt om data te vergaren. Het grote verschil tussen de twee is het type data dat verzameld wordt wanneer het ingezet wordt. Het is dan ook van belang om de tool te kiezen die je nodig hebt om de data te verkrijgen waar je naar op zoek bent. Wat is screen scraping precies? Hoe verschilt het van web scraping? En wat voor data kan je voor je onderneming opgraven door allebei deze technieken te gebruiken?

Screen scraping of web scraping? Met RPA kan het allebei.

Laten we eerst eens kijken naar de definitie van screen scraping. Screen scraping is het proces van het 'crawlen' en ophalen van visuele data van een scherm. Denk hierbij aan data die je kan krijgen uit applicaties, webpagina's, documenten, pdf-bestanden, Word-documenten of andere bestandstypen. De data wordt in dit proces automatisch (of handmatig) uitgelezen vanaf het scherm. Deze data kan overgezet worden naar een andere applicatie of een ander systeem, waar het gebruikt kan worden in bedrijfskundige processen. Deze data kan op drie manieren van het scherm afgelezen worden.

Allereerst is er FullText-scraping. Dat stelt gebruikers in staat om data uit een specifiek deel van een User Interface (UI), element of document te halen. De tweede techniek heet Native. Native screen scraping kan enkel in specifieke apps. In deze apps kunnen de coördinaten van bepaalde informatie vastgesteld worden, en die informatie wordt vervolgens opgehaald. De laatste methode heet Optical Character Recognition (OCR). OCR screen scraping haalt data uit visuele bronnen en applicaties. Ook met deze techniek wordt informatie vastgelegd aan de hand van schermcoördinaten. Web scraping bestaat uit het ophalen van data van publiekelijk toegankelijke webpagina's. Deze data wordt dan omgezet in een aanpasbaar format.

Wat zijn de grootste verschillen tussen deze twee technieken? Waar screen scraping ongestructureerde data ophaalt, haalt web scraping alle typen data op (gestructureerd, semi-gestructureerd en ongestructureerd). Screen scraping kan gebruikt worden om data op te halen van applicaties die op de desktop van de gebruiker draaien, terwijl web scraping internetpagina's nodig heeft. Screen scraping gebruikt schermdata van oude systemen, en kan deze in nieuwe systemen inladen, waar web scraping ook gebruikt wordt voor het monitoren van prijzen, het controleren van concurrenten en marktonderzoek, om maar enkele functionaliteiten te benoemen.

Wat kan met RPA?

Het mooie van Robotic Process Automation (RPA) als oplossing is dat het screen scraping én web scraping kan doen. Screen scraping is in dit geval een vanzelfsprekendere techniek omdat RPA sowieso aan de hand van grafische input werkt. Maar ook web scraping kan met RPA gedaan worden. Hoe? Deze software kan elementen op een internetpagina identificeren. Naar deze elementen zoekt de software vervolgens wanneer data ongestructureerd weergeven wordt. Zo zijn allebei deze technieken mogelijk wanneer een bedrijf of organisatie ervoor kiest om een softwarerobot in te zetten.

Gratis totdat jouw administratieve werk geautomatiseerd is

Wij automatiseren jouw admin gratis en brengen niets in rekening totdat het werkt.  (Dat klopt, geen lock-in).

Boek een meeting
Phone Icon
Jop de Bakker

Gratis discovery call van 30 min met onze CEO, Jop!