Co to je web scraping?

Pod pojmem web scraping si lze zjednodušeně představit automatizované získávání dat (nejen osobních) za účelem jejich dalších využití (interního či externího). Web scraping je omezen na webové (internetové) prostředí.

Hlavní alternativou je osobní dohledávání dat, které může vynikat kvalitou dat, avšak zcela zaostává svojí rychlostí za web scrapingem.

... a nyní trochu právního pohledu aneb opět je u toho GDPR (ochrana osobních údajů)

Právo na web scraping nahlíží zejména z pohledu získávaných dat, když samotná metoda není pro právo natolik významná. Nakládaní s některými daty v závislosti na jejich povaze je často ze strany právního řádu regulováno.

Typickým příkladem dat, které jsou významně chráněna jsou osobní údaje. Nikoho nepřekvapí, že na získávání dat prostřednictvím web scrapingu je nezbytné aplikovat GDPR (resp. chránit osobní údaje). GDPR je namístě i s ohledem na skutečnost, že web scrapingem je možné získat automatizovaně velké množství dat.

Ochrana databází a autorská ochrana

Web scraping může sloužit i k získávání dat za účelem jejich dalšího prodeje, či pro sledování konkurence (např. získávání informací o ceně). V takovém případě je nezbytné zvažovat, zda na vytěžované informace nedopadá ochrana dle autorského zákona v podobě databází. V takovém případě může dojít k zásahu do zvláštních práv k databází pořizovatele databáze, když cílem právní úpravy je ochrana kvalitativně či kvantitativně podstatného vkladu – investice – bez ohledu na to, zda samotná databáze má povahu autorského díla.

Zřejmě každý chápe, že shromažďování a využívání autorských děl zpravidla naráží na autorskoprávní ochranu, resp. absenci souhlasu s nakládáním s autorským dílem.

Obrana proti web scrapingu

Každý, kdo umisťuje na svůj web data, která by mohla být předmětem web scrapingu, by měl zvážit, jak se k web scrapingu postaví a podle toho zvážit i technická nastavení. Pro některé webové vlastníky může být web scraping vítaným rozšířením publikovaných dat mezi nové publikum (např. různé agregátory obsahu), nebo naopak nevítaným zásahem, který může snižovat hodnotu.

Vlastníkům dat lze minimálně doporučit, aby svůj postoj k web scrapingu veřejně vyjádřili prostřednictvím obchodních podmínek či pravidel pro využívání obsahu.

Sankce

Při nedodržení zákonných pravidel hrozí při využití web scrapingu různé sankce, které se opět budou měnit podle povahy zpracovávaných dat. Nabízí se samozřejmě postih dle GDPR, postih správní, civilní postih dle autorského práva či dle práv z nekalé soutěže, nebo trestní sankce.

Konkrétní sankce se odvíjí od porušené povinnosti a způsobu zpracování, když mezi nejzávažnější jednání jednoznačně patří sbírání citlivých údajů a jejich případné zveřejňování bez souhlasu subjektů údajů.

Souhlas není všechno

V závislosti na povaze dat je možné web scrapping legalizovat souhlasem vlastníka. Nicméně v případě osobních dat je nezbytné provést analýzu, zda ke zpracování postačuje souhlas vlastníka dat, či je nezbytné učinit další kroky k získání dat, a především jejich zpracování či uchování.

Dále vlastník databáze může shromažďovat autorská díla, avšak nemusí být oprávněn k udělení souhlasu s webscrapingem. I v těchto případech je třeba postupovat opatrně.

Závěr

Web scraping je  dostupný mnoha subjektům, avšak při dodržení všech zákonných předpokladů je jeho využití značně omezené. Škodlivost web scrapingu spočívá v jeho automatizaci, možné skrytosti a s tím spojených obtíží, aby subjekty dotčené na svých právech se mohly bránit proti případnému nezákonnému nakládání s daty. 

Na druhou stranu některé druhy web scrapingu jsou obecně vítané a umožňují ekonomický rozvoj, a proto metoda samotná není sama o sobě nezákonná a do budoucna by se mohla při vhodné regulaci dále rozvíjet. Konkrétní pravidla pro web scraping také bude postupně dotvářet soudní praxe.