Los datos cobran cada vez más importancia en el mundo empresarial. Cuantos más datos tenga una empresa sobre sus clientes potenciales y sobre la competencia más cerca estará de aumentar sus beneficios. De ahí que en los últimos años hayan surgido nuevas técnicas de obtención de datos en el entorno digital como el scraping web, una acción que es totalmente legal pero cuya ética es discutible y que además podría llegar a vulnerar la necesaria protección de datos personales.

¿Qué es el web scraping?

Una página web es un sitio público que cualquiera puede visitar y del que se pueden extraer datos. Sin embargo, hacer esta operación de forma manual implicaría invertir horas y horas de duro trabajo.

Por ello, se ha optado por dejar esta labor en manos de bots especializados, dando lugar a lo que conocemos como web scraping, que no es otra cosa que extraer datos de una web para tratarlos y crear con ellos una base de datos que pueda ser de utilidad a una empresa o profesional que no es el titular de esa página.

Es un sistema totalmente automatizado que consigue obtener grandes cantidades de información en muy poco tiempo. De ahí que el data scraping sea usado por la mayoría de las empresas, aunque hay quienes consideran que no es una acción ética.

Con qué finalidad se practica

En la actualidad hay una gran demanda de datos de todo tipo por parte de las empresas. Algunas quieren obtener directorios con correos electrónicos de otras empresas que operan dentro de un determinado sector para intentar contactar con ellas, otras quieren conocer los datos de visitantes que reciben las webs de su competencia y otras quieren tener un perfil más claro de los usuarios que interactúan con ciertas páginas.

Los datos son información muy valiosa y pueden marcar la diferencia a la hora de conseguir ventaja competitiva.

Lo que se hace a través del scraping es extraer información de páginas web, copiarla y crear con ella una base de datos que puede serle útil a otra empresa.

También se puede llegar a utilizar como técnica de black hat SEO, de forma que las web de la competencia reciben mucho tráfico de los bots que están extrayendo los datos, pero al ser visitas muy breves transmiten a Google la idea de que el contenido no es bueno, lo que lleva a la pérdida de puestos en el ranking de las páginas de resultados de búsqueda.

Cómo afecta a la protección de datos

Si el web scraping no es ilegal es precisamente porque se desarrolla respetando unos límites establecidos por el RGPD y la LOPD.

Es posible extraer datos de una web siempre que se trate de fuentes de acceso público y exista interés legítimo o público general. En ningún caso se puede recurrir a esta técnica para obtener información que infrinja la normativa sobre propiedad intelectual, el derecho a la intimidad de las personas o para llevar a cabo prácticas relacionadas con la suplantación de identidad.

En caso de no respetarse estos límites, los interesados pueden interponer una denuncia por mal tratamiento de los datos, lo que obligaría a quien ha realizado scraping a demostrar que existe un interés legítimo que habilita para la obtención y uso de esos datos.

El scraping web es legal pero no inevitable. Si somos titulares de una página web y queremos evitar que otros extraigan información de la misma, lo mejor que podemos hacer es categorizar todos los datos dentro de la propiedad intelectual de la web, para lo que tendremos que recurrir a la protección de copyright. La otra opción que nos queda es proteger todos los datos a través de una contraseña, de modo que solo aquellos que la tengan puedan acceder a los mismos.