El fallo de Hamburgo: ¿un punto de inflexión en la minería de datos para entrenamiento de la IA?
Este fallo permite la minería de datos para investigación científica bajo excepciones de derechos de autor
Inteligencia artificial (Foto: Freepik)
El fallo de Hamburgo: ¿un punto de inflexión en la minería de datos para entrenamiento de la IA?
Este fallo permite la minería de datos para investigación científica bajo excepciones de derechos de autor
Inteligencia artificial (Foto: Freepik)
El pasado 27 de septiembre, el Tribunal Regional de Hamburgo se pronunció con una decisión que marca un precedente importante en el ámbito de la minería de texto y datos (TDM) en Europa, concretamente en el contexto de la inteligencia artificial generativa. El caso enfrentaba a LAION e.V., una organización alemana sin fines de lucro que crea grandes conjuntos de datos para entrenar IA contra el fotógrafo Robert Kneschke, quien alegó que la descarga y uso de una de sus imágenes por parte de LAION constituía una infracción de sus derechos de autor.
Esta decisión judicial en Europa aborda las implicaciones de los artículos 3 y 4 de la Directiva de derechos de autor en el mercado único digital (DSM Directive) en relación con la TDM (Text Data Mining), y podría sentar las bases para futuras discusiones sobre la interacción entre la propiedad intelectual y la inteligencia artificial.
El caso tiene su origen en el uso de una imagen de Kneschke que estaba disponible en la plataforma Bigstockphoto, un sitio web donde el fotógrafo promocionaba y vendía sus obras. LAION había descargado la imagen como parte de la creación de su conjunto de datos LAION-5B, un dataset que consta de 5,85 mil millones de URLs de pares de imágenes-texto disponibles en línea y que ha sido utilizado para entrenar sistemas de inteligencia artificial, incluyendo herramientas como Stable Diffusion.
La disputa se centraba en si LAION tenía el derecho de descargar y usar la imagen sin el consentimiento explícito del autor, y si esta acción constituía una violación del derecho de reproducción protegido por la ley alemana de derechos de autor, la Urheberrechtsgesetz (UrhG).
En la defensa presentada en junio, LAION argumentó que su actividad de minería de texto y datos estaba protegida por ciertas excepciones contempladas en la legislación alemana. Las excepciones analizadas por el tribunal concretamente fueron las contenidas en los artículos 44a, 44b y 60d de la UrhG.
En los motivos de conclusión, el Tribunal sostiene que el demandado LAION interfirió en los derechos de explotación de Kneschke al reproducir la fotografía sin autorización, si bien ese uso se hallaba cubierto por la excepción del 60d UrhG, dado que se trata de una entidad sin ánimo de lucro compuesta por investigadores, comprometida con el desarrollo de algoritmos de autoaprendizaje en el contexto de la IA, para ponerlos a disposición del público en general.
Con relación a lo dispuesto en la Sección 44a UrhG sobre los actos temporales de reproducción, el tribunal desestimó rápidamente esta excepción al considerar que la descarga de la imagen por parte de LAION no era ni «transitoria» ni «incidental». Se realizó un proceso intencional y controlado, con el propósito explícito de su análisis, por lo que no se trató de un acto meramente accesorio.
La segunda de las excepciones invocadas fue la sección 44b UrhG text data mining. El Tribunal de Hamburgo consideró que la actividad de scraping y análisis técnico realizada por LAION entraba dentro de la definición de Text Data Mining, y sostuvo que con su actuación buscaba comprobar la correspondencia entre las imágenes y sus descripciones, lo que constituía un acto de minería de texto y datos dentro del alcance de esta sección.
Sin embargo, un elemento fundamental de la Sección 44b es que permite a los titulares de derechos optar por excluir sus obras de la minería de datos mediante una declaración de exclusión voluntaria “ops-out”. En este caso, Bigstockphoto contaba con una cláusula en sus Términos de Servicio que prohibía el uso de bots y programas automatizados para descargar o indexar su contenido. Aunque esta cláusula estaba escrita en lenguaje natural que no es típicamente considerado como “legible por máquina”, se consideró que podría llegar a serlo, especialmente dada la evolución tecnológica que permite a las IA comprender y procesar textos escritos de forma natural.
Aunque el tribunal, desafortunadamente, no se pronunció sobre la validez del opt-out en el caso concreto -ya que resolvió el caso bajo la sección 60d UrhG-, proporcionó indicios de que la cláusula en el sitio de Bigstockphoto podría haber sido considerada como «legible por máquina», pese a estar formulada en lenguaje natural. El tribunal señaló que, dado el avance de la inteligencia artificial, es lógico esperar que los modelos de IA sean capaces de interpretar y cumplir con tales cláusulas.
Igualmente, hace mención al Reglamento de Inteligencia Artificial en cuanto a la obligación de los proveedores de modelos IA de propósito general a prever una estrategia particular para identificar y cumplir con la reserva de derechos conforme al art 4.3 DSM-RL
Asimismo, interesa destacar dentro del análisis de aplicación de la excepción 44b, la consideración de que la mera intención general de obtener en un futuro contenidos generados por IA, que existía al momento de creación del conjunto de datos de entrenamiento, no es un criterio adecuado para evaluar la legalidad de la creación del conjunto de datos de entrenamiento en sí.
Finalmente, la sección 60d UrhG (Text Data Mining para fines de investigación científica), permite la minería de texto y datos cuando esta es realizada por instituciones de investigación con fines no comerciales, siempre que la finalidad sea obtener conocimiento científico.
En este contexto, LAION argumentó que se trataba de una organización sin fines de lucro y sus datos estaban disponibles públicamente para la comunidad investigadora. El tribunal aceptó este argumento, determinando que LAION estaba realizando minería de datos con fines de investigación científica y, por tanto, podía acogerse a esta excepción. El hecho de que la imagen descargada formara parte de un paso fundamental en el proceso de generación de conocimiento fue clave para la decisión, es decir, no fue descargada para ser usada como un fin en sí misma, sino que se descargó como parte de un esfuerzo mayo para desarrollar modelos de IA que analicen patrones, tendencias y correlaciones en los datos.
Este enfoque considera así el uso de la imagen bajo la excepción de minería de texto y datos para fines de investigación científica ya que LAION estaba creando un recurso orientado a la investigación y el avance del conocimiento en el campo de inteligencia artificial.
El tribunal desestimó los argumentos de Kneschke sobre la presunta colaboración entre LAION y Stability AI, una empresa comercial que supuestamente habría financiado la creación del conjunto de datos. Concluyó que la mera coincidencia de dos miembros de LAION que trabajaban para Stability AI no es suficiente para demostrar una influencia decisiva de la empresa sobre LAION ni un acceso preferencial a los resultados de la investigación, por lo que no considera que existiera fin comercial con su actuación.
El fallo del Tribunal de Hamburgo representa un avance significativo en la clarificación del alcance y los límites de la TDM en el contexto de la inteligencia artificial y la protección de los derechos de autor en Europa. Al establecer que la creación de conjuntos de datos para la investigación científica puede estar amparada bajo la Sección 60d UrhG, el tribunal ha proporcionado cierta certeza jurídica para entidades que buscan utilizar minería de texto y datos en sus investigaciones.
No obstante, el fallo deja abiertas preguntas esenciales, especialmente en lo que respecta a la forma en que los titulares de derechos deben ejercer su opt-out y cómo la legislación evoluciona para adaptarse a las tecnologías emergentes de inteligencia artificial.
Esta decisión supone un impulso a la innovación y el avance en el campo de la IA, pero también plantea cierta incertidumbre y preocupación sobre la protección de los derechos de autor y la capacidad que tienen los creadores para controlar el uso de su trabajo. Además, puede suponer un aumento del uso de minería de texto y datos buscando argumentarlo con fines de investigación.
Por ello, habrá que continuar atentos a las futuras actualizaciones y desarrollos de este asunto, así como a la repercusión que pueda tener en el ámbito de la propiedad intelectual y la inteligencia artificial en Europa.