Ciencia y Tecnología

Derechos de autor | Demandas dirigidas a cómo se diseñó la IA

A fines de junio, Microsoft anunció un nuevo tipo de tecnología de inteligencia artificial (IA) que puede generar su propio código de computadora.


Esta herramienta, denominada Copilot, fue diseñada para agilizar el trabajo de los programadores profesionales. Mientras escribían en sus computadoras portátiles, se les proporcionaron bloques de código de computadora listos para usar que podían agregar inmediatamente a su propio código.

A muchos programadores les gustaron, o al menos les intrigaron, las nuevas herramientas. Pero el programador, diseñador, escritor y abogado de Los Ángeles, Matthew Butterrick, no era uno de ellos. A principios de este mes, se unió a un equipo de otros abogados para presentar una demanda que busca iniciar una demanda colectiva contra Microsoft y otras grandes empresas que diseñaron e implementaron Copilot.

primer reto

Al igual que muchas tecnologías de inteligencia artificial de vanguardia, Copilot desarrolló sus habilidades mediante el análisis de grandes cantidades de datos. En este caso, se basó en miles de millones de líneas de código informático publicadas en Internet. Butterick, de 52 años, compara el proceso con la piratería. Esto se debe a que el sistema no reconoce el pasivo por obra existente. Su demanda alega que Microsoft y sus colaboradores violaron los derechos legales de millones de programadores que pasaron años escribiendo el código original.

Este es el primer desafío legal a un método de diseño llamado “entrenamiento de IA”, que es la forma en que construimos la IA y está tratando de sacudir la industria tecnológica. En los últimos años, muchos artistas, escritores, expertos y defensores de la privacidad se han quejado de que las empresas que capacitan a los sistemas de inteligencia artificial utilizan datos que no les pertenecen.

Este remedio se refleja en la historia de la industria tecnológica. En las décadas de 1990 y 2000, Microsoft luchó contra el auge del software libre (Fuente abierta), viéndolos como una amenaza existencial para el futuro de la empresa. A medida que estas piezas de software crecieron en importancia, Microsoft las adoptó y adquirió GitHub, una plataforma donde los programadores de software libre construyen y almacenan su código.

Casi todas las nuevas generaciones de tecnología (incluidos los motores de búsqueda en línea) enfrentan desafíos legales similares. En muchos casos, “no existe una ley o un precedente que los cubra”, dice Bradley J. Hulbert, un abogado de propiedad intelectual que se enfoca en esta área del derecho cada vez más importante.

Esta queja es parte de una ola de preocupaciones sobre la IA. A los artistas, escritores, compositores y otros creadores les preocupa cada vez más que empresas e investigadores utilicen su trabajo para crear nuevas tecnologías sin su consentimiento ni compensación, por lo que estas empresas impulsan diversas herramientas basadas en IA, como generadores de arte, sistemas de reconocimiento de voz. como Siri y Alexa, e incluso coches autónomos.

OpenAI a la vanguardia

Copilot se basa en tecnología desarrollada por OpenAI, un laboratorio de inteligencia artificial en San Francisco con una financiación de mil millones de dólares de Microsoft. OpenAI está a la vanguardia de un esfuerzo cada vez más amplio para entrenar la tecnología de IA a partir de datos digitales.

Después de que Microsoft y GitHub introdujeron Copilot, el CEO de GitHub, Nat Friedman, tuiteó que usar el código existente para entrenar el sistema constituye un “uso justo” del material bajo la ley de derechos de autor. Sin embargo, ningún ensayo ha validado aún esta afirmación.

“Las ambiciones de Microsoft y OpenAI van mucho más allá de GitHub y Copilot”, dijo Butterick en una entrevista. Quieren entrenar sobre cualquier dato, en cualquier lugar, gratis, sin consentimiento, para siempre. »

En 2020, OpenAI anunció un sistema llamado GPT-3. Los investigadores utilizan miles de libros, artículos de Wikipedia, registros de chat (Gato) y otros datos publicados en Internet.

Al encontrar patrones en todos estos textos, el sistema aprendió a predecir la siguiente palabra en la secuencia. Cuando alguien escribió algunas palabras en este “modelo de lenguaje grande”, pudo completar sus pensamientos en un párrafo completo de texto. De esta manera, el sistema puede crear publicaciones, discursos, poemas y artículos de noticias únicos en Twitter.

Para sorpresa de los investigadores que construyeron este sistema, incluso pudieron escribir programas de computadora. Parece haber aprendido de innumerables programas publicados en Internet.

Por lo tanto, OpenAI ha ido un paso más allá y entrenó un nuevo sistema, Codex, en nuevas recopilaciones de datos que contienen específicamente código. Labs dijo en un artículo de investigación que detalla la tecnología, que al menos parte de su código proviene de GitHub, un popular servicio de programación que pertenece y es operado por Microsoft.

Este nuevo sistema se convirtió en la tecnología subyacente de Copilot, que Microsoft distribuyó a los programadores a través de GitHub. Después de ser probado por un número relativamente pequeño de programadores durante aproximadamente un año, Copilot se puso a disposición de todos los programadores en GitHub en julio.

Butterick se llama a sí mismo programador de software libre, parte de una comunidad de programadores que comparten abiertamente su código con el mundo. Durante los últimos 30 años, el software de código abierto ha sustentado la mayoría de las tecnologías que los consumidores usan todos los días, incluidos los navegadores web, los teléfonos inteligentes y las aplicaciones móviles.

El software libre está diseñado para ser compartido libremente entre codificadores y empresas, pero este intercambio se rige por licencias diseñadas para ser utilizadas de manera que beneficien a la comunidad de programación en general. Butterick cree que Copilot viola estas licencias y que, a medida que mejoren, los codificadores de software libre quedarán obsoletos.

Inicio de procedimientos judiciales

Después de meses de quejarse abiertamente sobre el problema, presentó una demanda con varios otros abogados. La demanda aún está en pañales y el tribunal aún tiene que otorgar el estatus de demanda colectiva.

Para sorpresa de muchos expertos legales, la denuncia de Butterick no acusa a Microsoft, GitHub y OpenAI de infracción de derechos de autor. Ella adopta un enfoque diferente, argumentando que las empresas violan los términos de servicio y la política de privacidad de GitHub al mismo tiempo que violan la ley federal que exige que las empresas muestren información de derechos de autor cuando usan material. .

Butterick y otro abogado detrás de la demanda, Joe Saveri, dijeron que la demanda eventualmente podría abordar problemas de derechos de autor.

Cuando se le preguntó sobre la capacidad de la empresa para discutir la demanda, un portavoz de GitHub se negó a comentar antes de enviar un correo electrónico a la empresa. Continuaremos desarrollando nuestros productos para servirle”. Microsoft y OpenAI se negaron a comentar sobre la demanda.

Este artículo fue originalmente New York Times.

About the author

w-admin

Leave a Comment