La IA se ha construido saqueando el contenido de Internet. Ahora hay gente que quiere cobrar por permitirlo
Es una queja recurrente: los modelos de IA devoran contenido de forma industrial . Para lograr el conjunto de datos con los que se entrena un modelo se necesitan bots rastreadores . Cada compañía tiene los suyos: OpenAI usa GPTBot, para Gemini se emplea Googlebot, mientras que Anthropic se apoya en ClaudeBot. Son succionadores de información y hacen lo que se denomina scraping . Recorren millones de página web. En cada una descargan el HTML, extraen el texto limpio y almacenan los enlaces para s
Escuchá el resumen
Exclusivo para suscriptores Premium

Es una queja recurrente: los modelos de IA devoran contenido de forma industrial . Para lograr el conjunto de datos con los que se entrena un modelo se necesitan bots rastreadores . Cada compañía tiene los suyos: OpenAI usa GPTBot, para Gemini se emplea Googlebot, mientras que Anthropic se apoya en ClaudeBot. Son succionadores de información y hacen lo que se denomina scraping . Recorren millones de página web. En cada una descargan el HTML, extraen el texto limpio y almacenan los enlaces para s
- Es de sobra conocida la demanda del New York Times a Microsoft y OpenAI, acusándolos de utilizar millones de sus artículos para entrenar ChatGPT
- Eso sí, oneroso: tuvo que desembolsar unos 1.500 millones de dólares
- Era el equivalente a 3.000 dólares por cada uno de los 482.460 libros que admitió haber descargado ilícitamente para entrenar a su IA
- OpenAI llegó a un acuerdo con el grupo mediático News Corp para tener acceso a sus informaciones durante cinco años a cambio de 250 millones de dólares
Es una queja recurrente: los modelos de IA devoran contenido de forma industrial . Para lograr el conjunto de datos con los que se entrena un modelo se necesitan bots rastreadores . Cada compañía tiene los suyos: OpenAI usa GPTBot, para Gemini se emplea Googlebot, mientras que Anthropic se apoya en ClaudeBot. Son succionadores de información y hacen lo que se denomina scraping . Recorren millones de página web. En cada una descargan el HTML, extraen el texto limpio y almacenan los enlaces para s
Fuente: Xataka. Para leer la nota completa:
Leer artículo completoResumen rápido
Lo que necesitás saber en segundos. Para la nota completa, visitá la fuente original.
Preguntale a la nota
Hacé preguntas y la IA responde usando solo este artículo
2 preguntas restantes · Respuestas basadas en el contenido del artículo
Recibí las noticias en WhatsApp
Seguí nuestro canal para recibir lo más importante del día, directo a tu celular.
Noticias Relacionadas

La desorganización mundial del trabajo
El avance de la inteligencia artificial vuelve a poner en discusión un punto incómodo: no tanto la cantidad de empleo, sino la vigencia de su formato tradicional

Big tech: el “festival de inversiones” de Amazon para recuperar terreno en la nube
La compañía acelera sus proyectos de infraestructura para inteligencia artificial y apuesta a recortar la ventaja que le sacaron Microsoft y Google

Cómo compartir tus cuadernos en NotebookLM para compartir tus contenidos y trabajar en grupo con ayuda de Gemini
NotebookLM es el resultado de mezclar la IA Gemini con la app Documentos. En palabras de Google, es “un asistente de investigación basado en IA” diseñado para “ayudarte a perfeccionar y organizar tus ideas”. Si no lo has probado todavía, ya estás tardando. Es más. Puedes inspirarte con los cuadernos o documentos de otros usuarios. […]

Comentarios
para dejar un comentario