Saltar al contenido principal

Tempranísimo

jueves, 21 de mayo de 2026

Buenos DíasRápidasPolíticaEconomíaDeportesTecnologíaSociedadInternacionalEntretenimientoCulturaPremium
Oficial
Blue
MEP

Tempranísimo

La primera plataforma de noticias impulsada 100% por inteligencia artificial.

Seguinos en WhatsApp

Secciones

  • Política
  • Economía
  • Deportes
  • Tecnología
 
  • Sociedad
  • Entretenimiento
  • Internacionales
  • Cultura

Información

  • Buenos Días
  • Noticias Rápidas
  • Economía en Vivo
  • Cómo Funciona
  • Fuentes
  • Premium
  • Newsletter
  • Resumen Semanal
  • Términos y Condiciones
  • Privacidad
  • Acerca de
  • Por qué Tempranísimo
  • Estándares Editoriales
  • Correcciones
  • Contacto
  • Changelog
  • Estado del Sistema
  • Ideas

© 2026 Tempranísimo. Todos los derechos reservados.

Hecho con AI en Argentina

InicioBuscarSeccionesGuardadosPerfil
  1. Inicio
  2. tecnología
  3. OpenAI nuevas IA que razonan, traducen y transcriben mientras hablas
tecnología

OpenAI nuevas IA que razonan, traducen y transcriben mientras hablas

OpenAI ha presentado tres nuevos modelos de voz de IA que pueden razonar, traducir y transcribir mientras las personas hablan. La compañía señala que estos modelos permiten crear experiencias de voz que se sienten más naturales y responden de forma más inteligente en tiempo real. Los tres ya están disponibles a través de la API […]

21 de mayo de 2026Actualizado hace menos de un minuto4 min de lectura4 lecturasComentarios

Escuchá el resumen

Exclusivo para suscriptores Premium

Desbloquear
OpenAI nuevas IA que razonan, traducen y transcriben mientras hablas
#ia
Lo esencial

OpenAI ha presentado tres nuevos modelos de voz de IA que pueden razonar, traducir y transcribir mientras las personas hablan. La compañía señala que estos modelos permiten crear experiencias de voz que se sienten más naturales y responden de forma más inteligente en tiempo real. Los tres ya están disponibles a través de la API […]

  • Los tres ya están disponibles a través de la API para desarrolladores De acuerdo con una publicación en su web, los modelos en cuestión son GPT-Realtime-2, GPT-Realtime-Translate y GPT-Realtime-Whisper
  • GPT-Realtime-2 también introduce frases de transición como "déjame verificar eso" o "un momento" mientras procesa una solicitud, lo que evitará los silencios que hacen sentir que el sistema se ha colgado
  • En cuanto al precio, GPT-Realtime-2 tiene un coste de 32 dólares por cada millón de tokens de audio en entrada y 64 dólares por cada millón en salida
  • Por su parte, GPT-Realtime-Translate se ofrece a 0,034 dólares por minuto, y GPT-Realtime-Whisper a 0,017 dólares por minuto

OpenAI ha presentado tres nuevos modelos de voz de IA que pueden razonar, traducir y transcribir mientras las personas hablan. La compañía señala que estos modelos permiten crear experiencias de voz que se sienten más naturales y responden de forma más inteligente en tiempo real. Los tres ya están disponibles a través de la API para desarrolladores De acuerdo con una publicación en su web, los modelos en cuestión son GPT-Realtime-2, GPT-Realtime-Translate y GPT-Realtime-Whisper.

El primero de ellos es el más llamativo del grupo y cuenta con capacidades de razonamiento equivalentes a GPT-5. OpenAI menciona que su IA puede puede manejar conversaciones más complejas sin perder el hilo, ya que entiende el contexto, gestiona interrupciones, llama a herramientas externas mientras sigue hablando y ajusta su tono según la situación. Cuando los usuarios están frustrados, la IA puede responder con más calma, pero si está confirmando algo, sube el tono.

GPT-Realtime-2 también introduce frases de transición como "déjame verificar eso" o "un momento" mientras procesa una solicitud, lo que evitará los silencios que hacen sentir que el sistema se ha colgado. Otra función adicional es la posibilidad de llamar a varias herramientas al mismo tiempo y anunciarlo en voz alta: "revisando tu calendario", "buscando esa información ahora". GPT-Realtime-2 tine una ventana de contexto de 128.000 tokens, lo que permite conversaciones mucho más largas sin que el modelo pierda el hilo.

El nivel de razonamiento además es configurable entre cinco niveles, desde mínimo hasta muy alto, para equilibrar velocidad y profundidad según lo que necesite cada caso. Los nuevos modelos de OpenAI razonan, traducen y transcriben conversaciones en tiempo real El segundo modelo de la lista es GPT-Realtime-Translate, diseñado para traducción simultánea de voz. Esta IA admite más de 70 idiomas de entrada y traduce hacia 13 idiomas de salida, todo en tiempo real y siguiendo el ritmo del hablante.

OpenAI menciona que esta funcionalidad está enfocada a la atención al cliente, plataformas educativas, eventos en directo o cualquier app en donde dos personas necesiten hablar en idiomas distintos sin interrumpir la conversación. "La traducción en vivo debe preservar el significado mientras mantiene el ritmo del hablante, incluso cuando la gente habla de forma natural, cambia de contexto o utiliza pronunciación regional y lenguaje específico de dominio", dijo la compañía. Uno de los primeros en aplicar GPT-Realtime-Translate es Deutsche Telekom, quien está probando el modelo para permitir que sus clientes se comuniquen en el idioma con el que se sientan más cómodos. Por último, OpenAI lanzó GPT-Realtime-Whisper, un modelo de transcripción que convierte el audio en texto mientras la persona habla.

En la práctica, esta IA añade subtítulos en las presentaciones o transmisiones en directo, las cuales pueden sentirse más rápidas y naturales al reducir la latencia típica que añade una función de subtitulado en tiempo real. GPT-Realtime-Whisper también puede generar notas y resúmenes mientras las conversaciones aún están en progreso. El modelo permite construir agentes de voz que necesiten entender a los usuarios de forma continua, algo que se aprovechará en departamentos como el de atención al cliente, sanidad, ventas, reclutamiento y más.

Precio y disponibilidad Los tres modelos están disponibles dentro de la Realtime API de OpenAI. Para probarlos sin escribir código, puedes acceder directamente desde el Playground de la plataforma. Si quieres integrarlos en una app, OpenAI ofrece un punto de partida a través de Codex, donde puedes añadir GPT-Realtime-2 a un proyecto existente o arrancar uno desde cero.

En cuanto al precio, GPT-Realtime-2 tiene un coste de 32 dólares por cada millón de tokens de audio en entrada y 64 dólares por cada millón en salida. Por su parte, GPT-Realtime-Translate se ofrece a 0,034 dólares por minuto, y GPT-Realtime-Whisper a 0,017 dólares por minuto. OpenAI confirmó que la API incluye capas de seguridad que pueden detener conversaciones si detectan contenido que viola las políticas de uso.

Fuente: Hipertextual|Fuente primaria|Editado por Tempranísimo IA

Preguntale a la nota

Hacé preguntas y la IA responde usando solo este artículo

2 preguntas restantes · Respuestas basadas en el contenido del artículo

Compartir
WhatsAppXFacebookTelegram

Recibí las noticias en WhatsApp

Seguí nuestro canal para recibir lo más importante del día, directo a tu celular.

Seguir canal

Comentarios

para dejar un comentario

Cargando comentarios...

Noticias Relacionadas

Video insólito: El Chiringuito recreó la tremenda pelea de Valverde y Tchouaméni con inteligencia artificial
Tecnología

Video insólito: El Chiringuito recreó la tremenda pelea de Valverde y Tchouaméni con inteligencia artificial

El Chiringuito de Jugones recreó con inteligencia artificial lasa imágenes de la escandalosa pelea entre Federico Valverde y su compañero Tchouaméni.

MDZ Onlinehace alrededor de 1 hora2 min1
"Llegó a la morgue": la impactante historia detrás de la tapa del libro de Oriana Sabatini
Tecnología

"Llegó a la morgue": la impactante historia detrás de la tapa del libro de Oriana Sabatini

El proyecto comenzó con una serie de bocetos desarrollados mediante inteligencia artificial.

Los Andeshace alrededor de 4 horas3 min3
WhatsApp prepara un cambio revolucionario para el diseño de los chats
Tecnología

WhatsApp prepara un cambio revolucionario para el diseño de los chats

WhatsApp anticipó que trabaja en un cambio revolucionario para rediseñar por completo la lista de chats de tu cuenta. Los detalles.

MDZ Onlinehace alrededor de 7 horas2 min3
Celulares: gigante chino lanzó su nuevo smartphone de gama alta en la Argentina
Tecnología

Celulares: gigante chino lanzó su nuevo smartphone de gama alta en la Argentina

El Cronistahace alrededor de 7 horas5 min3
Más de TecnologíaVer todas las noticias