Imagen 3 de Google compite con Midjourney y Flux (comparativa)
El generador de imágenes desde texto de Google «Imagen 3» ya está disponible a través de ImageFX dentro de Google AI Test Kitchen.
Imagen 3 se puede usar a través de Google ImageFX con login de Google pero con restricciones
Imagen 3
Imagen 3 es un modelo de difusión latente que genera imágenes de alta calidad a partir de mensajes de texto.
Se ha diseñado Imagen 3 para generar imágenes de alta calidad en una amplia gama de formatos y estilos, desde paisajes fotorrealistas hasta pinturas al óleo ricamente texturizadas o caprichosas escenas de plastilina.
Imagen 3 también entiende las instrucciones escritas en un lenguaje natural y cotidiano, lo que facilita la obtención de los resultados deseados sin necesidad de una compleja ingeniería de instrucciones.
Para ayudar a Imagen 3 a captar matices como ángulos de cámara específicos o composiciones en instrucciones largas y complejas, se han añadido más detalles en los datos de entrenamiento. Al disponer de mejor información para aprender, Imagen 3 genera con mayor precisión una amplia gama de temas y estilos.
Imagen 3 genera imágenes visualmente ricas y de alta calidad, con buena iluminación y composición. Puede representar con precisión pequeños detalles, como las finas arrugas de la mano de una persona, y texturas complejas, como un elefante de peluche tejido.
Imagen 3 se ha construido con las últimas innovaciones en materia de seguridad y responsabilidad de Google, desde el desarrollo de datos y modelos hasta la producción. Se usa un amplio filtrado y etiquetado de datos para minimizar el contenido nocivo de los conjuntos de datos y reducir la probabilidad de resultados nocivos. También se han llevado a cabo evaluaciones y red teaming sobre temas como la imparcialidad, la parcialidad y la seguridad de los contenidos.
Se está desplegando Imagen 3 con las últimas tecnologías de privacidad, seguridad y protección, incluida la marca de agua SynthID, que incrusta una marca de agua digital directamente en los píxeles de la imagen, haciéndola detectable para la identificación pero imperceptible para el ojo humano.