Розробники представили інноваційну модель ШІ для візуалізації тексту
Компанія Stability AI оголосила про запуск попередньої версії Stable Diffusion 3 — удосконаленої моделі перетворення тексту на зображення, яка стала більш продуктивною та точною.
Stable Diffusion 3 виділяється на тлі попередніх версій завдяки суттєвим вдосконаленням: модель краще створює зображення, на яких потрібно показати декілька об’єктів, генерує якісні картинки і точніше пише тексти.
Поки що доступ до моделі обмежений, але розробники пропонують зареєструватись у списку очікування для участі у ранньому тестуванні. Цей етап є ключовим для збору відгуків, які допоможуть покращити функціональність та безпеку продукту перед його публічним релізом.
Нова лінійка Stable Diffusion 3 включає моделі з кількістю параметрів від 800 мільйонів до 8 мільярдів, що надає користувачам широкі можливості вибору залежно від вимог до масштабованості та якості, а також дозволяє адаптувати різні версії моделі для роботи на пристроях від смартфонів до серверів.
Як заявив гендиректор Stability AI Емад Мостак, модель заснована на комбінації архітектури дифузійного трансформера та методу зіставлення потоків (flow matching). Техніка flow matching призначена для того, щоб плавно переходити від випадкового шуму до структурованого зображення без необхідності симулювати кожен крок процесу.
Источник: noworries.news