ByteDance анонсувала SeedEdit — нову модель для редагування зображень за текстовими запитами. Вона дозволяє проводити високоякісні зміни, зокрема локальні заміни, геометричні трансформації та стилістичні коригування.
SeedEdit створено на базі дифузійної моделі, яка поєднує генерацію зображень з їх точним редагуванням. У ByteDance зазначають, що новий підхід до редагування забезпечує «стабільне редагування високоякісних зображень навіть без попередньої підготовки». Технологія підтримує послідовні ревізії зображень, зберігаючи їх естетичну привабливість.
Основна складність розробки полягала у відсутності парних даних для навчання. Команда вирішила цю проблему, інтегрувавши текстово-зображувальні моделі як базовий рівень редагування. Далі моделі було адаптовано для точного виконання інструкцій з редагування.
SeedEdit демонструє здатність виконувати завдання будь-якої складності — від зміни стилю до додавання фантастичних елементів. Серед прикладів: заміна об’єктів, налаштування освітлення, трансформація пейзажів.