Нейросети не сдаются
С недавних пор стало еще сложнее отличать реальные фото от сгенерированных изображений.
Вторая картинка отличается от первой только словом Female в запросе
Вся беда в том, что у новой модели для генерации картинок Flux все в порядке с числом пальцев, текстурой кожи и реалистичностью окружения. Более того - Flux умеет работать с текстом, понимает контекст и взаиморасположение объектов на фото. Может даже расположить окно вне области кадра справа, но освещение в кадре просчитать для этого невидимого окна
Теперь просьба нарисовать левую руку чуть касающуюся воды на фоне тропического острова не ставит нейросеть в тупик.
Как и запрос на отображение вида на рыбацкий городок из окна прибрежного здания
Энтузиасты уже начали создавать видео с помощью этой модели и по качеству оно уже намного превосходит первые робкие попытки полугодовой давности.
Конечно огрехи еще есть и их много (например, доставшаяся в наследство от предыдущих диффузионных моделей, проблема борьбы с размытостью фона), но технология не стоит на месте и даже страшно представить до чего дойдет через год-полтора..
Желающие могут пощупать Flux на https://replicate.com/black-forest-labs/flux-pro - 5 бесплатных генераций в сутки с большой задержкой. Или бесплатно скачать облегченно-ухудшенную версию модели и запустить ее локально на видеокарте с как минимум 12Гб памяти.
8 комментариев
5 месяцев назад
Удалить комментарий?
Удалить Отмена5 месяцев назад
Удалить комментарий?
Удалить Отмена5 месяцев назад
А ещё стало пенсионерам сложно с ходу отличать всяких спамеров с незнакомых номеров. Из "служб безопасности банков", и прочих контор, впаривающих свои услуги.
С другой стороны - нейросети тупо "клинит" в ответ на любой нестандартный вопрос - они же на стандартные ответы "заточены": "да, нет, может быть".
Удалить комментарий?
Удалить Отмена