Stabilna difuzija

Stable Diffusion
	Slika generisana pomoću Stabilne difuzije na osnovu tekstualnog uputstva „fotografija astronauta koji jaše konja“
Prvobitni; programer(i)	Runway, CompVis, i Stability AI
Programer(i)	Stability AI
Prva verzija	22. avgust 2022
Najnovija; verzija	SDXL 1.0 (model); 26. jul 2023
Pisano u	Piton
Tip	Model teksta u sliku
Licenca	Creative ML OpenRAIL-M
Veb-sajt

Stabilna difuzija je model teksta u sliku dubokog učenja objavljen 2022. zasnovan na tehnikama difuzije. Generativna tehnologija veštačke inteligencije je vrhunski proizvod Stabiliti VI i smatra se da je deo tekućeg buma veštačke inteligencije.

Укратко Prvobitniprogramer(i), Programer(i) ...

Prvenstveno se koristi za generisanje detaljnih slika uslovljenih tekstualnim opisima, mada se može primeniti i na druge zadatke kao što su slikanje, preslikavanje i generisanje prevoda slike u sliku vođeno tekstualnim upitom.^[3] Njegov razvoj uključivao je istraživače iz CompVis grupe na Univerzitetu Ludvig Makimilijan u Minhenu i kompanije Ranvaj uz računsku donaciju kompanije Stabiliti i podatke za obuku neprofitnih organizacija.^[4]^[5]^[6]^[7]

Stabilna difuzija je model latentne difuzije, neka vrsta duboke generativne veštačke neuronske mreže. Njegov kod i ponderi modela su javno objavljeni^[8] i može da radi na većini potrošačkog hardvera opremljenog skromnim GPU-om sa najmanje 4 GB VRAM-a. Ovo je označilo odmak od prethodnih vlasničkih modela teksta u sliku kao što su DALL-E i Midjourney koji su bili dostupni samo preko usluga u oblaku.^[9]^[10]

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

Stabilna difuzija

Reference

Spoljašnje veze

Wikiwand - on