Sztuczna inteligencja wdarła się do codziennego życia klasy kreatywnej oraz techników. Ale mimo paniki myślę, że posłuży ona bardziej narzędziem do pracy niż zamiennikiem specjalistów. Do takiego wniosku doszedłem, gdy zdecydowałem się ją wykorzystać w mojej pracy. Jako jeden z wyników mojego testu, przedstawiam przegląd usług opartych na sztucznej inteligencji, które mogą generować obrazy. A recenzję napisałem właśnie z punktu widzenia specjalisty SMM, który ma duże i regularne zapotrzebowanie na obrazki, więc przydają się tu sieci neuronowe.
Midjourney
Pierwszym w kolejce będzie „Midjourney”. Mianowicie z tej sieci zaczęła się moja znajomość ze sztuczną inteligencją, używając jej jako narzędzie do generowania obrazów. Na początku wydawało mi się to zabawnym, ale później zobaczyłem w jaki sposób wykorzystują jej inni. I tu zdałem sobie sprawę, że jest to niewyczerpalne źródło różnorodnych treści. Po pierwsze, nadal aktualne są wpisy typu „jak sieć neuronowa widzi …”. Oczywiście, z czasem takie wpisy staną się nieaktualne, ponieważ sieci neuronowe w żaden sposób nie widzą świata, tylko generują obrazy na żądanie. Ale mimo to, interesuje wciąż ludzi jak AI widzi herb miasta lub piosenkę.

Midjourney jest idealny do rozpoczęcia pracy z AI. Możesz tu generować kreacje reklamowe, obrazy do postów. Jedną z wad, która mi nie odpowiada, jest możliwość generowania obrazów w różnych formatach (należy na końcu żądania i podać następujący parametr -ar 770:330, gdzie 770:330 to szerokość i wysokość obrazu w pikselach.
Sam proces generowania obrazów jest prosty. Cała praca odbywa się przez Discord, gdzie piszesz swoje wskazówki, a bot wyświetla Ci 4 obrazka, z których do wyboru jest 1. Zgodnie z twoim wyborem sieć wygeneruje dodatkowe 4 opcje (lub więcej w zależności od potrzeb). Ale osoba bez doświadczenia może mieć problemy z Discordem.
Nawet dla niektórych postów na tym blogu generowałem obrazy za pomocą Midjourney, ponieważ nie mogłem znaleźć odpowiednich gdzieś indziej.

A więc poniżej moja subiektywna ocena Midjourney. Generalnie teraz z niej nie korzystam, gdyż podstawowe potrzeby już zaspokoiłem. Ale nie wykluczam, że jak uzbiera się większa ilość zadań dla AI, to wykupię miesięczną subskrypcję i zamknę te zadania.
DALL·E 2
DALL·E 2 to sieć od twórców Chat GPT (firma Open AI). To jedno z pierwszych narzędzi do generowania obrazów, niestety rozwinięcie tej sieci nie zaszło zbyt daleko. Dziś tworzy ona obrazy, które można jednoznacznie zidentyfikować jako wygenerowane przez „bezduszną maszynę”. Z drugiej strony, jeśli nie traktować efekty tej pracy jako końcowe, DALL·E można użyć jako narzędzie odniesienia dla tworzenia tablic moodboardów, storyboardów i po prostu wizualizacji własnych pomysłów. Następnie można szybko wrzucić różne wersje kompozycji i obrazów. Co więcej, „Dolly” może być używana za darmo, w przeciwieństwie do Midjourney, który całkowicie usunął możliwość generowania obrazów za darmo.
Poniżej znajdują się przykłady moich obrazów na temat „guru SMM (social media marketing)”. Wygląda to źle, ponieważ nie wyróżniają się szczegóły. Ale kilka obrazów można wziąć na uwagę (co właśnie i zrobiłem). A zdjęcia z burgerami w technice witrażu – to wynik naciśnięcia przycisku „zaskocz mnie”. Zrobiłem to by lepiej zrozumieć możliwości sieci i w zasadzie wynik jest całkiem znośny. Tylko że nie bardzo pasuje w moim wypadku.

Lexica
Lexica to jedna z opcji, która naprawdę zaskoczyła mnie jakością obrazu. Jestem daleki od sztuki, ale Lexiсa ma swój własny styl obrazów. Wyglądają jak tapety 4K na twoim telefonie (nawiasem mówiąc, wygenerowałem własną tapetę dla siebie za pomocą Lexica). Twórcy tej sieci najwyraźniej wydali z siebie wszystko i stworzyli interfejs przyjazny dla użytkownika. A ogromnym plusem jest możliwość tworzenia zdjęć różnych rozmiarów (również można zmienić orientację), ale one wciąż nie są popularne w mediach społecznościowych. To pierwszy serwis, który cieszy wynikiem, nawet pomyślałem, że wygenerowane obrazy można umieścić od razu, bez żadnych dodatkowych modyfikacji. Oczywiście, jak każda inna, Lexica nie radzi sobie z tekstem (ale lepiej niż inne, litery są gładsze, czasem rysowane są całe osobne słowa).
Dodatkowo Lexica pomoże w wygodny sposób znaleźć pomysł na obraz, ponieważ istnieje możliwość wyszukania stylu. W tym wypadku serwis zapewnia wiele różnych opcji na raz, podczas gdy większość serwisów zapewniają tylko 4 opcji. I jeszcze jeden znaczący plus – Lexica dobrze rysuje popularnych ludzi, można nawet zrobić wersję anime Harry’ego Pottera.

A tutaj postanowiłem pobawić się z Lexicą nad wizualizacją social media specjalisty. Na przykład, gdyby był nim Harry Potter. A drugim specjalistą miał być Lew Tołstoj.

Najbardziej użytecznym blokiem w Lexica jest możliwość wyboru opcji rozmiaru obrazu. Domyślnie obrazy są ustawione pionowo, ale można ustawić je jako kwadratowe. Dobra opcja dla mediów społecznościowych.

Dream by WOMBO
Dream by WOMBO jest przeznaczony wyłącznie do generowania treści dla sieci społecznościowych, o czym świadczą jego możliwości. Można wygenerować zdjęcie i wideo dla Tik Tok lub kwadratowy obraz dla posta na Instagramie, prostokątny obraz dla Twittera i innych sieci społecznościowych (16:9).
Ten serwis ma również aplikację mobilną dla iOS i Androida. Jest wygodny dla tych, którzy całą pracę wykonują przez telefon.
Nie kupiłem tej usługi i korzystałem z darmowej wersji, ponieważ nie chcę płacić za trochę bardziej zaawansowany DALL-E (moim zdaniem są to wyrzucone pieniądze). Gdyby generował obrazy jak Midjourney, to byłby to fantastyczny serwis.
Dla mnie osobiście to jest bezużyteczna zabawka za 10 dolców miesięcznie.

DreamStudio
Niezły i mało znany serwis, który ma elastyczne ustawienia generowania obrazów. Wygodnym jest wcześniejsze wybranie formatu obrazu. Jakość obrazu w dużym stopniu zależy od wymagań. Istnieją negatywne żądania do obrazu (na przykład usuń coś) i edytor obrazów (możesz usunąć niektóre szczegóły za pomocą gumki, AI je zastąpi). I właśnie możliwość dopracowania obrazów w ten sposób odróżnia DreamStudio od innych. Również są darmowe tokeny, które można wydać na testy. Dobra alternatywa Midjourney.

Wyniki i wnioski
W rezultacie wyróżniłbym 2 liderów: Midjourney oraz Lexica. Być może dodałbym DreamStudio do pierwszej trójki. Można używać AI do różnych postów i twórczości. Ale mi się wydaje, że dzisiaj jest to bardziej półprodukt, ponieważ treści natywne i wzięte z rzeczywistości wciąż lepiej przyciągają uwagę ludzi.
Dodatkowo niżej wygenerowałem obraz na jedną prośbę we wszystkich AI, aby móc je porównać. Prośba jest w pełni realna, tworzona dla jednej reklamy związanej z kryptowalutami. Postanowiłem wygenerować obraz postaci z gry Mario, która wybija monetę Bitcoin.
