chatgpt

OpenAI przedstawiło 4o Image Generation

OpenAI oficjalnie uruchomiło funkcję generowania obrazów w modelu GPT-4o, udostępniając ją bezpośrednio w ChatGPT.

Dzięki temu użytkownicy mogą tworzyć grafikę bez potrzeby korzystania z oddzielnych narzędzi czy aplikacji. To rozwiązanie, które pozwala nie tylko pisać, ale też ilustrować swoje pomysły, bazując na opisach słownych lub zdjęciach przesyłanych w czasie rzeczywistym.

W przeciwieństwie do wcześniejszych wersji, w których obrazy generowano z zewnętrznych modeli graficznych, GPT-4o pozwala tworzyć je natywnie. Obraz powstaje jako naturalna część rozmowy, co znacznie upraszcza proces i pozwala na pełną integrację tekstu z grafiką. Nowość jest dostępna dla użytkowników planów Pro i Plus, a w niedalekiej przyszłości ma trafić również do wersji bezpłatnej oraz API.

Twórcy rozwiązania podkreślają, że model łączy dane tekstowe, obrazy i dźwięk w jednym systemie, dzięki czemu potrafi analizować informacje z różnych źródeł jednocześnie. W praktyce oznacza to, że użytkownik może wysłać zdjęcie, opisać, co chce zmienić, a model wygeneruje obraz zgodnie z tymi instrukcjami. Przykładowo, wystarczy jedno zdjęcie, by uzyskać jego wersję w stylu anime, a cały proces odbywa się bez opuszczania czatu.

OpenAI przedstawiło 4o Image Generation ciekawostki tworzenie obrazów, sztuczna inteligencja, OpenAI, obraz z tekstu, obraz z promptu, multimodalność, model GPT, grafika AI, GPT-4o, generowanie obrazów, ChatGPT grafika, ChatGPT, AI obrazy, AI dla grafików OpenAI oficjalnie uruchomiło funkcję generowania obrazów w modelu GPT-4o, udostępniając ją bezpośrednio w ChatGPT. open 1

Wersja demonstracyjna, którą możecie zobaczyć poniżej pokazała, że model potrafi wygenerować ilustrację zawierającą wyraźny, poprawny tekst — coś, z czym wiele narzędzi wcześniej miało problemy. Tekst nie zawiera przypadkowych znaków, jest umieszczony dokładnie tam, gdzie trzeba, i ma odpowiednią czcionkę. To szczególnie przydatne przy tworzeniu grafik promocyjnych, edukacyjnych czy materiałów do druku.

Co ciekawe, GPT-4o radzi sobie także z obrazami o charakterze humorystycznym. Twórcy pokazali, jak model generuje memy, potrafiąc zrozumieć żart, kontekst kulturowy i popularne odniesienia z internetu. To potwierdza, że funkcja sprawdzi się zarówno w zadaniach profesjonalnych, jak i w codziennym użytku.

Podczas prezentacji pokazano kilka przykładów zastosowania. Jednym z nich była karta kolekcjonerska, w której zdjęcie psa zostało zamienione na stylizowaną grafikę z opisem, statystykami i nazwą modelu. Innym razem przygotowano ilustrację przedstawiającą teorię względności w stylu mangi z dodatkiem humorystycznych elementów. Wszystko wygenerowano na podstawie krótkiego opisu i zdjęć.

Użytkownik ma pełną kontrolę nad tym, co zostanie wygenerowane. Może wskazać styl, kolorystykę, format, a także dokładne elementy, które powinny znaleźć się na obrazie. W razie potrzeby możliwe są edycje — wystarczy wpisać kolejne polecenie i model dostosuje grafikę, zachowując jej dotychczasowy charakter. Właśnie to sprawia, że narzędzie sprawdza się w pracy nad projektami graficznymi, gdzie istotna jest spójność i możliwość szybkiej modyfikacji.

Interfejs został zaprojektowany tak, by korzystanie z funkcji nie wymagało doświadczenia graficznego. Wystarczy umiejętność opisania pomysłu, a resztą zajmie się model. Dzięki temu z narzędzia mogą korzystać osoby, które nie mają dostępu do specjalistycznych programów, ale chcą tworzyć ilustracje do prezentacji, treści marketingowych, postów w mediach społecznościowych czy materiałów edukacyjnych.

GPT-4o oferuje również funkcję edytowania już wygenerowanych obrazów. Można zmienić tło na przezroczyste, dodać nowe elementy, zmodyfikować tekst lub dopasować styl. Model potrafi zachować spójność pomiędzy kolejnymi wersjami, dzięki czemu efekt końcowy wygląda naturalnie i profesjonalnie.

Dzięki możliwości przetwarzania wielu informacji jednocześnie, model nie tylko generuje grafikę, ale rozumie jej sens i kontekst. Takie połączenie analizy językowej z wizualną może znaleźć zastosowanie w marketingu, edukacji, tworzeniu treści cyfrowych czy projektowaniu produktów.

Nowa funkcja generowania obrazów w GPT-4o jest już dostępna w ChatGPT i Sora. Twórcy zapowiadają, że niedługo trafi także do szerszego grona odbiorców przez API. To narzędzie, które pozwala użytkownikom z różnych branż tworzyć treści wizualne szybciej i wygodniej niż kiedykolwiek wcześniej.

Udostępnij
Facebook
Twitter
E-Mail
Dołącz do nas
Czytaj również
youtube

YouTube testuje timer do kontroli Shorts

Więc tak, YouTube – to niekończące się źródło krótkich, pulsujących dopaminą filmików, których miałeś obejrzeć tylko dwa, a nagle jesteś trzy godziny później, z jednym okiem suchym jak pustynia i mózgiem przegrzanym jak laptop w łóżku.

Więcej »
Polecamy
Scroll to Top