Open AI nie dało Google nacieszyć się mocną pozycją w dziedzinie AI nawet przez jeden dzień. Dowiedz się, czym jest Sora, przełomowe narzędzie mające potencjał do zrewolucjonizowania branży tworzenia treści wideo.
Kilka dni temu Google ponownie przyciągnął uwagę osób interesujących się sztuczną inteligencją, ogłaszając Gemini 1.5 zaledwie tydzień po udostępnieniu potężnego modelu Gemini 1.0 Ultra i zmianie nazwy chatbota Bard na Gemini.
Jednak Open AI nie dało Google nacieszyć się mocną pozycją w dziedzinie AI nawet przez jeden dzień. Twórcy ChataGPT ujawnili jeszcze bardziej ekscytujące rozwiązanie. Sora, generator wideo, który potrafi stworzyć niemal minutowe wideo na podstawie tekstowych wskazówek. Sora OpenAI zapowiada się jako przełomowe narzędzie mające potencjał do zrewolucjonizowania branży tworzenia treści wideo. Jednak to, co czyni Sorę wyjątkową, to nie tylko jej zdolności techniczne, ale także szeroki zakres potencjalnych zastosowań – od marketingu, przez edukację, po przemysł rozrywkowy i codzienną komunikację. Przyjrzyjmy się, jak Sora zamierza wprowadzić te zmiany i jakie perspektywy otwiera przed biznesem.
Od czasów pierwszych, nieporadnych prób tworzenia wideo za pomocą komputerów, przeszliśmy długą drogę. Już teraz widać, że filmy tworzone przez generatywną sztuczną inteligencję, nawet te sprzed pół roku, wyglądają przy generacjach Sory dość niezgrabnie. Chociaż Sora OpenAI, zdolna do tworzenia realistycznych scen wideo na podstawie instrukcji tekstowych, jest na razie w fazie eksperymentalnej i nie jest jeszcze dostępna dla publiczności, jej możliwości są oszałamiające.
Sora OpenAI oferuje szeroki wachlarz zastosowań, które mogą zmienić sposób, w jaki tworzymy i konsumujemy treści wideo. Oto kilka przykładów:
Przykłady te świadczą o ogromnym postępie w dziedzinie AI. Jednak przede wszystkim otwiera to nam drzwi do nowych możliwości w tworzeniu treści wideo. Aby się o tym przekonać, wystarczy spojrzeć na prezentację filmu w wysokiej rozdzielczości przedstawiającego rozwijający się kwiat.
Źródło: OpenAI (https://cdn.openai.com/sora/videos/flower-bloom”ing.mp4 lub https://youtu.be/UNmqxZoTgsk)
Czy Sora OpenAI to tylko zabawka i kolejne narzędzie do tworzenia treści wideo? Nie. Przynajmniej według OpenAI. Jak piszą twórcy Sory:
„Uczymy sztuczną inteligencję rozumienia i symulowania świata fizycznego w ruchu, a celem jest szkolenie modeli, które pomagają ludziom rozwiązywać problemy wymagające interakcji ze światem rzeczywistym”.
Aby trafnie generować wideo, model musi bowiem rozumieć świat na znacznie głębszym poziomie, niż wymaga tego tworzenie tekstu. Chodzi o rozumienie fizyki, przestrzennych zależności między obiektami znajdującymi się na jednym planie, a także relacji między pierwszym planem a tłem.
Sora będzie w stanie generować:
W przyszłości Sora może znaleźć zastosowanie w tworzeniu filmów promocyjnych, treści na media społecznościowe czy prezentacji biznesowych. To narzędzie, które może całkowicie zmienić sposób, w jaki tworzymy i dzielimy się treściami wideo.
Źródło: OpenAI (https://cdn.openai.com/sora/videos/aquarium-nyc.mp4 lub https://youtu.be/3l8wjxjNubE)
Chociaż ten kolosalny krok w rozwoju generatywnej sztucznej inteligencji jest ekscytujący, rodzi również obawy dotyczące ryzyka związanego z deep fake, szczególnie w związku z wyborami prezydenckimi w USA. Zagrożenia związane z używaniem Sory to przede wszystkim:
Połączenie technologii deepfake z klonowaniem głosu opartym na sztucznej inteligencji może niestety sprawić, że powstanie wiele bardzo przekonujących podróbek. W miarę jak zbliżamy się do momentu, w którym odróżnienie podróbki od rzeczywistego nagrania stanie się niezwykle trudne, czujność, świadomość i krytyczne myślenie mają coraz bardziej kluczowe znaczenie w zwalczaniu potencjalnych szkód powodowanych przez deepfake.
Dlatego, chociaż możliwości Sory są imponujące, musimy zachować ostrożność co do ich wpływu na społeczeństwo, stworzyć regulacje i podjąć dodatkowe kroki w celu minimalizacji ich negatywnych konsekwencji.
Chociaż na chwilę obecną Sora jest w fazie testów i nie jest dostępna dla szerszego grona użytkowników, korzystanie z niej zapowiada się jako proces prosty i intuicyjny. Użytkownicy będą prawdopodobnie mogli używać jej tak, jak teraz korzystają z DALL·E 3 w ChatGPT Plus. Czyli wpisywać tekstowe polecenia, które Sora przekształci w krótkie klipy wideo. To otwiera nowe perspektywy dla twórców treści, marketerów i edukatorów, umożliwiając im tworzenie angażujących i wysokiej jakości materiałów wideo w krótkim czasie.
Jak jednak wygląda porównanie Sora do innych narzędzi generujących video? Na razie możemy tylko domyślać się, jak będzie radzić sobie Sora OpenAI, jednak bazując na opisie narzędzia dostępnym na stronie OpenAI możemy powiedzieć, że w porównaniu z:
Sora OpenAI wyróżnia się na tle innych narzędzi do generowania wideo większym realizmem i trudnością odróżnienia jej rezultatów od prawdziwych nagrań. Ważna jest tutaj przede wszystkim rozdzielczość. Sora potrafi bowiem tworzyć filmy o rozdzielczości do 1920x1080px.
Model ten, dzięki głębokiemu zrozumieniu języka, precyzyjnie interpretuje polecenia. Open AI wykorzystało tutaj sposób działania sprawdzony w DALL·E 3. Model najpierw interpretuje prosty prompt wpisany przez użytkownika, a następnie na podstawie jego rozbudowanej i szczegółowej wersji generuje treści wizualne. Dzięki temu może tworzyć złożone sceny i generować postaci wyrażające autentyczne emocje.
Źródło: OpenAI (https://cdn.openai.com/sora/videos/closeup-man-in-glasses.mp4 Lub https://youtu.be/pxkfUDoQg5I)
Potencjał Sory do zmiany branży kreatywnej jest ogromny. Dostęp do tego narzędzia dla filmowców i projektantów wnosi nową jakość do tworzenia treści wideo. Sora służy jako fundament dla modeli zdolnych do symulowania świata rzeczywistego, co może być przełomem w osiągnięciu AGI (Artificial General Intelligence – Sztucznej Inteligencji Ogólnej). Tak przynajmniej twierdzą jej twórcy – OpenAI.
Ponieważ Sora OpenAI tworzy realistyczne ruchome obrazy, podobne do tych sfilmowanych ludzką ręką, może potencjalnie poważnie zmienić dziedzinę tworzenia wideo, od materiałów szkoleniowych po produkcje hollywoodzkie. Sora z pewnością wpłynie na:
Źródło: DALL·E 3, prompt: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)
Wykorzystanie AI w produkcji wideo oferuje firmom szereg korzyści, takich jak oszczędność czasu i środków, powtarzalna jakość wyników, czy zwiększenie wartości końcowej produkcji. OpenAI podejmuje kroki w kierunku zapewnienia bezpieczeństwa Sory, w tym współpracę z zespołami przeprowadzającymi testy antyadwersyjne oraz rozwijanie klasyfikatora do wykrywania wideo AI.
Sora od OpenAI otwiera przed nami nowe możliwości w tworzeniu i konsumpcji treści wideo. Od rewolucji w branży kreatywnej, przez zmiany w marketingu i edukacji, po wpływ na codzienną komunikację – potencjał jest ogromny. Jako narzędzie, które może całkowicie zmienić zasady gry, Sora zasługuje na szczególną uwagę. Wyczekujemy dalszych informacji od OpenAI, a zwłaszcza na temat tego, kiedy Sora stanie się dostępna dla szerszej publiczności. To początek nowej ery w tworzeniu treści wideo. Kolejny krok to jej integracja z tworzeniem dźwięku, głosu oraz modeli trójwymiarowych, które otworzą szeroko drzwi dometaverse.
Zachęcamy do komentowania naszych artykułów. Wyraź swoje zdanie i włącz się w dyskusje z innymi czytelnikami. Na indywidualne pytania (z zakresu podatków i księgowości) użytkowników ifirma.pl odpowiadamy przez e-mail, czat lub telefon – skontaktuj się z nami.
Administratorem Twoich danych osobowych jest IFIRMA S.A. z siedzibą we Wrocławiu. Dodając komentarz na blogu, przekazujesz nam swoje dane: imię i nazwisko, adres e-mail oraz treść komentarza. W systemie odnotowywany jest także adres IP, z wykorzystaniem którego dodałeś komentarz. Dane zostają zapisane w bazie systemu WordPress. Twoje dane są przetwarzane na podstawie Twojej zgody, wynikającej z dodania komentarza. Dane są przetwarzane w celu opublikowania komentarza na blogu, jak również w celu obrony lub dochodzenia roszczeń. Dane w bazie systemu WordPress są w niej przechowywane przez okres funkcjonowania bloga. O szczegółach przetwarzania danych przez IFIRMA S.A dowiesz się ze strony polityki prywatności serwisu ifirma.pl.
Z Biurem Rachunkowym i aplikacją IFIRMA masz wszystko pod kontrolą i w jednym narzędziu!