V poslední době řeším čím dál více případů použití AI nástrojů ve firemní praxi a zejména pak různé LLM v čele s chatGPT. Rád ovšem řeším AI nejen v práci, ale také sleduju posun ve 3 oblastech, které mě velmi zajímají. Jedná se o video, muziku a 3D modely. V těchto oblastech zaznamenala AI za poslední cca 3 měsíce neskutečný posun.
Není čas ztrácet čas, pojďme tedy rovnou na konkrétní příklady použití, které mě zaujaly a hned jsem je vyzkoušel.
AI Video
V této oblasti jsem zaznamenal dva hlavní aktéry a to jsou Stability AI se svým SVD a Runway se svým Run To Video. Zatím jsem měl možnost vyzkoušet jen to druhé.
Nástroj Motion Brush umí rozpohybovat statickou fotku díky motion efektu.
Původní obrázky z Midjourney
Motion efekt
AI Hudba
Další oblastí je hudba, která mě také velmi zajímá. Existuje více služeb, ale aktuálně jsem narazil na Suno AI, kde můžete vložit vlastní text i styl hudby a následně se vám vygeneruje (zatím bohužel jenom) 80 s audio.
Postupoval jsem tak, že jsem si nejprve vytvořil hrubý text v češtině, který jsem následně nechal přepsat ChatGPT do angličtiny a upravený text jsem následně vložil na vygenerování do aplikace.
Zde je ukázka dvou různých stylů:
Zde jsem nechal automaticky vygenerovat náhodný text:
A zde jsem již použil vlastní text:
A ještě něco trochu více metalového. Zde si myslím, že má AI zatím mezery a zřejmě to bude tím, že nebyla trénována na dostatečně velkých datech. Časem se to snad zlepší.
3D Modely
Na tuto oblast jsem s nadšením čekal (už jen z toho důvodu, že se dlouhodobě věnuji 3D tisku) a po pravdě jsem ani moc nečekal, že uvidíme v blízké době nějaké uspokojivé výsledky.
Když jsem si však přečetl, že Midjourney chystá brzo generovat 3D modely, velice mě to zaujalo.
Midjourney však zatím zůstává jen u obrázků a mezi tím se mu rodí konkurence. Jedna z nich mě velmi zaujala a to je Luma AI a jejich Genie běžící (stejně jako MJ) na Discortu.
Fascinuje mě, jak velký pokrok udělali za pouhý měsíc (z toho co aspoň sleduji).
Ukázky 3D modelů
Zkoušel jsem i použít model pro 3D tisk, ale tam bohužel nevidím zatím dost vysokou kvalitu.
Ve všech uvedených oblastech samozřejmě pořád vidím velké nedostatky a nedokonalosti. Video vlastně není zatím plnohodnotným videm, ale jen 4s hýbající se část obrázku, hudba je dost často falešná a 3D modely nejsou dost ostré či vhodné k tisku, přesto však zůstávám fascinován.
Když si uvědomíme, že ještě nedávno nebylo nic podobného vůbec možné vygenerovat a jak rychle jde aktuálně vývoj AI, tak si myslím, že se brzo dočkáme velmi působivých výsledků srovnatelných s profesionální lidskou prací a a možná jí časem i v mnohem předčí. „Sky is the limit.“