V poslední době přibylo spoustu novinek v oblasti AI. Podíváme se na nejzajímavější aktuality ze světa umělé inteligence, které mě upoutaly.
Firefly Image 2
Firefly Image 2 představuje revoluční krok v generování obrázků za pomoci AI, nabízený firmou Adobe.
Tato inovace nabízí uživatelům vylepšený fotorealismus, pokročilé nástroje pro úpravu, flexibilitu a vytváření kvalitních vizuálů pro různé účely.
Generování obrázků pomocí AI od Adobe, co přináší:
- Větší fotorealismus a přesnější detaily (například držení předmětů v ruce).
- Možnost editace obrázků (hloubka ostrosti, zorné pole, atd.).
- Funkce přidání referenčního obrázku.
- Generování vektorové grafiky (SVG) a následná možnost úpravy.
- Tvorba mockupu (např. na tričko).
- Tvorba vizuálů (tisk, příspěvky, videa, atd.).
Canva Magic Studio
Canva přináší novinky z oblasti AI a na rozdíl od pluginu v chatGPT – Canva, tyto funkce vypadají opravdu užitečně.
- Možnost tvorby na základě promptu (prezentace, grafika, leták, atd.).
- Design ve formě příspěvků v různých formátech.
- Editace videa.
- Generování prezentací.
- Přidání animace.
- Převod např. prezentace na text, zachování velikostí a formátu.
- Tvorba obrázku či videa na základě popisu.
- Možnost rozšíření obrázku či změny formátu.
- Nahrazení vybraného objektu za jiný.
- Separace obrázku od pozadí a přesunutí.
- Tvorba textových promptů.
Dropbox
Dropbox představuje řadu novinek a inovací, které zahrnují kompletně přepracované webové rozhraní, pokročilé funkce založené na umělé inteligenci a nástroje pro tvorbu videí.
Uživatelé mohou očekávat jednodušší a přehlednější design, vylepšené náhledy souborů a efektivní nástroje pro vyhledávání a spolupráci.
Nové Webové Rozhraní:
- Čistější a celkově jednodušší vzhled.
- Nový akční panel pro rychlý přístup: nahrávání obrazovky, vytváření složek a nahrávání souborů.
- Vylepšené náhledy souborů pro snadnější úpravy obrázků, videí a PDF.
- Zjednodušená levá navigační lišta.
- Postupné zavádění, dostupné pro všechny uživatele v nadcházejících měsících.
- Srovnávací snímky starého oproti novému rozhraní.
Dash – AI:
- Nyní v otevřené betě.
- Popisováno jako „Google pro vaše osobní věci.“
- Pomáhá nalézt práci napříč různými aplikacemi a kartami v prohlížeči.
Dropbox AI:
- Umí shrnout a odpovědět na otázky o obsahu uživatele: videa, zvukové soubory, dokumenty.
- Rozšíření funkce: pokrývá vše v uživatelském účtu a poskytuje souhrnné shrnutí.
- Aktuálně v alfa verzi, postupné rozšiřování dostupnosti pro více uživatelů.
Dropbox Studio:
- Nástroj pro spolupráci určený tvůrcům videí.
- Navazuje na stávající funkce Capture a Replay.
- Kombinuje nástroje pro úpravy (s podporou AI), komentáře a publikování.
- Brzy bude v alfa verzi dostupný vybraným zákazníkům.
ChatGPT Vision (chatGPT-V)
ChatGPT Vision je rozšíření modelu ChatGPT, které bylo vyvinuto společností OpenAI, a umožňuje ChatGPT zpracovávat vizuální obsah.
Konkrétně to umožňuje uživatelům nahrávat a diskutovat o obrázcích v rámci chatovacího rozhraní, což rozšiřuje možnosti interakce s ChatGPT na nové, vizuální úrovni.
- Umožňuje zpracovat i obrázky.
- Nově přístupná i v Česku (tedy alespoň u mě a dle dalších ohlasů).
Příklady praktického využití:
- Kontrola úkolů dětí na základě obrázku.
- Odpověď ohledně výživy (stačí vyfotit obal s informacemi).
- Přepiš ručně psaných poznámek do digitální podoby.
- Zařízení interiéru dle fotky.
- Překlad obalů či cedulí z jiného jazyka.
- Vysvětlení diagramu, schématu, značky, atd.
- Rozeznání snímků a stanovení diagnózy na základě např. rentgenu.
Microsoft Autogen
Microsoft Autogen je inovativní framework, který usnadňuje orchestraci, automatizaci a optimalizaci složitých pracovních postupů založených na velkých jazykových modelech (LLM – Large Language Models).
Je to otevřená knihovna, která umožňuje vytváření aplikací s víceagenty, které spolu mohou konverzovat a spolupracovat na splnění úkolů.
Autogen poskytuje multi-agentní konverzační rámec jako vysokoúrovňovou abstrakci, který umožňuje uživatelům budovat pracovní postupy LLM s možností spolupráce mezi více agenty, výuky a personalizace
- Microsoft představil technologii, která by mohla zásadně změnit naše interakce s AI.
- Byl představen AutoGen, revoluční AI framework.
- AutoGen využívá mnoho AI agentů nebo instancí, které spolupracují, podobně jako koordinovaný tým chatbotů.
- Tento multi-agentní přístup přináší lepší schopnosti usuzování, dokončování úkolů a snižování chyb.
- Koncepce multi-agentního AI začíná získávat na popularitě v AI výzkumné komunitě.
- AutoGen je výsledkem spolupráce Microsoftu s institucemi jako Pennsylvania State University a University of Washington.
- Hlavním cílem AutoGen je zjednodušit složité pracovní postupy.
- AutoGen nabízí vývojářům možnost přizpůsobit agenty různým úkolům.
- Potenciální využití AutoGen je prakticky neomezené, od analýzy dat po tvorbu obsahu.
- Microsoft nabízí AutoGen pod licencí Creative Commons Attribution, což podporuje inovace.
- Uvolnění AutoGen zdůrazňuje rychlý vývoj technologií AI.
- Microsoftův AutoGen může zásadně změnit způsob, jakým využíváme AI, a udávat tón budoucím inovacím v oboru.
Co mě ještě zaujalo
- AI Copilot na analýzu dat – Kyligence.io.
- AI dabing a překlad hlasu do jiných jazyků – Elevenlabs.io.
- Zajímavý rozhovor s kmotrem AI o hrozbách i současné inteligenci chatbotů.
- Nová funkce Vertex AI Search může být kombinována s Med-PaLM 2, což umožňuje poskytovatelům najít odpovědi na lékařské otázky týkající se přímo pacientových lékařských záznamů – Zdroj.
- Konečně byla zpřístupněna funkce chatGPT Voice a můžete si jí vyzkoušet ve svém telefonu (stačí mít členství plus a aktivovat v Beta Features). Doporučuji mluvit dostatečně nahlas, spisovně a spíše v kratších úsecích. Může se vám totiž stát, že nerozezná Češtinu, nebo vás přeruší dříve, než dokončíte myšlenku.