Odvětví umělé inteligence (AI) se rychle mění a vyvíjí. Jsme svědky ohromujících pokroků a inovativních produktů, které posouvají hranice toho, co jsme považovali za možné.

Tento týden jsme dodali několik působivých a špičkových produktů, které mají způsobit revoluci v různých sektorech a zvýšit osobní produktivitu.

OpenAI oficiálně spustilo Vyhledávání na webu ChatGPT funkce, která dokáže rychle a v reálném čase získat výsledky vyhledávání s relevantními webovými odkazy. k dosažení této funkce již nepotřebujete používat další webová rozšíření nebo aplikace.

Všechny odpovědi na vyhledávání obsahují také citace zdrojů. ChatGPT také poskytne podrobnější odpovědi začleněním kontextu do vyhledávacích dotazů.

Stažením rozšíření prohlížeče Chrome lze navíc ChatGPT nastavit jako výchozí vyhledávač. Tímto způsobem jej budete moci používat rychle a přímo!

Jak používat Vyhledávání na webu ChatGPT funkce, pokud nejste předplatitelem ChatGPT Plus

OpenAI oznámilo, že ChatGPT Search je přístupné pouze uživatelům ChatGPT Plus a Team, kteří jej mohou okamžitě používat. Žádní platící uživatelé nemusí chvíli čekat.

OpenAI však plánuje v nadcházejících měsících zpřístupnit bezplatný přístup

Počkejte na zavedení: Pokud nejste placeným předplatitelem, musíte počkat, až OpenAI rozšíří funkci na bezplatné uživatele, což se očekává v nadcházejících měsících.

Přidejte se na čekací listinu: Pokud je k dispozici, zvažte připojení k libovolnému seznamu čekatelů, který může OpenAI poskytnout, pro časný přístup k funkcím, jako je vyhledávání ChatGPT.

Pravidelně kontrolujte: Sledujte oznámení od OpenAI týkající se aktualizací, kdy bude funkce vyhledávání dostupná pro bezplatné uživatele.

Jak ChatGPT zajišťuje přesnost výsledků vyhledávání na webu?

ChatGPT zajišťuje přesnost výsledků vyhledávání několika způsoby:

Načítání dat v reálném čase: Přistupuje k aktuálním informacím prostřednictvím vyhledávačů, shromažďuje obsah z renomovaných zdrojů a cituje je.

Výběrová kritéria: ChatGPT upřednostňuje relevantní, autoritativní a nedávné zdroje, aby odpovídaly uživatelským dotazům.
Upřesnění vyhledávání: Pokud chybí počáteční výsledky, zpřesní dotazy, aby zlepšila relevanci.
Uživatelská zpětná vazba: Přizpůsobuje se na základě uživatelských oprav pro zlepšení odezvy v průběhu času.

HeyGen spustil novou funkci pro vytváření digitálních lidí

HeyGen spustil novou funkci, která uživatelům umožňuje vytvářet digitální lidi pouze pomocí fotografií bez natáčení.

Můžete nahrát svou vlastní fotografii nebo zadat textovou výzvu a vygenerovat obrázek virtuální postavy, který lze použít k trénování vlastního AI video digitálního avatara.

Čím více referenčních obrázků postavy nahrajete, tím větší bude konzistence rysů obličeje ve vygenerovaných obrázcích.

Tito digitální lidé mají přirozené pohyby těla, přizpůsobitelné oblečení, pózy a zaměnitelné pozadí a můžete si vybrat pohlaví, věk a etnický původ.

Můžete upravit scénář, zvolit různé hlasy a emocionální výrazy a rychle vygenerovat video v krátkém čase.

Suno spustilo Personas

Suno spustila novou funkci s názvem Personas.

Umožňuje uživatelům uložit základní charakteristiky písně, jako jsou vokály, styl a atmosféra, které pak mohou být znovu použity v nových výtvorech.

Tato funkce je navržena tak, aby vám pomohla zachovat váš jedinečný hudební styl.

Jak vytvořit Personu: Vyberte skladbu, která se vám líbí, klikněte na „Vytvořit“ a poté vytvořte Personu. Přidat text a styl: Uživatelé mohou přidávat texty a styl stejně jako u běžných výtvorů.

Veřejné a soukromé nastavení: Můžete si vybrat, zda chcete nastavit Personu jako veřejnou nebo soukromou. Veřejné persony budou mít svou vlastní stránku, mohou je používat ostatní uživatelé a objeví se ve vaší knihovně a osobním profilu.

GitHub zavedl do GitHub Copilot více modelů umělé inteligence

GitHub oznámil, že do GitHub Copilot zavádí více modelů umělé inteligence, aby vylepšil možnosti vývojářů a možnosti přizpůsobení.

Mezi nové modely patří:

Sonet Claude 3.5
Gemini 1.5 Pro
o1-náhled a o1-mini

GitHub také spustil GitHub Spark, nástroj pro vytváření aplikací výhradně s přirozeným jazykem.

Nemusíte znát složité techniky nasazení, jako je konfigurace serverů nebo databází.

GitHub Spark automaticky dokončí všechna nastavení cloudu a alokaci zdrojů na pozadí, což i začátečníkům umožní vytvářet webové aplikace výhradně prostřednictvím přirozeného jazyka.

Jinými slovy, stačí mu říct, „co chcete dělat“, a poskytne vám funkční aplikaci, díky níž je proces jednoduchý jako konverzace.

Stability AI vydala model Stable Diffusion 3.5 Medium.

Je k dispozici zdarma pro komerční i nekomerční uživatele. S modelem s 2,5 miliardami parametrů je speciálně navržen pro spotřební hardware.

Model vyžaduje pouze 9,9 GB VRAM. Může běžet na většině standardních grafických karet se spotřebitelským hardwarem.

Dokáže generovat vysoce kvalitní obrázky ve více rozlišeních, které dosahují lepších výsledků než u jiných středně velkých modelů.

Podle analýzy Stability AI vede Stable Diffusion 3.5 Large na trhu v rychlém dodržování a konkuruje mnohem větším modelům v kvalitě obrazu.

Jak používat Stable Diffusion 3.5?

Postup instalace pro místní použití


Nyní si můžete stáhnout modely Stable Diffusion 3.5 Large a Stable Diffusion 3.5 Large Turbo z Objímání obličeje a inferenční kód zapnutý GitHub. A pak jej můžete spustit na počítači nebo jiném hardwaru.

Než jej budete moci spustit na počítači. Měli byste nastavit předpoklady a nainstalovat základní knihovny.

Zatímco instalujete požadované knihovny Pythonu, můžete spustit Stable Diffusion lokálně.

Online přístup

Pomocí ComfyUI

ComfyUI nabízí uživatelsky přívětivé rozhraní pro správu vašich pracovních postupů pomocí Stable Diffusion 3.5. Do rozhraní můžete přetáhnout různé soubory a snadno spouštět úlohy generování obrázků.

Použití prostoru pro objímání obličeje

Navštivte Hugging Face Spaces a spusťte modely Stable Diffusion přímo ve vašem prohlížeči bez požadavků na instalaci.

Pro více uživatelů bude mnoho aplikací a webů brzy integrovat nejnovější model Stable Diffusion 3.5 pro generování obrázků, takže zůstaňte naladěni na aktualizace!

Ultralight-Digital-Human: ultralehký digitální model člověka může běžet na mobilním telefonu

Ultralehký-Digitální-Lidský: ultralehký digitální model člověka, který podporuje provoz v reálném čase na mobilních zařízeních.

Algoritmus modelu je optimalizován tak, aby běžel hladce i na zařízeních s nízkou spotřebou.
K dokončení školení stačí pouze 3 až 5 minut videa.

Ujistěte se, že každý snímek videa má obnaženou celou tvář osoby a že zvuk je čistý bez jakéhokoli šumu. Vložte jej do nové složky.

Navíc díky optimalizovanému toku dat a procesům odvození může model zpracovávat vstupní data (jako je video a zvuk) v reálném čase, což umožňuje okamžité digitální lidské reakce.

The AI video platforma D-ID uvedla na trh nové digitální lidské nástroje


Video platforma AI D-ID uvedla na trh dvě novinky digitální lidské nástroje—Express a Premium+, speciálně navržené pro tvorbu obsahu, zaměřené na umožnění podnikům používat realističtější virtuální lidi v oblastech, jako je marketing, prodej a zákaznická podpora.

Virtuální člověk Express vyžaduje vygenerování pouze jedné minuty videotréninku a lze jej synchronizovat s pohyby hlavy uživatele.

Virtuální člověk Premium+ vyžaduje delší tréninkové video, ale může provádět pohyby rukou a trupu, čímž vytváří realističtější lidské interakce.

Tyto nástroje usnadňují vytváření virtuálních lidských videí, snižují obchodní náklady na marketing a nabízejí širší použitelnost.

Google Gemini API zavedlo „Search Anchoring“

Google spustil novou funkci „Google Search Anchoring“ ve svém Gemini API a Google AI Studio. je velmi pohodlné používat.

Tato funkce využívá data z Vyhledávání Google v reálném čase, aby uživatelům poskytovala přesnější a aktuálnější informace spolu s podpůrnými odkazy a návrhy vyhledávání, díky čemuž jsou odpovědi AI spolehlivější.

Využití nejnovějších zpravodajských dat získaných prostřednictvím vyhledávání snižuje dezinformace.
Vyhledávání v reálném čase načítá nejnovější informace, což umožňuje lepší odpovědi v určitých výsledcích vyhledávání.

V odpovědích jsou uvedeny odkazy na informační zdroje, které uživatelům usnadňují ověření věrohodnosti informací.

Claude pro stolní počítač

AntropickýAI vytvořil desktopovou aplikaci Claude! Nyní můžete být k dispozici pro Mac a Windows.

Jako váš Asistent AI, Claude vám může pomoci provést hlubší práci rychleji a kreativněji.

Nyní můžete Clauda používat na jakémkoli zařízení, konverzovat s Claudem a nechat Clauda, aby vám pomohl najít odpovědi na otázky a analyzovat obsah obrázků.

Claude se naučil rozumět tabulkám a grafům v PDF!


Anthropic zaváděl možnost posílat soubory Claude PDF v rozhraní Anthropic API.
S jejich novou beta podporou PDF můžete přímo zahrnout PDF do svého požadavku API. Čtení výzkumných prací je nyní jednodušší.

Nový model Claude 3.5 Sonnet nyní podporuje zadávání PDF a rozumí textovému i vizuálnímu obsahu v dokumentech.

Tuto funkci si můžete vyzkoušet v náhledu funkce.

Můžete se zeptat na jakékoli konkrétní otázky týkající se obsahu v PDF a Claude vám může odpovědět na vaše otázky na základě jeho schopnosti číst obrázky.

Jak funguje podpora PDF?

  • Systém převede každou stránku PDF na obrázek.
  • Systém získává lepší porozumění PDF pomocí analýzy textu a obrázků.
  • Ostatní funkce Claude lze používat současně.

Jak mohu povolit použití funkce Visual PDF v Claude

Chcete-li povolit funkci Visual PDF v Claude, postupujte takto:

  1. Otevřete Nastavení:
    Otevřete rozhraní Claude a vyhledejte ikonu baňky nebo nabídku nastavení.
  2. Povolit vizuální soubory PDF:
    Klikněte na ikonu baňky, přejděte na možnost Visual PDF a zapněte ji. To Claudeovi umožní zpracovávat a interpretovat obrázky a vizuální prvky v dokumentech PDF.
  3. Nahrajte svůj PDF:
    Jakmile je funkce povolena, můžete nahrát dokument PDF přetažením do okna chatu nebo pomocí tlačítka nahrát. je to velmi snadné a pohodlné.
  4. Komunikujte s Claudem:
    Po nahrání souborů PDF se můžete Claude zeptat na jakékoli otázky týkající se textu i obrázků obsažených v PDF, čímž se zlepší vaše interakce se složitými dokumenty. To vám pomůže číst dokumenty pohodlněji a zvýší vaši efektivitu!

Podobné příspěvky