Branschen för artificiell intelligens (AI) förändras och utvecklas snabbt. Vi bevittnar några fantastiska framsteg och innovativa produkter som tänjer på gränserna för vad vi trodde var möjligt.

Vi har levererat några imponerande och banbrytande produkter som kommer att revolutionera olika sektorer och öka den personliga produktiviteten den här veckan.

OpenAI har officiellt lanserat ChatGPT webbsökning funktion, som snabbt och i realtid kan hämta sökresultat med relevanta webblänkar. du behöver inte längre använda andra webbtillägg eller appar för att uppnå den här funktionen.

Alla söksvar inkluderar även källhänvisningar. ChatGPT kommer också att ge mer djupgående svar genom att integrera sammanhang i sökfrågor.

Dessutom, genom att ladda ner Chrome-webbläsartillägget, kan ChatGPT ställas in som standardsökmotor. På så sätt kommer du att kunna använda den snabbt och direkt!

Hur man använder ChatGPT webbsökning funktion om du inte är en ChatGPT Plus-prenumerant

OpenAI har meddelat att ChatGPT Search endast är tillgängligt för ChatGPT Plus och Team-användare, som kan använda det omedelbart. Inga betalda användare behöver vänta ett tag.

Men OpenAI planerar att rulla ut tillgång till gratisanvändare under de kommande månaderna

Vänta på utrullning: Om du inte är en betalprenumerant måste du vänta på att OpenAI utökar funktionen till gratisanvändare, vilket förväntas under de kommande månaderna.

Gå med i väntelistan: Om det är tillgängligt, överväg att gå med på någon väntelista som OpenAI kan tillhandahålla för tidig åtkomst till funktioner som ChatGPT Search.

Kontrollera regelbundet: Håll ett öga på meddelanden från OpenAI angående uppdateringar om när sökfunktionen kommer att vara tillgänglig för gratisanvändare.

Hur säkerställer ChatGPT att dess sökresultat på webben är korrekta?

ChatGPT säkerställer noggrannheten i sina sökresultat genom flera metoder:

Datahämtning i realtid: Den får tillgång till aktuell information via sökmotorer, samlar in innehåll från välrenommerade källor och citerar dem.

Urvalskriterier: ChatGPT prioriterar relevanta, auktoritativa och senaste källor för att matcha användarfrågor.
Sökförfining: Om initiala resultat saknas, förfinar det frågor för att förbättra relevansen.
Användarfeedback: Den anpassar sig baserat på användarkorrigeringar för att förbättra svaren över tid.

HeyGen lanserade en ny funktion för att skapa digitala människor

HeyGen har lanserat en ny funktion som låter användare skapa digitala människor med enbart foton utan att filma.

Du kan ladda upp ditt eget foto eller ange en textuppmaning för att generera en virtuell karaktärsbild, som kan användas för att träna din egen AI-video digitala avatar.

Ju fler referensbilder du laddar upp av karaktären, desto större konsekvens blir ansiktsdragen i de genererade bilderna.

Dessa digitala människor har naturliga kroppsrörelser, anpassningsbara kläder, poser och utbytbara bakgrunder, och du kan välja kön, ålder och etnicitet.

Du kan redigera manuset, välja olika röster och känslomässiga uttryck och snabbt generera videon på kort tid.

Suno har lanserat Personas

Suno har lanserat en ny funktion som heter Personas.

Det tillåter användare att spara kärnegenskaperna hos en låt, såsom sång, stil och atmosfär, som sedan kan återanvändas i nya skapelser.

Den här funktionen är utformad för att hjälpa dig att behålla din unika musikstil.

Så här skapar du en persona: Välj en låt du gillar, klicka på "Skapa" och skapa sedan en persona. Lägg till texter och stil: Användare kan lägga till texter och stil precis som i vanliga skapelser.

Offentliga och privata inställningar: Du kan välja att ställa in en Persona som offentlig eller privat. Public Personas kommer att ha en egen sida, kan användas av andra användare och kommer att visas i ditt bibliotek och din personliga profil.

GitHub introducerade fler AI-modeller i GitHub Copilot

GitHub meddelade att det kommer att introducera fler AI-modeller i GitHub Copilot för att förbättra utvecklarnas alternativ och anpassningsmöjligheter.

De nya modellerna inkluderar:

Claude 3.5 sonett
Gemini 1.5 Pro
o1-förhandsvisning och o1-mini

GitHub har också lanserat GitHub Spark, ett verktyg för att bygga applikationer helt med naturligt språk.

Du behöver inte känna till komplexa distributionstekniker som att konfigurera servrar eller databaser.

GitHub Spark kommer automatiskt att slutföra alla molninställningar och resursallokering i bakgrunden, vilket gör att även nybörjare kan skapa webbapplikationer helt och hållet genom naturligt språk.

Med andra ord behöver du bara berätta "vad du vill göra", och det kommer att förse dig med en funktionell app, vilket gör processen lika enkel som en konversation.

Stability AI har släppt modellen Stable Diffusion 3.5 Medium.

Den är tillgänglig gratis för både kommersiella och icke-kommersiella användare. Med en modell på 2,5 miljarder parametrar är den speciellt designad för konsumenthårdvara.

Modellen kräver endast 9,9 GB VRAM. Det kan köras på de flesta vanliga grafikkort med konsumenthårdvara.

Den kan generera högkvalitativa bilder i flera upplösningar, vilket ger resultat som är överlägsna andra medelstora modeller.

Enligt Stability AI-analys leder Stable Diffusion 3.5 Large marknaden i omedelbar efterlevnad och konkurrerar med mycket större modeller i bildkvalitet.

Hur använder man Stable Diffusion 3.5?

Installationssteg för lokal användning


Nu kan du ladda ner modellerna Stable Diffusion 3.5 Large och Stable Diffusion 3.5 Large Turbo från Kramar ansikte och slutledningskoden på GitHub. Och sedan kan du köra det på din dator eller annan hårdvara.

Innan du kan köra den på datorn. Du bör ställa in förutsättningarna och installera viktiga bibliotek.

Medan du installerar Required Python Libraries kan du köra Stable Diffusion lokalt.

Tillgång online

Använder ComfyUI

ComfyUI erbjuder ett användarvänligt gränssnitt för att hantera dina arbetsflöden med Stable Diffusion 3.5. Du kan dra olika filer till gränssnittet och köra bildgenereringsuppgifter enkelt.

Använda Hugging Face Spaces

Besök Hugging Face Spaces för att köra Stable Diffusion-modeller direkt i din webbläsare utan installationskrav.

För fler användare kommer många appar och webbplatser snart att integrera den senaste Stable Diffusion 3.5-modellen för bildgenerering, så håll utkik efter uppdateringar!

Ultralätt-Digital-Human: en ultralätt digital mänsklig modell kan köras på en mobiltelefon

Ultralätt-Digital-Human: en ultralätt digital mänsklig modell som stöder realtidsdrift på mobila enheter.

Modellens algoritm är optimerad för att fungera smidigt, även på enheter med låg effekt.
Endast 3 till 5 minuters video behövs för att slutföra utbildningen.

Se till att varje bildruta i videon har personens hela ansikte exponerat och att ljudet är klart utan brus. Lägg den i en ny mapp.

Dessutom, genom optimerade dataflöden och slutledningsprocesser, kan modellen bearbeta indata (som video och ljud) i realtid, vilket möjliggör omedelbara digitala mänskliga svar.

De AI-videoplattform D-ID lanserade nya digitala mänskliga verktyg


AI-videoplattformen D-ID har lanserat två nya digitala mänskliga verktyg—Express och Premium+, speciellt designade för att skapa innehåll, som syftar till att göra det möjligt för företag att använda mer realistiska virtuella människor inom områden som marknadsföring, försäljning och kundsupport.

Express-virtuella människan kräver bara en minuts videoträning för att genereras och kan synkroniseras med användarens huvudrörelser.

Premium+ virtuella människan kräver en längre träningsvideo men kan utföra hand- och bålrörelser, vilket skapar mer realistiska mänskliga interaktioner.

Dessa verktyg gör det enklare att generera virtuella mänskliga videor, minskar företagets kostnader för marknadsföring och erbjuder en bredare tillämpning.

Google Gemini API har introducerat "Search Anchoring"

Google lanserade den nya funktionen "Google Search Anchoring" i Gemini API och Google AI Studio. det är väldigt bekvämt att använda.

Den här funktionen utnyttjar realtidsdata från Google Sök för att ge användarna mer exakt och uppdaterad information, tillsammans med stödjande länkar och sökförslag, vilket gör AI-svar mer tillförlitliga.

Att använda de senaste nyheterna som erhållits genom sökningar minskar felaktig information.
Realtidssökning hämtar den senaste informationen, vilket möjliggör bättre svar i vissa sökresultat.

Länkar till informationskällor finns med i svaren, vilket gör det lättare för användare att verifiera informationens trovärdighet.

Claude för skrivbordet

AntropiskAI har byggt en Claude skrivbordsapp! Nu kan du vara tillgänglig på Mac och Windows.

Som din AI-assistentClaude kan hjälpa dig att utföra djupare arbete snabbare och mer kreativt.

Du kan nu använda Claude på vilken enhet som helst, prata med Claude och låta Claude hjälpa dig att hitta svar på frågor och analysera innehållet i bilder.

Claude har lärt sig att förstå diagram och grafer i PDF-filer!


The Anthropic rullade ut möjligheten att skicka Claude PDF-filer i Anthropic API.
Med deras nya PDF-stödbeta kan du direkt inkludera en PDF i din API-förfrågan. Nu är det lättare att läsa forskningsrapporter.

Den nya Claude 3.5 Sonnet-modellen stöder nu PDF-inmatning och förstår både text och visuellt innehåll i dokument.

Du kan uppleva den här funktionen i förhandsgranskningen.

Du kan ställa vilka specifika frågor du vill om innehållet i PDF:en, och Claude kan svara på dina frågor baserat på dess bildläsningsförmåga.

Hur fungerar PDF-stöd?

  • Systemet konverterar varje sida i PDF-filen till en bild.
  • Systemet får en bättre förståelse av PDF:en genom att analysera text och bilder.
  • Andra Claude-funktioner kan användas samtidigt.

Hur kan jag aktivera funktionen Visual PDF i Claude

Följ dessa steg för att aktivera funktionen Visual PDFs i Claude:

  1. Öppna inställningarna:
    Öppna Claude-gränssnittet och leta efter en kolvikon eller en inställningsmeny.
  2. Aktivera visuella PDF-filer:
    Klicka på kolvikonen, navigera till alternativet Visual PDFs och slå på det. Detta kommer att tillåta Claude att bearbeta och tolka bilder och visuella element i PDF-dokument.
  3. Ladda upp din PDF:
    När funktionen är aktiverad kan du ladda upp ett PDF-dokument genom att dra det till chattfönstret eller använda uppladdningsknappen. det är väldigt enkelt och bekvämt.
  4. Interagera med Claude:
    Efter att ha laddat upp PDF-filerna kan du ställa alla frågor till Claude om både texten och bilderna i PDF-filen, vilket förbättrar din interaktion med komplexa dokument. Detta kommer att hjälpa dig att läsa dokument mer bekvämt och öka din effektivitet!

Liknande inlägg