Nya röst- och bildfunktioner
OpenAI börjar rulla ut nya röst- och bildfunktioner i ChatGPT. Dessa uppdateringar erbjuder en mer intuitiv användarupplevelse genom att möjliggöra röstkonversationer och bilddelning med ChatGPT. Användare kan nu ha en dialog med assistenten via tal eller visa bilder för att få hjälp med olika uppgifter.
Praktiska användningsområden
De nya funktionerna ger fler sätt att integrera ChatGPT i vardagen. Under resor kan du ta en bild av ett landmärke och diskutera dess intressanta detaljer med ChatGPT. Hemma kan du fotografera ditt kylskåp för att få idéer till middagen och be om steg-för-steg-recept. Efter middagen kan du hjälpa ditt barn med matteproblem genom att ta en bild av uppgiften och få ledtrådar för att lösa den tillsammans.
Tillgänglighet och lansering
Röst- och bildfunktionerna kommer att rullas ut till Plus- och Enterprise-användare under de kommande två veckorna. Röstfunktionen blir tillgänglig på både iOS och Android som en valfri inställning, medan bildfunktionerna finns tillgängliga på alla plattformar. Användare kan aktivera röstkonversationer via inställningarna i mobilappen och välja mellan fem olika röster.
Tekniken bakom funktionerna
Den nya röstteknologin drivs av en avancerad text-till-tal-modell som kan generera mänskligt liknande ljud från text och några sekunder av talprov. OpenAI har samarbetat med professionella röstskådespelare för att skapa varje röst. För röstigenkänning används Whisper, OpenAIs öppna taligenkänningssystem, som transkriberar tal till text.
Säkerhet och ansvar
OpenAI prioriterar säkerhet och ansvar vid lanseringen av dessa nya funktioner. Röstteknologin kan användas kreativt och för tillgänglighet, men det finns även risker som att illvilliga aktörer kan använda teknologin för att imitera offentliga personer eller begå bedrägerier. Därför används teknologin initialt endast för röstchatt med röster skapade i samarbete med röstskådespelare. Bildigenkänning genomförs med multimodala modeller som GPT-3.5 och GPT-4, och omfattande tester har gjorts för att säkerställa ansvarsfull användning.
Framtida expansion
Efter de inledande användargrupperna planerar OpenAI att expandera tillgången till röst- och bildfunktionerna till fler användarsegment, inklusive utvecklare, inom kort. Målet är att successivt introducera verktygen för att möjliggöra kontinuerliga förbättringar och riskhantering samtidigt som användarnas behov möts.
Framtiden för ChatGPT
Med introduktionen av röst- och bildfunktionerna fortsätter ChatGPT att utvecklas som en alltmer integrerad del av användarnas digitala liv. OpenAI strävar efter att kontinuerligt förbättra och utöka ChatGPT:s kapabiliteter, vilket kommer att göra det möjligt för användare att interagera på ännu mer naturliga och mångsidiga sätt. Denna utveckling understryker OpenAIs engagemang för att göra artificiell intelligens tillgänglig och användbar i en mängd olika sammanhang.