OpenAI, twórca ChatGPT, planuje wprowadzić osiem nowych głosów do swojego chatbota. W sieci pojawiło się nawet nagranie na którym można usłyszeć jak brzmią.
Nowe głosy mają nosić nazwy: Fathom, Maple, Glimmer, Orbit, Harp, Vale, Ridge, Rainbow i Reef. Powiększenie liczby dostępnych głosów do dwunastu ma umożliwić użytkownikom większą personalizację interakcji z chatbotem. OpenAI dąży do tego, by rozmowy z ChatGPT były coraz bardziej realistyczne i kontekstowe.
Planowane nowe głosy mają cechować się wyższym poziomem naturalności niż obecne opcje. OpenAI koncentruje się na udoskonaleniu zdolności chatbota do interpretowania i generowania dźwięków niewerbalnych. To ma przyczynić się do jeszcze bardziej realistycznych konwersacji. Wśród zapowiadanych ulepszeń znajduje się możliwość naśladowania odgłosów zwierząt, na przykład szczekania psa.
Interesującą nowością ma być zdolność nowych głosów do dostosowywania intonacji i akcentu w zależności od formatowania tekstu. Oznacza to, że chatbot będzie mógł zmieniać sposób wypowiedzi, na przykład kładąc większy nacisk na słowa wyróżnione pogrubieniem lub podkreśleniem. Ta funkcja może zwiększyć ekspresyjność i czytelność przekazu generowanego przez AI.
Preview of the new ChatGPT voices (animal sounds)
h/t to @stevelizcano https://t.co/hkT7wMU4VF pic.twitter.com/5Tre8eeKqw
— Tibor Blaho (@btibor91) September 1, 2024
Obecnie informacje o nowych głosach pochodzą głównie z analizy inżynierii wstecznej. OpenAI nie potwierdziło ich oficjalnie. Nie podano też konkretnego terminu wprowadzenia tych funkcji do publicznego użytku. Sama idea rozszerzenia możliwości głosowych ChatGPT przyciąga uwagę użytkowników i obserwatorów rynku technologicznego.
Rozwijając funkcje głosowe, OpenAI reaguje na potrzebę większej różnorodności i personalizacji w interakcjach z AI. Cztery istniejące głosy, choć innowacyjne, mogły być postrzegane przez niektórych użytkowników jako niewystarczające. Dodanie nowych opcji ma zaspokoić szersze spektrum preferencji i zastosowań.
Rozwój funkcji głosowych w ChatGPT to część szerszego trendu w branży technologicznej. Coraz większy nacisk kładzie się na naturalne interfejsy użytkownika. Głosowe interakcje z AI stają się coraz powszechniejsze w różnych dziedzinach życia, od asystentów domowych po systemy obsługi klienta.