OpenAI uruchomiło nową funkcję w ChatGPT – zaawansowany tryb głosowy. Nowość umożliwia wybranym użytkownikom premium testowanie ulepszonej interakcji głosowej z chatbotem.
Nowy tryb głosowy pozwala na prowadzenie bardziej naturalnych rozmów z AI w czasie rzeczywistym. System został udoskonalony, aby lepiej rozumieć niuanse wypowiedzi, takie jak żarty czy ironię. Ważnym ulepszeniem technicznym jest brak potrzeby konwertowania mowy na tekst i odwrotnie, co znacznie zmniejsza opóźnienia w komunikacji.
W przeszłości OpenAI zaprezentowało możliwości swojego systemu głosowego, demonstrując wirtualny głos o nazwie Sky. Wywołało to kontrowersje ze względu na podobieństwo do głosu aktorki Scarlett Johansson. Sytuacja ta zapoczątkowała dyskusję na temat etyki wykorzystywania głosów znanych osób w systemach AI bez ich zgody.
Scarlett Johansson publicznie skomentowała tę sytuację, wyrażając niezadowolenie. Aktorka ujawniła, że odrzuciła propozycje współpracy od dyrektora generalnego OpenAI, Sama Altmana, który chciał wykorzystać jej głos w ChatGPT. Johansson wyraziła swoje oburzenie stworzeniem głosu bardzo podobnego do jej własnego mimo jej odmowy. W reakcji na to OpenAI usunęło kontrowersyjny głos Sky ze swojego systemu.
To zdarzenie skłoniło OpenAI do podjęcia dodatkowych działań w celu poprawy bezpieczeństwa i etyki wykorzystania technologii głosowej. Firma podkreśla, że od tamtego czasu pracowała nad udoskonaleniem zabezpieczeń i jakości interakcji głosowych.
W najnowszej wersji zaawansowanego trybu głosowego OpenAI wprowadziło kilka zmian. System korzysta teraz z czterech predefiniowanych głosów, specjalnie opracowanych na potrzeby AI. Firma wdrożyła też mechanizmy blokujące generowanie sygnałów głosowych, które mogłyby imitować głosy znanych osób lub naruszać prawa autorskie.
OpenAI dodało również zabezpieczenia blokujące żądania generowania treści zawierających przemoc lub naruszających prawa autorskie. Firma planuje przeprowadzić testy, aby dalej udoskonalać funkcjonalność systemu przed jego szerszym wdrożeniem.
Nowa funkcja jest udostępniana stopniowo. Wybrani użytkownicy otrzymają mailowo szczegółowe instrukcje. OpenAI będzie rozszerzać grupę testerów, zbierając opinie i dane do dalszego doskonalenia systemu.
We’re starting to roll out advanced Voice Mode to a small group of ChatGPT Plus users. Advanced Voice Mode offers more natural, real-time conversations, allows you to interrupt anytime, and senses and responds to your emotions. pic.twitter.com/64O94EhhXK
— OpenAI (@OpenAI) July 30, 2024
Firma planuje udostępnić zaawansowany tryb głosowy wszystkim użytkownikom subskrypcji Plus jesienią tego roku. Stopniowe wdrażanie ma zapewnić stabilność systemu i zebrać cenne informacje zwrotne od użytkowników.