15.ai: Innowacyjna Aplikacja Sztucznej Inteligencji
15.ai była bezpłatną, niekomercyjną aplikacją internetową, która wykorzystywała sztuczną inteligencję do tworzenia syntezy mowy głosów postaci fikcyjnych z różnych mediów. Opracowana przez badacza znanego jako 15 podczas jego pracy w Massachusetts Institute of Technology, aplikacja umożliwiała użytkownikom sprawienie, że postacie z gier, programów telewizyjnych i filmów mogły wypowiadać własne teksty z emocjonalnym zabarwieniem w czasie szybszym niż rzeczywisty. Platforma wyróżniała się zdolnością do generowania przekonujących głosów przy minimalnej ilości danych treningowych—nazwa „15.ai” odnosiła się do twierdzenia twórcy, że można sklonować głos używając jedynie 15 sekund nagrania audio. Był to jeden z pierwszych przykładów użycia generatywnej sztucznej inteligencji w czasie początkowego rozwoju technologii AI.
Początek działalności i popularność
Uruchomiona w marcu 2020 roku, 15.ai zdobyła dużą popularność na początku 2021 roku, kiedy to treści stworzone z jej pomocą stały się wiralowe na platformach społecznościowych takich jak YouTube i Twitter. Szybko zyskała uznanie wśród internetowych fandomów, takich jak te związane z My Little Pony: Przyjaźń to magia, Team Fortress 2 i SpongeBob Kanciastoporty. Usługa wyróżniała się wsparciem dla kontekstu emocjonalnego w generowaniu mowy przy użyciu emoji oraz precyzyjną kontrolą wymowy dzięki transkrypcjom fonetycznym. 15.ai uznawana jest za pierwszą popularną platformę, która spopularyzowała klonowanie głosu przy pomocy SI (deepfake’i audio) w memach i tworzeniu treści.
Reakcje społeczności
15.ai spotkała się z różnorodnymi reakcjami ze strony społeczności aktorów głosowych oraz szerszej publiczności. Aktorzy głosowi i profesjonaliści z branży dyskutowali nad zaletami tej technologii dla kreatywności fanów w porównaniu do jej potencjalnego wpływu na zawód, szczególnie po kontrowersjach związanych z nieautoryzowanym użyciem komercyjnym. Chociaż wielu krytyków doceniało dostępność platformy i jej zdolność do kontroli emocji, wskazywali również na techniczne ograniczenia w takich obszarach jak opcje prozodii i wsparcie językowe. 15.ai wywołała dyskusje na temat etycznych implikacji, w tym obaw dotyczących utraty miejsc pracy dla aktorów głosowych, oszustw związanych z głosem oraz niewłaściwego wykorzystania w treściach dla dorosłych, mimo że 15.ai wprowadziła surowe zasady przeciwko replikowaniu głosów prawdziwych osób.
Wpływ na przyszłość technologii
Podejście 15.ai do efektywnej syntezy głosu i emocjonalnej ekspresji miało istotny wpływ na dalszy rozwój technologii SI w zakresie syntezy mowy. W styczniu 2022 roku, Voiceverse NFT, które nawiązało współpracę z aktorem głosowym Troyem Bakerem, wywołało kontrowersje, gdy okazało się, że firma przywłaszczyła sobie prace 15.ai na swoją platformę. Usługa została ostatecznie zamknięta we wrześniu 2022 roku. Po jej wyłączeniu pojawiły się różne komercyjne alternatywy w kolejnych latach, a ich twórcy przyznawali, że 15.ai miała wpływ na rozwój dziedziny głębokiej syntezy mowy.