Zespół DeepMind od Google stworzył SI, która mówi prawie tak jak człowiek

Obecnie, bardzo łatwo jest odróżnić głos rzeczywistego człowieka od głosu mówiącego programu komputerowego, ale w niedalekiej przyszłości może się to zmienić, dzięki nowej sztucznej inteligencji o nazwie WaveNet, stworzonej przez zespół DeepMind od Google. Przypomnijmy, że ten sam zespół opracował SI AlphaGo, który stał się jednym z najlepszych graczy w Go na świecie.
Obecnie, deweloperzy tworzą syntezatory mowy TTS (z ang. Text To Speech, tekst na mowę), korzystając z dwóch metod. Pierwsza polega na nagrywaniu całego zbioru słów i fragmentów zdań przez aktorów głosowych. Niestety, w tym przypadku program ma trudności z manipulowaniem intonacją i dźwiękami. Druga obejmuje elektroniczne formowanie słów, w zależności od tego, jak te słowa powinny brzmieć. Choć to sprawia, że otrzymane wypowiedzi łatwiej jest modyfikować, tak stworzone słowa i zdania po prostu brzmią „robotycznie”.WaveNetBy stworzyć program, którego mowa byłaby łudząco podobna do mowy człowieka, zespół z Google przekazał sieci neuronowej zapisy fal dźwiękowych pochodzących z nagrań głosów lektorów. Takie zapisy reprezentują charakterystykę dźwięków wizualnie. Za ich sprawą WaveNet może tworzyć własne dzięki, a co za tym idzie – mówić. Co ciekawe, ta sztuczna inteligencja być może odnajdzie także zastosowania muzyczne, bowiem zespół przekazał jej zapisy kilku klasycznych utworów. Na ich podstawie WaveNet zdołał opracować kilka własnych interesujących kawałków.

Jeżeli WaveNet jest wykorzystywany jako syntezator mowy TTS, przekształca wpisany tekst w serię fonemów oraz sylab, którą następnie wymawia. Osoby, które w ramach testu posłuchały mowy sztucznej inteligencji stwierdziły, że WaveNet brzmiał bardziej ludzko niż inne komputerowe programy. Wy także możecie ocenić mowę sztucznej inteligencji od Google. Wystarczy, że odwiedziciestronę zespołu DeepMind.

Źródło:DeepMind