Nowa jakość tworzenia muzyki w Gemini z Lyria 3
Google rozwija aplikację Gemini o funkcję generowania muzyki, która pozwala tworzyć krótkie utwory bez wiedzy muzycznej. Nowość opiera się na modelu Lyria 3, który potrafi pisać teksty, dobierać wokal i kontrolować styl oraz emocje. Funkcja działa już w wersji beta i ma trafić także do twórców korzystających z YouTube Shorts. Google zapewnia, że narzędzie ma wbudowane zabezpieczenia przed naruszeniami praw autorskich.
Aplikacja Gemini zyskuje możliwość generowania trzydziestosekundowych piosenek z wokalem i tekstem. Użytkownik podaje jedynie krótki opis, a system sam tworzy kompletny mini-utwór. Za nową funkcją stoi model Lyria 3 opracowany przez Google DeepMind. Model potrafi samodzielnie tworzyć teksty piosenek i lepiej oddawać emocje w wokalu. Umożliwia też precyzyjne sterowanie stylem, tempem i charakterem głosu, co przekłada się na bardziej naturalny efekt. W porównaniu z wcześniejszymi wersjami to wyraźny krok naprzód w jakości generowanej muzyki.
Firma podkreśla, że celem jest uproszczenie kontaktu z muzyką i umożliwienie tworzenia jej bez specjalistycznej wiedzy. Narzędzie ma dawać użytkownikom swobodę eksperymentowania z dźwiękiem bez kosztownego sprzętu czy współpracy z producentem. Google traktuje tę funkcję jako kolejny sposób na rozwijanie kreatywności w codziennym korzystaniu z AI. Użytkownik może przekształcić zdjęcie lub krótkie wideo w muzyczną historię z dopasowanym tekstem. Aplikacja automatycznie generuje także okładkę, co pozwala tworzyć kompletne mini-utwory inspirowane własnymi wspomnieniami. Funkcja może okazać się szczególnie przydatna dla twórców internetowych.
Lyria 3 trafi również do narzędzia Dream Track w YouTube Shorts. Twórcy będą mogli generować spersonalizowane podkłady muzyczne dopasowane do krótkich filmów. To kolejny krok w stronę ułatwienia produkcji treści wideo bez konieczności korzystania z bibliotek muzyki stockowej. Google zapewnia, że model został zaprojektowany z myślą o poszanowaniu praw twórców. System posiada filtry wykrywające zbyt duże podobieństwo do istniejących utworów. Inspiracje konkretnymi artystami są traktowane jako ogólne wskazówki stylistyczne, a nie próba kopiowania. Każdy wygenerowany utwór otrzymuje niewidoczny znacznik SynthID, który pozwala sprawdzić, czy powstał przy użyciu AI Google.
Funkcja jest dostępna w desktopowej wersji Gemini dla użytkowników powyżej osiemnastego roku życia. Obsługuje kilka języków, a wersja mobilna ma pojawić się w najbliższym czasie. Wyższe limity korzystania przewidziano dla subskrybentów planów AI Plus, Pro i Ultra.
Czytaj też: Google chce być jak Apple? Podobno szykuje własne „Face ID”
Grafika tytułowa: Amanz / Unsplash

