Noi voci expresive generate de IA pentru texte personalizate cu MAI-Voice-1

Noi voci expresive generate de IA pentru texte personalizate cu MAI-Voice-1 Sursa poza: Go4IT

Microsoft aduce o revoluție în domeniul generării vocale cu ajutorul unei funcții inovatoare denumite Copilot, care permite utilizatorilor să introducă un text și să-l transforme într-o voce expresivă generată de inteligența artificială (IA) în diferite stiluri distincte. Spre deosebire de metodele tradiționale de conversie text-vorbire, noua funcție promite o experiență sonoră mai naturală și mai expresivă, datorită modelului IA denumit MAI-Voice-1, dezvoltat de companie.

Lansarea Funcției de Către Microsoft AI

Anunțată de Mustafa Suleyman, CEO-ul Microsoft AI, printr-o postare pe X, lansarea noii funcționalități audio de către Copilot marchează un pas important în inovația tehnologică. Suleyman a menționat că această capacitate avansată este alimentată de MAI-Voice-1, un model de IA introdus în luna august. Experiența este, momentan, accesibilă prin Copilot Labs, disponibilă pentru utilizatorii care se conectează cu un cont personal.

Trei Moduri de Generare a Vocii

Noua funcție de generare vocală dispune de trei moduri distincte:

1. Scripted Mode

Acest mod funcționează prin citirea mesajului text exact așa cum a fost introdus, fără a schimba tonul sau adăuga intonații. Scripted Mode este ideal pentru situații formale, cum ar fi anunțurile oficiale, citirea documentelor și prezentările informative precise.

2. Emotive Mode

Emotive Mode adaugă un plus de dramatism și emoție textului. Conceput pentru a face textul mai captivant și expresiv, acest mod folosește o gamă variată de intonații și tonuri. Este perfect pentru publicitate, marketing sau narațiuni care necesită un stil mai neconvențional.

3. Story Mode

Cel mai complex mod, Story Mode, utilizează multiple voci și personaje diferite pentru a da viață narațiunilor. Este ideal pentru povestiri, podcasturi sau alte proiecte care implică un conținut narativ mai bogat. Acest mod permite o flexibilitate și creativitate sporite, fiind potrivit pentru diverse utilizări analitice.

Performanța Tehnică a MAI-Voice-1

Lansat inițial la sfârșitul lui august, modelul MAI-Voice-1 iscă interes prin capacitatea sa de a transforma un minut de sunet în mai puțin de o secundă, utilizând doar o singură placă grafică. Microsoft a instruit modelul cu ajutorul a circa 15.000 de plăci grafice Nvidia, asigurând astfel o performanță excepțională.

Momentan, această funcționalitate nu este disponibilă pe platformele mobile și desktop, iar Microsoft nu a specificat când ar urma să extindă disponibilitatea. Totuși, utilizatorii interesați pot testa funcția gratuit prin intermediul Copilot Labs, explorând potențialul enorm al acestei tehnologii inovatoare.

Această dezvoltare a Microsoft subliniază angajamentul continuu al companiei de a împinge limitele inteligenței artificiale și de a transforma interacțiunea digitală prin inovații tehnologice de top. Cu noile moduri vocale ale Copilot, utilizatorii pot aștepta o experiență audio mult mai bogată și variată care promite să schimbe regulile jocului în multe industrii.