D-ID, compania din spatele Deep Nostalgia, vă permite să creați videoclipuri generate de AI dintr-o singură imagine • TechCrunch

Companie israeliană de inteligență artificială FĂCUTcare a furnizat tehnologie pentru proiecte precum Nostalgie profundăse lansează o nouă platformă unde utilizatorii pot încărca o singură imagine și text pentru a genera videoclipuri. Cu acest nou site numit Creative Reality Studiocompania vizează sectoare precum formarea și educația corporativă, comunicarea internă și externă din partea companiilor, marketingul de produse și vânzările.

Platforma este destul de simplu de utilizat: utilizatorii pot încărca o imagine a unui prezentator sau pot selecta una dintre prezentatorii pre-creați pentru a începe procesul de creare a videoclipurilor. Utilizatorii plătiți pot accesa prezentatori premium care sunt mai „expresivi”, deoarece au expresii faciale și mișcări ale mâinilor mai bune decât cele implicite. După aceea, utilizatorii pot fie să tastați textul dintr-un script, fie pur și simplu să încarce un clip audio al discursului cuiva. Utilizatorii pot selecta apoi o limbă (platforma acceptă 119 limbi), voce și stiluri precum vesel, trist, emoționat și prietenos.

Algoritmii companiei bazați pe inteligență artificială vor genera un videoclip bazat pe acești parametri. Utilizatorii pot apoi distribui videoclipul oriunde. Firma susține că algoritmul durează doar jumătate din timpul video pentru a genera un clip, dar în testele noastre, a fost nevoie de câteva minute pentru a genera un videoclip de un minut. Acest lucru se poate schimba în funcție de tipul de prezentator și de limba pe care le-ați selectat.

„Pandemia COVID-19 a accelerat nevoile de conținut digital pe tot globul. O mare problemă pentru organizații este crearea de conținut educațional. Citirea documentelor și parcurgerea prezentărilor ar putea fi uscată și plictisitoare. În plus, trebuie să cheltuiască mii de dolari pentru a angaja actori și pentru a crea videoclipuri educaționale. Așa că ne folosim inteligența artificială pentru a crea prezentatori și tutori pentru a recrea oamenii și pentru a face conținutul mai captivant și mai eficient”, a declarat Gil Perry, CEO-ul D-ID pentru TechCrunch într-un interviu.

Perry a subliniat multe cazuri de utilizare pentru această tehnologie, de la un mesaj multilingv de la un CEO la angajați până la dorințe personalizate pentru utilizatorii unei organizații.

D-ID a lansat studioul pentru testare la mijlocul lunii august pentru a elimina erorile înainte de lansarea publică. Și în timp ce obiectivul său principal este de a răspunde companiilor de toate dimensiunile, compania vede mult interes de la creatori pe platformă.

Crearea de videoclipuri deepfake ofensive este un risc. De aceea, firma israeliană a pus balustrade cum ar fi filtrarea înjurăturii și remarcilor rasiste, precum și recunoașterea imaginilor pentru a evita folosirea fețelor oamenilor celebri. Acesta folosește API-ul de moderare a textului Microsoft Azure pentru a elimina remarcile sexuale și limbajul jignitor din scenariile video. D-ID a spus că termenii de utilizare ai platformei interzic utilizatorilor să creeze videoclipuri politice. În cazul încălcării oricăreia dintre aceste reguli, compania poate suspenda contul contravenientului și poate elimina videoclipul acestuia din bibliotecă.

D-ID ridicat 25 de milioane de dolari în finanțarea din seria B condusă de Macquarie Capital în martie – cu un total de 47 de milioane de dolari strânși până în prezent. Până acum, compania s-a bazat pe alții care foloseau API-ul său pentru a crea conținut – Deep Nostalgia este un prim exemplu în acest sens – cu clienți precum Modelez, Warner Bros. și Aplicația pentru videoclipuri scurte din India Josh. Acum, compania își extinde produsele care fac bani prin lansarea unui plug-in PowerPoint împreună cu această platformă de autoservire. Pluginul adaugă un prezentator interactiv pe deck, astfel încât utilizatorii nu trebuie doar să citească diapozitive. Ei pot alege între diferite avatare, voci și limbi – la fel ca platforma de autoservire. Dar nu există nicio prevedere pentru a avea un prezentator personalizat în acest moment.

La lansare, utilizatorii se vor putea înscrie gratuit pentru un cont de probă de 14 zile și vor putea crea până la cinci minute de videoclipuri 720p generate de AI. După aceea, ei pot plăti 49 USD pe lună pentru a avea acces la 15 minute de videoclipuri full HD generate de AI, un plugin PowerPoint și asistență prin e-mail.

Co-fondatorii D-ID Eliran Kuta, Gil Perry și Sella Blondheim. Credite de imagine: FĂCUT

De asemenea, utilizatorii pot încărca propriile clipuri audio pentru clonarea vocii. În plus, compania lucrează la un instrument care să le permită utilizatorilor să-și încarce propriile imagini pentru a antrena AI să fie mai expresiv, astfel încât să poată imita mai bine persoana din videoclip. Toate aceste caracteristici vor fi limitate la nivelul de întreprindere al companiei.

În timp ce compania se confruntă cu concurență din partea unor persoane precum Reformulați.ai și Mașini de suflet în zona video generată de AI, susține că aproape că nu există companii care pretind să genereze videoclipuri de înaltă calitate dintr-o singură imagine.

Perry a spus că D-ID nu își propune să se limiteze la formarea corporativă, comunicarea și videoclipurile de marketing. De asemenea, are ambiția de a facilita traducerea apelurilor video în timp real și prezentatorii clonați – ceea ce face ca un avatar să apară pe video în locul dvs. în timp ce dictați audio.

De asemenea, compania se gândește să devină un jucător cheie în dezvoltarea web3/metaverse. „Având în vedere că avem experiență în generarea de videoclipuri dintr-o singură imagine. Ne gândim la modalități de a crea avatare digitale pentru metavers”, a spus Perry.

Leave a Comment

Your email address will not be published.