Company name: Dynamic Solutions s.r.l.
Address: VIA USODIMARE 3 - 37138 - VERONA (VR) - Italy

E-Mail: [email protected]

ElevenLabs lancia l’app reader: come cambierà il modo di ascoltare i libri in 32 lingue

Scopri come l'app reader di ElevenLabs rivoluziona la lettura audio con voci naturali e supporto per 32 lingue, offrendo una vasta gamma di contenuti precaricati e opzioni di caricamento avanzate.
  • ElevenLabs lancia l'app Reader gratuitamente su iOS e Android, con supporto per 32 lingue.
  • La tecnologia OCR integrata permette di leggere testi da PDF contenenti scansioni di immagini, migliorando l'accessibilità.
  • Supporta vari formati di testo come EPUB, PDF, TXT e offre la possibilità di caricare contenuti tramite scrittura diretta o link.

ElevenLabs, azienda specializzata in prodotti audio basati sull’intelligenza artificiale, ha recentemente annunciato il lancio della sua nuova applicazione Reader, disponibile gratuitamente su iOS e Android. Questa app si distingue per la sua capacità di leggere testi con voci naturali, superando il problema delle letture robotiche. Offre una vasta gamma di voci e la possibilità di selezionare diverse lingue dopo la registrazione.

L’applicazione include testi precaricati, tra cui classici come “Cenerentola” e “Le avventure di Sherlock Holmes”. Una delle caratteristiche più innovative è la possibilità per gli utenti di caricare testi attraverso diverse modalità: scrittura diretta, incollando link, importando file (EPUB, PDF, TXT) o scansionando documenti. Supporta anche l’OCR, permettendo di leggere testi da PDF contenenti scansioni di immagini.

Nonostante alcune restrizioni tecniche, come la compatibilità con Android 7.0+ e il divieto di uso su dispositivi con bootloader sbloccato, l’app si presenta come un’alternativa interessante per gli amanti degli audiolibri. È particolarmente vantaggiosa per i libri di dominio pubblico, offrendo un potenziale risparmio significativo rispetto ai servizi di audiolibri a pagamento. Tuttavia, l’app è destinata esclusivamente all’uso personale, senza possibilità di scaricare o esportare contenuti audio per scopi commerciali.

Per gli appassionati di letteratura, ElevenLabs suggerisce l’utilizzo di risorse come Project Gutenberg o Standard Ebooks per accedere a una vasta gamma di libri di dominio pubblico. A luglio, la società ha lanciato Turbo 2.5, un modello AI di sintesi vocale veloce, che permette alle aziende terze parti di sviluppare agenti conversazionali basati su modelli di linguaggio avanzati e integrarli in dispositivi hardware come occhiali intelligenti per leggere testi o videogiochi.

Reader legge testi con voci AI di alta qualità su iPhone e Android

Se siete alla ricerca di un’app per leggere testi in varie lingue con voci professionali di alta qualità, l’app Reader AI Audio di ElevenLabs è una delle scelte più raccomandate. Supporta 32 lingue e può leggere PDF, articoli, racconti e saggi con tonalità diverse, dall’inglese usando il tono di voce di celebrità quali Judy Garland, James Dean, Burt Reynolds e Sir Laurence Olivier.

L’app, presentata a giugno e inizialmente disponibile solo negli Stati Uniti e nel Regno Unito, è ora accessibile in altre nazioni, con supporto per l’italiano, il portoghese, lo spagnolo, il francese, l’hindi, il tedesco, il giapponese, l’arabo, il tamil e lo svedese. Lo sviluppatore riferisce che il modello di intelligenza artificiale dell’app è di alta qualità, con bassa latenza e veloce nella gestione delle lingue.

L’app è disponibile sia per iOS che per Android. I primi tre mesi possono essere utilizzati gratuitamente, successivamente sono disponibili vari piani in abbonamento, a partire da 5$ al mese oppure 4,17$ al mese per il piano annuale. La qualità delle voci italiane è superiore a quella delle voci di serie su macOS o iOS. Al primo avvio è necessario creare un account (oppure utilizzare l’ID Apple o un account Google). Viene richiesto di indicare l’uso dell’app (divertimento, lavoro, istruzione, accessibilità) e altri dettagli per selezionare una voce modificata con nazionalità di riferimento (es. “Giovanni Rossi”). Si incolla il testo e si avvia la riproduzione.

L’app è ancora da perfezionare nella scelta delle lingue, con un meccanismo di selezione poco intuitivo. È possibile testare un’anteprima della qualità delle voci senza scaricare l’app: basta cliccare sulla bandierina, selezionare “Italia”, incollare il testo desiderato nel campo vuoto, selezionare la voce e cliccare sul pulsante di riproduzione.

Cosa ne pensi?
  • 🎉 Questo è un passo avanti incredibile per gli amanti degli audiolibri......
  • 😕 Nonostante le sue potenzialità, l'interfaccia utente lascia molto a desiderare......
  • 📚 Immaginate le possibilità educative di questa app in contesti multidisciplinari......

Reader di ElevenLabs ora disponibile a livello globale

ElevenLabs, una startup che sviluppa tecnologie di intelligenza artificiale per la sintesi vocale, ha creato un’applicazione Reader che converte testo scritto in voce, permettendo di ascoltare i contenuti. Inizialmente disponibile solo in alcuni Paesi, ElevenLabs ha annunciato il lancio globale dell’app, rendendola accessibile ovunque. L’app supporta 32 lingue e consente agli utenti di caricare qualsiasi contenuto testuale, articoli, documenti PDF e e-book, per ascoltarlo in una varietà di lingue e voci.

Con l’espansione globale, Reader supporta una vasta gamma di lingue, tra cui portoghese, spagnolo, francese, hindi, tedesco, giapponese, arabo, coreano, italiano, tamil e svedese. Questo dimostra l’impegno di ElevenLabs nel rendere la tecnologia accessibile a un pubblico diversificato e internazionale. L’utente può selezionare la lingua preferita e ascoltare la lettura di testi tradotti automaticamente nella lingua scelta. Ad esempio, un italiano può inserire un testo in inglese e ascoltarne la lettura in italiano, o un francese può ascoltare contenuti in spagnolo.

ElevenLabs ha guadagnato lo status di unicorno all’inizio di quest’anno, raccogliendo un finanziamento di 80 milioni di dollari da investitori come Andreessen Horowitz. Questo testimonia il potenziale e l’innovazione dell’azienda nel settore delle tecnologie vocali basate sull’intelligenza artificiale. Oltre all’app Reader, ElevenLabs fornisce un’API potente che le aziende possono utilizzare per una varietà di casi d’uso, dal doppiaggio al text-to-speech. Vanta collaborazioni di alto profilo, come le interazioni vocali su Rabbit r1 e le funzioni di sintesi vocale su piattaforme come il motore di ricerca AI Perplexity e le app audio PocketFM e KukuFM.

Per arricchire l’esperienza Reader, ElevenLabs ha aggiunto centinaia di nuove voci alla libreria, adatte a diverse lingue. Ha concesso licenze per le voci di attori come Judy Garland, James Dean, Burt Reynolds e Sir Laurence Olivier, portando un tocco di Hollywood all’interno dell’app. Questo si basa sui progressi del modello Turbo v2.5 di ElevenLabs, rilasciato il mese scorso. Il modello riduce la latenza nella conversione text-to-speech e migliora la qualità complessiva, garantendo un’esperienza senza interruzioni e di alta qualità.

Bullet Executive Summary

L’app Reader di ElevenLabs rappresenta un significativo passo avanti nel campo della sintesi vocale, offrendo un’esperienza di lettura audio di alta qualità in 32 lingue diverse. Con la sua capacità di leggere testi con voci naturali e la possibilità di caricare contenuti in vari formati, l’app si distingue come una risorsa preziosa per gli amanti della letteratura e per chi cerca un’alternativa ai servizi di audiolibri a pagamento. L’espansione globale dell’app e il supporto per una vasta gamma di lingue dimostrano l’impegno di ElevenLabs nel rendere la tecnologia accessibile a un pubblico internazionale.

In un mondo sempre più digitalizzato, la tecnologia di sintesi vocale di alta qualità può migliorare significativamente l’accessibilità e l’inclusività. La possibilità di ascoltare testi in diverse lingue e con voci naturali può aprire nuove opportunità per l’apprendimento, il lavoro e il divertimento. Inoltre, l’integrazione di modelli di intelligenza artificiale avanzati, come il Turbo v2.5 di ElevenLabs, riduce la latenza e migliora la qualità complessiva dell’esperienza utente.

Per chi è interessato alla tecnologia, è interessante notare come l’uso dell’OCR (Optical Character Recognition) nell’app Reader permetta di leggere testi da PDF contenenti scansioni di immagini. Questa funzione avanzata dimostra come l’intelligenza artificiale possa essere utilizzata per migliorare l’accessibilità e la fruibilità dei contenuti digitali.

In conclusione, l’app Reader di ElevenLabs non solo rappresenta un’innovazione significativa nel campo della sintesi vocale, ma offre anche un esempio di come la tecnologia possa essere utilizzata per creare soluzioni più inclusive e accessibili. Invitiamo i lettori a riflettere su come queste tecnologie possono essere integrate nella loro vita quotidiana per migliorare l’accessibilità e l’efficienza.


Articolo e immagini generati dall’AI, senza interventi da parte dell’essere umano. Le immagini, create dall’AI, potrebbero avere poca o scarsa attinenza con il suo contenuto.(scopri di più)
0 0 votes
Article Rating
Subscribe
Notificami
guest
2 Commenti
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
2
0
Ci interessa la tua opinione, lascia un commento!x