Program za sintezu govora za Android. Pico TTS koji je ovo program za Android? Googleova sinteza govora

Ocjena: / 44
Detalji Kategorija: Android. Istraživanje i razvoj. Ažurirano 2.12.2018 10:54 Pregleda: 37086

Stranica 2 od 3

Da biste instalirali i konfigurirali ruski glas u CoolReader treba ga staviti Android(glas). Android(današnja verzija, nije nadograđena na verziju 4) već ima mnogo za ovo, ali, nažalost, programeri CoolReader pristaše starih tradicija i glasova. Stoga je morao biti jednak onima koji su već dostupni na mom Galaxy Note : Samsung TTS I Pico TTS, stavi još jednu TTS - SVOX Classic TTS(otvaramo kod kuće Igra na tržištu i nalazimo tamo SVOX Classic TTS, distribuira se besplatno, što se ne može reći za glasove za njega). Instalirano? Idemo postavke, tamo - Glasovni unos i izlaz, Tekst u govor. Označite kućicu Uvijek koristi moje postavke. I omogući (opet potvrdni okvir) SVOX Classic TTS.

ACHTUNG, ACHTUNG! Rusene, džabe, ne budi glup i odbiti bilo kakva automatska ažuriranja i nadogradnje kao SVOX Classic TTS općenito jest Ruski ženski glas posebno .

Pokrenite CoolReader, izbornik sustava izabrati Mogućnosti/Citati naglas. I to je to... Radi kao na osobnim računalima. Glasno i dobro. Ne štuca. Postavio sam brzinu prilično brzo, postalo je malo ugodnije slušati glas ženskog robota. Ali poslužit će za mene. Dok idem na posao, slušam knjigu, a i na poslu kad idem u goste žestoka sitnica: slušalice u ušima, uređaj u džepu, a ponekad i kuckam po tipkama, da ne privući pozornost pažljivih šefova nedostatkom brbljanja po tipkovnici s moje strane.


SVOX Classic Text To Speech Engine glasovni motor za platformu je program koji vam omogućuje reprodukciju bilo kojeg Tekstualni dokument u obliku govornog toka. Svaki uređaj s Android OS-om ima ugrađeni program koji vam omogućuje pretvaranje teksta u ljudski govor. Međutim, nedostatak ovog programa je što podržava samo strane jezike. Posebnost SVOX Classic Text To Speech Engine je upravo to ovaj program zna "pričati" ruski.


Korištenje SVOX Classic Text otvara puno novih mogućnosti. Zahvaljujući njemu moći ćete dati glas razne programe, igra e-knjige i važne poruke. SVOX Classic Text podržava više od 25 jezika. Zahvaljujući ovom skupu, ovaj program je jedinstven u svojoj vrsti. Tu je i mogućnost odabira glasovne pratnje - ukupno je četrdeset opcija. Da biste reproducirali tekst na ruskom, morate preuzeti poseban dodatak programu koji je lako pronaći na Internetu. Za daljnji rad samo instalirajte program zajedno s ovim dodatkom i to je to - vaš pametni telefon govori ruski!


Postavke SVOX Classic Text prilikom reprodukcije teksta omogućuju vam da postavite program koji će se koristiti prema zadanim postavkama. Da biste to učinili, samo idite na postavke aplikacije i idite na " glasovni unos- zaključak". Tamo trebate označiti potvrdni okvir "sustav instaliran prema zadanim postavkama". Nakon toga, korisnik također može odabrati zadani glas.

Na našoj web stranici možete preuzeti ruske glasovne programe na svoj Android pametni telefon. Sam program je uključen aktiviran ključem i ne zahtijeva registraciju, kao i 40 muških i ženskih glasova na 25 jezika, naravno uključujući ruski. Sada tvoj pametni telefon uistinu postane takav, dajte mu bilo koji tekst ili naredbu i on će za vas pročitati bilo koji niz teksta, na jeziku koji vam je potreban.

Jezični motori i sintesajzeri ( TTS pretvaranje teksta u govor) nikada nisu bili nešto savršeno za ruski jezik. Za razliku od engleskih, čiji je razvoj bio konstantan i stalan, najbolji predstavnik domaćih sintisajzera više od deset godina bio je muški glas. Nikolaja od Acapela. Posljednjih godina natječe se s dvije sasvim pristojne ženske opcije - Alena (Acapela) i Katerina, kasnije - Katerina II (ScanSoft RealSpeak).

Za svakodnevnu upotrebu zahtijevali određeni napor, a za mobilne platforme, prvenstveno Android, bili su prikladni samo u kombinaciji s osobno računalo, prisiljavajući tekst da se pretvori u zvuk kako bi se kasnije mogao reproducirati sa standardnim Mp3 playerom na krajnjem uređaju.

Neku nadu za napredak, kao što se često događa, dala je dobra korporacija Google, pogledajte naš materijal:
. Donedavno su se maksimalne mogućnosti koje je pružao pretraživački div svele na online rad sa svojim sintisajzerom. Rezultat, iskreno govoreći, nije bio nešto revolucionarno. S primjerom Google rad Možete se upoznati s TTS API-jem na opće informacije o Klubu.

Bilo je nekoliko drugih rješenja posebno prilagođenih za korištenje s pametnim telefonima:

  • Pico TTS isporučuje se prema zadanim postavkama - bez ruskog jezika
  • IVONA Text-to-Speech - nažalost, podrška za ruski još nije implementirana, iako je službeni glas Tatyane predstavljen na web stranici programera
  • SVOX klasični pretvarač teksta u govor- jedini radni model. Instalacija softvera je besplatna, probno razdoblje za procjenu. Konačna cijena ~ 3 USD
Kao što vidite, samo rješenje stvarno djeluje SVOX. Unatoč svoj “realnosti”, sustav radi izuzetno loše. Odnosno, njegova glavna svrha je čitanje na ruskom, formalno to ispunjava, ali slabo čita.

I tako, krajem svibnja 2014. Google Play pojavljuje se njihov novi potpuno besplatni Google Speech Synthesizer. Ovaj proizvod lako nadmašuje dosadašnja rješenja koja koriste ruske TTS sustave, štoviše, po mom skromnom mišljenju, ovaj ženski glas bolji je od dostupnih rješenja za osobna računala.

Ispod je mali demo fragment primljen sa pametnog telefona s instaliranim Googleovim sintetizatorom govora - ruski ženski glas (za sada jedini dostupan)

Unos primljen putem standardni program za fb2 FBReader s povezanim modulom čitača Čak i ako računalni govor ne percipirate u kontekstu bodovanja knjige, ovo će vam rješenje omogućiti da nadogradite svoj mobilni prijatelj. Google navigacija će umjesto vas početi čitati imena ulica, posebne aplikacije moći će čitati SMS tekst i brojeve tijekom dolaznih poziva.

Osim toga, što je vrlo korisno za slabovidne ili slijepe korisnike, sada možete u potpunosti koristiti TalkBack - analogni čitač zaslona Jaws koji je mnogima poznat iz rada na osobnim računalima. Ovaj sustav ostvaruje potencijal Androida za glasovno obavještavanje o svim događajima na telefonu, omogućujući vam da njime upravljate bez gledanja ekrana.

    Nedostaci rada sa sintisajzerom
  • Značajan nedostatak za ljubitelje audio knjiga je povećana potrošnja energije, za nekoliko sati presnimavanja izgubit ćete do pola napunjene baterije
  • Smetnja snimljena samo pri reprodukciji preko zvučnika telefona: lagano prigušivanje - slabljenje razine zvuka na početku rečenice. Putem žičane slušalice, vanjski uređaj i bluetooth ovaj efekt nedostaje
  • Nema podrške za prilagođene naglaske i rječnike

Ne možete očekivati ​​posebna čuda - to je samo računalo, međutim, neka hladnoća tijekom čitanja može se nekome učiniti ugodnim predahom od viška teatralnosti u radu pojedinih izvođača.

Instalacija sintisajzera je izuzetno jednostavna.
Idite na stranicu proizvoda u trgovini. Google Play će vas kao i obično obavijestiti o kompatibilnosti s vašim uređajem - potreban je Android 4.0.3 i više, tada će doći do preuzimanja i instalacije. Zatim morate preuzeti "glas":
Postavke -> Pristupačnost -> Izlaz teksta u govor -> Google sintetizator govora (neka vas ne uzbuni prijeteće upozorenje, proizvođač neće saznati ništa novo o vama kroz ovaj program, on već sve sigurno zna) -> preuzmi . I za mir, ponovno pokrenite.

    UPD: listopad 2016
Za Android 4.2 (bolje 4.4) i više, osnovnom ženskom glasu dodano je 6 novih - tri muška i tri ženska:

Čitač zaslona za Android ili pametni telefon za slabovidne ili slijepe osobe

Suvremeni svijet neprestano napreduje. Divno diplomirao softver- zaslonski najavljivač, zahvaljujući kojem osoba lišena vida može uroniti u svijet visoke tehnologije. Pisali smo ranije, a u ovu recenziju Pogledajmo aplikacije za pametne telefone.

Softver za sintetiziranje govora izgleda kao aplikacija koja omogućuje prijevod tekstualnih informacija u glas.

Širok izbor ovih proizvoda ne prestaje zadivljivati ​​korisnike, stoga predlažem da pobliže pogledate one najpopularnije.

Klasifikacija primjene

Već razvijen i objavljen veliki broj sintetizatori govora, uz njihovu pomoć užitak je ne samo vizualno percipirati korisna informacija, ali i čuti.

Ovi programi su podijeljeni u dvije vrste: plaćeni i besplatni.

Oni programi koji su “bazirani na lopti” imaju oskudniji arsenal mogućnosti, ali se također mogu koristiti, s plaćenim verzijama stvari su zabavnije, njihova golemost ne poznaje granice.

Sintetizatori govora na ruskom jeziku

Za operativne sustave kao što je Android postoji mnogo opcija za sintetizatore govora, ali većina njih nema verzije na ruskom jeziku.

Pogledajmo nekoliko najpopularnijih čitača zaslona:

Ovaj program je razvijen za Android. Ima visoke stope sinteze govora, višejezičan, ima 25 različiti jezici, uključujući Russified.

Programeri su Acapela Group S.A.. Približna cijena je 4 eura.

Višejezični sintetizator govora koji nije komercijalan. Obrada informacija na 37 jezika, glasovna gluma je dobra, postoji mnogo glasovnih opcija.

Radi na više operacijskih sala Linux sustavi, MacOS, Microsoft Windows i RISC OS. Za ispravnu reprodukciju glasa razvijen je prošireni rječnik.

Zbog neprofitnih aktivnosti, program radi nešto lošije od plaćene aplikacije, ali programeri imaju planove za poboljšanje performansi.

Postavljanje TTS-a

U početku morate odlučiti koji je sintetizator govora najprikladniji. Preuzmite i instalirajte aplikaciju, zatim idite na TTS postavke. Pogledajmo upute korak po korak:

  1. Morate početi s lansiranjem;
  2. Zatim morate ići na postavke aplikacije;
  3. Odaberite i instalirajte željeni jezik;
  4. Odlučite se za sintezu govora;
  5. Trebali biste odabrati motor, najčešće "automatski";
  6. Postavite brzinu govora koja vam odgovara;
  7. Prilagodite prema vlastitom nahođenju Dodatne mogućnosti, potrebno za rad.

Kada su svi parametri postavljeni, ako je potrebno, možete započeti s radom.

TalkBack je standardni uslužni program, koji je obično ugrađen u Android OS. Ova funkcija je razvijen za osobe s problemima vida, slabovidne osobe, zahvaljujući TalkBacku, mogu bez problema koristiti gadgete.

Kada prvi put pokrećete program, možete koristiti upute. Pripovjedač ima vrlo opsežne postavke. Na svim uređajima, uključeno različiti tipovi firmware, postoje male razlike u postavkama usluge.

Glavne značajke TalkBacka su:

  • Promjenjiva razina glasnoće reprodukcije;
  • Mogućnost promjene tona glasa;
  • Glasovni zapis svakog pritiska tipke;
  • Postoji senzor udaljenosti, zahvaljujući kojem se podešava razina zvuka;
  • Uređaj javlja informacije o dolaznim pozivima i SMS-ovima, Caller ID princip;
  • Pretvorite govor u tekst i obrnuto;
  • Kontrola gestama.

Ovo su glavne značajke, ali postoji i veliki izbor sekundarnih.

TalkBack je nezamjenjiva aplikacija za osobe koje su izgubile sposobnost gledanja i korištenja istih uređaja kao osobe koje vide

Za osobe oštećena vida ovo je pravo otkriće. Ljudi s punim vidom ovu aplikaciju neće biti zgodno, može biti neugodno i usporiti proces rada na uređaju.

Osobi koja ne vidi ništa bit će dosta teško sama postaviti program, pa je najbolje potražiti pomoć ljudi oko sebe.

Za gadgete koji rade na Androidu, postoji mogućnost glasovne pomoći u kontroli. TalkBack izgovara sve ikone na koje možete kliknuti prstom ili jednostavno dok se krećete po zaslonu.

U tome pomaže značajka Istraži dodirom. Jesti detaljne upute, kako točno koristiti ovu funkciju.

Nakon čitanja uputa, korisnici nemaju problema s radom uređaja.

Kako biste odabrali željenu ikonu i aktivirali element, samo pritisnite ikonu prstom i oglasit će se glasovna uputa. Pomicanje, popraćeno različitim tonovima, također dodaje praktičnost.

Video: Acapela Tts glasovi za Android

Zaključak

Nakon što smo razumjeli rad i funkcionalnost čitača zaslona, ​​možemo izvući sljedeće zaključke:

  1. Spikeri su neizostavan program za osobe s problemima vida i sljepoćom;
  2. Koristeći takve programe, možete izgovoriti bilo koje testne informacije;
  3. Informacije proizvedene glasom mogu se lako pretvoriti u pisani tekst;
  4. Cijena glasovnih zvučnika je niska, postoje čak i besplatni.

Ako vam engleski nije materinji jezik i ne pišete aplikacije samo za iPhone, tada ćete imati dosta problema ako želite pronaći odgovarajući alat za razvoj tzv. mobilne "glasovne" aplikacije.

Ova recenzija daje klasifikaciju i opisuje najvrjednije mobilne TTS motore.

Bavim se istraživanjem u području dizajna sučelja Mobilni uredaji za osobe s oštećenjem vida. Za provedbu jednog od svojih projekata trebao mi je mehanizam za generiranje glasa s višejezičnom podrškom (barem dva jezika - engleski i ruski). To je bio razlog za potragu za sintetizatorom govora.

Radi praktičnosti, TTS motore dijelimo u tri klase:

  • komercijalni;
  • besplatno (rješenja licencirana pod GPL, LGPL i mekšim licencama kao što su BSD licenca ili wxWindows licenca, koje omogućuju komercijalni razvoj proizvoda);
  • ugrađeni (alati koje pruža sam operativni sustav).

Komercijalni motori

SVOX mobilni TTS

Cijena: n/a
Jezici: 26, uključujući ruski
visoka
Mobilni OS: Android, Symbian, Windows CE/ Windows Mobile SKUHATI

Tvrtka SVOX ima najukusniji proizvod s tehničke točke gledišta - SVOX Mobile TTS. Međutim, budući da tvrtka posluje uglavnom u B2B segmentu, nikada nisu odgovorili na moja dva e-maila s upitom o cijeni.

Cijena navedena u zaglavlju odnosi se na takve operativni sustavi poput Windows Mobile i Symbian, ali Acapelin poslovni model varira ovisno o odabranom OS-u. Primjerice, najjače promoviraju iOS smjer, za što je napravljena zasebna web stranica. Tamo se možete registrirati i besplatno dobiti probnu verziju njihovog motora. Gola SDK cijena za bivši iPhone OS je 250€. Također od svakog artikla koji prodajete Trgovina aplikacijama prijave, naplaćuju se znatne kamate.

Napominjem da Acapela pruža sintezu govora u "oblaku", kao i prijenos SDK-a na bilo koju platformu.

Besplatni motori

Flite
Cijena: br
Jezici: engleski plus mogućnost kompajliranja FestVox jezika
Subjektivna ocjena kvalitete zvuka: niska
Mobilni OS: Android, Windows CE/Windows Mobile, iOS, PalmOS
Mogućnost razvoja komercijalnih proizvoda: da (CMU licenca)

U desktop svijetu, festivalski sintetizator govora je dobro poznat. Ima priključak pod nazivom Flite za mobilne uređaje i ugrađene sustave, koji se distribuira pod vlastitom licencom nalik na X11, što omogućuje besplatnu distribuciju softvera svima, kao i izradu komercijalnih i besplatnih aplikacija temeljenih na njemu. Postoje priključci za Windows CE/Windows Mobile, PalmOS, Android i .

Upute za kompajliranje motora za WM uključene su u distribuciju, ali na ovoj platformi eSpeak ima jedno značajno ograničenje - generiranje glasa moguće je samo u WAV datoteci. Može se nabaviti sklopljeni TTS motor za Windows Mobile.

ESpeak je prenesen na Android. Najlakši način da isprobate je instalirati aplikaciju TTS Service Extended s Android Marketa, koja vam omogućuje prebacivanje između ugrađenog motora i eSpeaka. Ovaj TTS mehanizam se distribuira pod uvjetima GNU GPL.

Ugrađena rješenja

Ugrađena rješenja prisutna su samo u Symbianu i Androidu. Iz nepoznatog razloga, Microsoft je svoj mobilni OS lišio odgovarajućeg softverskog sučelja (MS SAPI).
Symbian

Cijena: br
Jezici: engleski
Subjektivna ocjena kvalitete zvuka: izuzetno niska
Mogućnost razvoja komercijalnih proizvoda: da

Ugrađeni TTS Symbian Foundationa skriven je u klasi CMdaAudioPlayerUtility. Iako ne govori ništa o tome, dopušta sintezu govora. Nažalost, ruski jezik nije podržan. Kvaliteta generiranja engleskog govora je vrlo niska. Bez pripreme prilično je teško razumjeti što je točno rekao.

Dodatni jezični paketi mogu se preuzeti, ali je popis podržanih telefona vrlo ograničen. Instaliranje paketa za ruski jezik na uređaju sa Symbain OS S60 5. nije dalo očekivane rezultate; ugrađeni TTS nije govorio ruski.

Napominjem da postoji prilično zgodno API proširenje pod nazivom NSS TTS Utility API, čiji opis možete pronaći