A beszédtechnológia területei

A beszédfelismerés főbb témakörei
A gépi beszédfelismerés távlati célja az  általános a beszéd-szöveg átalakítás környezeti zajtól, beszélőtől és témakörtől függetlenül. Ilyen "mindentudó" beszédfelismerő rendszer még semmilyen nyelvre nem létezik. Azonban szűkítve a témakört, számos részterületen már a gyakorlatban is használható megoldások születtek, illetve koncentráltabb kutatások folynak.
▪ izolált szavas (parancsszó) felismerés: adott, kisméretű szótárban szereplő szavak, kifejezések közül egyet bemondva, a felismerés nagy hatékonyságú lehet
▪ kulcsszó keresés: akár folyamatos beszédben egy kulcsszó halmaz keresése és a találat jelzése
▪ nagyszótáras folyamatos beszéd felismerése: egy adott témakörben elhangzó folyamatos beszéd átírása szöveggé (alacsony hibaarány csak nagymértékben kötött témakör esetén várható)
▪ morfológiailag gazdag nyelveken történő beszédfelismerés: a magyar, finn, török, stb. nyelvek alaktani gazdagságát kezelő nyelvi és akusztikai modellezés kutatása beszédfelismerés céljából
▪ spontán beszéd felismerése: a spontán beszéd sajátosságait kezelő beszédfelismerési módszerek kutatása
▪ zajtűrő beszédfelismerés: zajos környezethez (pl. autóban) alkalmazkodó jelfeldolgozó és modellezési eljárások kutatása
▪ beszélő felismerés: a beszélő személy azonosítása
▪ a beszéd érzelmi töltetének felismerése: érzelmi kategóriák (öröm, harag, félelem, stb.) felismerése a beszéd akusztikai jegyei alapján

A beszédszintézis néhány témaköre, alkalmazása
Kutatási szinten
▪ érzelem kifejezése a gépi beszédben
▪ az emberi hangszín megközelítése
▪ az emberi prozódiai változatosság modellezése

Fejlesztés
A beszédszintetizátort minden esetben hozzá kell illeszteni a tervezett alkalmazáshoz.
▪ beszéd előállítása általános szövegből
    ▪ regényfelolvasás
    ▪ játékok hanggal való ellátása
    ▪ hírfelolvasás
    ▪ időjárásjelentés
▪ szövegfeldolgozás és gépi beszédkeltés célzott alkalmazásokhoz
    ▪ elektronikus-levél felolvasó (beolvassa a telefonba a levél tartalmát)
    ▪ SMS-felolvasó (vezetékes telefonra is küldhető SMS, a gép felolvassa azt)
    ▪ név- és címfelolvasás céginformációkhoz
    ▪ menetrendi információk gépi generálása telefonba és állomásokon
    ▪ banki rendszerek, számlafelolvasók
    ▪ időpont, dátum, devizaárfolyam stb. felolvasók (például kötvényárfolyamok)
    ▪ vakok és gyengénlátók részére készített beszélő alkalmazások számítógépre és mobiltelefonra
    ▪ lakossági beszédinformációs rendszerek
    ▪ nyilvános gyógyszerinformációs rendszer (T: (06-1)-886-94-90) Felolvassa a betegtájékoztató szövegét)
    ▪ beszélő bankautomata (gyengén látókat segíti hanggal a gép kezelésében)
    ▪ telefonos tudakozó az előfizető száma szerint (T: 12-70) (Felolvassa a bebillentyűzött magyar telefonszám előfizetőjének adatait)
    ▪ orvosi területen használt eszköz pl. MONDOM-2000 beszédhallást vizsgáló szűrő készülék (új módszerrel, szintetikus beszéddel méri a hallás károsodását).
        Főleg óvodákban használják.
    ▪ Automatikus ékezet ellenőrzés a szövegben
    ▪ Ékezet nélküli szöveg automatikus visszaékezetesítése