A nyelv- és beszédtechnológia, amelyet a mesterséges intelligencia kutatás területe alá is szokás sorolni, kialakulását tekintve megelőzi azt. Az első próbálkozások több, mint 200 évre nyúlnak vissza és a beszéddel kapcsolatosak. Kempelen Farkas 1791-ben mutatta be a világ első olyan gépét (beszédszintetizátorát), amellyel beszédhez hasonló hangsorokat tudott előállítani. Tulajdonképpen ezt nevezhetjük a világ első artikulációs elven működő beszédelőállító gépének. Kempelen tehát 200 évvel megelőzte korát. Tudományos kutatásának eredményeit a Mechanismus der Menschlichen Sprache című könyvében foglalta össze (Bécs, 1791). Megállapításaival megalapozta a fonetika tudományát.
A beszédszintézis további fejlődése a 20. század elejétől folytatódott. A hangrögzítés és az elektronika fejlődésével párhuzamosan jöttek létre különböző kutatási eredmények. Büszkék vagyunk arra, hogy az első gépi szövegfelolvasással kapcsolatos szabadalmi bejelentés szintén magyar szakember nevéhez fűződik. Bánó Miklós 1916-ban adta be a Szabadalmi Hivatalba (74361 sorszám alatt) a következő találmányt: Tetszőleges szöveg reprodukálására alkalmas beszélőgép. A szabadalmat 1919-ben meg is kapta. Az elgondolás egy elektromechanikus megoldást javasolt, beszédhangok egymás utáni összekapcsolását párhuzamosan futó viaszhengerekről (ez hasonló elv, mint a mai elemösszefűzéses technikák).
A következő lépcsőfok a teljesen elektronikus beszélőgép volt kézi vezérléssel. A Bell Laboratóriumban mutatták be 1939-ben a Voice Demonstrator (VODER) nevű, angolul beszélő eszközt, amelyet egy képzett személy klaviatúrával tudott vezérelni. A VODER folyamatos beszédet tudott előállítani. Az igazi áttörés a beszédszintézisben az 1950-es évektől kezdve történt meg, amikor a számítógépek segítségével már a beszédszintetizátor vezérlését is automatizálni lehetett. Az első magyar beszédszintetizátort 1979-ben fejlesztették ki az MTA Nyelvtudományi Intézetének Fonetikai Laboratóriumában (Olaszy Gábor és munkatársai). Ez a gép az Intézet állandó kiállításán megtekinthető és hangja meghallgatható. A beszédfelismerésre irányuló kutatások később kezdődtek és a számítástechnika rohamos fejlődése segített, hogy mára már jelentős eredmények születtek ezen a területen is.
A számítógépes nyelvészet területén a kezdeti lépéseket az Amerikai Egyesült Államokban tették meg az 1950-es években, amikor is számítógépek segítségével próbáltak idegen nyelvű szövegeket, elsősorban orosz tudományos írásokat angolra fordítani. Mivel a számítógépek sikerrel bizonyították, hogy matematikai műveleteket lényegesen gyorsabban hajtanak végre, mint az emberek, úgy vélték, hogy rövid időn belül, a technikai részletek tisztázása után, arra is képesek lesznek, hogy ezekhez hasonlóan az emberi nyelvet is kezelni tudják.
Az első gépi fordítási kísérletek azonban kiábrándító eredményeket hoztak, mivel nem sikerült precíz fordításokat készíteniük, és a kutatóknak be kellett ismerniük, hogy a nyelv gépi feldolgozása lényegesen komplexebb feladat, mint azt korábban gondolták. Amikor az 1960-as években a mesterséges intelligencia kutatások is elkezdődtek, a nyelv- és beszédtechnológia ennek a tudományágnak a részévé vált, amely a természetes nyelvek emberi szintű megértésével és produkciójával foglalkozik.
Ahhoz, hogy egy nyelvről egy másikra fordítani tudjunk, meg kell értenünk, hogy a nyelvtanuk miképp épül fel, milyen konstrukciók vannak benne, miképp működnek benne a hagyományosan alaktanként és mondattanként megnevezett részek is. A mondattan sikeresebb megértéséhez ugyanakkor elkerülhetetlen, hogy rendszerünk tisztában legyen a jelentéstan és a lexikon működésével és legalábbis alapfokú pragmatikai, nyelvhasználati tudásnak is birtokában legyen. Az alaktani ismeretek alkalmazásakor nélkülözhetetlen a fonológia és a fonetika alkalmazása, különösen, ha beszédtechnológiai alkalmazásokat kívánunk fejleszteni. Így a kezdeti fordításra irányuló erőfeszítéseknek köszönhetően egy új tudományág jött létre, amelynek fókuszában az áll, hogy miképp tudunk reprezentálni és feldolgozni természetes nyelveket számítógépek segítségével.