Sprachliche KI
Sprachliche KI schreibt man Systemen zu, die in der Lage sind natürliche Sprache(n) zu verstehen (Spracherkennung) und mittels solcher zu kommunizieren (Sprachsynthese). Natürlich werden auch hier die Schwierigkeiten sofort deutlich, denn schließlich erschwert selbst uns der Sprachstil und Dialekt mancher Leute das Verständnis. Wie also müsste ein Computer vorgehen um natürliche Sprache zu verstehen?
Zunächst muss das Sprachsignal in die einzelnen Worte zerlegt werden. Dies geschieht, indem zunächst die einzelnen Laute bestimmt werden. Mit deren Hilfe und natürlich mit Hilfe eines Wörterbuches ist letztendlich die Erkennung der Wörter möglich. Ist dieser Schritt beendet liegt sozusagen ein geschriebener Text vor.
Der nächste Schritt besteht in der Bestimmung der Satzstruktur aus der Wortfolge. Somit wird natürlich auch geklärt um welche Wortart es sich bei den einzelnen Wörtern handelt. Natürlich benötigt das System hierfür die grammatikalischen Regeln der jeweiligen Sprache.
Sind Satzstruktur und Wortarten klar, so kann nun auch die Bedeutung der einzelnen Wörter sowie die allgemeine Bedeutung des gesamten Satzes geklärt werden. Bei manchen Sätzen erfordert dies jedoch einen weiteren Schritt, denn schließlich ist ja ein Merkmal von natürlichen Sprachen, dass nicht alle Wörter und Sätze eine eindeutige Bedeutung haben.
Also ist ein bestimmtes Maß an Hintergrundwissen erforderlich. So kann zum Beispiel der Satz: "Susi hat die Schule geschmissen" theoretisch zwei Bedeutungen haben. Die eine kann jedoch mit dem Wissen über das Größenverhältnis von Mensch und Schule ausgeschlossen werden. Auch spezielles Hintergrundwissen kann von Vorteil sein, denn wenn man zum Beispiel weiß, dass Susis Taschenlampe vor kurzem verschwunden ist, so ist auch die Bedeutung des Satzes: "Susi entdeckte ihn mit der Taschenlampe im Wald" klar.
Wie bereits erwähnt, gehört auch die Sprachsynthese und damit die Kommunikation mittels natürlicher Sprache zur sprachlichen KI. Diese funktioniert in etwa umgekehrt. Die "Botschaft" muss in Sätze mit der jeweiligen Bedeutung gebracht werden, welche als akustische Signale ausgegeben werden.
Wie leicht zu erkennen ist, ist auch die vollständige Realisierung Sprachlicher KI sehr schwer. Fehlendes Hintergrundwissen, verschiedene Wörter mit gleicher Aussprache, gleiche Wörter mit verschiedener Bedeutung, sowie störende Hintergrundgeräusche oder Dialekte erschweren das Sprachverständnis.
Deshalb sind Systeme mit Spracherkennungs- und Sprachsynthesefähigkeiten auch nur bei begrenzten Aufgaben im Einsatz. Bereits realisierte Einsatzgebiete sind Telefonauskünfte von Bahnhöfen, Flughäfen oder Kinos, bei denen man Zeiten und Preise erfragen kann. Eventuell kann man hier die gewünschte Leistung auch gleich buchen. Dies ist möglich, da hier die Menge der Informationen, über die das System verfügen muss, stark begrenzt ist. Denn schließlich muss es nicht damit rechnen, das jemand am Flughafen anruft um zu erfahren, wo es die billigsten Baugrundstücke gibt.
Auch Spracherkennungssysteme, die nur auf einen bestimmten Nutzer abgestimmt sind, sind einfacher zu realisieren, da nicht unzählige verschiedene Sprachstile berücksichtigt werden müssen.
Spracherkennung im Aktien-Trubel: Aktuelle Spracherkennungssysteme arbeiten mittlerweile auch mit Stör- und Hintergrundgeräuschen sicher. Dank des Sprechertrainings werden nichts sagende Laute aus dem Gesprochenen herausgefiltert
(www.tu-chemnitz.de/phil/leo/rahmen.php?seite=r_wiss/thanninger_spracherkennung.php)
Zurück
(vgl. Cawsey, Alison; Künstliche Intelligenz im Klartext; S.125 ff.)