Die Zukunft der Spracherkennung

Die Zukunft der Stimme
Ich erinnere mich noch an die Aufregung, die ich bei lesen eines der ersten Artikel f&uuml;hlte, die in gl&uuml;henden Worten die neuen mit Stift zu bedienenden 'Pen-Computer' diskutierten. Sie versprachen "revolution&auml;r" zu werden, "der nat&uuml;rlichste Weg, ihren Computer zu bedienen" und da&szlig; sie "Legionen von Computer Usern an sich ziehen w&uuml;rden". Und es schien wahr zu werden - die Wahrheit ist, da&szlig; Pens in Verbindung mit Computern nat&uuml;rlich waren. Was k&ouml;nnte leichter und nat&uuml;rlicher sein, als einen Stift zur Hand zu nehmen?

Jetzt, sieben Jahre sp&auml;ter, sind die Firmen, die die Pionierarbeit f&uuml;r Pens leisteten alle verschwunden: von Giganten geschluckt oder bankrott. Pen-Computer waren ein Flop und au&szlig;er einigen sehr speziellen Anwendungen und dem gelegentlichen Apple Newton Anh&auml;nger gibt es heute keinen einzigen verbreiteten Computer mehr, der heutzutage mit einem Stift verkauft wird.

Wie kam es dazu? Schliesslich lernt man die Nutzung eines Stiftsviel leichter als die einer Tastatur oder einer Maus.

Die Antwort ist, da&szlig; der Pen den Maschinen, auf denen er laufen sollte, weit voraus war. Zu einem Gro&szlig;teil war die n&ouml;tige Prozessorgeschwindigkeit nicht vorhanden, um Handschriften genau und schnell genug zu erkennen, schon gar nicht in einer Gr&ouml;&szlig;e, die ein guter Pen Computer haben sollte. Ich erinnere mich an einem fr&uuml;hen IBM Pen Computer, den ich mal gesehen habe und der &uuml;ber 5 Kilo wog, mit einem passiven schwarz-wei&szlig; LCD Bildschirm, der bei hellem Tageslicht nahezu unlesbar war, der eine Batterielaufzeit von unter 1 Stunde hatte und einen 386SX Prozessor enthielt. Das nenne ich eine lahme Ente! Diese Maschiene fristet jetzt wahrscheinlich ein Leben als T&uuml;rstopper, was so ziemlich alles ist, wof&uuml;r es zu gebrauchen war, als es zusammengeschraubt wurde. Ich bin sicher, da&szlig; es selbst f&uuml;r die heutigen schnellen Notebooks eine Herausforderung w&auml;re, meine schnellste Handschrift zu lesen. Ich habe es ja manchmal schon schwer, meine eigene Handschrift zu lesen.

Sieht so auch die Zukunft der Spracherkennung aus? Die Sprachfunktionen in Merlin sind wirklich beeindruckend - und dem Stand von ein paar Jahren zuvor weit voraus. Ein Produkt zu haben, das mit einer ganz normalen Soundkarte funktioniert und die M&ouml;glichkeit bietet, seinen Computer ohne Training ziemlich gut zu steuern, war letztes Jahr noch v&ouml;llig unm&ouml;glich. Aber jetzt - in einem Monat - wird ein kommerzielles Betriebssystem dieses Feature als Hauptverkaufsmerkmal beinhalten.

Ein Kollege erz&auml;hlte mir k&uuml;rzlich diese Geschichte: Er arbeitet mit einem Herrn zusammen, der einer der Vize-Pr&auml;sidenten in einer von Amerikas gr&ouml;&szlig;ten und gesch&auml;tzten Allgemeinen Universit&auml;ten ist. Dieser VP hat keinen Bedarf an Computern - er weigert sich, einen E-Mail Account anzumelden und h&auml;lt seinen Schreibtisch von Computern frei, weil er keine Zeit hat, deren Bedienung zu lernen.

Diese selbe Person jedoch, hat fr&uuml;her Audiologie, die Lehre von T&ouml;nen und Sprachen, studiert. Hin und wieder gibt mein Kollege ihm eine Demonstration, auf welchem Stand die Sprachtechnologie zum aktuellen Zeitpunkt ist. Der VP ist bereit- jederzeit bereit, auf eine Technologie zu warten, die er effektiv einsetzen kann. Noch wartet er.

Stellen sie sich die Anwendungsm&ouml;glichkeiten f&uuml;r einen Firmenpr&auml;sidenten oder Vizepr&auml;sidenten wie ihn vor. Anstatt die Benutzung eines Computers zu lernen, k&ouml;nnte der Pr&auml;sident einfach ein Mikrophon zur Hand nehmen und sagen," Zeig mir die Verkaufszahlen aus dem letzten Monat", oder "Vergleiche die Produktionskosten dieses Monats mit denen aus dem letzten Monat und stelle das Ergebnis graphisch dar". Was w&auml;re das f&uuml;r eine Revolution!

An diesem Punkt sind wir heute noch nicht angekommen und meine gr&ouml;&szlig;te Angst ist, da&szlig; wir dort niemals hinkommen werden, wenn sich Leute von der fr&uuml;hen, unperfektionierten Technologie abschrecken lassen, wie es bei den Pen Computern passierte. Meine Hochachtung an IBM, f&uuml;r ihre Einf&uuml;hrung der Technologie und die weitere Arbeit an den Mindestandforderungen f&uuml;r Prozessor und Geschwindigkeit, um Spracheingabe nutzen zu k&ouml;nnen. Nur &uuml;ber eine l&auml;ngere Zeit wird diese Technologie perfektioniert werden und ich hei&szlig;e Microsoft und andere Verk&auml;ufer willkommen, um um die beste L&ouml;sung zu konkurrieren, denn ich glaube daran, da&szlig; das gesprochene Wort sich als noch als m&auml;chtiger als der Stift herausstellen k&ouml;nnte.

John McDonald