Wie bereits erwähnt, ist der Computer ein Kommunikationsmedium. Blattner und Dannenberg unterscheiden vier Teilgebiete der Kommunikation zwischen Mensch und Computer [BD92a]:
In das Gebiet der Computer-Computer Kommunikation fällt beispielsweise die elektronische Post. Multimediale Anwendungen lassen sich in das Gebiet der Mensch-Mensch Kommunikation via Computer einordnen: Ein Entwickler bereitet Informationen auf und übermittelt sie mittels des Computers einem Endbenutzer. Während die Computer-Mensch Kommunikation eher die Informationsausgabe des Computers und die Informationsaufnahme durch den Menschen betrifft, wird im Bereich der Mensch-Computer Kommunikation die Informationseingabe des Menschen in den Computer betrachtet. In diesem Kapitel steht die Mensch-Computer Kommunikation oder auch (Mensch-Computer) Interaktion im Vordergrund.
Kommunikation dient dem Informationsaustausch. Zur Kommunikation gehören mindestens zwei Partner. Einer gibt Informationen weiter, der andere nimmt sie auf. Häufig findet dabei ein Dialog statt, bei dem sich die Rollen der beiden Kommunikationspartner, Informant bzw. Informierter zu sein, abwechseln. Der Mensch besitzt im wesentlichen folgende Fähigkeiten zur Informationsweitergabe (siehe auch [Gei90]):
Die Fähigkeiten können getrennt eingesetzt werden (Pantomime, Telefon, Brief). Sie werden im allgemeinen jedoch kombiniert verwendet. Die Verbreitung der Fähigkeiten nimmt in der angegebenen Reihenfolge ab und die dafür jeweils notwendige Anstrengung und Ausbildung nehmen zu. Fast jeder Mensch kann durch Gesten Informationen weitergeben, aber nur relativ wenige beherrschen das Maschinenschreiben. Auch geschichtlich haben sich die genannten Fähigkeiten in der angegebenen Reihenfolge entwickelt. Zudem sind Gesten meistens unabhängig von irgendwelchen Völkern. Das Kopfnicken dient beispielsweise überall auf der Welt als Zeichen der Zustimmung [SC72]. Selbst Tiere können sich dem Menschen durch Gesten bzw. Verhaltensweisen verständlich machen. Dahingegen gibt es weltweit eine Vielzahl von Sprachen und Schriften. Dadurch ist eine Kommunikation mittels dieser Fähigkeiten nur begrenzt einsetzbar. Weiterhin sind Gesten als Mittel der Informationsweitergabe dem Menschen auch so geläufig, daß sie häufig unbewußt eingesetzt werden, wohingegen Sprache und Schrift meistens vom Bewußtsein kontrolliert genutzt werden.
Den Fähigkeiten der zwischenmenschlichen Kommunikation folgend, müßten Gesten, Sprache und Schrift in der angegebenen Reihenfolge auch zur Informationseingabe in den Computer genutzt werden. Aber genau das Gegenteil ist der Fall, wie Abbildung 9.1 (aus [Gei90]) verdeutlicht.
Die Eingabe über eine Tastatur ist am weitesten verbreitet. Handschriftliche Eingaben bzw. Spracheingaben werden selten unterstützt. Eine gestische Eingabe ist heutzutage so gut wie gar nicht möglich. Grund für diese Kontroverse zwischen den menschlichen Fähigkeiten auf der einen Seite und der Realität auf der anderen Seite sind technische Grenzen. Der Mensch muß sich heute der Technik anpassen. Das Verhältnis zwischen Mensch und Computer wird durch den Computer bestimmt. Begrifflich zeigt sich dies beispielsweise daran, daß die Informationseingabe in den Computer häufig noch mit bedienen bezeichnet wird (siehe [Cha87] oder [Cha92]).
Das Teilgebiet der Informatik, das sich mit der Eingabe von Informationen in den Computer beschäftigt, ist das Gebiet der Mensch-Computer Interaktion (Human-Computer Interaction).Mensch-Computer Interaktion Neben Informatikern gehören diesem Gebiet Ergonomen, Soziologen, Psychologen und Kognitionswissenschaftler an [Boo89]. Ihr Hauptziel ist es, die Kluft zwischen Mensch und Computer umzukehren: Die Technik soll sich in der Zukunft dem Menschen anpassen. Auf dem Gebiet der Handschrifterkennung bzw. der Spracherkennung wird schon seit einiger Zeit geforscht, und auch die Informationseingabe über Gesten wird verstärkt untersucht. Möglichkeiten bietet hier der Datenhandschuh (siehe Abschnitt 9.2.1) oder auch die Beobachtung eines Benutzers durch eine Videokamera und die Interpretation seiner beobachteten Verhaltensweisen. Beispielsweise könnte ein Kopfnicken (Geste der Zustimmung) eine Frage bejahen und ein Kopfschütteln (Geste der Ablehnung) eine Frage verneinen, womit die in textuellen Systemen häufig auftretende Ja/Nein-Frage, bei der ein Benutzer ein ,,J`` bzw. ein ,,N`` eintippen muß, durch eine gestische Eingabeform ersetzt werden könnte. Einige Forschungssysteme werden in [BB87c] vorgestellt.
Bis derartige Forschungsansätze aber kommerziell einsatzfähig sind, wird sicher noch einige Zeit vergehen. Von daher muß versucht werden, mit heutzutage existierenden Technologien die gestische Eingabe zu simulieren [Sch89]. Mit Hilfe der Maus lassen sich beispielsweise Zeigegesten simulieren. Durch die Dialogform der Direkten Manipulation (siehe Abschnitt 9.2.3.2) ist es möglich, menschliche Verhaltensweisen graphisch auf dem Bildschirm nachzubilden.9.3 Klassisches Beispiel ist hier das Bewegen eines Objektes auf einen durch ein Ikon dargestellten Papierkorb als Metapher zum Löschen des Objektes. Derartige Simulationen müssen insbesondere in Anwendungen eingesetzt werden, deren Benutzer im allgemeinen keine Computerexperten sind. Dies trifft beispielsweise sowohl auf Entwickler als auch auf Benutzer multimedialer Anwendungen zu.
Multimodal Häufig werden multimediale Systeme auch multimodal genannt. Dix betont, daß multimediale Systeme oft auch multimodal sind, es aber nicht unbedingt sein müssen [DFAB93]. Nach Dix sind multimodale Systeme dadurch gekennzeichnet, daß sie mehr als einen Sinneskanal des Menschen zur Mensch-Computer Kommunikation nutzen. Während heutzutage Informationen meistens nur optisch auf einem Bildschirm dargestellt werden, wodurch die visuelle Sinnesmodalität des Menschen angesprochen wird, unterstützen multimodale Systeme auch eine akustische oder haptische Anzeige und beziehen damit auch die auditive, die taktile und die kinästhetische Sinnesmodalität in die Mensch-Computer Kommunikation ein. Systeme, die beispielsweise Video und Graphik integrieren, sind nach der Definition von Steinmetz (siehe Kapitel 2) multimedial, nach Dix aber nicht multimodal.
Während Dix mit Modalität die sensorische Modalität9.4 meint und damit eher die Informationsaufnahme durch den Menschen anspricht, verwendet Blattner den Begriff in Zusammenhang mit der Informationsweitergabe durch den Menschen [BD92a]. Für Blattner ist ein System multimodal, wenn es mehrere Arten der Interaktion durch den Menschen unterstützt. Beispiele für verschiedene (Eingabe-)Modalitäten sind die Tastatureingabe, die Eingabe mit Hilfe einer Maus, die Spracheingabe oder die Gestikeingabe mit Hilfe eines Datenhandschuhs. Nach Blattner bezieht sich die Multimedialität eines Systems auf die Ausgabe von Informationen durch den Computer und die Multimodalität auf die Eingabe von Informationen in den Computer. In dieser Ausarbeitung wird die Terminologie von Blattner verwendet.
Über das Eingabesystem eines Computers gibt der Mensch Informationen in den Computer ein. Die Auswahl und Gestaltung des Eingabesystems ist dabei von folgenden Faktoren abhängig (siehe auch [Gei90]):
Hauptbegrenzungsfaktor bei der Gestaltung eines Eingabesystems ist natürlich die verfügbare Eingabetechnologie: Je mehr Eingabegeräte zur Verfügung stehen, desto flexibler läßt sich ein Eingabesystem gestalten.9.5 Eingabesysteme sind weiterhin anwendungsspezifisch: Unterschiedliche Anwendungen verlangen unterschiedliche Eingabegeräte. Während für Texteditoren Tastaturen erforderlich sind, sind CAD-Systeme ohne Mäuse kaum nutzbar. Die Eingabe natürlicher Sprache erfolgt im allgemeinen über Mikrophone. Zusammengefaßt kann man sagen, daß Eingabesysteme von der Eigenschaft der einzugebenden Information abhängig sind.
In höherem Maße als die einzusetzende Technik muß in Zukunft jedoch der Mensch bei der Gestaltung von Eingabesystemen berücksichtigt werden. Die durchzuführenden Aufgaben müssen optimal vom Eingabesystem unterstützt werden. Es müssen verschiedene Techniken zur Durchführung von Aufgaben angeboten werden, aus denen sich der Benutzer die für ihn geeignetste auswählen kann. Die Gestaltung muß nach ergonomischen Gesichtspunkten erfolgen. Eingabesysteme müssen weiterhin adaptiv sein, d.h. sich den Bedürfnissen des Benutzers anpassen.
Damit ist auch schon das Hauptziel der Gestaltung von Eingabesystemen bzw. der gesamten Mensch-Computer Kommunikation angesprochen, nämlich die Anpassung der Technik an den Menschen. Anwendungen müssen so entwickelt werden, daß sie den Fähigkeiten und Intensionen der Benutzer gerecht werden. Sie dürfen ihn weder unter- noch überfordern. Insbesondere multimediale und multimodale Techniken und Systeme bieten hier eine gute Grundlage zur Erreichung dieses Ziels.