Lehrwerksintegrierte Lernvideos als innovatives Unterrichtsmedium im fremdsprachlichen Anfangsunterricht (Französisch/Spanisch)

- -
- 100%
- +
Demgegenüber steht das sogenannte alternative Modell, bei dem (in Übereinstimmung mit der dualen Theorie nach Paivio) von einem „eigenständigen Repräsentationssystem für akustische und visuelle Prototypen“ (Gilmozzi 2002, 156) ausgegangen wird, bei dem Wort- und Bildstimuli im Zuge zentraler Prozesse (Stufe 2) zwar gemäß ihrer Modalität verarbeitet werden, jedoch durchaus miteinander in Verbindung treten können. Das Modell stellt somit einen Kompromiss zwischen der dualen und der monistischen Theorie dar (cf. Stachelscheid/Testrut 1997, 37). Es findet Unterstützung durch jüngste wissenschaftliche Erkenntnisse (cf. Abb. 6).

(S)= Sprachliche Information, (B)= Bildliche Information
Abb. 6: Drei Grundmodelle audiovisueller Informationsverarbeitung modifiziert nach Stachelscheid/Testrut (1997, 37)
Unter Berücksichtigung der konzeptuellen Nähe zwischen eingegangenen und vorhandenen Informationen unterscheidet Ballstaedt ferner zwischen drei Arten audiovisueller Integration, deren Verarbeitung an das jeweils vorliegende Verhältnis zwischen Text und Bild anschließt und über die Komplexität der geforderten Denkleistungen bestimmt. Diese umfassen Integration durch (1) Redundanz, (2) Komplementarität und (3) Inferenz.
Während bei redundanten Text-Bild-Beziehungen eine Aktivierung über das gleiche Konzept erfolgt, setzt die Integration durch Komplementarität voraus, dass mittels Text und Bild zwar unterschiedliche Konzepte angeregt werden, diese jedoch zueinander in Verbindung stehen und sich zu einer Botschaft ergänzen. Bei der Integration durch Inferenz findet die Integration hingegen erst durch die Aktivierung unterschiedlicher Konzepte im amodalen System statt, aus denen dann Schlussfolgerungen gezogen werden können. Bei den genannten Integrationsarten ist zu berücksichtigen, dass sie mit jeweils unterschiedlichem Vorwissen und einem unterschiedlichen Maß an Verarbeitungsaufwand verbunden sind, zumal inferente Text-Bild-Beziehungen weitaus komplexer sind als bei vorliegender Redundanz oder Komplementarität (cf. Ballstaedt 1988, 10sqq.).
Prinzipiell bedeutet der Einsatz audiovisueller Medien eine erhöhte Informationsdichte und folglich eine komplexere Verarbeitung gegenüber der einkanaligen Informationsaufnahme. Um der Gefahr einer Überforderung entgegenzuwirken, greift das menschliche Gehirn auf verschiedene Strategien zur Selektion von Informationen zurück, dank derer wir trotz Informationsfülle handlungsfähig bleiben (cf. ibid. 21sq.). Diese werden nachstehend erläutert.
3.2 Wahrnehmung als komplexer Prozess: Selektionsmechanismen und Aufmerksamkeitslenkung
In Ergänzung zu den Überlegungen des vorangehenden Kapitels geht die kognitive Theorie des multimedialen Lernens nach Mayer (2001, 43) davon aus, dass die Rezeption und Verknüpfung audiovisueller Inhalte dreierlei Maximen unterliegen. Diese umfassen die Prinzipien der dualen Kodierung, die eines begrenzten Arbeitsspeichers und die der aktiven Informationsverarbeitung.
Mayers Theorie basiert auf der Annahme, dass sprachliche und bildliche Informationen gemäß ihrer Sinnesmodalität automatisch getrennt voneinander aufgenommen werden, wobei Wörter im Gegensatz zu Bildern sowohl über die Augen als auch über die Ohren wahrgenommen werden können. Folglich können die Sinneskanäle durchaus interagieren. Dies ist etwa der Fall bei in Bildern oder Filmen auftauchenden Schriftzügen, deren Repräsentation zunächst anhand des visuellen und schließlich anhand des auditiven Kanals erfolgt. Gleiches gilt für erfahrene Lerner bei der mentalen akustischen Artikulation visueller Reize und vice versa.
In diesem Zusammenhang spielt die begrenzte Kapazität des menschlichen Arbeitsspeichers eine wichtige Rolle. Mit Verweis auf die cognitive load theory schreiben Wissenschaftler wie Baddeley, Chandler und Sweller unserem Gehirn ein limitiertes Maximum an Informationsverarbeitung pro Sinneskanal zu. Infolgedessen werden die eingegangenen Informationen einer Selektion unterzogen. Bei der Selektion handelt es sich um einen aktiven Prozess, bei dem relevante Informationen herausgefiltert werden. Der Abgleich und die Organisation bereits vorhandener bzw. gespeicherter Informationen mit neuen Reizen mündet in der Integration bildlicher und sprachlicher Konzepte. Ziel ist die mentale Repräsentation und Konstruktion kohärenter Sinneinheiten unter Rückgriff auf Informationen aus dem Langzeitgedächtnis. Sie gelten als Voraussetzung für erfolgreiches Lernen (cf. Mayer 2001, 46sqq.).
Die beschriebenen Vorgänge können dem von Mayer (2001, 44) entwickelten Modell zur kognitiven Theorie multimedialen Lernens, ebenfalls bekannt als S-O-I Modell (Selection – Organization – Integration), nachempfunden werden (cf. Abb. 7). Sie wiederholen sich viele Male während der Rezeption audiovisueller Medien.

Abb. 7: Theorie multimedialen Lernens nach Mayer (2001, 44)
Dass es sich bei der Wahrnehmung um einen komplexen und produktiven Prozess handelt, liegt nicht zuletzt darin begründet, dass höhere Verarbeitungsprozesse in Form von Korrekturmechanismen vermutlich versuchen, Merkmale und Eigenschaften, die bei der visuellen Informationsübertragung verloren gingen oder verändert wurden, nachträglich wiederherzustellen. Dies hängt zum einem mit der eigenen physischen Raumposition und Schwerkraftwirkung zusammen, zum anderen mit der Informationsübertragung auf das Netzhautbild (cf. Kebeck 1994, 164).
Fest steht, dass gerade bei der Wahrnehmung uneindeutiger Reizvorlagen (wie etwa einer unleserlichen Handschrift) der unmittelbar gegebene Kontext eine entscheidende Rolle für die Interpretation spielt. Aber auch sonst haben unser Vorwissen bzw. unsere gewohnte Kontexterwartung und -erfahrung einen erheblichen Einfluss auf unsere Wahrnehmung. Hintergrund ist der, dass wahrgenommene Bildinformationen Hypothesen stimulieren, die mit unseren bisherigen Erfahrungen abgeglichen werden, sodass aus den visuellen Reizen schließlich plausible Schlüsse gezogen werden können.
Dies führt sogar so weit, dass fehlende oder fehlerhafte Elemente des Bildinhalts vom Gedächtnis durch Kontextwissen ergänzt, vernachlässigt oder übergangen werden. Die visuelle Datenverarbeitung unterliegt demzufolge neben der Korrektur auch der Selektion und kognitiven Prozessen der Interpretation (cf. ibid. 196sqq.). Besonders deutlich werden die genannten Korrekturmechanismen bei optischen Täuschungen. Betrachtet man die folgende Abbildung, ist unklar, wie viele Beine der dargestellte Elefant hat, obwohl der Rückgriff auf unser Weltwissen eine klare Anzahl an Beinen vorsieht (cf. Abb. 8).

Abb. 8: Optische Täuschung: Wie viele Beine hat der Elefant? (Mißfeldt 2012, http://www.sehtestbilder.de/optische-taeuschungen-illusionen/, 20.3.2013)
Ein erfolgreiches Dekodieren und Interpretieren visueller Reize setzt gleichermaßen voraus, dass bei informationsreduzierten Bildern ausreichend charakteristische Merkmale erkennbar sind, anhand derer auf das Ganze geschlossen werden kann. Im Gegensatz dazu werden bei visueller Reizüberflutung in der Regel nur die Elemente gespeichert, die dem Betrachter interessant und neuartig erscheinen. Aufmerksamkeitserregend sind daher vor allem ungewöhnliche Montagen aus Bildern und/oder Texten, die ihrem herkömmlichen Kontext entrissen wurden, aber dennoch einen Bezug zur eigenen Lebenswelt aufweisen (cf. Sass 2007, 6).
Das Erstellen ungewöhnlicher und irrealer Bildkompositionen ist insbesondere durch Computerprogramme möglich. Oftmals wirkt das Endprodukt so authentisch, dass unklar ist, ob wir unseren Augen trauen können oder ob ihnen ein Streich gespielt wird. Dies gilt für Standbilder, aber auch für animierte Videoproduktionen (cf. Abb. 9).

Abb. 9: Wolkenreiter (N.N.)
Etwaige Techniken der Bildverarbeitung und -manipulation werden insbesondere in der Werbung angewandt, um die Blicke der Zuschauer zu gewinnen. Dabei handelt es sich um ständig wechselnde Reize, wie etwa häufige Schnitte, spezielle Kameratechniken und dynamische Darstellungen seitens der Akteure, die unseren Orientierungsreflex maßgeblich steuern. Im Vergleich zu Texten und Bildern „zeichnet sich […] nur das Filmverstehen durch ein Maximum an Verstehensökonomie und gleichzeitiger Reizabwechslung aus“ (Weidenmann 1988, 94). Die Verarbeitung gemäß dem Prinzip des geringsten Aufwandes ergibt sich aus dem hohen Grad an Stimulation, dem unsere Wahrnehmung ausgesetzt ist.
Für unser Gehirn stellen die genannten Korrektur- und Selektionsmechanismen kaum eine Herausforderung dar, vielmehr ist das Gegenteil der Fall: „das [konzeptgesteuerte] Zusammenspiel von Bildfragmentierung und Bildergänzung gehört für uns zur Routine visueller Alltagskommunikationen“ (Schrader 1998, 32).
Ähnliches gilt für den bei Film und Video parallel zum Sehverstehen stattfindenden Hörprozess. So erfolgt die Bedeutungskonstruktion des Gehörten ebenso durch datengesteuerte top-down und konzeptgesteuerte bottom-up Prozesse. Ihr Zusammenspiel charakterisiert sich zum einen durch den Rückgriff auf Vorwissen und den situativ gegebenen Kontext, zum anderen durch die Analyse und Semantisierung linear abfolgender sprachlicher Signale (cf. Grünewald/Küster 2009, 170).
Hinsichtlich der Aufmerksamkeit des Betrachters wird im Wesentlichen zwischen willkürlicher und unwillkürlicher Aufmerksamkeit unterschieden. Willkürliche Aufmerksamkeit meint das interessengesteuerte intentionale Hinwenden zu Sachverhalten, Themen und Gestaltung, die die Neugierde des Einzelnen wecken. Stoßen wir dagegen auf unerwartete Reize unserer Umwelt, deren Gestaltung durch grelle Farben oder ungewöhnliche Elemente unsere Beachtung findet, ohne dass der Inhalt von persönlichem Belang ist, spricht man von unwillkürlicher Aufmerksamkeit (cf. Sass 2007, 6).
Natürlich kann nicht alles, was wir wahrnehmen, auch aufgenommen, verarbeitet und gespeichert werden. Dementsprechend unterscheidet man in der Fremdsprachendidaktik zwischen dem von außen auf uns einwirkenden Input und dem, was davon verstanden wurde – dem Intake. Bezogen auf das Medium Film umfasst der Begriff des Inputs alle fremdsprachlichen Artikulationen und Beiträge – ungeachtet dessen, ob sie vom Lernenden verstanden wurden oder nicht. Die Bezeichnung Intake beschränkt sich dagegen auf diejenigen Elemente, die vom Rezipienten verstanden wurden und seinen sprachlichen Lernprozess beeinflussen. Bedingt durch die Tatsache, dass selbst kurze Videosequenzen über einen hohen Grad an verbalem sowie nonverbalem Input verfügen, fördert das Zusammenspiel von Bild und Sprache den Übergang vom Input zum tatsächlichen Intake (cf. University of Texas at Austin 2010).
3.3 Lernpsychologische Überlegungen
Von all unseren Sinnesorganen stellen die Augen die vermutlich bedeutendste Verbindung zum menschlichen Gehirn dar. Verglichen mit dem Tast- (8 %) und Hörsinn (3 %) nimmt die visuelle Wahrnehmung mit über zwei Millionen Nervensträngen ganze 30 % des Großhirns ein. Es ist daher kaum verwunderlich, dass der Mensch in der Lage ist, ein Farbbild im Bruchteil einer Sekunde zu erschließen. Burmark (2008, 8) zufolge vollzieht sich die visuelle Wahrnehmung sogar 60.000 Mal schneller als etwa die Verarbeitung eines Texts.
Doch trotz dieser enormen Leistung unseres Gehirns erschließen sich visuelle Eindrücke keineswegs immer von selbst. Stattdessen ist eine visuelle Lesefähigkeit (visual literacy) erforderlich, um Bildreize erfolgreich erfassen und interpretieren zu können. Diese im Zuge der visuellen Wende oftmals als „bildungsrelevante […] Kulturtechnik“ bezeichnete Fähigkeit ist bei Jugendlichen trotz ihrem täglichen Umgang mit visuellen Medien meist nur oberflächlich ausgeprägt (Michler 2011, 141). Folglich muss die Kompetenz der Bildentschlüsselung gezielt geschult werden, sodass „ausgehend von den Sehgewohnheiten der Schüler […] ein sachkritischer Blick auf ein Bild eingeübt und eine reflektierte Auseinandersetzung mit Visualisierungen angebahnt werden“ kann (ibid. 142). Dies erfordert allerdings, wie alle anderen Fertigkeitsbereiche, ein gezieltes Training mittels einer entsprechenden Didaktisierung, denn „systematisches Bildverstehen […] verlangt nicht weniger Wissen und mentalen Aufwand als [beispielsweise] systematisches Lesen“ (Weidenmann 1988, 177). Zur Heranführung und Optimierung des Hör-Seh-Verstehens bewährt sich daher eine Dreiteilung in Aktivitäten vor, während und nach der audiovisuellen Rezeption. Nur so kann der Lerner aktiv mit dem Medium in Verbindung gebracht und passive Rezeption vermieden werden.
Wie dem Begriff zu entnehmen ist, impliziert Hör-Seh-Verstehen neben Sehverstehen immer auch Hörverstehen. Der Verstehensprozess wird für den Rezipienten dahingehend erleichtert, dass unter Heranziehen der visuellen Dimension das Gehörte direkt auf seine Plausibilität verifiziert werden kann. Anhaltspunkte sind Mimik, Gestik, Verhaltensmuster, Umgebung, aber auch die Gesamtsituation als solche. Allerdings konnte empirisch nachgewiesen werden, dass eine Verbesserung der Hörverstehensleistung erst dann gegeben ist, wenn der visuelle Input „den auditiven Input in sinnvoller Weise ergänzt“ (Porsch/Grotjahn/Tesch 2010, 181).
So zeigt der Vergleich zwischen kontext- und inhaltsbezogenen Visualisierungen, dass insbesondere letztere einen positiven Effekt auf das Verständnis haben. Im Gegensatz zu inhaltsbezogenen Visualisierungen (e.g. Verbildlichung einer vorgetragenen Geschichte), die in direktem Zusammenhang zu dem Inhalt des Gesagten stehen, können kontextbezogene Visualisierungen (e.g. Visualisierung eines Sprecherwechsels) unter Umständen sogar negative Auswirkungen auf den Verstehensprozess des Rezipienten haben (cf. Ginther 2002, 134, 163).
Folglich sind Lernvideos, deren Bildmaterialien nicht in direktem Zusammenhang mit der Tonspur stehen, eher ungeeignet, um das fremdsprachliche Hörverstehen zu unterstützen. Das hier angeführte Beispiel (cf. Abb. 10) hat laut Titel und Inhalt die Karwoche in Spanien la semana santa zum Gegenstand, zu deren Anlass landestypische kirchliche Prozessionen stattfinden, die von der Bevölkerung begleitet werden. Wie anhand der Abbildung deutlich wird, gibt die Bildspur des Lernvideos jedoch lediglich Auskunft über den Sprecher, der im Großformat den Zuschauern zugewandt seinen Sprechertext vorträgt. Auch die im Hintergrund zu erkennenden Bilder stehen in keinerlei Zusammenhang mit dem Thema des Lernvideos. Dementsprechend stellt sich unweigerlich die Frage nach dessen Mehrwert gegenüber einem reinen Hördokument.

Abb. 10: Beispiel eines ungünstigen Lernvideos (Klink/Willenbrinck 2012) © Unión Europea, 1995–2016
Gerade die Simultanität visueller und akustischer Zeichen stellt in der Regel eine Unterstützung für Lernende dar, obgleich in Einzelfällen die Gefahr einer Überlastung nicht ausgeschlossen ist (cf. Hu/Leupold 2008, 58). Aufgrund der Tatsache, dass die im Lernvideo dargestellten Informationen tendenziell leicht nachvollziehbar sind, können eventuelle Verständnisschwierigkeiten durch nonverbale Komponenten ausgeglichen werden.
Im Unterschied zur rein auditiven Informationsaufnahme, bei der das Gehörte sprichwörtlich ‚zum einen Ohr hinein und zum anderen wieder hinausgeht‘, bietet der zusätzliche Rückgriff auf nonverbale Zeichen die Möglichkeit, hör-sehend wahrgenommene Informationen sowohl sprachlich als auch bildlich zu speichern. Die zweikanalige Speicherung erweist sich aus lernpsychologischer Sicht als besonders einprägsam, zumal die visuellen Impressionen an den Hörtext gekoppelt sind und erheblich zu dessen Verständnis beitragen, indem sie die Kohärenz zwischen Bild und Text stärken. Um die Aufmerksamkeit der Lernenden zu erlangen, sind vor allem solche Bildmaterialien geeignet, die in direktem Bezug zu ihrer Lebenswelt stehen, eine emotionale Betroffenheit auslösen und somit deren Interesse und Neugierde wecken (cf. Gilmozzi 2002, 157). Bei der schulischen Arbeit mit audiovisuellen Materialien haben Bilder folglich „nicht nur eine illustrative, sondern [auch] eine bedeutungstragende Funktion“ (Sass 2007, 7). Dies wirkt sich wiederum positiv auf die Konzentration und Motivation des Lernenden aus und stimuliert grundlegende Sprachlernprozesse.
3.4 Didaktische Konsequenzen für den Fremdsprachenunterricht
Aufgrund der beschriebenen positiven Grundeinstellungen eignet sich die Arbeit mit fremdsprachlichen Lernvideos bereits ab dem ersten Lernjahr, da sie den Lernenden erste ästhetische Erfahrungen mit dem Medium Film ermöglicht und ein positives Erleben der Fremdsprache begünstigt, das im weiteren Laufe des Sprachlernprozesses für eine Vielzahl an Aktivitäten genutzt werden kann.
Generell kann das Lernvideo auf der Basis eines erweiterten Textbegriffs durchaus als Textsorte verstanden werden. Ähnlich der Buchlektüre sind daher auch bei der Arbeit mit audiovisuellen Materialien einige didaktische Leitlinien zu beachten, um eine Aktivierung des Lerners zu gewährleisten. Demzufolge müssen vor dem Videoeinsatz nicht nur entsprechende inhaltliche Schwerpunkte gesetzt, sondern auch mögliche Hemmschwellen entdeckt und abgebaut werden. Ergebnisse aus der Interkomprehensionsforschung zeigen in diesem Zusammenhang, dass „Leser Texte schon dann nicht mehr verstehen, wenn sie 30 % der Elemente nicht identifizieren können“ (Nieweler 2008, 3). Vergleichbares lässt sich auf das Verständnis von Hörtexten übertragen. Aus Lernersicht wird Hörverstehen aufgrund von Sprechtempo, Prosodie, Sprecheranzahl, unbekannter Lexik und Grammatik als besonders anspruchsvoll und schwierig empfunden, zumal die Verarbeitungszeit nicht wie bei Texten individuell bestimmt werden kann. Hinzu kommt, dass der zusätzliche Umgang und das Verständnis visueller Informationen durchaus einen gewissen Reifegrad erfordern (cf. Weidenmann 1988, 175).
Aufgrund der Tatsache, dass „Hör- und Sehdaten […] unterschiedliche Verarbeitungswege in unterschiedlicher Geschwindigkeit [durchlaufen], [tritt] eine Simultanisierung […] erst auf der Ebene der semantischen Verarbeitung ein“ (Meißner 2006, 264) (cf. Kap. 3.2). Umso wichtiger ist es, der fehlenden zeitlichen Koordination entgegenzuwirken und audiovisuelle Materialien didaktisch so aufzubereiten, dass das Hör-Seh-Verstehen bestmöglich unterstützt wird. Wie bereits angesprochen, kann dies u.a. durch die Bewusstmachung von Bildinformationen geschehen. Jeder Film hat eine ästhetische Bildsprache, die es zu entdecken gibt (cf. Müller 1991, 267). Die „Schulung des eigenen Sehens und die Kenntnis davon, wie Wahrnehmung durch Bildgestaltung im Film gesteuert wird“ (Grünewald/Küster 2009, 170), kann die Rezeption grundlegend beeinflussen. Darüber hinaus vermag das Einblenden deutsch- oder fremdsprachiger Untertitel sprachliche Schwierigkeiten zu überwinden und das Verständnis auf diese Weise um bis zu 30 % zu erhöhen (cf. Sass 2007, 7).1
Prinzipiell ist zu beachten, dass die Aufmerksamkeit der Rezipienten bereits nach fünf Minuten deutlich nachlässt. Daher ist es von grundlegender Bedeutung, die Filmrezeption auf wenige Minuten zu beschränken oder aber kurze Pausen einzuplanen, sodass sich die Aufmerksamkeit insbesondere bei längeren Sequenzen wieder erhöht. Aus didaktischer Sicht ist es besonders gewinnbringend, Szenen wiederholt vorzuführen, da bei der ersten Rezeption der Fokus in der Regel zunächst auf der Handlung liegt. Sprachliche Aspekte treten dagegen meist erst nach mehrmaligem Wiederholen in den Vordergrund. Szenen sollten allerdings nicht häufiger als drei Mal gezeigt werden, da ein erweitertes Textverständnis eher unwahrscheinlich ist (cf. Grünewald/ Lusar 2008, 226).
Etwaige Hemmschwellen oder Frustration im Verständnis können durch den Aufbau einer sogenannten Teilverstehenstoleranz vermieden werden. Den Lernenden muss bewusst gemacht werden, dass ein Wort-für-Wort-Verstehen selbst in der Muttersprache aufgrund von Nebengeräuschen oder anderen Störquellen nicht immer möglich ist. Umso wichtiger ist es, beim schulischen Aufbau der Hör-Seh-Verstehenskompetenz von Anfang an die Strategie (global, selektiv, detailliert) zu schulen, die dem zu Grunde liegenden Hör-Seh-Verstehensinteresse entspricht (cf. Nieweler 2008, 4sq.).
Um den didaktischen Forderungen Rechnung zu tragen, gilt es, aus dem derzeitigen Überangebot an audiovisuellen Medien eben jene auszuwählen, die dem Lernenden unter der Beachtung der genannten Variablen einen alters- und lernstandsgerechten Zugang zu dem Medium ermöglichen. Entscheidend ist dabei nicht zuletzt das filmästhetische Zusammenspiel akustischer und visueller Elemente (cf. Leupold 2007a, 225), auf deren Basis der Lerner mithilfe filmbegleitender Aktivitäten schließlich (meta-)kognitive Strategien entwickeln soll. Diese dienen dazu, den erworbenen Intake dahingehend zu fördern, dass durch die aktive Auseinandersetzung und Verarbeitung wiederum ein neuer, eigenständiger Input entsteht (cf. Meißner 2010, 33) (cf. Kap. 3.2).
4 Zur curricularen Stellung eines integrierten Hör-Seh-Verstehens als Teilfertigkeit des Sprachlernprozesses
In Anlehnung an den GeR sollen im Zuge des Fremdsprachenunterrichts die sogenannten vier Grundfertigkeiten (Lesen, Sprechen, Schreiben und Hören) systematisch erarbeitet und eingeübt werden. Der GeR unterscheidet prinzipiell zwischen rezeptiven Kompetenzen (Hören, Lesen) und produktiven Kompetenzen (Schreiben, Sprechen). Im Kontext der rezeptiven Sprachfähigkeiten hat sich das Hör-Seh-Verstehen in den letzten Jahren zu einem zentralen Begriff innerhalb der fremdsprachendidaktischen Diskussion entwickelt. Hör-Seh-Verstehen ist im GeR als Unterkategorie des Hörverstehens aufgeführt, wobei Hören als auditive rezeptive Aktivität und Hör-Seh-Verstehen als audiovisuelle Rezeption bezeichnet wird. Obwohl es sich auf den ersten Blick lediglich um eine Teilfertigkeit des Sprachlernprozesses handelt, hat die Kompetenz des Hör-Seh-Verstehens jüngst an enormer Bedeutung gewonnen und sich neben Lesen, Sprechen, Schreiben und Hören als fünfte zu erwerbende Fertigkeit der bildungspolitischen Rahmenrichtlinien etabliert (cf. Gilmozzi 2002, 153).
Dieses Kapitel hat zum Ziel, die bestehenden europäischen und nationalen Rahmenrichtlinien zur Kategorie des Hör-Seh-Verstehens vorzustellen. Unter Bezugnahme auf den GeR, die Bildungsstandards für den Mittleren Schulabschluss und die Allgemeine Hochschulreife, die hessischen Kerncurricula sowie die hessischen Lehrpläne soll am Beispiel der Fächer Französisch/Spanisch deutlich werden, welchen Ansprüchen der moderne Fremdsprachenunterricht hinsichtlich des Einsatzes audiovisueller Materialien gerecht werden muss, sodass in einem weiteren Schritt gezeigt werden kann, welche Implikationen die curricularen Forderungen nach einem integrierten Hör-Seh-Verstehen für die Gestaltung aktueller Lehrwerke haben.
4.1 Curriculare Vorgaben zur Schulung des Hör-Seh-Verstehens
Bildungsrichtlinien sind notwendig, um einheitliche Zielsetzungen, Inhalte und Methoden zu schaffen, die allgemeingültigen Standards entsprechen und gleichzeitig der (inter-)nationalen Vergleichbarkeit dienen. Maßgeblich für den Bildungssektor sind dabei insbesondere der GeR, die nationalen Bildungsstandards sowie die kultusministeriellen Beschlüsse. Im Sinne der Qualitätssicherung werden diese einer ständigen Überprüfung und Aktualisierung seitens Experten von Bund und Ländern und im Falle des GeR von ganz Europa unterzogen. Die folgenden Ausführungen haben zum Ziel, unter Berücksichtigung der in Deutschland geltenden curricularen Vorgaben, einen Überblick über die Kompetenzanforderung des Hör-Seh-Verstehens zu geben.
4.1.1 Der Gemeinsame europäische Referenzrahmen für Sprachen






