Datengeleitetes Lernen (DDL) – Eine Einführung

Der Beitrag stellt das Konzept des Data-driven Learning (DDL) als Methode der Sprachvermittlung vor. Der Schwerpunkt liegt dabei auf der Vermittlung von Deutsch als Fremdsprache (DaF). Nach einer kurzen historischen Verortung des DDL (Abschn. 1) werden wichtige DDL- Varianten präsentiert (2). Es folgen eine systematische Übersicht und kommentierte Vorstellung konkreter DDL-Aktivitäten aus veröffentlichten Unterrichtsmaterialien (3), ein Überblick über aktuelle Publikationen zu DDL im DaF-Bereich (4), eine literaturbasierte Vorstellung lerntheoretischer Prinzipien, die mit DDL verbunden werden (5), sowie ein Überblick über empirische Studien zur Wirksamkeit und zu Herausforderungen des Ansatzes (6). Anschließend wird aufgezeigt, wie das KED-Projekt die Umsetzung des DDL-Ansatzes unterstützt (7). Ein Fazit fasst den Beitrag zusammen (8).
DDL (datengeleitetes Lernen)
Einführung
DaF
EFL
Autor:in
Zugehörigkeit
Veröffentlichungsdatum

22. Mai 2025

1 Woher kommt und was ist DDL?

Data-driven learning (DDL) – zu Deutsch ‚datengeleitetes‘, ‚datengestütztes‘ oder ‚datengesteuertes‘ Lernen – ist ein Ansatz der Sprachvermittlung, der authentische, in Korpora gesammelte Sprachdaten für Sprachlernprozesse nutzt. Lernende sollen die Regelhaftigkeiten und die Gebrauchsmuster einer zu lernenden Sprache entdecken, indem sie mit Belegen aus echten Texten konfrontiert und beim Umgang mit den Belegen aufgaben-orientiert angeleitet werden. Darüber hinaus trägt die wiederholte Begegnung mit einem Wort, einer Verbindung mehrerer Wörter oder einer grammatischen Struktur dazu bei, dass Lernende diese mit ihren formalen und funktionalen Merkmalen im Gedächtnis speichern und aktiv verwenden können.

Die Ursprünge des Ansatzes liegen in den 1980er Jahren, als Forschende im Umkreis des COBUILD-Projekts1 der Universität Birmingham (UK) die Potentiale der computergestützten Erfassung und Auswertung immer größerer Mengen an Sprachdaten erkannten und für die Sprachvermittlung zu nutzen begannen. Tim Jones, der als Erfinder und Namensgeber des DDL-Ansatzes gilt, definiert Data-driven Learning als

the use in the classroom of computer-generated concordances to get students to explore regularities of patterning in the target language, and the development of activities and exercises based on concordance output (Johns und King 1991, iii; zit. n. Mukherjee 2006, 11).

In dieser kurzen Definition sind bereits alle Kernelemente des DDL-Ansatzes enthalten. Hierzu gehören die Arbeit mit authentischen Materialien in Form von Konkordanzlisten, das entdeckende Lernen zielsprachlicher Strukturen und das Erstellen von Lehr-/Lernmaterialien aus Korpusbelegen2.

2 Wie funktioniert DDL?

Eine wichtige Unterscheidung bei der didaktischen Arbeit mit Korpora betrifft die Frage, ob die Lernenden selbst mit Korpora arbeiten und in diesen nach zielsprachlichen Belegen suchen sollen (Kapitel 2.1) oder ob es die Lehrpersonen sind, die geeignete Belege aus dem Korpus heraussuchen und ihren Lerner:innen das ermittelte sprachliche Material dann in didaktisch aufbereiteter Form präsentieren (Kapitel 2.2). Im ersten Fall spricht man auch von „direktem“, „hands-on“ oder „computer-basiertem“ DDL. Für den zweiten Fall werden die Bezeichnungen „indirekter“, „hands-off“ oder auch „papierbasierter“ Ansatz verwendet. Ob die direkte oder die indirekte Variante effizienter ist, ist noch unklar bzw. kann nicht pauschal entschieden werden3.

2.1 Direkte Nutzung

Lernende können Korpora im Rahmen von DDL-Aktivitäten ohne Weiteres selbst nutzen, wenn sie klare Instruktionen bzw. Unterstützung von Seiten der Lehrpersonen erhalten. Diese Instruktionen können dabei die Sucheingabe selbst, Empfehlungen zur Filtereinstellungen oder Tipps zur Sortierung der Treffer enthalten. Mit zunehmender Erfahrung lernen Lerner:innen, Anfragen selbst zu formulieren, und entwickeln ein Verständnis für den Nutzen von Korpora und Konkordanzen. Das führt im Idealfall zu der Befähigung, Korpora für die eigenen kommunikativen Bedürfnisse zu nutzen. Diese sog. Corpus Literacy (Mukherjee 2002) umfasst Wissen darüber,

  • welche Korpora bzw. Korpusportale (für das Deutsche) existieren und wie diese sich unterscheiden
  • wofür – also für welche Fragestellungen – Korpora sinnvoll genutzt werden können
  • welche Möglichkeiten der Suche (nach Metadaten, Wortformen, Grundformen, Kollokationen u.a.) es generell und auf speziellen Korpusportalen gibt
  • wie man eine Suchanfrage in einem gegebenen Suchinterface formuliert und Schritt für Schritt optimiert
  • wie die ermittelten Ergebnisse zu interpretieren sind (Sripicharn 2010, 380).

In Kapitel 3.3 finden sich Beispiele für Instruktionen in direkten DDL-Aktivitäten.

2.2 Indirekte Nutzung

Viele der in der Literatur vorgestellten DDL-Aktivitäten sind indirekte DDL-Aktivitäten. Dabei arbeiten die Lernenden mit Korpusbelegen, die eine Lehrperson zuvor ermittelt und zusammengestellt hat. Der Vorteil dieses Vorgehens liegt darin, dass Lehrpersonen die unterrichtlichen Prozesse besser steuern können, indem sie entscheiden, welches Sprachmaterial sie in welchem Umfang zu welchem Zeitpunkt einsetzen. Das heißt, dass sie bei der Gewinnung und Präsentation der Korpusbelege zahlreiche didaktische Entscheidungen – in Abhängigkeit von Vermittlungsgegenstand, Lernziel und Lernendengruppe – treffen:

  • Anzahl der Belege: Lehrpersonen müssen entscheiden, wie viele Suchtreffer / Belegbeispiele sie ihren Lernenden für eine DDL-Aktivität präsentieren wollen.
  • Auswahl der Belege: Lehrpersonen können aus der ausgegebenen Menge an Belegen didaktisch geeignete auswählen oder aber sie wählen keine einzelnen Belege aus, sondern präsentieren z.B. 25 zufällig ausgewählte Treffer. Kriterien für eine händische Selektion von Belegen wären etwa die Schwierigkeit, Häufigkeit oder Nützlichkeit der im Beleg vorkommenden lexikalischen oder grammatischen Strukturen (vgl. Gilquin und Granger 2022, 433).
  • Schiefverteilter oder ausgeglichener Input: Lehrpersonen können mit Konkordanzlisten die Verteilung von Zielstrukturen im realen Sprachgebrauch nachbilden und den Lernenden so besonders häufige, prototypische Beispiele präsentieren. Im realen Sprachgebrauch ist die Verteilung von Strukturen und Wörter normalerweise nicht ausgeglichen. Stattdessen kommen bestimmte Strukturen besonders häufig mit bestimmten Wörtern vor, und umgekehrt. Dieser schiefverteilte Input (skewed input) bildet eine Art von Anker oder Prototyp für den inputgetriebenen Erwerb einer Struktur. So würden beispielsweise in einer Konkordanzliste mit Belegen für die Konjunktion je (z.B. „Je mehr man bläst, …“) die Mehrheit der Belege die Variante je kombiniert mit desto enthalten (z.B. „Je mehr man bläst, desto lauter wird der Ton.“), umso-Fortsetzungen (z.B. „Je mehr man bläst, umso lauter wird der Ton.“) kommen dagegen vergleichsweise selten vor (im KED etwa im Verhältnis 215 : 10). „Ein solcher Input begünstigt das Erlernen einer Konstruktion, da sich die Lernenden über die Ankerbeispiele die Bedeutung der Konstruktion aneignen können“ (Amorocho und Ender 2025, 9; vgl. auch Henk 2022, 179–181).
  • Gruppierung von Belegen: Die Lehrperson wählt im Vorhinein passende Belege aus und ordnet sie in zwei oder mehrere Sets, abhängig von den relevanten Eigenschaften der Belege. Dies Art der Präsentation von Belegen wird häufig beim Vergleichen von Phänomenen genutzt. Beispiele hierfür werden unten in Abschn. 3 (s. Übung 4 und Übung 5) vorgestellt.
  • Präsentation im KWIC-Format oder im Satz-Format: In manchen Korpusportalen (z.B. DWDS) kann man wählen, ob die Belege im KWIC-Format (als Zeilen mit visuell getrennten Spalten „linker Kontext“, „Suchausdruck“, „rechter Kontext“) oder als ganze Sätze ausgegeben werden. Ersteres ermöglicht eine bessere Sichtbarmachung sprachlicher Muster (etwa auch durch die Sortierfunktionen der drei Spaltenfelder), während das Satz-Format den üblichen Lesegewohnheiten entgegenkommt (Gilquin und Granger 2022, 433).
  • Bearbeitung von Belegen: Konkordanzbelege können den Lernenden unbearbeitet oder (didaktisch) bearbeitet vorgelegt werden (Gilquin und Granger 2022, 433). Während unbearbeitete Belege dem Authentizitäts-Anspruch am besten entsprechen, kann es auch gute Gründe für didaktisch motivierte Bearbeitungen geben. Zu den Bearbeitungsoptionen gehören z.B.
    • die typographische Hervorhebung von Ausdrücken im Belegausschnitt, als Form des input enhancement (Doughty und Williams 1998, 236f.)
    • die Entfernung abgeschnittener Satzfragmenten im rechten und / oder linken Kontext, um die Lesbarkeit zu erhöhen
    • die Korrektur von offensichtlichen orthographischen Fehlern in Korpusmaterial
    • das Hinzufügen von Erläuterungen zu Belegausdrücken, z.B. zur Auflösung von Pro-Formen (Pronomen, Pronominaladverbien)
    • die Vereinfachung von Belegen hinsichtlich des verwendeten Wortschatzes oder der grammatischen Konstruktionen
    • die Entfernung von Sequenzen im Belegausschnitt, die von der Lehrperson als zu schwierig, unnötig oder gar unverständlich eingeschätzt werden
  • Präsentation von falsch-positiven Treffern: Lehrpersonen müssen entscheiden, ob sie den Lernenden auch falsch-positive Treffer präsentieren oder diese schon vorher aussortieren. Falsch-positive Treffer sind solche, die zwar aufgrund einer gewählten Suchanfrage ausgegeben wurden, aber dennoch nicht für den anvisierten Lerngegenstand relevant sind. Für manche Vermittlungskonstellationen kann es jedoch eine anregende Aufgabe darstellen, Lernende darüber reflektieren zu lassen, ob und warum ein Beleg zum gewünschten Suchprofil passt. Ein Beispiel hierfür ist eine Unterrichtssequenz zur Unterscheidung der Verlaufsform und der Partizipialform im Englischen, in der die Lernenden explizit aufgefordert werden, diejenigen Belege herauszufinden, die vom generellen Verhaltensmuster abweichen (Sutherland 2023, 34).

Die Entscheidung, ob und wie Lehrpersonen Belege gegenüber ihrer Originalform verändern, steht im Spannungsfeld zwischen dem Streben nach Authentizität und anderen didaktischen Zielen, die mit der jeweiligen Aktivität verbunden sind.

3 Wie sehen typische DDL-Aktivitäten aus?

Um zu veranschaulichen, wie Korpusbelege in konkreten Aktivitäten (Aufgaben und Übungen) genutzt werden können, werden nachfolgend einige Beispiele aus der Fachliteratur präsentiert und kommentiert. Wir unterscheiden dabei Aktivitäten nach ihrer didaktischen Zielsetzung:

  • Aktivitäten zum Entdecken und zur Bewusstmachung von Regularitäten (Kapitel 3.1)
  • Aktivitäten zum Einüben von Mustern und Regeln (Kapitel 3.2)
  • Aktivitäten zur Initiierung von direktem DDL (Kapitel 3.3)

Die Beispiele sind sowohl dem Englisch-als-Fremdsprache (EFL)- als auch dem DaF-Vermittlungskontext entnommen.

3.1 Aktivitäten zum Entdecken und zur Bewusstmachung von Regularitäten

Das Ziel dieses Typs von Aktivitäten ist es, Lernende dazu zu bringen, sprachliche Muster und Regularitäten in vorgegebenen Korpusbelegen zu entdecken. Die Instruktionen dazu können eher offen formuliert werden (wie in Übung 1 und Übung 2) oder stärker gesteuert und kleinschrittiger (wie in Übung 3).

In Übung 1, die einer längeren EFL-Sequenz zu that-Sätzen (Johns 1991, 300) entnommen ist, sollen die Lernenden ihre Aufmerksamkeit auf diejenigen Verben richten, die vor dem that-Satz stehen, und die Verwendungskontexte derjenigen Verben genauer betrachten, an denen sie interessiert sind oder deren Bedeutung sie nicht kennen.

Übung 1  

Instruktion und Anfang der KWIC-Liste zu that-clauses (Johns 1991, 300)

Instruktion und Anfang der KWIC-Liste zu that-clauses (Johns 1991, 300)

In Übung 2 sollen die Lernenden Hypothesen darüber aufstellen, welche (Typen von) Verben die Subjunctive-Form im Englischen auslösen und welche Bedeutungskomponente diese Verben gemein haben.

Übung 2  

DDL-Übungsbeispiel aus Siepmann (2018) zu Signalen für die Subjunctive-Form (Link, Abruf 22.05.2025)

DDL-Übungsbeispiel aus Siepmann (2018) zu Signalen für die Subjunctive-Form (Link, Abruf 22.05.2025)

Übung 3 ist Teil einer längeren Übungssequenz zu Verben mit Präpositionen im Deutschen. Die Instruktion enthält eine konkrete Fragestellung („determine which prepositions combine with da- and which prepositions combine with dar-“). Die Lernenden sollen also im Belegmaterial entdecken, welche Präposition mit da- und welche mit dar- kombiniert wird und sich entsprechender Muster bewusst werden.

Übung 3  

Instruktion zu einer Unterrichtssequenz zu Pronominaladverbien (Vyatkina 2020, Link, Abruf 22.05.2025, „VPC“ steht für ‚verb-preposition collocation‘)

Instruktion zu einer Unterrichtssequenz zu Pronominaladverbien (Vyatkina 2020, Link, Abruf 22.05.2025, „VPC“ steht für ‚verb-preposition collocation‘)

Insbesondere wenn Lernende relevante Form-Funktionsunterschiede zwischen zwei (oder mehr) Strukturen entdecken sollen, kann es sinnvoll sein, Belege nach gemeinsamen Merkmalen zu gruppieren und mit Beleggruppen zu kontrastieren, die sich in einem relevanten Merkmal unterscheiden. So sollen die Lernenden in Übung 4 durch die gruppierte Darstellung die Unterschiede in den Verwendungskontexten der Relativpronomen who und which entdecken.

Übung 4  

Siepmann (2018), Übung 3 (Link, Abruf 22.05.2025)

Siepmann (2018), Übung 3 (Link, Abruf 22.05.2025)

In Übung 5 sollen DaF-Lernende anhand der Belege aus dem DWDS die unterschiedlichen Verbpositionen entdecken, die mit den Konnektoren der Gruppen A (koordinierende Konnektoren) und B (subordinierende Konnektoren) einhergehen. Der Aufmerksamkeitsfokus der Lernenden wird in der Instruktion auf die Position des konjugierten Verbs gelegt („pay special attention to …“). Danach sollen sie die passende Regelbeschreibung aus zwei vorgegebenen auswählen.

Übung 5  

Aktivität zu Konnektoren aus der Seite „Incorporating Corpora“ (Vyatkina 2020, Link, Abruf 22.05.2025)

Aktivität zu Konnektoren aus der Seite „Incorporating Corpora“ (Vyatkina 2020, Link, Abruf 22.05.2025)

Für die Präsentation von Regularitäten und Mustern werden neben verbalen Formulierungen (wie in Übung 5) auch schematische Darstellungen (wie in Übung 6) verwendet. Die Lernenden sollen von den Einzelfällen der Belege zu einer abstrakteren Darstellung und Repräsentation des Musters gelangen, indem sie die Belege vergleichen, Gemeinsamkeiten ableiten und die entsprechenden Einheiten in die offenen Kästchen eintragen.

Übung 6  

Aktivität zur Entdeckung von sprachlichen Mustern zu „Prozent“ (Krekeler 2021, 173, Ausschnitt)

Aktivität zur Entdeckung von sprachlichen Mustern zu „Prozent“ (Krekeler 2021, 173, Ausschnitt)

3.2 Aktivitäten zum Einüben von Mustern und Regeln

Bei diesem Typ von DDL-Aktivitäten werden Korpusbelege als sprachliches Material verwendet, mit denen Muster oder Regularitäten vertiefend eingeübt werden sollen. Im Folgenden werden einige Beispiele für unterschiedliche Übungstypen beschrieben.

3.2.1 Lückenübungen

Lückenübungen mit authentischem Korpusmaterial gehören zu den meistgenutzten DDL-Übungstypen, vermutlich nicht zuletzt deshalb, weil sie einfach zu erstellen sind: Im KWIC-Format muss hierzu lediglich die Spalte für den Suchausdruck (das „Keyword“) getilgt werden (Übung 7, Übung 8, Übung 9).

Die Bezeichnung „Lückenübung“ ist zunächst eine formale Kennzeichnung. Beim Ausfüllen von Lücken können jedoch im Einzelfall sehr unterschiedliche mentale Operationen angeregt werden. So erfordert Ü 7 die semantische und syntaktische Verarbeitung der Ausdrücke „Reichweite“, „Empfehlung“ und „Prozent“ in typischen Kontexten, was im Idealfall zur Verankerung entsprechender musterhafter Einträge im mentalen Lexikon führt.. Die gruppierte Darstellung der Belege soll dazu führen, dass musterhafte Merkmale der jeweiligen Kontexte erkannt und abstrahiert werden.

Übung 7  

Lückenübung mit gruppierten Belegen zur Festigung von Mustern (die Wörter „Reichweite“, „Empfehlung“ und „Prozent“) (Krekeler 2021, 173)

Lückenübung mit gruppierten Belegen zur Festigung von Mustern (die Wörter „Reichweite“, „Empfehlung“ und „Prozent“) (Krekeler 2021, 173)

Dasselbe gilt auch für Übung 8, bei der häufige Nomen (allegation, assumption …), die im Englischen that-Sätze einleiten, den passenden Kontexten zugewiesen werden sollen.

Übung 8  

[…]

Lückenübung mit gruppierten Belegen zu Nomen, die that-Sätze einleiten (Johns 1991, 307, gekürzter Ausschnitt, GD)

In Übung 9 sind die gesuchten Lückenwörter zwar schon vorgegeben, aber um die Aufgabe zu lösen, muss den Lernenden die Bedeutung der Lückenwörter bekannt sein. Die Passung zu den Belegen erfolgt über die Analyse der Belegkontexte, insbesondere die Sequenzen nach such as, in denen Unterbegriffe zu den gesuchten Nomen erscheinen. Mit der Aktivität wird die klassifizierende Funktion der such as-Konstruktion mit dem Muster [Nomen / Oberbegriff] + such as + [Nomen / Unterbegriff] durch das Verarbeiten von verschiedenen Exemplaren der Konstruktion vertieft und eingeprägt.

Übung 9  

Lückenübung zu Nomen vor einer such as-Phrase (Johns 1991, 303)

Lückenübung zu Nomen vor einer such as-Phrase (Johns 1991, 303)

Übung 10 bietet den Lernenden Gelegenheit, gleichzeitig die Formen (Konjugation) und die Bedeutung von häufigen starken Verben einzuüben.

Übung 10  

KED-Beispielmaterial zu starken Verben (Link, Abruf 25.2.2025)

KED-Beispielmaterial zu starken Verben (Link, Abruf 25.2.2025)

3.2.2 Rekonstruktionsübungen

Bei Rekonstruktionsübungen sind die Lernenden angewiesen, aus dem vorgegebenem Wortmaterial die originalen Sätze bzw. Konstruktionen der Korpusbelege zu formulieren. In Übung 11 sollen Lernende Belege für die je-desto-Konstruktion aus dem KED rekonstruieren.

Übung 11  

Lückenübungen aus Unterrichtsmaterial zur je-desto-Konstruktion (eigener Entwurf; GD)

Lückenübungen aus Unterrichtsmaterial zur je-desto-Konstruktion (eigener Entwurf; GD)

Die Reihenfolge der Übungen (A5-A7) folgt der vermuteten Schwierigkeit. In jeder der drei Übungen werden unterschiedliche formale Aspekte der Konstruktion fokussiert: die Position von je und desto (A5), Komparativformen der Adjektive / Adverbien nach je bzw. desto (A5, A6, A7), Konjugation (A6, A7) und Positionierung der Verben (A7).

3.2.3 Zuordnungsübungen

Bei diesem Übungstyp wird das Belegmaterial „zerschnitten“ und die Lernenden sollen die Teile wieder zusammenfügen (Übung 12 , Übung 13, Übung 14). Hierzu müssen sie die Satzfragmente auf thematisch-semantische und / oder formal-grammatische Passung hin überprüfen.

Übung 12  

Zuordnungsübung zu that-Sätzen (Johns 1991, 308)

Zuordnungsübung zu that-Sätzen (Johns 1991, 308)

Übung 13  

Zuordnungsübung zu Belegen mit starken Verben (Link, Abruf 22.05.2025)

Zuordnungsübung zu Belegen mit starken Verben (Link, Abruf 22.05.2025)

Übung 14  

KED-Beispielmaterial zu trennbaren Verben (Link, Abruf 22.05.2025)

KED-Beispielmaterial zu trennbaren Verben (Link, Abruf 22.05.2025)

3.2.4 Umformungsübungen

Bei Umformungsübungen sollen die Lernenden die Zielkonstruktion produzieren. Hierfür ist eine Manipulation des Belegmaterials durch die Lehrperson erforderlich. In Übung 15 wurden Konkordanzzeilen für sollen in redewiedergebender Bedeutung so bearbeitet, dass die sollen-Konstruktion durch eine bedeutungsähnliche Umschreibung ersetzt wurde (unterstrichene Passagen). Die Aufgabe der Lernenden besteht darin, anstelle der Umschreibung die sollen-Konstruktion zu verwenden.

Übung 15  

Umformungsübung zu sollen in redewiedergebender Bedeutung (Link, Abruf 22.05.2025)

Umformungsübung zu sollen in redewiedergebender Bedeutung (Link, Abruf 22.05.2025)

3.3 Aktivitäten zur Initiierung von direktem DDL

Diese Art von DDL-Aktivitäten soll Lernende dazu befähigen, selbstständig Korpora zu konsultieren, um Antworten auf zu klärende Fragen der Sprachverwendung zu finden.

Damit die Lernenden eine selbst durchgeführte Korpusrecherche als hilfreich und motivierend erfahren, sollten die Lehrpersonen die vorgeschlagene Suche unbedingt im Vorfeld ausprobiert haben und in den Arbeitsanweisungen den Lernenden mehr oder weniger genaue Vorgaben zur Suche machen. Dies kann sich auf die Sucheingabe selbst (wie in Übung 16 - Übung 20) oder auf die Sucheinstellungen (wie z.B. in Übung 19) beziehen.

Anlass zu direkten DDL-Aktivitäten können beispielsweise Korpusrecherchen zur Fehlerkorrektur wie in Übung 16 sein, in der die Lernenden die sprachlich angemessene Verwendung des Nomens Weise im Deutschen Wortschatz (Leipzig) herausfinden sollen4.

Übung 16  

Instruktion zur Durchführung einer Korpusrecherche zur Korrektur von Lernerfehlern (Krekeler 2021, 180)

Instruktion zur Durchführung einer Korpusrecherche zur Korrektur von Lernerfehlern (Krekeler 2021, 180)

Ein weiteres Ziel direkter DDL-Aktivitäten kann das Überprüfen von Häufigkeitsverhältnissen sein. In Übung 17 sollen die Lernenden in einer Korpusabfrage im Deutschen Wortschatz ermitteln, ob die deutsche oder englische Variante eines Fachausdrucks häufiger genutzt wird.

Übung 17  

Instruktion zur Korpusnutzung mit Rechercheauftrag im Deutschen Wortschatz (Leipzig) (Krekeler 2021, 169)

Instruktion zur Korpusnutzung mit Rechercheauftrag im Deutschen Wortschatz (Leipzig) (Krekeler 2021, 169)

Sind Lernende schon in den Umgang mit einem bestimmten Korpus eingeführt, so lassen sich gezielte Rechercheaufträge in die unterrichtliche Thematisierung eines Lerngegenstands einbetten. Ein Beispiel hierfür ist etwa Übung 18, in der die Lernenden im KED nach typischen Kontexten für eine vorgegebene Liste von Gefühlsadjektiven suchen und dabei herausfinden sollen, ob sie eher positive, negative oder neutrale Bedeutungen haben.

Übung 18  

KED-Beispielmaterial zur Erkundung der Bedeutung von Gefühlsadjektiven (Link, Abruf 22.05.2025)

KED-Beispielmaterial zur Erkundung der Bedeutung von Gefühlsadjektiven (Link, Abruf 22.05.2025)

In Übung 19 sollen die Lernenden nach Belegen für unterschiedlich komplexe Nominalphrasen für die englischen Nomen visa (‚Visum‘) und delay (‚Verspätung‘) bzw. nach Belegen für Nominalphrasen, die mit dem Ausdruck a very beginnen, suchen. Hier werden den Lernenden sowohl Tipps für die Einstellungen im Suchinterface („set the max search hits from …“; „SORT“) als auch die konkreten Sucheingaben vorgegeben.

Übung 19  

Anleitung zur Suche nach verschiedenen Nominalphrasen in einem japanisch-englischen Korpus (Chujo und Oghigian 2012, 133f.)

Anleitung zur Suche nach verschiedenen Nominalphrasen in einem japanisch-englischen Korpus (Chujo und Oghigian 2012, 133f.)

In Übung 20 ist die Durchführung einer Korpusabfrage (Schritt 2) Teil einer DDL-Sequenz zur Thematisierung der Sprachhandlung „eine Eignung ausdrücken“ (Krekeler 2021, 178).

Übung 20  

Exemplarische Anleitung zur Durchführung einer Korpusrecherche im „Deutschen Wortschatz“ als Teil einer Unterrichtssequenz (Krekeler 2021, 178)

Exemplarische Anleitung zur Durchführung einer Korpusrecherche im „Deutschen Wortschatz“ als Teil einer Unterrichtssequenz (Krekeler 2021, 178)

Die in diesem Abschnitt vorgestellten Beispiele sollten die vielfältigen Einsatzmöglichkeiten von DDL-Aktivitäten veranschaulichen.

4 Wie können DDL-Aktivitäten in den Sprachunterricht integriert werden?

Mit Blick auf den schulischen Deutschunterricht bietet das Einführungsbuch „Sprachkorpora im Deutschunterricht“ (Beißwenger u. a. 2025) eine leserfreundliche Darstellung korpuslinguistischer Basiskonzepte (Kap. 3), einen Überblick über relevante Korpora des Deutschen (Kap. 4) und eine Einführung in die Nutzung eines Tools (CorpusExplorer) zur Erstellung und Auswertung eigener Korpora (Kap. 6). Im Zentrum des Buches stehen sechs „Unterrichtsmodelle“ (Kap. 5), mit denen exemplarisch gezeigt werden soll, wie Lehrpersonen „Korpora im eigenen Unterricht für die Untersuchung von Sprache auf verschiedenen Ebenen der Sprachbeschreibung und als Hilfsmittel im eigenen produktiven Umgang mit Sprache einsetzen können“ (Beißwenger u. a. 2025, 231). Die Unterrichtsmodelle behandeln die Themenfelder Wortbildung, Rechtschreibung, Höflichkeit in der digitalen Kommunikation, Formulierungsvarianten bei der Textproduktion, Sprachwandelphänomene sowie den Migrationsdiskurs und bieten jeweils konkrete Aufgabenstellungen, Erwartungshorizonte, Materialbeispiele und curriculare Verortungen bzw. Kompetenzziele.

Auch im DaF- und DaZ-Kontext erscheinen erfreulicherweise zunehmend korpuslinguistische Arbeiten zu relevanten Gegenständen der DaF-Vermittlung5. Viele dieser Arbeiten bleiben jedoch oft vage hinsichtlich konkreter unterrichtspraktischer Vorschläge, die sich aus den Befunden ableiten ließen. Während im EFL-Vermittlungskontext schon umfangreiche Materialsammlungen für DDL-Aktivitäten und -Unterrichtssequenzen existieren (z.B. Viana 2023), liegen für den DaF- und DaZ-Bereich bislang vergleichsweise wenige einschlägige Publikationen vor, von denen im Folgenden drei vorgestellt werden sollen (Vyatkina 2020; Krekeler 2021; Amorocho und Pfeiffer 2023a; Amorocho und Pfeiffer 2023b).

Ein frei zugängliches Online-Material zu einschlägigen Grammatikthemen für Deutsch als Fremdsprache (Adjektiv-Endungen, Konnektoren, Präpositionen u.a.) sowie zu elementaren Wortschatzthemen (Wetter, Essen, Kleidung u.a.) bietet das Portal „Incorporating Corpora“ (Vyatkina 2020, https://opentext.ku.edu/corpora/). Die Beschreibungssprache ist Englisch. Der Ansatz ist eher deduktiv und form-fokussiert. Genutzt werden neben selbst erstellten Beispielsätzen auch Belege und Konkordanzzeilen aus dem DWDS, die als Anschauungsmaterial (mit Instruktionen wie „Now look at …“ / „Pay attention to …“) oder als Übungsmaterial für Lückenübungen (s. Abschn. Kapitel 3.1 Übung 3) bearbeitet werden sollen.

Krekeler (2021) stellt eines der seltenen Beispiele für die Umsetzung von DDL für DaF in einer längeren Unterrichtssequenz dar. Für die Behandlung des Themas Influencer-Marketing in seinem Wirtschaftsdeutsch-Kurs auf B1-Niveau hat der Autor eine komplexe Unterrichtseinheit entworfen, in der die Lernenden sowohl direkte als auch indirekte DDL-Aktivitäten ausprobieren sollten. Zu den direkten Aktivitäten gehörten eigenständige Recherchen im Deutschen Wortschatz (Leipzig), zu den indirekten zählten die Ermittlung von Kollokationen mithilfe von vorausgewählten Konkordanzlisten, die Verwendung von Korpusbelegen als Übungsmaterial u.a.6. Das Beispiel ist unter anderem deshalb so instruktiv, weil es zeigt, dass und wie DDL-Aktivitäten in einen kommunikativ-inhaltlich geprägten Vermittlungskontext eingebunden werden können. Krekeler berichtet zudem, dass die Lernenden dies als durchaus lernförderlich empfunden haben7.

Amorocho und Pfeiffer (2023a; 2023b) haben eine Sequenz zur Vermittlung der Zitatmarkierungskonstruktion in der gesprochenen Wissenschaftssprache erarbeitet. Sie entwerfen zunächst ein konstruktionsdidaktisches Modell (Amorocho und Pfeiffer 2023a), das sie anschließend in sechs Phasen (0. Einstieg – 1. Rezipieren und Verstehen – 2. Fokussieren – 3. Reproduzieren – 4. Analysieren & Abstrahieren – 5. Produzieren) konkret umsetzen (Abbildung 1) (Amorocho und Pfeiffer 2023b).

Abbildung 1: Modell konstruktionsdidaktischen Arbeitens (Amorocho und Pfeiffer 2023b, 219)

Das Phasen-Modell bietet ein Vorgehen für die Vermittlung von Konstruktionen als „Form-Bedeutungspaare unterschiedlichen Umfangs und Schematizitätsgrades“ (Amorocho und Pfeiffer 2023b, 214), das auch auf andere Lerngegenstände als die Zitatmarkierungskonstruktion anwendbar ist .

Obwohl die Zahl konkreter Vorschläge noch immer klein ist, zeigen die beschriebenen Beispiele, dass DDL-Aktivitäten prinzipiell eine Vielzahl unterschiedlicher Lerngegenstände adressieren können. Im Menüpunkt „Beispiele“ im KED-Portal (https://korpus-einfaches-deutsch.de/examples/) finden sich hierzu weitere Vorschläge.

5 Welche lerntheoretischen Prinzipien sind mit DDL verbunden?

In der Literatur werden eine Reihe lerntheoretischer und didaktischer Prinzipien mit DDL verknüpft. Wir beschränken uns auf einige wichtige Aspekte und verweisen für weiterführende Diskussionen auf Überblicksdarstellungen in der Literatur8.

5.1 Arbeit mit authentischen Materialien

Lernende erwerben eine Fremdsprache anhand von „authentischen“ Texten, also anhand von Texten, die nicht eigens für sprachdidaktische Zwecke erstellt wurden, sondern die kommunikative Zwecke in realen Situationen zwischen (meist erstsprachlichen) Sprachnutzer:innen erfüllen sollten. Für linguistische Untersuchungen werden derartige Texte in Korpora9 gespeichert. Solche Sammlungen repräsentieren den tatsächlichen Sprachgebrauch in einer Zielsprache (Dietz 2022). DDL nutzt Korpora für den Einsatz von authentischem Sprachmaterial im Fremdsprachenunterricht.

5.2 Input in Form von Konkordanzlisten

Die Suche in Korpora erzeugt sogenannte Konkordanzlisten. Darunter werden zeilenweise Zusammenstellungen von Belegen für ein sprachliches Phänomen bzw. für einen Suchausdruck verstanden, bei denen der Suchausdruck umgeben von seinem vorausgehenden und nachfolgenden Kontext angezeigt wird (vgl. Abbildung 2). Diese Art der Darstellung von Belegen wird auch als KWIC (KeyWord-In-Context) bezeichnet.

Abbildung 2: Bildschirmausschnitt der KWIC-Anzeige / Konkordanzliste zum Suchausdruck „Grund“ im DWDS (Beleglistenanfang) Link, Abruf 22.05.2025)

DDL nutzt solche Konkordanzlisten oder KWICs als sprachlichen Input im Unterricht. Die Arbeit mit solchen sprachlichen Fragmenten, die in keinem textuellen Zusammenhang mit dem vorausgehenden und nachfolgenden Beleg stehen, ist sowohl für Lehrende als auch für Lernende anfangs herausfordernd (Mishan 2004, 222). Sie bietet aber auch neue Möglichkeiten der sprachlichen Erkenntnisgewinnung bzw. der Aneignung von Zielstrukturen und von Wortschatzeinheiten.

5.3 Entdeckendes, induktives Lernen

Johns (1991) betrachtet Lernende als „Sprach-Detektive“ oder „Entdecker“, die über die Arbeit an authentischen Belegen zu Hypothesen über die Form und Funktion einer sprachlichen Struktur gelangen sollen (vgl. Rets 2017, 316; Bernadini 2004, 16ff., 22ff; Mishan 2004, 223f.; Chambers 2022, 418; Sripicharn 2010, 372). Als Vorteile dieses induktiven Vorgehens werden in der Fachliteratur meist die folgenden Punkte genannt:

  • Entdeckendes Lernen fördert die Lernerautonomie (Koeppel 2016, 218).
  • Die Lerner:innen sind aktiv am Wissenserwerb beteiligt (Smart 2014, 187).
  • Was Lerner selbst herausfinden, wird mental besser verankern bzw. knüpft besser an vorhandene Wissensstrukturen an (Zimmermann 1977, 108).

Allerdings hat sich auch gezeigt, dass eine induktive Vermittlungsweise nicht für alle Lerngegenstände sinnvoll ist und auch nicht alle Lernenden willens oder in der Lage sind, Muster selbstständig zu entdecken (Koeppel 2016, 218; Kollosche 2020, 285). Induktives Lernen ist in der Regel zudem relativ zeitaufwändig und erfordert eine gründliche Vorbereitung der Lehrperson (Pessutti Nascimento 2014, 166). Lehrende und Lernende müssen zudem damit umgehen lernen, dass die entdeckten Regularitäten möglicherweise unvollständig sind und nicht den Regelbeschreibungen im Kopf der Lehrperson oder im Lehrwerk entsprechen.

So hat entdeckendes Lernen nach ca. 30 Jahren DDL-Erfahrung zwar nach wie vor einen wichtigen Platz im DDL-Repertoire, allerdings nurmehr als ein Ansatz unter vielen (Krekeler 2021, 187)10. In neueren Arbeiten werden induktive und deduktive Vorgehensweisen oft kleinschrittig und aufeinander abgestimmt in einer Unterrichtssequenz verschränkt. Studien aus den Erziehungswissenschaften haben zudem gezeigt, dass der Lernerfolg (in Form von Behaltensleistungen und Kompetenzentwicklung) höher ist, wenn Lernende beim entdeckenden Lernen stärker geleitet werden (Kirschner, Sweller und Clark 2006). Johansson spricht in diesem Zusammenhang von einem „guided inductive approach“ (2009, 41), bei dem induktives Lernen durch lernerorientierte Hilfestellungen und Erklärungen deduktiv ergänzt wird. Auf diese Weise werden die Lernenden beim Entdecken zielsprachlicher Strukturen in den Korpusdaten gezielt angeleitet und unterstützt (vgl. auch Vyatkina 2016, 209). Beispiele hierfür finden sich in der Aktivitäten-Sammlung in Kapitel 3.

5.4 Gebrauchsbasiertes Lernen – „geballter“ authentischer Input

Belege aus Konkordanzlisten ermöglichen Lernenden gehäufte Begegnungen mit zielsprachlichen Strukturen in authentischem Kontext. Derartig „geballter Input“ wird von Vertretern einer gebrauchsbasierten Lerntheorie (Aguado 2024; Ellis 2008; Ellis 2018; Ellis, Römer und O’Donnell 2016; Bybee 2008; Amorocho und Ender 2025; Madlener-Charpentier 2025) als besonders lernförderlich eingeschätzt11. Input in Form von Konkordanzlisten hat gegenüber Input in Form von authentischen Texten, denen Lernende in natürlicher Umgebung begegnen, den Vorteil, dass Konkordanzlisten deutlich mehr Beispiele für die im didaktischen Fokus stehenden Muster oder Strukturen enthalten als dies in einzelnen natürlichen Texten möglich ist (Gabrielatos 2005, 11).

Konkordanzbasierter Input vermeidet zudem auch die Probleme von Lehrwerkstexten, bei denen im Zuge der didaktischen Bearbeitung die Frequenz der Zielstrukturen erhöht wird. Solche künstlichen Frequenzerhöhungen wirken sich jedoch wiederum auf andere Texteigenschaften aus, so dass am Ende oft unnatürliche Texte entstehen (Gabrielatos 2005, 11).

Ballance und Cobb (2019, p.330) heben die Vorteile von Konkordanzlisten beim Wortschatzerwerb hervor. Zielwörter sind in authentischen Texten normalerweise vergleichsweise selten und relativ weit verteilt, so dass zwischen der ersten und der zweiten Begegnung mit einem unbekannten Zielwort längere Zeit vergeht. Das erschwert den induktiven Erwerb. Dagegen enthalten Konkordanzlisten mehrere Zielwort-Belege auf relativ engem Raum. Dies steigert die Anzahl an Begegnungen mit dem Wort und erleichtert so den induktiven Wortschatzerwerb. Die Einbettung eines Zielwortes in natürliche Kontexte ermöglicht zudem den Aufbau einer komplexen Bedeutungsrepräsentation. Verdichtung und Einbettung führen dabei nicht notwendigerweise zu einer Erhöhung der lexikalischen Komplexität: In einer quantitativen Untersuchung von Konkordanzzeilen verschiedener Korpora konnten Ballance und Coxhead (2020) sogar zeigen, dass die lexikalische Komplexität von Konkordanzbelegen im Durchschnitt signifikant niedriger liegt als die der zugehörigen Quelltexte.

Zusammenfassend lässt sich sagen, dass Korpusbelege den Lernenden die Möglichkeit bieten, auf engem Textraum einer großen Vielfalt an Verwendungsbeispielen einer Struktur zu begegnen und diese zu verarbeiten (vgl. Chambers 2022, 242).

5.5 Förderung von Sprachbewusstheit

Während die Aneignung einer Sprache beim ungesteuerten Spracherwerb weitgehend implizit über die Verarbeitung von Mustern erfolgt, spielt in unterrichtlich gesteuerten Erwerbssituationen neben dem impliziten das explizite Lernen eine bedeutende Rolle. Eine wichtige Voraussetzung für explizites Lernen ist die bewusste Lenkung der Aufmerksamkeit auf die Zielstrukturen im sprachlichen Input (Ellis 2018, 31). Konkordanzzeilen unterstützen diese Erwerbssituation, zum einen, weil in ihnen die Zielstrukturen mit vergleichsweise hoher Inputhäufigkeit vorkommen, und zum anderen, weil sie durch das spezielle KWIC-Format (zentrierte Positionierung und visuelle Abgrenzung gegen den Kontext) und oft auch durch typographische Kennzeichnungen (Fett- oder Farbdruck) gut wahrnehmbar („salient“) sind und so auf besondere Weise „Noticing“ (Schmidt 1990) fördern12.

5.6 Generierung von Lehr- / Lernmaterialien aus Korpusbelegen

Es ist ein Kennzeichen des DDL-Ansatzes, dass das sprachliche Material aus den Korpora nicht nur als Anschauungsmaterial zur Bewusstmachung von Regularitäten genutzt wird, sondern auch für die Gestaltung von Übungen und Aufgaben (s. Kapitel 3.2).

6 Wie wirksam ist der DDL-Ansatz?

Die Wirksamkeit des DDL-Ansatzes wurde in zahlreichen empirischen Einzelstudien, in systematischen Übersichtartikeln und in Meta-Analysen (Boulton 2017; Lee, Warschauer und Lee 2019), d.h. quantitativ-statistische Auswertungen einer Vielzahl von Primärstudien, untersucht. Tabelle 1 listet wichtige Meta-Studien und Literaturübersichten auf. Alle Studien wurden in englischsprachigen Fachorganen publiziert.

Tabelle 1: Synopse über zusammenfassende Arbeiten zur Wirksamkeit von datengeleitetem Lernen (DDL)
Studie Ausgewertete Einzelstudien (n) Zeitraum Zielsprache(n) Besonderer Fokus
Meta-Analysen
Mizumoto und Chujo (2015) 14 Englisch
Boulton (2017) 64 1991-2014 Englisch
Lee, Warschauer und Lee (2019) 29 -2016 Englisch Wortschatzerwerb via DDL
Ueno und Takeuchi (2023) 144 1998-2021 Englisch
Literaturübersichten
Luo und Zhou (2017) 18 2010-2016 Englisch L2-Schreiben via DDL
Chen und Flowerdew (2018) 37 2000-2015 Englisch Englisch als Wissenschaftssprache
Pérez-Paredes (2022) 32 2011-2015 Englisch / Deutsch / …
Boulton und Vyatkina (2021) 489 1989-2019 Englisch + andere Sprachen
Lusta, Demirel und Mohammadzadeh (2023) 89 1997-2022 Englisch
Vyatkina (2024) 17 1989-2018 Deutsch

Aus Tabelle 1 geht klar hervor, dass DDL in ganz überwiegendem Maße im EFL-Kontext betrieben wurde und wird. In der bislang umfassendsten Literaturübersicht (Boulton und Vyatkina 2021) sind 436 der 489 berücksichtigten Studien dem Englischen als Zielsprache gewidmet, nur 17 dem Deutschen und noch weniger anderen Zielsprachen. Die empirischen DDL-Studien zu Deutsch als Zielsprache werden in Vyatkina (2024, p. 40-67) vorgestellt.

In den DDL-Studien wurden u.a. folgende Fragen thematisiert (O’Keeffe 2021, 260):

  • Ist eine direkte (hands-on) oder eine indirekte (hands-off) Interaktion wirksamer?
  • Für welches Sprachniveau ist DDL am besten geeignet?
  • Welche Art von Korpusdaten sind am besten geeignet: kleinere, lokale, selbst erstellte Korpora oder öffentlich verfügbare Korpora?
  • Welche Vorbereitung der Lernenden ist erforderlich, um erfolgreiche Lernergebnisse zu gewährleisten?
  • In welchem Kontext funktioniert DDL am besten: im allgemeinen Sprachunterricht oder in fach- oder berufsspezifischen Kursen?
  • Welche Lerngegenstände lassen sich am besten durch DDL vermitteln (Vokabular, Grammatik, Lexikogrammatik, …)?

Auch wenn diese Aspekte noch nicht abschließend empirisch geklärt sind, zeigen die vorliegenden Meta-Analysen, dass DDL generell gesehen ein wirksamer Ansatz der Fremdsprachenvermittlung ist. So fassen Boulton (2017) ihre Studie mit dem ermutigenden Satz zusammen: „DDL works pretty well in almost any context where it has been extensively tried“ (Boulton 2017, 386). Die Metastudie von Lee, Warschauer und Lee (2019) zeigt, dass DDL vor allem hilfreich ist beim Erwerb von detailliertem Wortschatzwissen (‚in-depth knowledge‘), das u.a. die Kenntnisse geeigneter Kollokationspartner umfasst (Lee, Warschauer und Lee 2019, 746). Zudem profitierten fortgeschrittenere Lernende mehr von DDL als Anfänger:innen (Lee, Warschauer und Lee 2019, 747).

In den Studien werden auch Schwierigkeiten genannt, die aus Sicht von Lehrenden und Lernenden mit DDL verbunden sind. Der Großteil der berichteten Herausforderungen bezieht sich auf direkte DDL-Aktivitäten. Dazu gehören Probleme von Lernenden, eine zielführende Suchanfrage zu formulieren (Boulton 2017, 188) und Konkordanzzeilen als „unvollständige Sätze“ zu verarbeiten (Lusta, Demirel und Mohammadzadeh 2023, 10). Auch der Umstand, dass die von ihnen ermittelten Suchergebnisse möglicherweise zu viele, zu wenige, gar keine oder irrelevante Daten enthalten (Gilquin und Granger 2022, 437f.) bzw. dass sie bei selbstständigen Korpusrecherchen möglicherweise „in die Wildnis“ der Sprache (Krekeler) geraten, stellt eine Herausforderung für Lernende dar. Als weitere Hürden werden der hohe Zeitaufwand für die Erstellung und die Durchführung von DDL-Aktivitäten (Wallner 2013; Lusta, Demirel und Mohammadzadeh 2023, 10) und das unbekannte Vokabular, auf das Lernende in den Konkordanzbelegen stoßen (Lusta, Demirel und Mohammadzadeh 2023, 10), genannt.

Vielen dieser Schwierigkeiten kann durch geeignete didaktische Feinjustierungen der DDL-Aktivitäten entgegengewirkt werden, etwa durch genaue, kleinschrittige Instruktionen, eine sorgfältige Auswahl der Belege und evtl. die Bearbeitung von Korpusbelegen (s. Kapitel 2).

7 Welche Ressourcen stellt das KED-Portal für die Umsetzung von DDL zur Verfügung?

7.1 Das Korpus

Die Hauptressource stellt das KED-Korpus selbst dar: authentische, konzeptionell schriftliche Texte, die mit Blick auf relative sprachliche Einfachheit in einem pragmatischen Sinn (vgl. „Konzept“) zusammengestellt wurden. Der zugrundeliegende Gedanke ist dabei, dass diese Sprachdaten potentiell sinnvoller für die Sprachvermittlung genutzt werden können als Daten aus gängigen Korpora des Deutschen.

7.2 Die KED-Suche

Einen Zugang zu den KED-Daten bietet das KED-Portal über die „KED-Suche“. Dort werden zahlreiche didaktisch relevante Einstellungsoptionen zur Suche, zum Filtern und zum Export von Suchergebnissen angeboten. Ziel ist es, die Suchmöglichkeiten so zu gestalten, dass möglichst auch Lehrpersonen und Lernende ohne (korpus-)linguistische Fachkenntnisse diese nutzen können.

7.3 Die Hilfe-Seiten

Das KED-Portal bietet umfängliche Unterstützung bei der Formulierung von Suchanfragen und beim Login. Auf der Seite „Welche Möglichkeiten bietet die KED-Suche?“ wird das Such-Interface ausführlich systematisch beschrieben.

7.4 DDL-Anwendungsszenarien für DaF / DaZ

Um zu illustrieren, wie authentische Sprachdaten des KED im DaF-/DaZ-Unterricht genutzt werden können, stellt das KED-Portal verschiedene didaktische Materialien bereit, die sukzessive ausgebaut werden sollen.

Auf der Seite „Beispiele“ werden Anwendungsszenarien für die DaF-Vermittlung aus der Perspektive von Lehrpersonen vorgestellt, zum Beispiel zu Komposita mit Lieblings‐, zu Zeitangaben mit am vs. um und zur Konjugation starker Verben. Diese Anwendungsbeispiele sind nicht als vollständige, Ready to use-Unterrichtseinheiten gedacht, sondern als (exemplarische) Anregungen zur Nutzung des KED für ausgewählte Lerngegenstände. Sie bestehen aus einer Szenarien-Beschreibung (inklusive anvisiertem GER-Niveau), einer Schritt-für-Schritt-Anleitung für die Lehrkraft sowie Tipps zu hilfreichen Suchanfragen im KED.

Auf der Seite „Material“ stellen wir Listen mit vorausgewählten Belegen für relevante Lerngegenstände (z.B. starke Verben) zur Verfügung.

Auf der „Blog“-Seite des Portals werden unter anderem vollständige Unterrichtssequenzen zu ausgewählten Lerngegenständen vorgestellt und zum Download angeboten.

8 Fazit

Datengeleitetes Lernen ist eine Methode des sprachlichen Lehrens und Lernens, in deren Zentrum die Nutzung authentischer sprachlicher Belege als Input für Sprachaneignungsprozesse steht. Ermöglicht wird DDL dadurch, dass im Zuge der fortschreitenden Digitalisierung immer mehr Texte unterschiedlichster Textsorten und Diskursarten in Korpora gesammelt, mit relevanten Informationen (sog. Metadaten und Annotationen) versehen und zunehmend auch für Nichtspezialisten, v.a. Lehrpersonen und Lernende, zugänglich gemacht werden.

Für die Sprachvermittlung liegt der große Mehrwert von DDL darin, dass Lernende durch die wiederholte Begegnung mit Belegen authentischer Sprache – Stichwort „geballter Input“ (Kapitel 5.4) – vermehrt Lerngelegenheiten erhalten, um Regularitäten und Muster zu entdecken und diese in ihr sprachliches Handlungsrepertoire aufzunehmen. Gegenüber der traditionellen Arbeit mit vorgefertigten und in der Regel didaktisch aufbereiteten Materialien in Lehrwerken bietet DDL Lehrenden und Lernenden einen relativ direkten Zugang zu sprachlichen Phänomenen in ihrem natürlichen Umfeld bzw. authentischen Kontext.

Die Herausforderung des DDL-Ansatzes für Lehrpersonen besteht darin, dass sie den Lernenden ein auf deren Bedürfnisse und Vorwissen zugeschnittenes Lernangebot machen. Auf der technologischen Ebene erfordert dies, dass Lehrpersonen über ein gewisses Maß an Corpus Literacy verfügen (s. Kapitel 2.1), d.h. einschlägige Korpora des Deutschen kennen und in der Lage sind, geeignete Suchanfragen zu formulieren und deren Suchergebnisse zu interpretieren – und auch, dass sie dieses methodische Wissen gegebenenfalls an ihre Lernenden vermitteln, um wiederum diese zu befähigen, selbständig mit Korpora zu arbeiten. In methodisch-didaktischer Hinsicht müssen Lehrpersonen diverse Entscheidungen treffen: An welcher Stelle des Unterrichtsverlaufs ist die Arbeit mit Korpusdaten sinnvoll, für welchen Lerngegenstand lohnt sie sich? Sollen die Lerner:innen selbst in einem Korpus suchen oder stellt die Lehrperson das Datenmaterial für die Lernenden zusammen? Ist es besser, die ermittelten Belege didaktisch zu bearbeiten, und wenn ja, in welcher Form? usw.

DDL ist kein Wundermittel. Korpora können und sollen didaktisch ausgeklügelte Lehrbuchmaterialien nicht ersetzen. Aber der DDL-Ansatz hat das Potenzial, den Sprachunterricht zu beleben und stärker an den tatsächlichen Sprachgebrauch heranzuführen.

DDL erfordert bei Lehrenden und Lernenden die Bereitschaft, sich auf unbekanntes didaktisches und sprachliches Terrain zu begeben. Wenn diese Einführung dabei mithilft, dann hat sie ihren Zweck erfüllt.

dummy_download

© Daniel Jach und Gunther Dietz 2025. All rights reserved. | Impressum

9 Literatur

Aguado, Karin. 2024. Chunks, Mehrworteinheiten & Co. Zur Rolle von usuellen Wortverbindungen im L2-Erwerb. Deutsch als Fremdsprache 61, Nr. 1: 3–13. doi:10.37307/j.2198-2430.2024.01.02,.
Amorocho, Simone und Andrea Ender. 2025. Gebrauchsbasierte Ansätze in der Sprachvermittlung. Fremdsprache Deutsch. Zeitschrift für die Praxis des Deutschunterrichts, Nr. 72: 3–11.
Amorocho, Simone und Christian Pfeiffer. 2023a. Konstruktionsdidaktik – Grundzüge einer sprachdidaktischen Konzeption. Deutsch als Fremdsprache 60, Nr. 3: 131–147. doi:10.37307/j.2198-2430.2023.03.02,.
---. 2023b. Vom Konzept zur Anwendung: Konstruktionsdidaktik am Beispiel von Zitatmarkierungskonstruktionen in der gesprochenen Wissenschaftssprache. Deutsch als Fremdsprache 60, Nr. 4: 213–224. doi:10.37307/j.2198-2430.2023.04.04,.
Ballance, Oliver James und Averil Coxhead. 2020. How much vocabulary is needed to use a concordance? International Journal of Corpus Linguistics 25, Nr. 1: 36–61.
Ballance, Oliver und Tom Cobb. 2019. Resources for learning single-word items. In: The routledge handbook of vocabulary studies, hg. von Stuart Webb, 320–326. London: Routledge.
Beißwenger, Michael, Eva Gredel, Thomas Bartz, Carolina Flinz, Antonia Hamdi, Laura Herzberg, Lothar Lemnitzer, u. a. 2025. Sprachkorpora im Deutschunterricht. Bd. 5. SLLD-E. Bochum: Universitätsbibliothek der Ruhr-Universität Bochum. doi:10.46586/SLLD.390, https://omp.ub.rub.de/index.php/SLLD/catalog/view/390/309/1762.
Bernadini, Silvia. 2004. Corpora in the classroom: An overview and some reflections on future developments. In: How to use corpora in language teaching, hg. von John Sinclair, 15–36. Studies in corpus linguistics. Amsterdam: John Benjamins.
Boulton, Alex. 2017. Data-driven learning and language pedagogy. In: Language, education and technology, hg. von Steven L. Thorne und Stephen May, 181–192. Encyclopedia of language and education / series editor stephen may (faculty of education and social work, the university of auckland, auckland, new zealand). Cham: Springer. doi:10.1007/978-3-319-02237-6{}15,.
Boulton, Alex und Nina Vyatkina. 2021. Thirty years of data-driven learning: Taking stock and charting new directions over time. Language Learning & Technology 25, Nr. 3: 66–89. https://scholarspace.manoa.hawaii.edu/handle/10125/73450.
Bybee, Joan L. 2008. Usage-based grammar and second language acquisition. In: Handbook of cognitive linguistics and second language acquisition, hg. von Peter Robinson und Nick C. Ellis, 216–236. Erlbaum.
Chambers, Angela. 2022. What is data-driven learning? In: The Routledge handbook of corpus linguistics, hg. von Anne O’Keeffe und Michael McCarthy, 416–429. Routledge handbooks in applied linguistics. London and New York: Routledge Taylor & Francis Group.
Chen, Meilin und John Flowerdew. 2018. A critical review of research and practice in data-driven learning (DDL) in the academic writing classroom. International Journal of Corpus Linguistics 23, Nr. 3: 335–369. doi:10.1075/ijcl.16130.che,.
Chujo, Kiyomi und Kathryn Oghigian. 2012. DDL for EFL beginners: A report on student gains and views on paper-based concordancing and the role of L1. In: Input, process and product, hg. von James Thomas und Alex Boulton, 130–143. Brno: Masarykova univerzita.
Cosentino, Gianluca. 2017. Standarddeutsch oder DaF-deutsch? Eine korpuslinguistische Analyse am Beispiel der Nebensätze in DaF-Lehrwerken. Deutsch als Fremdsprache 54, Nr. 2: 87–99. doi:10.37307/j.2198-2430.2017.02.05,.
Dietz, Gunther. 2022. Mikrohören und authentische Hörmaterialien – Zur Einführung in den Tagungsband. In: Mikro-Hörübungen und authentische Hörmaterialien:, hg. von Gunther Dietz, 7–32. Schriften aus der fakultät geistes- und kulturwissenschaften der otto-friedrich-universität bamberg. Bamberg: University of Bamberg Press. https://opus.bibliothek.uni-augsburg.de/opus4/95701.
Doughty, Catherine und Jessica Williams. 1998. Pedagogical choices in focus on form. In: Focus on form in classroom second language acquisition, hg. von Catherine Doughty und Jessica Williams, 197–261. New York: Cambridge University Press (CUP).
Ellis, Nick C. 2008. Usage Based and Form-Focussed Language Acquisition: The associative learning of constructions, learned attention, and the limited L2 endstate. In: Handbook of cognitive linguistics and second language acquisition, hg. von Peter Robinson und Nick C. Ellis, 372–405. Erlbaum.
---. 2018. Salience in usage-based SLA. In: Salience in second language acquisition, hg. von Susan M. Gass, Patti Spinner, und Jennifer Behney, 21–40. Second language acquisition research series. New York, NY: Routledge.
Ellis, Nick C., Ute Römer und M. B. O’Donnell. 2016. Constructions and usage-based approaches to language acquisition. Language Learning 66, Nr. S1: 23–44. doi:10.1111/lang.1{}12177,.
Flowerdew, Lynne. 2015. Data-driven learning and language learning theories: Whither the twain shall meet. In: Multiple affordances of language corpora for data-driven learning, hg. von Agnieszka Leńko-Szymańska und Alex Boulton, 15–36. Studies in corpus linguistics. Amsterdam and Philadelphia: John Benjamins.
Gabrielatos, Costas. 2005. Corpora and language teaching: Just a fling or wedding bells? TESL-EJ 8, Nr. 4. https://files.eric.ed.gov/fulltext/EJ1068106.pdf.
Gilquin, Gaëtanelle und Sylviane Granger. 2022. Using data-driven learning in language teaching. In: The Routledge handbook of corpus linguistics, hg. von Anne O’Keeffe und Michael McCarthy, 430–442. Routledge handbooks in applied linguistics. London and New York: Routledge Taylor & Francis Group.
Henk, Katrin. 2022. Skewing – ein Prinzip bei der expliziten Strukturvermittlung? In: Aufmerksamkeitslenkung und bewusstmachung in der sprachvermittlung, hg. von Karin Madlener-Charpentier und Giulio Pagonis, 169–210. Basler studien zur deutschen sprache und literatur. Tübingen: Narr Francke Attempto.
Hirschmann, Hagen. 2019. Korpuslinguistik: Eine Einführung. Berlin: J.B. Metzler. doi:10.1007/978-3-476-05493-7, https://doi.org/10.1007/978-3-476-05493-7.
Jach, Daniel. 2021. Revisiting German two-way prepositions. Zeitschrift für Sprachwissenschaft 40, Nr. 2: 95–133. doi:10.1515/zfs-2021-2029,.
Johansson, Stig. 2009. Some thoughts on corpora and second-language acquisition. In: Corpora and language teaching, hg. von Karin Aijmer, 33–44. Studies in corpus linguistics. Amsterdam: Benjamins. https://doi.org/10.1075/scl.33.05joh.
Johns, Tim. 1991. Should you be persuaded: Two samples of data-driven learning materials. Empirical Language Research 4: 1–16.
Johns, Tim und Philip King. 1991. Classroom concordancing. Birmingham: Centre for English Language Studies, University of Birmingham.
Kabatnik, Susanne. 2021. Statistische signifikante Funktionsverbgefüge im Gebrauch: Eine korpusbasierte Untersuchung für den DaF-Unterricht. Korpora Deutsch als Fremdsprache 1, Nr. 2: 95–114. doi:10.48694/TUJOURNALS-73, https://kordaf.tujournals.ulb.tu-darmstadt.de/article/id/73/.
Kamber, Alain. 2022. Von der Frequenz zur Affinität: Funktionsverbgefüge für fortgeschrittene Lernende. In: Funktionsverbgefüge im fokus, hg. von Sabine de Knop und Manon Hermann, 75–100. Linguistik – impulse & tendenzen. Berlin and Boston: de Gruyter.
Kirschner, Paul A., John Sweller und Richard E. Clark. 2006. Why minimal guidance during instruction does not work: An analysis of the failure of constructivist, discovery, problem-based, experiential, and inquiry-based teaching. Educational Psychologist 41, Nr. 2: 75–86. doi:10.1207/s15326985ep4102{}1,.
de Knop, Sabine und Fabio Mollica. 2024. Ditransitive Kollokationen: Eine konstruktionsgrammatische Untersuchung aus der DaF-Perspektive. Deutsch als Fremdsprache 61, Nr. 1: 14–25. doi:10.37307/j.2198-2430.2024.01.03,.
Koeppel, Rolf. 2016. Deutsch als Fremdsprache: Spracherwerblich reflektierte Unterrichtspraxis. 3. Aufl. Baltmannsweiler: Schneider Verlag Hohengehren.
Kollosche, David. 2020. Entdeckendes Lernen auf dem Prüfstand. MNU-Journal, Nr. 4: 282–286.
Krekeler, Christian. 2021. Korpustraining und datengestütztes Lernen im Wirtschaftsdeutsch-Unterricht. Zeitschrift für Interkulturellen Fremdsprachenunterricht 26, Nr. 1: 161–195. http://tujournals.ulb.tu-darmstadt.de/index.php/zif/.
Lee, Hansol, Mark Warschauer und Jang Ho Lee. 2019. The effects of corpus use on second language vocabulary learning: a multilevel meta-analysis. Applied Linguistics 40, Nr. 5: 721–753. doi:10.1093/applin/amy012, https://doi.org/10.1093/applin/amy012.
Luo, Qinqin und Jie Zhou. 2017. Data-driven learning in second language writing class: a survey of empirical studies. International Journal of Emerging Technologies in Learning (iJET) 12, Nr. 3: 182–196. doi:10.3991/ijet.v12i03.6523,.
Lusta, Amel, Özcan Demirel und Behbood Mohammadzadeh. 2023. Language corpus and data driven learning (DDL) in language classrooms: A systematic review. Heliyon 9, Nr. 12: e22731. doi:10.1016/j.heliyon.2023.e22731,.
Madlener-Charpentier, Karin. 2025. Beiläufiges Lernen durch Inputfluten. Fremdsprache Deutsch. Zeitschrift für die Praxis des Deutschunterrichts, Nr. 72: 45–53.
Malloggi, Patrizio. 2021. Zur Förderung der Kollokationskompetenz in der DaF-/DaZ-Didaktik für den Tourismus anhand von DWDS-Korpora. Korpora Deutsch als Fremdsprache 1, Nr. 1: 6–24. doi:10.48694/TUJOURNALS-37, https://kordaf.tujournals.ulb.tu-darmstadt.de/article/id/37/.
McDonough, Kim und Pavel Trifomovich. 2013. Learning a novel pattern through balanced and skewed input. Bilingualism: Language and Cognition 16, Nr. 3: 654–662.
Mishan, Freda. 2004. Authenticating corpora for language learning: a problem and its resolution. ELT Journal 58, Nr. 3: 219–227. doi:10.1093/elt/58.3.219,.
Mizumoto, A. und Kiyomi Chujo. 2015. A meta-analysis of data-driven learning approach in the Japanese EFL classroom. English Corpus Studies 22: 1–18.
Mukherjee, Joybrato. 2002. Korpuslinguistik und Englischunterricht: Eine Einführung. Bd. 14. Sprache im kontext. Frankfurt am Main: Peter Lang.
---. 2006. Corpus linguistics and language pedagogy: The state of the art - and beyond. In: Corpus technology and language pedagogy, hg. von Sabine Braun, Kurt Kohn, und Joybrato Mukherjee, 5–24. English corpus linguistics. Frankfurt am Main and Berlin and Bern and Wien: Peter Lang.
O’Keeffe, Anne. 2021. Data-driven learning – a call for a broader research gaze. Language Teaching 54, Nr. 2: 259–272. doi:10.1017/S0261444820000245, https://www.cambridge.org/core/services/aop-cambridge-core/content/view/90406240679846B0D286D874BB7BBA35/S0261444820000245a.pdf/data-driven-learning-a-call-for-a-broader-research-gaze.pdf (zugegriffen: 7. Juli 2022).
Pérez-Paredes, Pascual. 2022. A systematic review of the uses and spread of corpora and data-driven learning in CALL research during 2011–2015. Computer Assisted Language Learning 35, Nr. 1-2: 36–61. doi:10.1080/09588221.2019.1667832,.
Pessutti Nascimento, Priscilla Maria. 2014. Grammatik induktiv vermitteln: Vor- und Nachteile. In: Grammatikunterricht zwischen linguistik und didaktik, hg. von Sabine Dengscherz, Martin Businger, und Jaroslava Taraskina, 163–182. Tübingen: Narr Francke Attempto.
Rets, Irina. 2017. Vocabulary retention and concordance-based learning in L3 acquisition. Eurasian Journal of Applied Linguistics 3, Nr. 2: 313–324.
Schmidt, Richard W. 1990. The role of consciousness in second language learning. Applied Linguistics 11: 129–158.
Siepmann, Dirk. 2018. Datengesteuertes Lernen: Lexiko-grammatische Kenntnisse erweitern und sprachliche Zweifelsfälle lösen. Hg. von Klett Akademie für Fremdsprachendidaktik. https://www.klett.de/inhalt/digitalisierung-im-englischunterricht/data-driven-learning/9965.
Silberstein, Dagmar. 2024. Modalpartikeln als Lerngegenstand: Partikelprofile für die Vermittlung von aber, ja, doch, mal, denn, eigentlich und etwa. Bd. 20. Studien deutsch als fremd- und zweitsprache. Berlin: Schmidt Erich / Erich-Schmidt-Verlag. http://www.esv.info/978-3-503-23754-8.
Smart, Jonathan. 2014. The role of guided induction in paper-based data-driven learning. ReCALL 26, Nr. 2: 184–201. doi:10.1017/S0958344014000081,.
Sripicharn, Passapong. 2010. How can we prepare learners for using language corpora? In: The Routledge handbook of corpus linguistics, hg. von Anne O’Keeffe und Michael McCarthy, 371–384. Routledge handbooks in applied linguistics. London: Routledge.
Sutherland, Sean. 2023. Using concordance lines to teach participial adjectives. In: Teaching english with corpora, hg. von Vander Viana, 33–35. London and New York: Routledge.
Ueno, Shotaro und Osamu Takeuchi. 2023. Effective corpus use in second language learning: A meta-analytic approach. Applied Corpus Linguistics 3, Nr. 3: 100076. doi:10.1016/j.acorp.2023.100076,.
Viana, Vander, Hrsg. 2023. Teaching English with corpora: A resource book. London and New York: Routledge. doi:10.4324/b22833, https://www.taylorfrancis.com/books/9781032253008.
Vyatkina, Nina. 2016. Data-driven learning for beginners: The case of German verb-preposition collocations. ReCALL 28, Nr. 2: 207–226. doi:10.1017/s0958344015000269, https://www.cambridge.org/core/journals/recall/article/datadriven-learning-for-beginners-the-case-of-german-verbpreposition-collocations/0E4247A41320183C34AD6D70EA181C3B.
---. 2020. Incorporating corpora: Using corpora to teach German to English-speaking learners: Online instructional materials. Lawrence, KS. https://opentext.ku.edu/corpora/ (zugegriffen: 28. April 2025).
---. 2024. Corpus applications in language teaching and research: The case of data-driven learning of German. Routledge applied corpus linguistics. Abingdon, Oxon and New York, NY: Routledge.
Wallner, Franziska. 2013. Korpora im DaF-Unterricht – Potentiale und Perspektiven am Beispiel des DWDS. Revista Nebrija de Lingüística Aplicada 13. https://www.nebrija.com/revista-linguistica/korpora-im-daf-unterricht-potentiale-und-perspektiven-am-beispiel-des-dwds.html (zugegriffen: 2. Oktober 2022).
Wang, Zhoufeng. 2025. Chunks in der gesprochenen Wissenschaftssprache des Deutschen: Eine korpusbasierte Studie. Bd. 22. Studien deutsch als fremd- und zweitsprache. Berlin: Erich Schmidt Verlag / Erich Schmidt Verlag.
Zimmermann, Günther. 1977. Grammatik im Fremdsprachenunterricht. Frankfurt/M. et al.: Diesterweg u.a.

Fußnoten

  1. COBUILD (Collins Birmingham University International Language Database) ist das erste rein auf Korpusdaten beruhende Wörterbuch des Englischen.↩︎

  2. Forschungsgeschichtliche Abrisse finden sich in Chambers (2022), 417-421; Gilquin und Granger (2022), 430; Vyatkina (2024), 22ff.; Boulton (2017), 182-184; O’Keeffe (2021), 260f.↩︎

  3. „The effect of a direct vs. indirect approach to DDL is still relatively unclear. While it has often been claimed that the indirect approach, through the use of printed materials, is more effective, Boulton and Cobb’s (2017) meta-analysis shows that the opposite seems to be true, and Vyatkina (2016) finds the two approaches equally effective.“ (Gilquin und Granger 2022, 433)↩︎

  4. Weitere Beispiele für Fehlerkorrektur-Aktivitäten siehe KED-Beispielmaterial zu handeln von vs. sich handeln um (https://korpus-einfaches-deutsch.de/examples/activities/handelnVonUm.html).↩︎

  5. Zum Beispiel Kamber (2022) und Kabatnik (2021) zu Funktionsverbgefügen, Jach (2021) zu Wechselpräpositionen, Malloggi (2021) zu Kollokationen, Cosentino (2017) zu Nebensatzkonstruktionen, de Knop und Mollica (2024) zu ditransitiven Konstruktionen, Silberstein (2024) zu Modalpartikeln, Wang (2025) zu Chunks in der gesprochenen Wissenschaftssprache.↩︎

  6. Beispiele für viele Übungen aus Krekeler (2021) finden sich in Kapitel 3↩︎

  7. Eine differenzierte Analyse findet sich in Krekelers abschließender Reflexion der Sequenz (Krekeler 2021, 181–189).↩︎

  8. Z.B. Vyatkina (2016), 208f.; Boulton (2017), 182-184; Flowerdew (2015), 16-18; O’Keeffe (2021), 264f; Gilquin und Granger (2022), 430f.↩︎

  9. Unter Korpora werden Sammlungen von Texten verstanden, die nach vorgegebenen Kriterien (z.B. Textsorte, Kommunikationsbereich, Erscheinungsjahr, Thema u.a.) zusammengestellt wurden und digital nach sprachlichen Zielstrukturen durchsucht werden können (Hirschmann 2019, 2).↩︎

  10. Schon in den Anwendungsbeispielen bei Johns finden sich deduktiv angelegte Aktivitäten (z.B. Johns 1991, 310, Fig. 10).↩︎

  11. „In usage-based approaches to acquisition, exposure to exemplars in the input and the engagement of cognitive mechanisms are believed to facilitate the acquisition of constructions“ (McDonough und Trifomovich 2013, 654).↩︎

  12. „In this method […] rich and enhanced input (e.g., concordance lines) serves as material for learners’ noticing and analysis of language patterns.“ (Vyatkina 2016, 208f.)↩︎

Zitat

Mit BibTeX zitieren:
@article{dietz2025,
  author = {Dietz, Gunther},
  title = {Datengeleitetes Lernen (DDL) – Eine Einführung. Blogbeitrag},
  date = {2025},
  url = {https://korpus-einfaches-deutsch.de/posts/2025-05-22-ddl-intro/},
  langid = {de}
}
Bitte zitieren Sie diese Arbeit als:
Dietz, Gunther. 2025. Datengeleitetes Lernen (DDL) – Eine Einführung. Blogbeitrag. https://korpus-einfaches-deutsch.de/posts/2025-05-22-ddl-intro/.