Category Archives: Talks

Gebrauchsbasierte Graphematik (FU Berlin)

Invited talk on 6 July 2023 at at Freie Universität Berlin. Download: Roland Schäfer: Gebrauchsbasierte Graphematik (Folien).

Der Graphematik – der Lehre von Schrift und Schreibung – wurde über viele Jahrzehnte von großen Teilen der Linguistik (von Strukturalismus bis Generativismus) die Zugehörigkeit zur eigenen Disziplin abgesprochen. Im Sinne des – vor allem von seinen lautstärksten Verfechtern – nie eingelösten nachgerade bizarren Anspruchs des Primats der gesprochenen Sprache wurde gerne ins Feld geführt, die Schreibung sei ein künstliches und überformtes, der Sprache nachträglich aufgezwängtes Konstrukt, das der für eine angemessene wissenschaftliche Sprachforschung nötigen Spontaneität entbehre. Man bediente sich stattdessen gerne der eigenen spontanen Grammatikalitätsurteile über schriftsprachliches Material. Schon die Beschäftigung mit der Geschichte der Graphematik des Deutschen entlarvt das Narrativ von der quasi am Reißbrett entstandenen Schreibung als Ente. Wir sehen ein sich den grammatischen Prinzipien langsam mehr oder weniger gut anpassendes und diese gleichermaßen formendes System im stetigen Wandel. Die Gebrauchsbasierte Graphematik (Schäfer & Sayatz 2014, 2016 usw.) geht als zunächst rein synchrone Betrachtungsweise über den diachronen Befund hinaus und knüpft dabei an Prinzipien der Gebrauchsbasierten Grammatik an. In gebrauchsbasierten Theorien ist die Grundannahme, dass lediglich der Input und allgemeine kognitive Mechanismen den Spracherwerb steuern. Beginnt der Schrift- und Schreibungserwerb auch spät und zunächst stark gesteuert, so sind lesende Lerner doch bald einer zunehmenden Menge von standardnahen und standardfernen Texten ausgesetzt, was dazu führt, dass basierend auf Ähnlichkeitsbeziehungen ggf. unscharfe Abbildungsmuster von grammatischen und lexikalischen Strukturen auf graphematische Realisierungen gelernt werden. Die Gebrauchsbasierte Graphematik versucht, diese Muster durch korpusbasierte und experimentelle Methoden zu dekodieren. Es geht also nicht um die normativen Regeln oder um eine „reine Systembeschreibung“, sondern um kognitiv reale Kategorien, die gerade dann gut sichtbar werden sollten, wenn normferne grammatische Phänomene oder Zweifelsfälle verschriftet werden, für die es intrinsisch keine (oder keine eindeutige) Normschreibung geben kann. Spätestens mit der Gebrauchsbasierten Graphematik werden also alle Scheinargumente gegen Graphematik an sich ausgeräumt. In diesem Vortrag stelle ich kurz die theoretischen Grundannahmen der Gebrauchsbasierten Graphematik und einige Fallstudien zur Schreibung des Deutschen vor. Der Vortrag schließt mit einer kurzen Diskussion des größten methodischen Grundproblems des Ansatzes und seiner möglichen Lösungen.

What is a good corpus? (Anke Lüdeling, Roland Schäfer, Elizabeth Pankratz, Thomas Krause, Felix Bildhauer, Felix Golcher)

Anke Lüdeling, Roland Schäfer, Elizabeth Pankratz, Thomas Krause, Felix Bildhauer, Felix Golcher. 2021. What is a good corpus? A series of three talks given in the colloquium of the CRC (SFB) 1412 Register at Humboldt University.

Part 1: What is a good corpus? Corpus Design

  1. Sampling
  2. Annotation

Part 2: Inference

  1. Philosophies of inference
  2. The Texas Marksman
  3. Weak or no error probing with corpora Some solutions
  4. It’s never “just another interface”! (INF)

Part 3: Corpus creation and corpus use

  1. Specialised corpora
  2. Web corpora

Corpora, Inference, and Models of Register Distributions (DGfS 2021, AG15)

Felix Bildhauer & Elizabeth Pankratz & Roland Schäfer (alphabetically). Corpora, Inference, and Models of Register Distribution. Accepted presentation at Contrastive corpus methodology for language modeling and analysis (AG 15) at the Annual Meeting of the German Linguistic Society, DGfS 2020. Freiburg, Cyberspace.

Bildhauer, Pankratz, Schäfer. DGfS Jahrestagung 2021. Corpora, Inference, and Models of Register Distributions (Handout, licensed under CC-BY-SA)

 

Beyond Multidimensional Analysis: probabilistic register induction for large corpora (DGfS-CL 2020)

Bildhauer & Schäfer Probabilistic Register Induction DGfS 2020Felix Bildhauer & Roland Schäfer. Beyond Multidimensional Analysis: probabilistic register induction for large corpora. Poster to be presented at DGfS-CL session at DGfS 2020 in Hamburg 3–6 March 2020. Download abstract (PDF). Klick on the image or this link to download the A0 poster.