Category Archives: Computational Linguistics

Statistische Inferenz (Vorlesung/Übung)

Inhalte und Zielpublikum

Diese Lehrveranstaltung richtet sich an alle, die etwas über Statistik lernen möchten, das über die üblichen Einführungen hinausgeht, die dabei aber alle wichtigen Verfahren der frequentistischen Statistik kennenlernen möchten. In dieser Vorlesung und Übung werden statistische Verfahren eingeführt. Der Fokus liegt nicht auf dem stupiden Auswendiglernen von Verfahren zur mechanischen Anwendung, sondern auf dem Verstehen gerechtfertigter und nicht gerechtfertigter Inferenzen auf Basis von Daten mittels statistischer Verfahren. Wir beschäftigen uns also mit dem ewigen Kampf, den die Wissenschaft mit der Varianz in ihren jeweiligen Betrachtungsbereichen führt. Es wird daher auf eine Einführung in R, SPSS oder ein anderes Statistikpaket verzichtet. Sie rechnen von Hand, soweit das geht, oder lernen, Ergebnisse statistischer Verfahren zu interpretieren, wenn ein Rechnen von Hand nicht praktikabel ist.

Allgemeine Hinweise

  • Sie benötigen einen (nicht programmierbaren) Taschenrechner in dieser Lehrveranstaltung. Im Grunde reicht Ihr Schultaschenrechner oder sogar eine Leistungsklasse darunter (TI 30 oder besser).
  • Die Aufgaben behandeln jeweils den Stoff der Vorwoche und werden in der im Semesterplan (s.u.) genannten Woche besprochen. Sie müssen die jeweiligen Aufgaben also zum genannten Datum erledigen. Die Aufteilung im Unterricht ist dann ungefähr: 30 Minuten Besprechung der Aufgaben, 60 Minuten neuer Stoff. Damit das funktioniert, müssen Sie auf jeden Fall von Woche zu Woche sehr gut vorbereitet sein. Andernfalls verlieren Sie ganz sicher den Faden.

Lektionen und Links zu den Materialien

    1. Inferenz und sogenannte Wahrscheinlichkeit
      Fisher-Exakt-Test
      Folien | Handout | Aufgabe
    2. Daten und Varianz
      Standardabweichung, Standardfehler, z-Wert
      Folien | Handout | Aufgabe
    3. Überraschend große Unterschiede
      z-Test, t-Test
      Folien | Handout | Aufgabe
    4. Simulationen
      Verteilungen, Sampling
      Folien | Handout | Aufgabe
    5. Varianzen und Unterschiede
      ANOVA
      Folien | Handout | Aufgabe
    6. Passendmachen
      χ², Chancenverhältnis, Binomialtest, Mann-Whitney-U, Kruskal-Wallis H
      Folien | Handout | Aufgabe
    7. Sogenannte Effektstärken und Freiheitsgrade
      Cramérs v, Cohens d und r², η²
      Folien | Handout | Aufgabe
    8. Größe von Stichproben, Teststärke und ernsthaftes Testen
      Power, Severity
      Folien | Handout | Aufgabe | Mayo & Spanos (2006)
    9. Varianz in numerischen Messwerten
      Korrelation, Likelihood, Lineares Modell
      Folien | Handout | Aufgabe | Gelman & Hill (2006)
    10. Wahrscheinlichkeiten
      Logit-Modelle
      Folien | Handout | Aufgabe | Gelman & Hill (2006)
    11. Varianz auf mehreren Ebenen
      Generalisierte Lineare Gemischte Modelle
      Folien | Handout | Aufgabe | Schäfer (2020), Gelman & Hill (2006)
    12. Ronald A. Fisher vs. Jerzy Neyman (entfällt in der Regel)
      Folien | Handout | Lehmann (2011)
    13. Inferenzphilosophien (entfällt in der Regel)
      Folien | Handout | Senn (2011)

Weitere Literatur

Weitere Literatur wird rechtzeitig zur Verfügung gestellt.

Aktueller Semesterplan (Wintersemester 2024/2025)

  • 14. Oktober | Inferenz und Wahrscheinlichkeit
  • 21. Oktober | Daten und Varianz (Aufgabe: Fisher-Test)
  • 28. Oktober | Überraschend große Unterschiede (Aufgabe: Standardfehler)
  • 4. November | Simulationen (Aufgabe: z-Test)
  • 11. November | Varianzen und Unterschiede (Aufgabe: t-Test)
  • 18. November | Ausfall
  • 25. November | Passendmachen (Aufgabe: ANOVA)
  • 2. Dezember | Effektstärken (Aufgabe: χ², Chancenverhältnis, Binomialtest)
  • 9. Dezember | Größe von Stichproben usw. (Aufgabe: Effektstärken)
  • 16. Dezember | Ausgleichs- und Reservesitzung (Aufgabe: Power und Severity)
  • 6. Januar | Varianz in numerischen Messwerte (Aufgabe: keine)
  • 13. Januar| Wahrscheinlichkeiten (Aufgabe Korrelation, Likelihood, Lineares Modell)
  • 20. Januar | Varianz auf mehreren Ebenen (Aufgabe: Logit-Modelle interpretieren)
  • 27. Januar | Ausgleichs- und Reservesitzung (Aufgabe: Multilevel-Modelle interpretieren)
  • 3. Februar | Klausur für Masterstudierende (Termin fürs Examen über LPA)

Formale Syntax: HPSG (Vorlesung)

Inhalte und Zielpublikum

Diese Vorlesung (und die zugehörige Übung bzw. das Begleitseminar) führen in die Head-Driven Phrase Structure Grammar anhand des Deutschen ein. Dazu wird das Buch von Stefan Müller verwendet und fallweise ergänzt. Die Vorlesung wendet sich an alle, die eine wirklich formale symbolische Beschreibung der deutschen Syntax (auch im Gegensatz zu pseudo-formalisierten Baumbeschreibungen) kennenlernen möchten, und die vor Formalismen aus der Logik, Mathematik und Informatik nicht zurückschrecken. Auch wenn nicht-formalisierte Beschreibungsrahmen mit kognitivem Anspruch en vogue sind, kommt man meines Erachtens nicht umhin, die symbolischen Eigenschaften menschlicher Sprache zu würdigen und in Bezug zu den Ergebnissen der kognitiv orientierten und empirischen Forschung zu setzen.

Hinweis: Ich vereinfache gegenüber Stefan Müllers Einführung an einigen Stellen die Argumentation (insbesondere zu den Daten), da ich davon ausgehe, dass Teilnehmer bereits solide Grundkenntnisse in der Grammatik/Syntax des Deutschen (zum Beispiel in Form meiner Einführungen in Morphologie und Syntax sowie einer weiteren Einführung in generative Ansätze) haben. Ich konzentriere mich daher hier auf das Wesentliche des Formalismus.

Lektionen und Links zu den Materialien

Teilnehmende müssen auf jeden Fall Stefan Müllers HPSG-Buch von Anfang an parallel durchlesen. (Seitenangaben finden sich jeweils auf den Folien.) Seit 2024 ist es von restriktiven Urheberrechtsknebeln befreit (GitHub-Repo) und wird hoffentlich als Open Access-Buch wiedergeboren.

Die Themen Semantik 2 und Semantik 3 sowie Modelltheoretische Syntax werden im Buch nicht so wie in dieser Vorlesung besprochen. Sie werden daher mittels zusätzlicher Literatur beigesteuert. Diese muss ebenfalls gelesen werden (s. Links in der Liste). Das Passwort für die verschlüsselten Dateien erhalten Sie in der Vorlesung. Ich versuche, die Progression des Stoffs trotzdem möglichst kompatibel mit Stefans Lehrveranstaltung (HU Berlin) und seinem Buch zu halten, damit Sie den Prüfungsstoff so vollständig wie möglich an einem Ort finden.

Download aller Folien in einer großen Datei im Handout-Modus (aktuell bis Vorlesung 9).
Übersicht über den kombinatorischen Teil der Grammatik (bis Vorfeldbesetzung).

  1. Phrasenstruktur und Phrasenstrukturgrammatiken
    Handout | Folien
  2. Merkmalstrukturen und Merkmalbeschreibungen
    Handout | Folien
  3. Komplementation und Grammatikregeln
    Handout | Folien
  4. Semantik 1 | Verbsemantik und Linking
    Handout | Folien
  5. Adjunktion und Spezifikation
    Handout | Folien
  6. Lexikon und Lexikonregeln
    Handout | Folien
  7. Konstituentenreihenfolge und Verbbewegung
    Handout | Folien
  8. Unbegrenzte Dependenzen
    Handout | Folien
  9. Semantik 2 | Quantorenspeicher
    Handout | Folien | Pollard & Sag (1994) [Download]
  10. Semantik 3 | Minimal Recursion Semantics
    Handout | Folien | Copestake et al. (2005) [Download]
  11. Modelltheorische Syntax
    Ohne Handout bzw. Folien | Richter (2021)

Weitere Literatur

Ausgangspunkt weiterer Lektüre, vor allem für Hausarbeiten, ist das HPSG Handbook (Müller et al. 2021). Für den Vergleich mit anderen Theorien sollte auch Müller (2023) zurate gezogen werden. Die HPSG Bibliography von Stefan Müller enthält eine sehr vollständige Liste vermutlich fast aller Veröffentlichungen in HPSG.

Gesichter zur Theorie

Hier finden Sie Links zu Fotos von HPSG-Treibenden auf LingPhot, einer Seite von Stefan Müller. Die Auswahl ist subjektiv, und es handelt sich vor allem um die Personen, die ich in der Vorlesung öfter in Anekdoten oder als Autoren erwähne. Die Reihenfolge ist intuitiv die, die am besten zur Vorlesung passt.

Aktueller Semesterplan (wieder 2026)

  • Momentan wird die Vorlesung nicht angeboten.

Formale Semantik (Seminar)

Inhalte und Zielpublikum

In diesem Seminar wird in die Grundlagen der modelltheoretischen formalen Semantik eingeführt. Ich stelle sowohl einen phrasenstrukturell orientierten Ansatz (Chierchia) als auch einen logikbasierten Ansatz (Montague bzw. Dowty et al.) vor, nachdem ich in die Mengenlehre, die Aussagenlogik und die Prädikatenlogik eingeführt habe. Auf Basis dieses gründlichen Grundlagenwissens lassen sich Syntax-Semantik-Schnittstellen in formalen Theorien wie HPSG gut verstehen (vgl. mein Modul zur HPSG) und aktuellere Entwicklungen in der formalen Semantik bewerten, die teilweise oder sogar großenteils von der Modelltheorie und ihrer philosophischen Fundierung abgekehrt sind. Insbesondere eignet sich dieses Seminar auch zur Kombination mit meiner Lehrveranstaltung zur linguistisch orientierten analytischen Sprachphilosophie des 20. Jahrhunderts (Frege, Russell, Davidson, Kripke, Montague, etwas Wittgenstein, etwas Grice, und ein paar Opponenten der Genannten).

Lektionen mit Links zu den Materialien

Den kompletten Foliensatz können Sie durch anklicken dieses Satzes herunterladen (eventuell noch nicht komplett überarbeitet). Die Einzelthemen sind die folgenden – jeweils mit Link zu den Materialien:

  1. Inferenz und Bedeutung
    Folien | Video (in Vorbereitung)
  2. Referentielle Semantik
    Folien | Video (in Vorbereitung)
  3. Mengen und Funktionen
    Folien | Video (in Vorbereitung)
  4. Aussagenlogik
    Folien | Video (in Vorbereitung)
  5. Prädikatenlogik
    Folien | Video (in Vorbereitung)
  6. Quantifikation und Modelltheorie
    Folien | Video (verfügbar)
  7. Getypte λ-Sprachen höherer Ordnung
    Folien | Video (verfügbar)
  8. Intensionalität
    Folien | Video (verfügbar)
  9. Tempus und Modalität
    Folien | Video (in Vorbereitung)
  10. Montagues intensionale Logik
    Folien | Video (in Vorbereitung)
  11. Lektüre: Barwise & Cooper “Generalized Quantifiers and Natural Language”
  12. Lektüre: Link “The Logical Analysis of Plurals and Mass Terms”
  13. Lektüre: Bach “The Algebra of Events”
  14. Lektüre: Partee “Noun Phrase Interpretation and Type Shifting Principles”

Basislektüre zum Seminar

  • Gennaro Chierchia & Sally McConnell-Ginet (2000). Meaning and Grammar: An Introduction to Semantics. Cambridge: MIT Press. [Volltext-Link zu archive.org]
  • David R. Dowty, Robert E. Wall & Stanley Peters (1981). Introduction to Montague Semantics. Dordrecht: Kluwer. [Volltext-Link zu archive.org]
  • Barbara Partee, Alice ter Meulen & Robert E. Wall (1990). Mathematical Methods in Linguistics. Dordrecht: Kluwer.[Volltext-Link 1 ; Volltext-Link 2]

Die weitere Lektüre im Seminar (ohne Folien/Vorlesung) findet sich in:

  • Paul Portner & Barbara Partee (eds.) (2002). Formal Semantics: The Essential Readings. Oxford: Blackwell.

Bildhauer & Schäfer (2019): Describing corpora, comparing corpora

Felix Bildhauer & Roland Schäfer. A one-day pre-conf tutorial at the annual meeting of the DGfS 2019 in Bremen. 5 March 2019.