Author Archives: Roland

What happened to webcorpora.org?

My current university cannot provide the required infrastructure (in terms of data center resources and staff) at a reasonable cost that would allow me to offer the COW corpora to a wider audience. Individual institutions can get access to the data, but COW is unable to provide access via a platform with installations of NoSketch Engine, RStudio, etc. Furthermore, difficulties with the only suitable and freely available corpus query engine (the aforementioned NoSketch Engine) – largely due to the fact that it’s practically undocumented – created a workload that we could no longer afford. After Felix Bildhauer and I paid for the server out of our own pockets from 2014 to 2024, we finally took it offline.

Contact me directly if you need access to the data and are able to manage large text corpora yourself.

Sprachphilosophie (Seminar)

Inhalte und Zielpublikum

In dieser Lehrveranstaltung wird in die linguistisch orientierte analytische Sprachphilosophie des 20. Jahrhunderts aus Sicht der Linguistik eingeführt. Wir besprechen und lesen Frege, Russell, Davidson, Kripke, Montague, evtl. Wittgenstein oder Grice, und ein paar Opponenten der Genannten. Ich bin kein Philosoph, und ich täusche auch nicht vor, einer zu sein. Ich versuche den Teilnehmenden nur näherzubringen, wie stark Teile der Linguistik (z.B. die formale Semantik) aus der Sprachphilosophie entstanden sind.

Die Veranstaltung ist für alle fortgeschrittenen Studierenden der Linguistik, der Germanistik und des Lehramtsstudiums Deutsch (Sek 2) geeignet. Außer guten Grammatikkenntnissen sind keine Vorkenntnisse erforderlich. Eine kurze Einführung in die Logik und ein Einblick in die formale Semantik werden im Seminar gegeben und sind keine Voraussetzung. Für Philosophiestudenten ist dieses Seminar nicht oder nur bedingt geeignet, weil es nicht das der Philosophie angemessene Niveau erreichen kann.

Wichtig: Wir beginnen mit der Lektüre von ca. 200 Seiten aus einer Einführung in englischer Sprache (Lycan: Philosophy of Language). Sie müssen Englisch lesen können. Im Anschluss lesen wir ausgewählte Texte von Sprachphilosophen oder Ausschnitte daraus. Sie benötigen eine gewisse Frustrationstoleranz beim Lesen widerspenstiger Texte. Sobald Sie versuchen, LLMs (z.B. ChatGPT) einzusetzen, anstatt die Texte zu lesen und zu verstehen, können Sie es gleich bleiben lassen. Im Seminar werden zudem Diskussionsformen und Hausaufgaben eingesetzt, die es unmöglich machen, mit LLMs erfolgreich zum Abschluss zu kommen.

In der Abschlussklausur (Staatsexamen) müssen Sie einen der Texte diskutieren und in Bezug zu den anderen Texten setzen. Sie erhalten dazu in der Prüfung zwei Texte zur Auswahl, sodass Sie z.B. zwischen Frege und Kripke wählen können.

Continue reading

Desintegration attributiver Adjektivphrasen (Zeitschrift für Sprachwissenschaft 2025)

Sayatz, Ulrike & Roland Schäfer. 2025. Desintegration attributiver Adjektivphrasen. In Zeitschrift für Sprachwissenschaft (angenommen).

Abstract

This paper examines graphemic ways of marking constituents as syntactically non-integrated despite a strong default reading as fully integrated. Specifically, we look at canonically positioned pre-nominal APs in German which can be marked as non-integrated through punctuation marks such as commas, dashes, and parentheses (as well as prosodically though pauses and intonation curves). We present  evidence (from an elicitation experiment and a large-scale corpus study) for influencing factors triggering the use of the aforementioned punctuation marks as well as for their functional differentiation. The paper is written from the perspective of Probabilistic Graphemics, a production-oriented framework dedicated to decoding the mapping of grammatical categories onto graphemic usage, which is derived from usage-based approaches.

Statistical Inference for Everybody and a Linguist (in progress)

Mission

This book is work in progress. I restarted essentially from scratch in 2025, and I hope two designated a-authors will join shortly. It’s a cleanly frequentist introduction to statistics without any friggin’ software package. In this book you get to use paper, a pen, and a pocket calculator. Why does “hands-on introduction to statistics” always mean that we’re flooded with R commands starting on page 1? This book is for people without a deadline who would like to do some serious thinking (with me) about what inferential frequentist statistics actually does for us, but without the usual misinterpretations. No real-life data sets are used in this book, only intentionally simplified fictional examples from toy linguistics and lots of simulations. Who cares about the examples anyway? As I’m not a statistician and above all not perfect, please don’t hesitate to look at whatever is there at the moment. If you find errors, tear the PDF apart, throw it in my face, and tell me about those errors as harshly as you can. Yell at me if necessary! I’m serious. As opposed to many of our colleagues, I find nothing more satisfying than being corrected and understanding why I was wrong. I’m not being ironic, sarcastic, or what have you. Email me or submit a ticket on GitHub.

Progress is expected to stall around April and May due to the German semester beginning mid-April.

Progress on Chapters (21 March 2025)

1 Scientific Inference and Error (0%)
2 Inference: Successes and Failures (100%)
3 Data: Central Tendency and Variance (100%)
4 Estimation: Means and Proportions (100%)
5 Inference: Mean Differences (100%)
6 Inference: Three or More Means (0%)
7 Inference: Making Positive Inferences (0%)
8 Inference: This and That (0%)
9 Data: Co-Varying Variables (0%)
10 Modelling: Linear Relationships (0%)
11 Modelling: Arbitrary Outcomes (0%)
12 Modelling: Grouped Data (50%) – Will be based on this.

Downloads and GitHub

The GitHub links to this work in progress:
PDF direct: https://github.com/rsling/Inferencelinguistics/blob/main/main.pdf
GitHub Repository: https://github.com/rsling/Inferencelinguistics

Grundriss der deutschen Grammatik (SE)

Inhalte und Zielpublikum

Alle, die Germanistik oder Deutsche Philologie studiert haben, sollten sich in ihrem Studium einen Überblick über das grammatische System des Deutschen angeeignet haben. Die Einführungsveranstaltungen eignen sich dazu aus Zeitgründen nur bedingt. Dieses Seminar hilft Teilnehmenden, ihr Fähigkeiten in der grammatischen Analyse des Deutschen zu vertiefen und souveräner im Umgang mit grammatischen Sachverhalten zu werden. Dazu versuchen sie zunächst, aus flachen Quellen (wie StudySmarter und ChatGPT) substanzielles Wissen über Themen der Grammatik des Deutschen zu gewinnen. In der zweiten Hälfte des Seminars versuchen sie, dieselben Themen fundiert durch Lektüre meiner Einführung in die grammatische Beschreibung des Deutschen und des Grundrisses der deutschen Grammatik von Peter Eisenberg (Achtung: Wir verwenden die 3. Auflage!) und einer weiteren (selbst gesuchten bzw. gewählten) wissenschaftlichen Quelle zu erschließen.

Continue reading

Deutsche Morphologie (Seminar)

Inhalte und Zielpublikum

In diesem Seminar wird vor allem die Morphologie (Formenlehre) des Deutschen besprochen. Dabei wird auch die Strukturierung des Wortschatzes (also des sogenannten Lexikons) durch morphologische Generalisierungen (Wortklassen, Flexionsklassen, Ableitungen usw.) in den Vordergrund gestellt. Das Seminar basiert auf meiner Einführung in die grammatische Beschreibung des Deutschen. Die nötigen Vorkenntnisse in Einklang mit dem Rahmenlehrplan für das Fach Deutsch in Thüringen definiert der Einstiegstest (bzw. die für dieses Seminar dort gekennzeichneten Aufgaben).

Continue reading

Deutsche Syntax (Vorlesung)

Inhalte und Zielpublikum

In dieser Vorlesung führe ich in ein didaktisiertes Beschreibungsformat für syntaktische Strukturen ein, in dem dann die fundamentalen syntaktischen Strukturen des Deutschen (Phrasentypen und Satztypen) modelliert werden. Die Vorlesung basiert auf meiner Einführung in die grammatische Beschreibung des Deutschen. Die nötigen Vorkenntnisse in Einklang mit dem Rahmenlehrplan für das Fach Deutsch in Thüringen definiert der Einstiegstest (bzw. die für diese Vorlesung dort gekennzeichneten Aufgaben). Die Vorlesung wendet sich ausdrücklich an alle, die Germanistik in der Basisphase studieren, also vor allem Deutsch-Lehramtstudierende und Fachstudierende in Germanistik oder germanistischer Linguistik.

Continue reading

Probabilistische Grammatik (Seminar)

Inhalte und Zielpublikum

Dieses Seminar richtet sich an alle, die sich für Variation und ihre Modellierung im Deutschen oder anderen Sprachen interessieren. Dabei geht es vor allem nicht um die üblichen Dimensionen wie dialektale oder diachrone Variation, sondern unabhängige, systembedingte Variation, wie sie sich zum Beispiel in sogenannten Zweifelsfällen äußert. Das Seminar führt dazu einerseits in die Grundlagen der gebrauchsbasierten probabilistischen Grammatik ein und beschäftigt sich andererseits mit ihrer Anwendung auf das Deutsche. Wir lesen einige von meinen Arbeiten zur probabilistischen Morphologie, Syntax und Graphematik des Deutschen sowie andere Werke, nicht unbedingt nur zum Deutschen. Eine Kombination mit meiner Vorlesung/meinem Seminar zur statistischen Inferenz liegt nahe und ist für Masterstudierende sowie bei Belegung zur Examensvorbereitung an der FSU Jena verpflichtend.

Continue reading

Statistische Inferenz (Vorlesung/Übung)

Inhalte und Zielpublikum

Diese Lehrveranstaltung richtet sich an alle, die etwas über Statistik lernen möchten, das über die üblichen Einführungen hinausgeht, die dabei aber alle wichtigen Verfahren der frequentistischen Statistik kennenlernen möchten. In dieser Vorlesung und Übung werden statistische Verfahren eingeführt. Der Fokus liegt nicht auf dem stupiden Auswendiglernen von Verfahren zur mechanischen Anwendung, sondern auf dem Verstehen gerechtfertigter und nicht gerechtfertigter Inferenzen auf Basis von Daten mittels statistischer Verfahren. Wir beschäftigen uns also mit dem ewigen Kampf, den die Wissenschaft mit der Varianz in ihren jeweiligen Betrachtungsbereichen führt. Es wird daher auf eine Einführung in R, SPSS oder ein anderes Statistikpaket verzichtet. Sie rechnen von Hand, soweit das geht, oder lernen, Ergebnisse statistischer Verfahren zu interpretieren, wenn ein Rechnen von Hand nicht praktikabel ist (nur bei GLMs und GLMMs). Eine Kombination mit meiner Vorlesung/meinem Seminar zur probabilistischen Grammatik liegt nahe und ist für Masterstudierende sowie bei Belegung zur Examensvorbereitung an der FSU Jena verpflichtend.

Continue reading