Workshop on corpora and statistics

Universität Siegen, July 12–13, 2014, teaching language: German

Statistische Verfahren für Linguisten
Statistische Verfahren für Linguisten, Kurzübersicht
Kurzgefasste Korpuslinguistik für Germanisten
Statistik: ANOVA-Musterloesung

In diesem Methodenseminar für LinguistInnen wird in die Grundlagen der quantitativen empiri­schen Forschung kom­pakt und überblickshaft eingeführt. Der Schwerpunkt liegt auf der statisti­schen Analyse, als Daten werden Korpusdaten verwendet. Eine Einführung in die Arbeit mit Korpo­ra ist daher in das Seminar integriert. Die statistischen Verfahren sind allerdings in gleichem Maß für andere Arten von Daten in der Linguistik anwendbar (z.B. Grammatikalitätsurteile, Lesezeiten). Vorkenntnisse sind nicht erforderlich. TeilnehmerInnen werden durch das Seminar vor allem in die Lage versetzt, sich selbständig in methodischen Fragen (insbesondere Statistik) weiterzubil­den.

Methodisch wechseln sich Vorlesung und Übung ab, indem jeder der thematischen Blöcke (bis auf die ersten beiden) mit einem Vorlesungsteil beginnt und in einen Übungsabschnitt mündet. Es wird mit der freien Statistiksoftware R und der Benutzeroberfläche RStudio gearbeitet, Korpusanfragen erfolgen innerhalb von R mittels der Bibliothek rcqp, einer Anbindung von R an die IMS Open Corpus Work­bench (CWB). Teilnehmer erhalten vom Dozenten einen zeitlich begrenzten Zugang zu einer Server-Version von RStudio und benötigen daher nur einen aktuellen Browser und Internetzugang, um den Kurs zu absolvieren.

In diesem Methodenseminar für LinguistInnen wird in die Grundlagen der quantitativen empiri­schen Forschung kom­pakt und überblickshaft eingeführt. Der Schwerpunkt liegt auf der statisti­schen Analyse, als Daten werden Korpusdaten verwendet. Eine Einführung in die Arbeit mit Korpo­ra ist daher in das Seminar integriert. Die statistischen Verfahren sind allerdings in gleichem Maß für andere Arten von Daten in der Linguistik anwendbar (z.B. Grammatikalitätsurteile, Lesezeiten). Vorkenntnisse sind nicht erforderlich. TeilnehmerInnen werden durch das Seminar vor allem in die Lage versetzt, sich selbständig in methodischen Fragen (insbesondere Statistik) weiterzubil­den.

Methodisch wechseln sich Vorlesung und Übung ab, indem jeder der thematischen Blöcke (bis auf die ersten beiden) mit einem Vorlesungsteil beginnt und in einen Übungsabschnitt mündet. Es wird mit der freien Statistiksoftware R und der Benutzeroberfläche RStudio gearbeitet, Korpusanfragen erfolgen innerhalb von R mittels der Bibliothek rcqp, einer Anbindung von R an die IMS Open Corpus Work­bench (CWB). Teilnehmer erhalten vom Dozenten einen zeitlich begrenzten Zugang zu einer Server-Version von RStudio und benötigen daher nur einen aktuellen Browser und Internetzugang, um den Kurs zu absolvieren.