Die Schreibwerkstatt Mehrsprachigkeit

Download Report

Transcript Die Schreibwerkstatt Mehrsprachigkeit

Von einer Datensammlung zum
Korpus
die Datenlage der
Schreibwerkstatt Mehrsprachigkeit
Melanie Andresen und
Dagmar Knorr
Dieses Vorhaben wird aus Mitteln des Bundesministeriums für Bildung und Forschung unter dem
Förderkennzeichen 01PL12033 gefördert.
Die Verantwortung für den Inhalt dieser Veröffentlichung liegt bei den Autorinnen.
Universitätskolleg
Universitätskolleg
Schreibwerkstatt Mehrsprachigkeit
Dagmar
M.
Andresen,
KnorrD. Knorr
[email protected]
[email protected]
Überblick
 Woher stammen die Daten?
 Welche Daten werden gesammelt?
 Wie möchten wir die Daten nutzen – Beispiel einer
Suchanfrage
 Auf dem Weg zu einem Korpus
Universitätskolleg
Universitätskolleg
Schreibwerkstatt Mehrsprachigkeit
Dagmar
M.
Andresen,
Knorr D. Knorr
[email protected]
[email protected]
Peer Tutoren Schreibberatung
Aufgabe der Peer Tutoren Schreibberatung =
durch Textkommentierungen und Gespräche ratsuchende
Studierende unterstützen, Schreib- und Textkompetenz
aufzubauen
Universitätskolleg
Universitätskolleg
Schreibwerkstatt Mehrsprachigkeit
Dagmar
M.
Andresen,
Knorr D. Knorr
[email protected]
[email protected]
Datensammlung – Überblick
Dokumenttyp
Datei-Formate
Datensätze
Metadaten zu den Ratsuchenden
.fm4
180
Texte von Ratsuchenden
.doc(x), .pdf
ca. 350
Texte von Ratsuchenden mit Kommentierungen
von PT
.doc(x)
Texte von Ratsuchenden mit Kommentierungen
von Lehrenden
.pdf
Beratungsprotokolle
.fm4
213
Beratungsgespräche
.mp3, .mp4,
.wav, .wma
ca. 35
Inhaltsübersichten zu den
Beratungsgesprächen
.xls
Transkriptionen der Beratungsgespräche
.exb
Universitätskolleg
Universitätskolleg
Schreibwerkstatt Mehrsprachigkeit
Dagmar
M.
Andresen,
Knorr D. Knorr
[email protected]
[email protected]
ca. 200
ca. 10
31
2
Beispiel – Datensatz Metadaten
Universitätskolleg
Universitätskolleg
Schreibwerkstatt Mehrsprachigkeit
Dagmar
M.
Andresen,
Knorr D. Knorr
[email protected]
[email protected]
Beispiel –
Datensatz
Beratungsprotokoll
Universitätskolleg
Universitätskolleg
Schreibwerkstatt Mehrsprachigkeit
Dagmar
M.
Andresen,
Knorr D. Knorr
[email protected]
[email protected]
Beispiel – Datenablage
Universitätskolleg
Universitätskolleg
Schreibwerkstatt Mehrsprachigkeit
Dagmar
M.
Andresen,
Knorr D. Knorr
[email protected]
[email protected]
Universitätskolleg
Universitätskolleg
Schreibwerkstatt Mehrsprachigkeit
Dagmar
M.
Andresen,
Knorr D. Knorr
[email protected]
[email protected]
Universitätskolleg
Universitätskolleg
Schreibwerkstatt Mehrsprachigkeit
Dagmar
M.
Andresen,
Knorr D. Knorr
[email protected]
[email protected]
Suchanfrage stellen
Suche Texte von Studierenden
– mit Migrationshintergrund
– angestrebter Abschluss: LA
Universitätskolleg
Universitätskolleg
Schreibwerkstatt Mehrsprachigkeit
Dagmar
M.
Andresen,
Knorr D. Knorr
[email protected]
[email protected]
Suchanfrage stellen
Suche Texte von Studierenden
– mit Migrationshintergrund – Leserführung
– angestrebter Abschluss: LA
Universitätskolleg
Universitätskolleg
Schreibwerkstatt Mehrsprachigkeit
Dagmar
M.
Andresen,
Knorr D. Knorr
[email protected]
[email protected]
Dokumentauswahl als Ergebnis
Universitätskolleg
Universitätskolleg
Schreibwerkstatt Mehrsprachigkeit
Dagmar
M.
Andresen,
Knorr D. Knorr
[email protected]
[email protected]
Frage
• Welche Software-Lösungen existieren, um solche
Suchabfragen zu ermöglichen?
• Wie können die Metadaten sinnvoll mit den Dokumenten
verbunden werden?
Universitätskolleg
Universitätskolleg
Schreibwerkstatt Mehrsprachigkeit
Dagmar
M.
Andresen,
Knorr D. Knorr
[email protected]
[email protected]
Aufbereiten der Texte
+ allgemeine Kommentare direkt im Text
Universitätskolleg
Universitätskolleg
Schreibwerkstatt Mehrsprachigkeit
Dagmar
M.
Andresen,
Knorr D. Knorr
[email protected]
[email protected]
Mögliche Fragestellungen
qualitative Fragen
An welchen Stellen werden Textkommentare
angebracht?
Wie entwickeln sich Texte durch Kommentierungen?
quantitative Fragen
Vorkommen von Sprechhandlungsverben
Vorkommen von Funktionsverbgefügen
Universitätskolleg
Universitätskolleg
Schreibwerkstatt Mehrsprachigkeit
Dagmar
M.
Andresen,
Knorr D. Knorr
[email protected]
[email protected]
Annotation
• (halb)automatische Annotation
(Tokenisierung, Lemmatisierung, Part-of-Speech Tagging, Syntax?)
• manuelle Annotation
– Mikroebene (z. B. Kontaminationen/Verschränkungen)
– Mesoebene (z. B. Portmanns (i. Dr.) Unterscheidung von Referat,
Elaboration, Deklaration)
– Makroebene (z. B. Textstruktur)
Universitätskolleg
Universitätskolleg
Schreibwerkstatt Mehrsprachigkeit
Dagmar
M.
Andresen,
Knorr D. Knorr
[email protected]
[email protected]
Veröffentlichung des Korpus
• Was muss bei der Korpuserstellung mit Blick auf eine
Veröffentlichung beachtet werden?
• Welche der Daten sollen veröffentlicht werden?
• Wo kann das Korpus veröffentlicht werden?
Universitätskolleg
Universitätskolleg
Schreibwerkstatt Mehrsprachigkeit
Dagmar
M.
Andresen,
Knorr D. Knorr
[email protected]
[email protected]
Fragen und Antworten?
Universitätskolleg
Universitätskolleg
Schreibwerkstatt Mehrsprachigkeit
Dagmar
M.
Andresen,
Knorr D. Knorr
[email protected]
[email protected]