Transcript cosmas ii

KORPUSLINGUISTISCHE RECHERCHEN
04.11.2010
Philipp Dorok M.A.
Lehrstuhl für Germanistische Linguistik
Prof. Dr. Karin Pittner
Philipp Dorok M.A.
Lehrstuhl für Germanistische Linguistik
Prof. Dr. Karin Pittner
Gliederung
1. Einstieg: Korpuslinguistisches Arbeiten
2. Recherche mit COSMAS II
3. Recherche in der Datenbank Gesprochenes Deutsch
4. Offene Fragen
KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010
Philipp Dorok M.A.
Lehrstuhl für Germanistische Linguistik
Prof. Dr. Karin Pittner
1. Einstieg: Korpuslinguistisches Arbeiten
2. Recherche mit COSMAS II
3. Recherche in der Datenbank Gesprochenes Deutsch
4. Offene Fragen
Einstieg: Korpuslinguistisches Arbeiten
KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010
Philipp Dorok M.A.
Lehrstuhl für Germanistische Linguistik
Prof. Dr. Karin Pittner
1. Einstieg: Korpuslinguistisches Arbeiten
2. Recherche mit COSMAS II
3. Recherche in der Datenbank Gesprochenes Deutsch
4. Offene Fragen
Recherche mit COSMAS II
 Was ist COSMAS II?
Corpus Search, Management and Analysis System
Eine am IDS konzipierte Volltextdatenbank für das linguistisch motivierte
Recherchieren in den Textsammlungen (= Korpora) des IDS.
KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010
Philipp Dorok M.A.
Lehrstuhl für Germanistische Linguistik
Prof. Dr. Karin Pittner
1. Einstieg: Korpuslinguistisches Arbeiten
2. Recherche mit COSMAS II
3. Recherche in der Datenbank Gesprochenes Deutsch
4. Offene Fragen
COSMAS II
COSMAS II
http://www.ids-mannheim.de/cosmas2/
Windows-Vollversion 3.6.1
http://www.ids-mannheim.de/cosmas2/win-app/
Online-Version 1.1 (reduziert)
https://cosmas2.ids-mannheim.de/cosmas2-web/
KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010
Philipp Dorok M.A.
Lehrstuhl für Germanistische Linguistik
Prof. Dr. Karin Pittner
1. Einstieg: Korpuslinguistisches Arbeiten
2. Recherche mit COSMAS II
3. Recherche in der Datenbank Gesprochenes Deutsch
4. Offene Fragen
DeReKo und COSMAS II
 Deutsches Referenzkorpus (http://www.ids-mannheim.de/kl/projekte/korpora/).
 Umfang von ca. 3,2 Mrd. Wörtern (laut IDS-Homepage).
 Das Deutsche Referenzkorpus umfasst Zeitungen, Sach-, Fach- sowie
schöngeistige Literatur aus Deutschland, Österreich und der Schweiz von
1772 bis heute.
 Zugang über COSMAS II in der eingeschränkten Web-Version (keine
Installation nötig) oder der normalen Installations-Version.
 Für den Zugang zu COSMAS II ist eine Registrierung aus urheberrechtlichen
Gründen erforderlich.
 Die Nutzung von COSMAS II ist kostenlos.
KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010
Philipp Dorok M.A.
Lehrstuhl für Germanistische Linguistik
Prof. Dr. Karin Pittner
1. Einstieg: Korpuslinguistisches Arbeiten
2. Recherche mit COSMAS II
3. Recherche in der Datenbank Gesprochenes Deutsch
4. Offene Fragen
Mit COSMAS II arbeiten
 So könnte eine Arbeitssitzung mit COSMAS II aussehen:
KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010
Philipp Dorok M.A.
Lehrstuhl für Germanistische Linguistik
Prof. Dr. Karin Pittner
1. Einstieg: Korpuslinguistisches Arbeiten
2. Recherche mit COSMAS II
3. Recherche in der Datenbank Gesprochenes Deutsch
4. Offene Fragen
Mit COSMAS II arbeiten
 Die Kookkurrenzanalyse gibt für die erzielten Treffer Auskunft über die
statistische Wahrscheinlichkeit von gemeinsam auftretenden Wörtern und
deren syntagmatischen Mustern.
 Die KWIC-Ansicht (Key Word In Context) stellt zeilenweise die jeweiligen
Treffer farblich hervorgehoben in ihrem Kontext dar.
 In der Beleg-Ansicht werden die Treffer - im Unterschied zur KWIC-Ansicht nicht in einem auf eine Zeile begrenzten Ausschnitt angezeigt, sondern in
einem größeren Kontext, der bis zur drei Absätze umfassen kann. Aus diesem
Grund spricht man auch von einer Volltext-Ansicht.
 Zusätzlich werden Quelleninformationen eingeblendet, die als Zitierform der
Belege für wissenschaftliche Arbeiten benutzt werden können.
KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010
Philipp Dorok M.A.
Lehrstuhl für Germanistische Linguistik
Prof. Dr. Karin Pittner
1. Einstieg: Korpuslinguistisches Arbeiten
2. Recherche mit COSMAS II
3. Recherche in der Datenbank Gesprochenes Deutsch
4. Offene Fragen
Ergebnis-Ansicht in COSMAS II
KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010
Philipp Dorok M.A.
Lehrstuhl für Germanistische Linguistik
Prof. Dr. Karin Pittner
1. Einstieg: Korpuslinguistisches Arbeiten
2. Recherche mit COSMAS II
3. Recherche in der Datenbank Gesprochenes Deutsch
4. Offene Fragen
KWIC-Ansicht
KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010
Philipp Dorok M.A.
Lehrstuhl für Germanistische Linguistik
Prof. Dr. Karin Pittner
1. Einstieg: Korpuslinguistisches Arbeiten
2. Recherche mit COSMAS II
3. Recherche in der Datenbank Gesprochenes Deutsch
4. Offene Fragen
Beleg-Ansicht
KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010
Philipp Dorok M.A.
Lehrstuhl für Germanistische Linguistik
Prof. Dr. Karin Pittner
1. Einstieg: Korpuslinguistisches Arbeiten
2. Recherche mit COSMAS II
3. Recherche in der Datenbank Gesprochenes Deutsch
4. Offene Fragen
Recherche mit COSMAS II
KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010
Philipp Dorok M.A.
Lehrstuhl für Germanistische Linguistik
Prof. Dr. Karin Pittner
1. Einstieg: Korpuslinguistisches Arbeiten
2. Recherche mit COSMAS II
3. Recherche in der Datenbank Gesprochenes Deutsch
4. Offene Fragen
Suchanfragen in COSMAS II
 Suchanfragen in COSMAS II werden u.a. gebildet aus
•
Wörtern, Teilwörtern, Wortgrundformen,
•
Wortklassen (z.B. Verb, Artikel) und grammatikalischen Mustern,
•
Angaben zu Wort- und Satzabstand,
•
Angaben zu Textbereichen und Position (z.B. erstes Wort eines Satzes).
KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010
Philipp Dorok M.A.
Lehrstuhl für Germanistische Linguistik
Prof. Dr. Karin Pittner
1. Einstieg: Korpuslinguistisches Arbeiten
2. Recherche mit COSMAS II
3. Recherche in der Datenbank Gesprochenes Deutsch
4. Offene Fragen
Suchoperatoren in COSMAS II
 logische Operatoren: UND, ODER, NICHT (beziehen sich auf ganze Texte)
 Platzhalteroperatoren:
* beliebig viele Zeichen als Lückenfüllung
+ 0 oder 1 beliebiges Zeichen als Lückenfüllung
? Genau ein Zeichen als Lückenfüllung
 Grundformenoperator: &
 Ignorierungsoperator: $
 Abstandsoperatoren: /w (Wörter), /s (Sätze), /p (Absätze), /z (Zeilen)
KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010
Philipp Dorok M.A.
Lehrstuhl für Germanistische Linguistik
Prof. Dr. Karin Pittner
1. Einstieg: Korpuslinguistisches Arbeiten
2. Recherche mit COSMAS II
3. Recherche in der Datenbank Gesprochenes Deutsch
4. Offene Fragen
Recherche mit COSMAS II
KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010
Philipp Dorok M.A.
Lehrstuhl für Germanistische Linguistik
Prof. Dr. Karin Pittner
1. Einstieg: Korpuslinguistisches Arbeiten
2. Recherche mit COSMAS II
3. Recherche in der Datenbank Gesprochenes Deutsch
4. Offene Fragen
Beispiele für Suchanfragen in COSMAS II
Suchanfrage: &blau /+w5 &Himmel
Viel Spass unter blauem Himmel
Im Judentum symbolisiert das Blau des Himmels Gott, den Glauben und die
Offenbarung;
Die Farbe Blau erinnert an einen wolkenlosen Himmel, an das blaue Blut der
Aristokratie, an einen herrlichen Gebirgssee oder das südliche Mittelmeer,
vielleicht auch an einen Zustand oder eine politische Richtung.
Beide sagten aus - und einer log dabei das Blaue vom Himmel herunter.
KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010
Philipp Dorok M.A.
Lehrstuhl für Germanistische Linguistik
Prof. Dr. Karin Pittner
1. Einstieg: Korpuslinguistisches Arbeiten
2. Recherche mit COSMAS II
3. Recherche in der Datenbank Gesprochenes Deutsch
4. Offene Fragen
Beispiele für Suchanfragen in COSMAS II
Suchanfrage: &blau /-w5 &Himmel
Denn der Himmel lacht in blassem Blau über dem See.
Schon früh am Morgen war der Himmel strahlend blau und die Sonne zeigte sich
in voller Pracht.
Kreuzlingen hat die ersten Spiele unter freiem Himmel mit einem blauen Auge
überstanden.
Als sie die Augen wieder öffnete, war der Himmel über ihr gewesen, ein blauer,
riesiger Himmel, wie sie ihn noch nie gesehen hatte.
KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010
Philipp Dorok M.A.
Lehrstuhl für Germanistische Linguistik
Prof. Dr. Karin Pittner
1. Einstieg: Korpuslinguistisches Arbeiten
2. Recherche mit COSMAS II
3. Recherche in der Datenbank Gesprochenes Deutsch
4. Offene Fragen
Beispiele für Suchanfragen in COSMAS II
Suchanfrage: entweder /+s0 "oder„
Geprobt wird einmal pro Woche, entweder am Donnerstag oder Freitag.
Die Gruppe trifft sich entweder zum theoretischen Büffeln oder zum konkreten
Lernen vor Ort, nämlich in einem Stall.
«Alle Frauen schwimmen im Fluss der weiblichen Sexualität. Entweder sie
dümpeln gemütlich vor sich hin, oder sie ertrinken fast in ihren
Erotiksehnsüchten», schreibt Maya Onken in ihrem neuesten Buch.
Man hatte sich zu entscheiden - entweder oder.
KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010
Philipp Dorok M.A.
Lehrstuhl für Germanistische Linguistik
Prof. Dr. Karin Pittner
1. Einstieg: Korpuslinguistisches Arbeiten
2. Recherche mit COSMAS II
3. Recherche in der Datenbank Gesprochenes Deutsch
4. Offene Fragen
Beispiele für Suchanfragen in COSMAS II
Suchanfrage: der /+w1 (kleine ODER große) /+w1 Mann
Der große Mann mit den kräftigen Händen hat Routine darin, nach Erdbeben vor
Ort Soforthilfe zu leisten.
Der kleine Mann blieb stumm, fassungslos.
Der große Mann des deutschen Tischtennis bestreitet in Viernheim sein letztes
Spiel als Einzelspieler, bevor er seine Trainer-Karriere startet.
Der kleine Mann wog bei seiner Geburt 3.200 Gramm und war 49 Zentimeter
groß.
KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010
Philipp Dorok M.A.
Lehrstuhl für Germanistische Linguistik
Prof. Dr. Karin Pittner
1. Einstieg: Korpuslinguistisches Arbeiten
2. Recherche mit COSMAS II
3. Recherche in der Datenbank Gesprochenes Deutsch
4. Offene Fragen
Wie heißt die Suchanfrage?
Beispiele für Belege:
rotnasigen
Roto-Hallen
Rotor-Anlagen
rotorangenen
Rotrücken-Totenkopfäffchen
Rotsandplätzen
Rotzgören
Suchanfrage: rot*en
KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010
Philipp Dorok M.A.
Lehrstuhl für Germanistische Linguistik
Prof. Dr. Karin Pittner
1. Einstieg: Korpuslinguistisches Arbeiten
2. Recherche mit COSMAS II
3. Recherche in der Datenbank Gesprochenes Deutsch
4. Offene Fragen
Wie heißt die Suchanfrage?
Beispiele für Belege:
Schachteinsturz
Schauspielerherz
Schlangenwurz
Schleudersturz
Schmerz
Schnurzdiburz
Schwarz-Silber-Schwarz
Suchanfrage: sch*rz
KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010
Philipp Dorok M.A.
Lehrstuhl für Germanistische Linguistik
Prof. Dr. Karin Pittner
1. Einstieg: Korpuslinguistisches Arbeiten
2. Recherche mit COSMAS II
3. Recherche in der Datenbank Gesprochenes Deutsch
4. Offene Fragen
Wie heißt die Suchanfrage?
Beispiele für Belege:
3D-Gestalt
aufgestachelt
aufgestapelt
eingestampft
eingestellt
Flugestablishment
Folgestreit
hingestottert
Suchanfrage: ???gest*t
KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010
Philipp Dorok M.A.
Lehrstuhl für Germanistische Linguistik
Prof. Dr. Karin Pittner
1. Einstieg: Korpuslinguistisches Arbeiten
2. Recherche mit COSMAS II
3. Recherche in der Datenbank Gesprochenes Deutsch
4. Offene Fragen
Wie heißt die Suchanfrage?
Beispiele für Belege:
zerfallen
hinfällig
Gammelfleischabfällen
Alltagsfallen
Verteidigungsfalles
Friedhofallee
Suchanfrage: *fall??
KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010
Philipp Dorok M.A.
Lehrstuhl für Germanistische Linguistik
Prof. Dr. Karin Pittner
1. Einstieg: Korpuslinguistisches Arbeiten
2. Recherche mit COSMAS II
3. Recherche in der Datenbank Gesprochenes Deutsch
4. Offene Fragen
Recherche in der Datenbank Gesprochenes Deutsch
 Internetseite: http://dsav-wiss.ids-mannheim.de/DSAv/
KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010
Philipp Dorok M.A.
Lehrstuhl für Germanistische Linguistik
Prof. Dr. Karin Pittner
1. Einstieg: Korpuslinguistisches Arbeiten
2. Recherche mit COSMAS II
3. Recherche in der Datenbank Gesprochenes Deutsch
4. Offene Fragen
Recherche in der Datenbank Gesprochenes Deutsch
KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010
Philipp Dorok M.A.
Lehrstuhl für Germanistische Linguistik
Prof. Dr. Karin Pittner
1. Einstieg: Korpuslinguistisches Arbeiten
2. Recherche mit COSMAS II
3. Recherche in der Datenbank Gesprochenes Deutsch
4. Offene Fragen
Recherche in der Datenbank Gesprochenes Deutsch
KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010
Philipp Dorok M.A.
Lehrstuhl für Germanistische Linguistik
Prof. Dr. Karin Pittner
1. Einstieg: Korpuslinguistisches Arbeiten
2. Recherche mit COSMAS II
3. Recherche in der Datenbank Gesprochenes Deutsch
4. Offene Fragen
Offene Fragen
 Haben Sie noch Fragen zur korpuslinguistischen Recherche?
 Sie können mich unter [email protected] kontaktieren, wenn sich später
weitere Fragen ergeben sollten.
 Eine gute Einführung zur Korpuslinguistik:
Lemnitzer, Lothar und Zinsmeister, Heike (2006): Korpuslinguistik. Eine Einführung.
Tübingen: Narr.

Online-Einführungskurs zur Korpuslinguistik von Noah Bubenhofer (IDS Mannheim):
Einführung in die Korpuslinguistik: Praktische Grundlagen und Werkzeuge.
http://www.bubenhofer.com/korpuslinguistik/kurs/
KORPUSLINGUISTISCHE RECHERCHEN – 04.11.2010