Qualitatives Wissen aufgrund einer Fragestellung aus einem

Download Report

Transcript Qualitatives Wissen aufgrund einer Fragestellung aus einem

Erschließung von qualitativem
Wissen aufgrund einer
Fragestellung aus einem
Textkorpus
Dr. Helmuth Sagawe
WS 2010/11
Universität Heidelberg
Textkorpora
•
•
•
•
•
Korpora geschriebener Gegenwartssprache des IDS
http://www.ids-mannheim.de/kt/projekte/korpora/
Bestand: über 2 Milliarden Token
DWDS-Korpus
http://www.dwds.de/
Bestand: 1.2 Milliarden Token (intern), 100 Millionen Token (öffentlich)
Schweizer Textkorpus
http://www.schweizer-textkorpus.ch/
Im Testbetrieb besteht das Korpus nun aus etwa 10 Mio. Token. Im
Endausbau sind 20 Mio. Token geplant.
Dortmunder Chatkorpus
http://www.chatkorpus.uni-dortmund.de/
Bestand: 1.1 Mio. Token aus 150'000 Chat-Beiträgen.
British National Corpus (BNC)
http://www.natcorp.ox.ac.uk/
Bestand: über 100 Millionen Token
Der Weg über die quantitative
Analyse von Textmengen zur
qualitativen Aussage
- Fragestellung erarbeiten
- geeignete Textkorpora zusammenstellen
oder
- vorhandene (im Internet zugängliche)
Korpora auf die Operationalisierung der
Fragestellung hin überprüfen
- geeignete Analyseprogramme finden
Textanalyseprogramme
•
•
•
•
•
•
•
TACT
OCP
Tustap
Monoconc
Opentext
Saga
lexa
Analysemöglichkeiten
• 1. Wordliste erstellen /Häufigkeitsverteilung
• 2. Type/ Token Verhältnis prüfen / bewerten
• 3. Konkordanz zu bestimmten Begrifflichkeiten
erstellen
• 4. Semantisches Umfeld der untersuchten
Begrifflichkeit prüfen
Aufgabe:
1.
2.
3.
4.
5.
Bitte versuchen Sie zu analysieren, in welchen
Kontexten und Begrifflichkeiten das Wort „Terror“ in
der heutigen aktuellen Diskussion vorkommt.
Erstellen Sie mit Texten aus dem Internet ein
Textkorpus in WORD,
Speichern Sie dieses als TXT-Datei ab
Führen Sie eine kurze (Wordliste/ Konkordanz)
Analyse mit MONOCONC durch
4. Verbalisieren Sie die Ergebnisse in einer Mail an
mich ([email protected]) auf ca. einer halben Seite.
Bitte alle Namen der Gruppenarbeit mit aufführen.