Strukturell kompleksitet

Download Report

Transcript Strukturell kompleksitet

Tre perspektiver
på språklig kompleksitet
Bård Uri Jensen
http://privat.hihm.no/buj/nordand2011/
[email protected]
Innhold
Teoretisk
bakgrunn
1. Teoretisk bakgrunn
Systemkompleksitet
2. Systemkompleksitet
Strukturell
kompleksitet
3. Strukturell kompleksitet
Tekstkompleksitet
4. Tekstkompleksitet
5. Oppsummering
Bård Uri Jensen, Høgskolen i Hedmark (Norge)
Oppsummering
Informasjonell kompleksitet
1. aabbaabbaabbaabbaabbaabbaabbaabb
2. babbaabbabaabaabbbbbaabbabbabaaa
3. aabbaabbaabbaabbaabbabbbaabbaabb
Teoretisk
bakgrunn
Systemkompleksitet
Strukturell
kompleksitet
Tekstkompleksitet
Oppsummering
Bård Uri Jensen, Høgskolen i Hedmark (Norge)
Entropi
Definisjon av entropi
4. H(x) = ∑ pi * ( –log( pi ) )
Teoretisk
bakgrunn
Systemkompleksitet
Strukturell
kompleksitet
Tekstkompleksitet
Relativ entropi (”effektiv entropi”)
5. E(x) = H(x) / log(n)
Bård Uri Jensen, Høgskolen i Hedmark (Norge)
Oppsummering
Teoretisk
bakgrunn
Vokalsystemet i svensk og älvdalsk
lang
kort
lang
kort
Systemkompleksitet
Strukturell
kompleksitet
Tekstkompleksitet
Oppsummering
e
ä
E
Bård Uri Jensen, Høgskolen i Hedmark (Norge)
e
e
ä
ä
Empiri: 40 tekster fra ASK (UiBergen)
Teoretisk
bakgrunn
Systemkompleksitet
L1:
CEFR:
B1
B2
polsk
spansk
10
10
10
10
Bård Uri Jensen, Høgskolen i Hedmark (Norge)
Strukturell
kompleksitet
Tekstkompleksitet
Oppsummering
Teoretisk
bakgrunn
Subklaususfrekvens
Systemkompleksitet
polsk
spansk
1.5
Strukturell
kompleksitet
1.0
Tekstkompleksitet
0.5
Oppsummering
B1
po.B1
B2
sp.B1
Bård Uri Jensen, Høgskolen i Hedmark (Norge)
po.B2
sp.B2
Teoretisk
bakgrunn
Systemkompleksitet
polsk
spansk
Strukturell
kompleksitet
1.2
1.4
1.6
T-enhetsdybde
0.8
1.0
Tekstkompleksitet
0.4
0.6
Oppsummering
0.2
B1
po.B1
B2
sp.B1
Bård Uri Jensen, Høgskolen i Hedmark (Norge)
po.B2
sp.B2
Rekursjon eller iterasjon
• <t-unit>
Jeg vil lære han
<clause type="nominal">
at å ta feil er ingenting ille,
<clause type="adverbial">
fordi mann lærer seg av sine egne feil.
</clause>
</clause>
</t-unit>
•
Bård Uri Jensen, Høgskolen i Hedmark (Norge)
Teoretisk
bakgrunn
Systemkompleksitet
Strukturell
kompleksitet
Tekstkompleksitet
Oppsummering
Rekursjon eller iterasjon
• I huset bodde en mann
som hadde en sønn
som hadde en hund
som hadde en loppe
som hadde en lus.
• I huset bodde en mann
og han hadde en sønn
og han hadde en hund
og den hadde en loppe
og den hadde en lus.
Bård Uri Jensen, Høgskolen i Hedmark (Norge)
Teoretisk
bakgrunn
Systemkompleksitet
Strukturell
kompleksitet
Tekstkompleksitet
Oppsummering
Rekursjon eller iterasjon
• <t-unit>
Barna må kontakt med andre barn, spesiell
<clause type="adverbial">
hvis de er enebarn,
</clause>
for å bli mer sosjal, å lære
å dele leker eller mat med andre.
</t-unit>
•
Bård Uri Jensen, Høgskolen i Hedmark (Norge)
Teoretisk
bakgrunn
Systemkompleksitet
Strukturell
kompleksitet
Tekstkompleksitet
Oppsummering
Teoretisk
bakgrunn
Systemkompleksitet
polsk
spansk
Strukturell
kompleksitet
0.5
0.6
Subklaususer som ikke er høyreinnføyd
0.3
0.4
Tekstkompleksitet
0.0
0.1
0.2
Oppsummering
B1
po.B1
B2
sp.B1
Bård Uri Jensen, Høgskolen i Hedmark (Norge)
po.B2
sp.B2
Teoretisk
bakgrunn
Subklaususer som ikke er høyreinnføyd
0.6
1.0
1.4
0.0
0.2
0.4
0.6
0.6
0.2
Systemkompleksitet
0.2 0.6 1.0 1.4
0.2
kl-frek
0.96
Strukturell
kompleksitet
Tekstkompleksitet
t-dybde
0.0 0.2 0.4 0.6
0.95 0.96
0.62
0.2
0.4
0.6
0.64
0.8
Bård Uri Jensen, Høgskolen i Hedmark (Norge)
1.5
Oppsummering
0.5
kl-dybde
0.78
0.5
1.0
1.5
v/s
2.0
Teoretisk
bakgrunn
Gjennomsnittlig t-enhetslengde
målt i antall ord
Systemkompleksitet
Strukturell
kompleksitet
20
polsk
spansk
Tekstkompleksitet
10
15
Oppsummering
B1
po.B1
B2
sp.B1
Bård Uri Jensen, Høgskolen i Hedmark (Norge)
po.B2
sp.B2
Teoretisk
bakgrunn
Fordeling av t-enhetslengde
400
Systemkompleksitet
300
Strukturell
kompleksitet
200
Tekstkompleksitet
0
100
Oppsummering
1-5
6-10
Bård Uri Jensen, Høgskolen i Hedmark (Norge)
11-15
16-20
21+
Teoretisk
bakgrunn
Fordeling av t-enhetslengde
Strukturell
kompleksitet
polsk
spansk
0.85
Oppsummering
0.65
0.70
0.75
Tekstkompleksitet
0.80
0.90
0.95
Systemkompleksitet
B1
po.B1
B2
sp.B1
Bård Uri Jensen, Høgskolen i Hedmark (Norge)
po.B2
sp.B2
Teoretisk
bakgrunn
Fordeling av subklausustyper
15
Systemkompleksitet
Strukturell
kompleksitet
10
Tekstkompleksitet
0
5
Oppsummering
Nominale
Relative
Bård Uri Jensen, Høgskolen i Hedmark (Norge)
Adverbiale
Teoretisk
bakgrunn
Entropi over subklausustyper
1,0
Systemkompleksitet
0,9
Strukturell
kompleksitet
0,7
0,8
Tekstkompleksitet
0,4
0,5
0,6
Oppsummering
B1
po.B1
polsk
spansk
B2
sp.B1
Bård Uri Jensen, Høgskolen i Hedmark (Norge)
po.B2
sp.B2
Teoretisk
bakgrunn
Fordeling av subklausus-typer for 7
skribenter med lav entropi
nominale
relative
adverbiale
SUM
po
B1
4
0
3
7
po
B1
7
9
0
16
Bård Uri Jensen, Høgskolen i Hedmark (Norge)
po
B2
3
17
2
22
sp sp
B1 B1
0
1
2
0
6
3
8
4
sp
B1
2
12
0
14
Systemkompleksitet
sp
B1
10
0
7
17
Strukturell
kompleksitet
Tekstkompleksitet
Oppsummering
Teoretisk
bakgrunn
Oppsummering
0.6
0.8
1.0
6
7
8
9
200
400
ent t
0.4 0.7 1.0
600
0.65 0.85
0.4
Systemkompleksitet
Strukturell
kompleksitet
ent kl
20
0.29
0.32
t-lengde
10
0.21
Tekstkompleksitet
0.034
0.60
kl-lengde
0.21
0.24
0.88
0.16
kl-frek
0.51
0.38
0.17
0.26
0.043
0.65
0.80
0.95
10
15
20
Bård Uri Jensen, Høgskolen i Hedmark (Norge)
0.5
1.0
0.5
1.5
0.36
ord
200
500
6 7 8 9
Oppsummering
1.5
Referanser
Arecchi, F. T. (2001). Complexity and emergence of meaning: toward a semiophysics.
Paper presentert på Complexity and Emergence. fra
http://www.ino.it/home/arecchi/SezA/fis405.pdf.
Dahl, Ö. (2004). The growth and maintenance of linguistic complexity. Amsterdam:
John Benjamins.
Dahl, Ö. (2009). Testing the assumption of complexity invariance : the case of
Elfdalian and Swedish. I G. Sampson, D. Gil & P. Trudgill (red.), Language complexity
as an evolving variable (s. 50-63). Oxford: Oxford University Press.
Gammerman, A., & Vovk, V. (1999). Kolmogorov Complexity : Sources, Theory and
Applications. The Computer Journal, 42(4).
Karlsson, F. (2007). Constraints on multiple initial embedding of clauses. International
Journal of Corpus Linguistics, 12(1), 107-118.
Karlsson, F. (2007). Constraints on multiple center-embedding of clauses. Journal of
linguistics, 43(2), 365-392.
Sampson, G. (2002). Empirical linguistics. London: Continuum.
Sampson, G., Gil, D., & Trudgill, P. (red.). (2009). Language Complexity as an Evolving
Variable. Oxford: Oxford University Press.
Shen, A. (1999). Discussion on Kolmogorov complexity and statistical analysis. The
Computer Journal, 42(4).
Yngve, V. H. (1961). The depth hypothesis. I R. Jakobson (red.), Structure of language
and its mathematical aspects. Providence, Rhode Island: American Mathematical
Society.
Bård Uri Jensen, Høgskolen i Hedmark (Norge)
Teoretisk
bakgrunn
Systemkompleksitet
Strukturell
kompleksitet
Tekstkompleksitet
Oppsummering