Grup d’Història i Contacte de Llengües (GHCL) Coloma Lleal Galceran (dir.) Emilia Anglada Arboix, Paloma Arroyo Vega, Esther Blasco Mateo, Mar Cruz Piñol, Mar.

Download Report

Transcript Grup d’Història i Contacte de Llengües (GHCL) Coloma Lleal Galceran (dir.) Emilia Anglada Arboix, Paloma Arroyo Vega, Esther Blasco Mateo, Mar Cruz Piñol, Mar.

Grup d’Història i Contacte de Llengües
(GHCL)
Coloma Lleal Galceran (dir.)
Emilia Anglada Arboix, Paloma Arroyo Vega, Esther Blasco Mateo,
Mar Cruz Piñol, Mar Forment Fernández, Ignacio Vázquez Diéguez.
Alícia Domènech, Mónica González, Laura Romero (becàries)
DICCIONARI ELECTRÒNIC DEL CASTELLÀ
DEL SEGLE XV A LA CORONA D’ARAGÓ
Departament de Filologia Hispànica
Facultat de Filologia
1. DEL TEXT A LA BASE
el text
* selecció: textos del segle XV escrits en castellà a la
Corona d’Aragó i conservats en manuscrits o incunables.
* criteris de transcripció: fidelitat a l’original; mots
aglutinats separats per punt volat; noms propis units;
majúscules contextuals eliminades…
la base inicial
* camps inicials: forma i situació
* camps afegits: vocable, funció i variant
2. LEMATITZACIÓ
REPLACE ALL vocablo WITH “assi”, variante WITH forma, función WITH “adv.”
FOR (forma=“assi” OR forma=“asi” OR forma=“assy” OR forma=“asy”
OR forma=“ansi” OR forma=“ansy”)
LOCATE FOR (“assemos ” $forma OR “assedes ” $forma OR “asseden ” $forma)
DO WHILE NOT EOF()
STORE TRIM(forma) TO mot
STORE LEN(mot) TO mida
REPLACE NEXT 1 función WITH “verbo”, vocablo WITH LEFT(mot,(mida-6))+“r”,
variante WITH LEFT(mot,(mida-6))+“r”
CONTINUE
ENDDO
LOCATE FOR forma=(“el ” OR forma=“la ” OR forma=“lo ” OR forma=“los ”
OR forma=“las ”)
DO WHILE NOT EOF()
SKIP
IF función=“verbo”
SKIP -1
REPLACE NEXT 1 vocablo WITH “el ella ello”, funciónWITH “pron. pers.”
ELSE
SKIP -1
REPLACE NEXT 1 vocablo WITH “el la lo”, función WITH “art.”
ENDIF
SKIP 2
CONTINUE
ENDDO
Programa lematitzador a partir de:
* lexicó:
formes d’inventari tancat (articles, pronoms, conjuncions, preposicions…) i
formes lèxiques d’alta freqüència.
* regles de derivació i flexió.
{-oso, -ario, -ble…}
{-dad, -ez, -ura…}
{-riamos, -assedes…}
{-mente}
adj.
sust. fem.
verb
adv.
…
* regles sintàctiques.
distinció articles/pronoms (lo, la)
distinció sust./verb… (canto)
…
* correcció ortogràfica
i, a continució, revisió del text
TOTAL DE FORMES LEMATITZADES
AUTOMÀTICAMENT: 96,7% DEL TEXT
5: EL DICCIONARI: Base REUNIÓ
Informació general
Altres possibilitats de cerca: alguns exemples
1. Llistat de locucions
locucions adverbials
locucions sustantives
2. Llistat de neologismes
Obtenció de llistats dels termes a
partir de la data de primera
documentació en el DCECH de
Corominas-Pascual (en aquest cas,
igual o posterior a 1400).
Es marca en negreta la data de la
primera documentació en el nostre
corpus quan és igual o anterior a la
del DCECH.
3. Famílies etimològiques
Llistat dels termes del nostre corpus que parteixen d’una mateixa base etimològica.
4. Camps semàntics
‘document’
‘planta’
‘documento’