Бранко Тошовиќ (Грац) Емилија Бојковскa (Скопје) Димитар Попоски (Скопје) Арно Вониш (Грац) Македонски корпус „Гралис“ („Гралис-Мак”) XXXVIII научна конференција Универзитет “Св Кирил и Методиј”, Меѓународен семинар за македонски.

Download Report

Transcript Бранко Тошовиќ (Грац) Емилија Бојковскa (Скопје) Димитар Попоски (Скопје) Арно Вониш (Грац) Македонски корпус „Гралис“ („Гралис-Мак”) XXXVIII научна конференција Универзитет “Св Кирил и Методиј”, Меѓународен семинар за македонски.

Бранко Тошовиќ (Грац)
Емилија Бојковскa (Скопје)
Димитар Попоски (Скопје)
Арно Вониш (Грац)
Македонски корпус
„Гралис“ („Гралис-Мак”)
XXXVIII научна конференција
Универзитет “Св Кирил и Методиј”,
Меѓународен семинар за македонски јазик, литература и култура
Охрид, 14–15 јули 2010
Три реферати
• Емилија Бојковска
• Димитар Попоски
• Арно Вониш
2
Основни резултати
• перспективи за развојот на
еднојазичниот и на повеќејазичниот
(паралелен) корпус за проучување на
македонскиот јазик
3
Првиот реферат
Бранко Тошовиќ
• Резултати меѓу двете конференции во
Охрид (јули 2010 - јули 2011)
• план на активности до следната
конференција во јули 2012 година
4
Вториот реферат
• Емилија Бојковска
• Предизвиците и значењето на корпусот
за проучување на македонскиот јазик во
однос на другите словенски и
несловенски јазици
5
Третиот реферат
• Димитар Попоски
• Проблемот на почитувањето на
авторските права (Creative Commons)
6
Четвртиот реферат
• заменки
• демонстрација како може да се користи
корпусот „Гралис“ во контрастивните
истражувања
• Арно Вониш
7
Дел 1
8
Основни информации
• информациски и аналитички комплекс
• собирање, обработка и анализа на
пишувани и на говорени текстови на
македонски јазик
• систематско истражување на
македонскиот јазик
9
Gralis Korpus
Австрија, Грац
http://www-gewi.kfunigraz.ac.at/gralis
10
Текстуален и говорен корпус
• македонско-словенски и македонскогермански текстови
• Институт за славистика во Грац
• Центар за моделирање на информации
• Филолошки факултет „Блаже Конески”
11
Барање
а) одреден збор во контекст од една
реченица, на пр. бара.*
12
б) список со сите форми од некој збор, на
пр. бара.*
13
Метаинформација
• извор
1. автор
2. кога и каде
3. страници
4. функционален стил и жанр
5. преведувач
14
• Говорен корпус
15
• Важност за македонистиката
16
Австриско-македонски тим
• Грац
Бранко Тошовиќ
Арно Вониш
• Скопје
Емилија Бојковска
Димитар Попоски
17
• Максим Каранфиловски
• Олга Пањкина
18
40 текста
• 108.474 одредници (токен)
• De: 66.242
• Mk: 22.304
• Ru: 17.456
• Sr: 1.770
• Uk: 702
•
19
Дел 2
20
Поетиката, стилистиката и лингвистиката
на текстовите од Блаже Конески
во корпусот „Гралис“
21
• Корпус текстови од Иво Андриќ
• Корпус текстови од Блаже Конески
22
Преведувачка работилница
• XLIV меѓународен семинар за
македонски јазик, литература и култура
• Охрид 2011
• Роза Тасевска
23
Руски колективни преводи
• Олга Савчиц
• Марија Морозова
• Софија Заболотнаја
• Алина Костриченко
24
• три српски индивидуални преводи
(Бранко Тошовиќ)
• еден украински превод (Андреј
Гумењук)
25
Блаже Конески
1.Средба во рајот
2.Разминување
3.Тихиот Дон
26
Конески Блаже
1.Лозје
2.Потез
3.Песна
4.Љубов
5.Тихиот Дон
6.Разминување
7.Средба во рајот
27
Дел 3
28
• Едно од главните тежишта на
Универзитетот во Грац – Југоисточна
Европа
29
Студиски јазици
• БКС (бошњачки, хрватски, српски)
• словенечки јазик
• руски јазик
Курсеви
• бугарски, чешки, полски јазик
30
• Анонимно анкетирање
• 37 студенти
• 87% (32) позитивно одговорија на
прашањето:
• Дали би ја поздравиле можноста да се
комплетира понудата на
јужнословенски филологии со
вклучување на македонскиот јазик?
31
• Ако Вашиот одговор гласи „да“, во
каква форма би можеле да си ја
замислите понудата на македонскиот
јазик?
32
33
Ви благодарам за
вниманието!
34
35
36
Интерфејс
•
•
•
•
англиски
германски
руски
српски/хрватски/бошњачки
37
Корпус со морфосинтактична анотација
• Gralis MorphoGenerator
38
39
Подвлечени зборови
• парадигми
• сите барани и добиени форми во една
реченица
40
41
Гралис-Корпус
• околу пет милиони
token
словоформы
зборовни форми
pojavnice
42
•
43
44
45
Два типа на копрусот
• текстуален
• говорен
• Gralis Speech-Korpus
46