Дигитализација језика и културе кроз електронске корпусе: пример тимочких говора
Digitizing language and culture through electronic corpora: the case of the Timok vernacular
Аутори
Мирић, Мирјана![](/themes/MirageDAIS/images/orcid.png)
Миличевић Петровић, Маја
Ћирковић, Светлана
![](/themes/MirageDAIS/images/orcid.png)
Остала ауторства
Vraneš, AleksandraПоглавље у монографији (Објављена верзија)
Метаподаци
Приказ свих података о документуАпстракт
У раду се представља текући пројекат израде електронског корпуса тимочких говора, као примера дијалекатског корпуса важног за област дигиталне хуманистике. Описују се теренска истраживања у оквиру пројекта Чувари нематеријалне баштине тимочких говора (2015–2017) током којих је прикупљена обимна мултимедијална грађа. Приказују се процедуре у изради корпуса: транскрипција и анотација језичке грађе и могућности претраге. Наводе се досадашња истраживања и могуће примене у лингвистичким дисциплинама и областима традицијске културе и фолклорне традиције
The aim of this paper is to describe the ongoing development of an electronic corpus of the Timok vernacular, a rare example of an oral dialect corpus of the Serbian language. The corpus comprises data relevant for both linguistics and studies of (traditional) culture, and as such it can help bridge the gap currently present between corpus linguistics and digital humanities. The material contained in the corpus is a result of fieldwork research conducted between 2015 and 2017, mainly within the project Protecting the intangible culture of the Timok vernacular. The paper outlines the phases of fieldwork research, in particular the selection of villages and participants, as well as the open-ended interview methodology applied in data collection. The steps in corpus development are presented next: transcription, annotation (part-of-speech tagging, lemmatization, normalization), and the resulting search options. In addition, an overview of previous and ongoing studies based on the collecte...d material are provided, capturing the domains of dialectology, Balkan linguistics, socio-, areal and anthropological linguistics, as well as studies of folklore and traditional culture, with suggestions for future research in these domains.
Кључне речи:
дигитална хуманистика / електронски корпус / мултимедијална грађа / тимочки говори / дијалектологија / балканска лингвистика / традицијска култура / фолклорна традиција / digital humanities / electronic corpus / multimedia material / Timok dialect / dialectology / Balkan linguistics / traditional culture / folklore traditionИзвор:
Дигитална хуманистика и словенско културно наслеђе I (Међународна научна конференција. Зборник радова), 2021, 75-94Издавач:
- Београд : Савез славистичких друштава Србије, Филолошки факултет Универзитета у Београду
Институција/група
Балканолошки институт САНУ / Institute for Balkan Studies SASATY - CHAP AU - Мирић, Мирјана AU - Миличевић Петровић, Маја AU - Ћирковић, Светлана PY - 2021 UR - https://dais.sanu.ac.rs/123456789/14280 AB - У раду се представља текући пројекат израде електронског корпуса тимочких говора, као примера дијалекатског корпуса важног за област дигиталне хуманистике. Описују се теренска истраживања у оквиру пројекта Чувари нематеријалне баштине тимочких говора (2015–2017) током којих је прикупљена обимна мултимедијална грађа. Приказују се процедуре у изради корпуса: транскрипција и анотација језичке грађе и могућности претраге. Наводе се досадашња истраживања и могуће примене у лингвистичким дисциплинама и областима традицијске културе и фолклорне традиције AB - The aim of this paper is to describe the ongoing development of an electronic corpus of the Timok vernacular, a rare example of an oral dialect corpus of the Serbian language. The corpus comprises data relevant for both linguistics and studies of (traditional) culture, and as such it can help bridge the gap currently present between corpus linguistics and digital humanities. The material contained in the corpus is a result of fieldwork research conducted between 2015 and 2017, mainly within the project Protecting the intangible culture of the Timok vernacular. The paper outlines the phases of fieldwork research, in particular the selection of villages and participants, as well as the open-ended interview methodology applied in data collection. The steps in corpus development are presented next: transcription, annotation (part-of-speech tagging, lemmatization, normalization), and the resulting search options. In addition, an overview of previous and ongoing studies based on the collected material are provided, capturing the domains of dialectology, Balkan linguistics, socio-, areal and anthropological linguistics, as well as studies of folklore and traditional culture, with suggestions for future research in these domains. PB - Београд : Савез славистичких друштава Србије, Филолошки факултет Универзитета у Београду T2 - Дигитална хуманистика и словенско културно наслеђе I (Међународна научна конференција. Зборник радова) T1 - Дигитализација језика и културе кроз електронске корпусе: пример тимочких говора T1 - Digitizing language and culture through electronic corpora: the case of the Timok vernacular SP - 75 EP - 94 UR - https://hdl.handle.net/21.15107/rcub_dais_14280 ER -
@inbook{ author = "Мирић, Мирјана and Миличевић Петровић, Маја and Ћирковић, Светлана", year = "2021", abstract = "У раду се представља текући пројекат израде електронског корпуса тимочких говора, као примера дијалекатског корпуса важног за област дигиталне хуманистике. Описују се теренска истраживања у оквиру пројекта Чувари нематеријалне баштине тимочких говора (2015–2017) током којих је прикупљена обимна мултимедијална грађа. Приказују се процедуре у изради корпуса: транскрипција и анотација језичке грађе и могућности претраге. Наводе се досадашња истраживања и могуће примене у лингвистичким дисциплинама и областима традицијске културе и фолклорне традиције, The aim of this paper is to describe the ongoing development of an electronic corpus of the Timok vernacular, a rare example of an oral dialect corpus of the Serbian language. The corpus comprises data relevant for both linguistics and studies of (traditional) culture, and as such it can help bridge the gap currently present between corpus linguistics and digital humanities. The material contained in the corpus is a result of fieldwork research conducted between 2015 and 2017, mainly within the project Protecting the intangible culture of the Timok vernacular. The paper outlines the phases of fieldwork research, in particular the selection of villages and participants, as well as the open-ended interview methodology applied in data collection. The steps in corpus development are presented next: transcription, annotation (part-of-speech tagging, lemmatization, normalization), and the resulting search options. In addition, an overview of previous and ongoing studies based on the collected material are provided, capturing the domains of dialectology, Balkan linguistics, socio-, areal and anthropological linguistics, as well as studies of folklore and traditional culture, with suggestions for future research in these domains.", publisher = "Београд : Савез славистичких друштава Србије, Филолошки факултет Универзитета у Београду", journal = "Дигитална хуманистика и словенско културно наслеђе I (Међународна научна конференција. Зборник радова)", booktitle = "Дигитализација језика и културе кроз електронске корпусе: пример тимочких говора, Digitizing language and culture through electronic corpora: the case of the Timok vernacular", pages = "75-94", url = "https://hdl.handle.net/21.15107/rcub_dais_14280" }
Мирић, М., Миличевић Петровић, М.,& Ћирковић, С.. (2021). Дигитализација језика и културе кроз електронске корпусе: пример тимочких говора. in Дигитална хуманистика и словенско културно наслеђе I (Међународна научна конференција. Зборник радова) Београд : Савез славистичких друштава Србије, Филолошки факултет Универзитета у Београду., 75-94. https://hdl.handle.net/21.15107/rcub_dais_14280
Мирић М, Миличевић Петровић М, Ћирковић С. Дигитализација језика и културе кроз електронске корпусе: пример тимочких говора. in Дигитална хуманистика и словенско културно наслеђе I (Међународна научна конференција. Зборник радова). 2021;:75-94. https://hdl.handle.net/21.15107/rcub_dais_14280 .
Мирић, Мирјана, Миличевић Петровић, Маја, Ћирковић, Светлана, "Дигитализација језика и културе кроз електронске корпусе: пример тимочких говора" in Дигитална хуманистика и словенско културно наслеђе I (Међународна научна конференција. Зборник радова) (2021):75-94, https://hdl.handle.net/21.15107/rcub_dais_14280 .