Дигитални архив издања САНУ
    • English
    • Српски
    • Српски (Serbia)
  • Српски (ћирилица) 
    • Енглески
    • Српски (ћирилица)
    • Српски (латиница)
  • Пријава
Преглед рада 
  •   ДАИС
  • Институт за српски језик САНУ / Institute for the Serbian Language of SASA
  • ИСЈ САНУ - Општа колекција / General collection
  • Преглед рада
  •   ДАИС
  • Институт за српски језик САНУ / Institute for the Serbian Language of SASA
  • ИСЈ САНУ - Општа колекција / General collection
  • Преглед рада
JavaScript is disabled for your browser. Some features of this site may not work without it.

SASA Dictionary as the Gold Standard for Good Dictionary Examples for Serbian

Thumbnail
2019
stankovic.et.al.sasa.2019.pdf (981.1Kb)
Аутори
Stanković, Ranka
Šandrih, Branislava
Stijović, Rada
Krstev, Cvetana
Vitas, Duško
Marković, Aleksandra
Чланак у часопису (Објављена верзија)
Метаподаци
Приказ свих података о документу
Апстракт
In this paper we present a model for selection of good dictionary examples for Serbian and the development of initial model components. The method used is based on a thorough analysis of various lexical and syntactic features in a corpus compiled of examples from the five digitized volumes of the Serbian Academy of Sciences and Arts (SASA) dictionary. The initial set of features was inspired by a similar approach for other languages. The feature distribution of examples from this corpus is compared with the feature distribution of sentence samples extracted from corpora comprising various texts. The analysis showed that there is a group of features which are strong indicators that a sentence should not be used as an example. The remaining features, including detection of non-standard and other marked lexis from the SASA dictionary, are used for ranking. The selected candidate examples, represented as featurevectors, are used with the GDEX ranking tool for Serbian candidate ex...amples and a supervised machine learning model for classification on standard and non-standard Serbian sentences, for further integration into a solution for present and future dictionary production projects.

Кључне речи:
Serbian / good dictionary examples / automatization of dictionary-making / feature extraction / machine learning
Извор:
Electronic lexicography in the 21st century : Smart lexicography, 2019, 248-269
Издавач:
  • Brno : Lexical Computing CZ s.r.o.
Пројекти:
  • Књижевност и визуелне уметности: руско-српски дијалог (RS-178003)
  • Инфраструктура за електронски подржано учење у Србији (RS-47003)
  • Лингвистичка истраживања савременог српског књижевног језика и израда Речника српскохрватског књижевног и народног језика САНУ (RS-178009)

ISSN: 2533-5626

[ Google Scholar ]
URI
http://dais.sanu.ac.rs/123456789/7162
Колекције
  • ИСЈ САНУ - Општа колекција / General collection
Институција
Институт за српски језик САНУ / Institute for the Serbian Language of SASA

DSpace software copyright © 2002-2015  DuraSpace
О Дигиталном архиву издања САНУ (ДАИС) | Пошаљите запажања

re3dataOpenAIRERCUB
 

 

Комплетан репозиторијумИнституцијеАуториНасловиТемеОва институцијаАуториНасловиТеме

Статистика

Преглед статистика

DSpace software copyright © 2002-2015  DuraSpace
О Дигиталном архиву издања САНУ (ДАИС) | Пошаљите запажања

re3dataOpenAIRERCUB