Towards Automatic Definition Extraction for Serbian
U radu su prikazani preliminarni rezultati automatske ekstrakcije kandidata za definicije rečnika iz nestrukturiranih tekstova na srpskom jeziku u cilju ubrzanja razvoja rečnika. Definicije u rečniku Srpske akademije nauka i umetnosti (SANU) korišćene su za modelovanje različitih tipova definicija (opisnih, gramatičkih, referentnih i sinonimskih) koje imaju različite sintaksičke i leksičke karakteristike. Korpus istraživanja sastoji se od 61.213 definicija imenica, koje su analizirane korišćenjem morfoloških e-rečnika i lokalnih gramatika implementiranih kao pretvarači konačnih stanja u paketu za obradu korpusa otvorenog
Megaklizišta u gornjem toku Drine od Foče do Višegrada i njihov uticaj na hidroenergetske objekte
Sunarić Duško, Jevremović Dragutin, Lolin M.. "Megaklizišta u gornjem toku Drine od Foče do Višegrada i njihov uticaj na hidroenergetske objekte" in Tehnički institut, Zbornik radova no. 3, Bijeljina:Arhiv za tehničke nauke Bijeljina (2010): 65-81
Improvement of geodatabase queries within GeolISS
... Serbia” u časopisu Zapisnici Srpskog geološkog društva, Srpsko geološko društvo, Beograd. [7] ESRI Developer network (http://edn.esri.com) [8] Vitas D., G. Pavlović-Lažetić, C. Krstev, Lj. Popović, I. Obradović (2003): „Processing Serbian Written Texts: An Overview of Resources and Basic Tools“ ...Ranka Stanković. "Improvement of geodatabase queries within GeolISS" in Review of the National Center for Digitization, Beograd : Faculty of Mathematics, Belgrade (2008)
Softverski alati za korišćenje resursa za srpski jezik
Српски језик у дигиталном добу -- The Serbian Language in the Digital Age
... СРПСКИ ЈЕЗИК У ДИГИТАЛНОМ ДОБУ Duško Vitas Ljubomir Popović Cvetana Krstev Ivan Obradović Gordana Pavlović-Lažetić Mladen Stanojević White Paper Series THE SERBIAN LANGUAGE IN THE DIGITAL AGE Серија белих књига СРПСКИ ЈЕЗИК У ДИГИТАЛНОМ ДОБУ Duško Vitas University of Belgrade Ljubomir ...
... Sciences: Radovan Garabík Словенија Slovenia Jožef Stefan Institute: Marko Grobelnik Србија Serbia Univ. of Belgrade, Faculty of Mathematics: Duško Vitas, Cvetana Krstev, Ivan Obradović Pupin Institute: Sanja Vraneš Финска Finland Computational Cognitive Systems Research Group, Aalto Univ.: Timo ...Duško Vitas, Ljubomir Popović, Cvetana Krstev, Ivan Obradović, Gordana Pavlović-Lažetić, Mladen Stanojević. "Српски језик у дигиталном добу -- The Serbian Language in the Digital Age" in META-NET White Paper Series, G. Rehm, H. Uszkoreit (eds.), Springer (2012)
Development of Open Educational Resources (OER) for Natural Language Processing
In this paper we present the development of an online course at the edX BAEKTEL platform named "Lexical Recognition in the Natural Language Processing (NLP)". It is based on the course of the same name for PhD studies at the University of Belgrade, Faculty of Philology. There are not many courses in Computational Linguistics (CL) on OER platforms, and there is none in Serbian either for CL or NLP. We have developed this course in order to improve this
Keyword Extraction from Parallel Abstracts of Scientific Publications
Чији је пример? Анализа лексичких обележја на примерима Речника САНУ
У овом раду поставља се питање: да ли се може утврдити ко је аутор неког текста уколико се анализирају искључиво његова лексичка обележја? Како бисмо покушали да добијемо одговор на ово питање, посматрали смо примере у оквиру речничког чланка појединачне лексеме Речника САНУ, који су забележени у пет томова (и то: I, II, XVIII, XIX и XX). Сваки пример је преузет из неког извора на шта упућују скраћенице, наведене у заградама. Од преко 5.000 понуђених извора, определили смо се
... градским капијама (Гавр. М. 2, 377); плескач, -aча м покр. експр. онај који много и непромишљено говори, прича, брбљивац, блебетало; исп. плескати и пљескати (I, 5). — Такога плескача тешко је наћ (Крња Јела, ЦГ, Вукс. М.). Велики је то плескач (Крња Јела, ЦГ, Вукс. М.). Детаљним прегледањем штампане ...
... примери лематизовани су коришћењем тагера (в. Утвић 2014), а затим је примењена листа стоп речи. Коришћењем електронских речника и алата Unitex (в. Витас и Крстев 2012) елиминисане су све врсте речи изузев именица. Чији је пример? анализа лексичких обележја на примерима речника сану 311 6.1. моделирање ...Бранислава Б. Шандрих, Ранка М. Станковић, Мирјана С. Гочанин. "Чији је пример? Анализа лексичких обележја на примерима Речника САНУ" in Српски језик и његови ресурси, Међународни славистички центар, Филолошки факултет, Универзитет у Београду (2019). https://doi.org/10.18485/msc.2019.48.3.ch13
Vebran Web Services for Corpus Query Expansion
U ovom radu se govori o razvoju veb usluga Vebran i njihovoj primeni u poboljšanju pretraživanja korpusa. Veb-servisi Vebran koriste se za konsultovanje spoljnih leksičkih izvora za srpski jezik (uglavnom elektronski morfološki rečnici i srpski Vordnet) i proširivanje korisničkih upita radi dobijanja relevantnijih rezultata iz srpskih korpusa.
The first version of SrpKor, SrpKor2003, has not been morphologically annotated. SrpKor2013 is the current version of SrpKor
... and А. Милановић, Vol. 48/3, 279–298. Београд: МСЦ, Универзитет у Београду, Филолошки факултет, 2019. https://doi. org/10.18485/msc.2019.48.3.ch12 Vitas, Duško and Cvetana Krstev. “Processing of Corpora of Serbian Using Electronic Dictionaries”. Prace Filologiczne Vol. 63 (2012): 279–292 Обрадовић ...Ranka Stanković, Miloš Utvić. "Vebran Web Services for Corpus Query Expansion" in Infotheca, Faculty of Philology, University of Belgrade (2020). https://doi.org/10.18485/infotheca.2019.19.2.5
Using Lexical Resources for Irony and Sarcasm Classification
Integracija heterogenih tekstualnih resursa
Two approaches to compilation of bilingual multi-word terminology lists from lexical resources
In this paper, we present two approaches and the implemented system for bilingual terminology extraction that rely on an aligned bilingual domain corpus, a terminology extractor for a target language, and a tool for chunk alignment. The two approaches differ in the way terminology for the source language is obtained: the first relies on an existing domain terminology lexicon, while the second one uses a term extraction tool. For both approaches, four experiments were performed with two parameters being
An Integrated Environment for Management and Exploitation of Linguistic Resources
Development of integrated fuzzy model for mine management optimization
Creation of a Training Dataset for Question-Answering Models in Serbian
Razvoj i primena veštačke inteligencije u jezičkim tehnologijama značajno su napredovali poslednjih godina, posebno u domenu zadatka odgovaranja na pitanja (Question Answering - QA). Dok su postojeći resursi za QA zadatke razvijeni za glavne svetske jezike, srpski jezik je relativno zanemaren u ovoj oblasti. Ovaj rad predstavlja inicijativu za kreiranje obimnog i raznovrsnog skupa podataka za obučavanje modela za odgovaranje na pitanja na srpskom jeziku, koji će doprineti unapređenju jezičkih tehnologija za srpski jezik. Pored brojnih istraživanja o jezičkim modelima

veštačka inteligencija, obrada prirodnog jezika, jezički resursi, anotirani skupovi, ekstrakcija informacija, odgovaranje na pitanja

Ranka Stanković, Jovana Rađenović, Maja Ristić, Dragan Stankov. "Creation of a Training Dataset for Question-Answering Models in Serbian" in South Slavic Languages in the Digital Environment JuDig Book of Abstracts, University of Belgrade - Faculty of Philology, Serbia, November 21-23, 2024, University of Belgrade - Faculty of Philology (2024)
Improving Document Retrieval in Large Domain Specific Textual Databases Using Lexical Resources
Large collections of textual documents represent an example of big data that requires the solution of three basic problems: the representation of documents, the representation of information needs and the matching of the two representations. This paper outlines the introduction of document indexing as a possible solution to document representation. Documents within a large textual database developed for geological projects in the Republic of Serbia for many years were indexed using methods developed within digital humanities: bag-of-words and named
... . INFOtheca 12(1), 49a–63a (2011) 25. Utvić, M.: Annotating the corpus of contemporary Serbian. INFOtheca - J. Inform. Librariansh. 12(2), 36a–47a (2011) 26. Vitas, D., Popović, L., Krstev, C., Obradović, I., Pavlović-Lažetić, G., Stanojević, M.: Srpski jezik u digitalnom dobu - The Serbian ...
... (2011) 17. Milosevic, N.: Stemmer for Serbian language. CoRR abs/1209.4471 (2012). http:// arxiv.org/abs/1209.4471 18. Mladenović, M., Mitrović, J., Krstev, C., Vitas, D.: Hybrid sentiment analysis framework for a morphologically rich language. J. Intell. Inf. Syst. 1–22, to appear 19. Nadeau, D. ...Ranka Stanković, Cvetana Krstev, Ivan Obradović, Olivera Kitanović. "Improving Document Retrieval in Large Domain Specific Textual Databases Using Lexical Resources" in Trans. Computational Collective Intelligence - Lecture Notes in Computer Science 26, Springer (2017). https://doi.org/10.1007/978-3-319-59268-8_8
A Tel Platform Blending Academic And Entrepreneurial Knowledge
Development of an integrated model for open-pit-mine discontinuous haulage system optimization
Miodrag Čelebić, Dragoljub Bajić, Sanja Bajić, Mirjana Banković, Duško Torbica, Aleksej Milošević , Dejan Stevanović (2024)Miodrag Čelebić, Dragoljub Bajić, Sanja Bajić, Mirjana Banković, Duško Torbica, Aleksej Milošević , Dejan Stevanović . "Development of an integrated model for open-pit-mine discontinuous haulage system optimization" in Sustainability, MDPI (2024). https://doi.org/10.3390/su16083156
Towards the semantic annotation of SR-ELEXIS corpus: Insights into Multiword Expressions and Named Entities
Овај рад представља активности на развоју корпуса ELEXIS-sr, српском додатку вишејезичном анотираном корпусу ELEXIS-а, који се састоји од семантичких анотација и репозиторија значења речи. ELEXIS је паралелни вишејезични анотирани корпус на десет европских језика, који може да се користи као вишејезички репер за евалуацију европских језика са мање и средње развијеним ресурсима. Фокус овог рада је на вишечланим изразима и именованим ентитетима, њиховом препознавању у скупу реченица ELEXIS-sr и поређењу са анотацијама на другим језицима. Разматрају се први кораци

Cvetana Krstev, Ranka Stanković, Aleksandra Marković, Teodora Mihajlov. "Towards the semantic annotation of SR-ELEXIS corpus: Insights into Multiword Expressions and Named Entities" in Proceedings of the Joint Workshop on Multiword Expressions and Universal Dependencies (MWE-UD) @ LREC-COLING 2024, Turin, May 25, 2024, ELRA and ICCL (2024)
Development and Evaluation of Three Named Entity Recognition Systems for Serbian - The Case of Personal Names
In this paper we present a rule- and lexicon-based system for the recognition of Named Entities (NE) in Serbian news paper texts that was used to prepare a gold standard annotated with personal names. It was further used to prepare training sets for four different levels of annota tion, which were further used to train two Named Entity Recognition (NER) sys tems: Stanford and spaCy. All obtained models, together with a rule- and lexicon based system were evaluated on
... Serbian Daily Press]. Knjižen- stvo - časopis za studije književnosti, roda i kulture V. https://doi.org/10.18485/knjiz.2015.1.24. Cvetana Krstev, Duško Vitas, and Sandra Gucul. 2005. Recognition of Personal Names in Serbian Texts. In International Conference Recent Advances in Natu- ral Language Processing ...
... and Juníchi Tsu- jii. 2012. BRAT: a Web-based Tool for NLP- Assisted Text Annotation. In Proceedings of the Demonstrations Session at EACL 2012. Duško Vitas and Cvetana Krstev. 2012. Processing of Corpora of Serbian using Electronic Dictionaries. Prace Filologiczne LXIII:279–292. ...Branislava Šandrih, Cvetana Krstev, Ranka Stanković. "Development and Evaluation of Three Named Entity Recognition Systems for Serbian - The Case of Personal Names" in Proceedings - Natural Language Processing in a Deep Learning World, Incoma Ltd., Shoumen, Bulgaria (2019). https://doi.org/10.26615/978-954-452-056-4_122