Football terminology: compilation and transformation into OntoLex-Lemon resource
- објављена
- српски
- Jelena Lazarević, Ranka Stanković, Mihailo Škorić, Biljana Rujević
- LDK 2023 – 4th Conference on Language, Data and Knowledge, 12-15 September in Vienna, Austria
- 2023
- У овом раду представља се пројекат који је у развоју, креирање првог дигиталног фудбалског речника на српском језику, као и да демонстрација примене модела OntoLex и љегових модула. OntoLex-FrAC модул укључује информације о учесталости и примерима употребе екстрахованих из корпуса. У овом случају, креиран је корпус за специфичан домен под називом СрФудКо, који садржи чланке вести о фудбалу на српском језику. Вишечлани термини аутоматски су екстраховани из српског корпуса, а затим ручно евалуирани и класификовани као спортски или фудбалски. Лексикон флексија је произведен и трансформисан у OntoLex формат, информације о фреквенцији из фазе екстракције су додељене лексичким записима. Коначно, неколико лексичких записа је повезано са потврдама из корпуса.
- The purpose of this article is to present the ongoing project which is the compilation of the first digital Football dictionary in the Serbian language, as well as to demonstrate the application of OntoLex and associated modules. The OntoLex-FrAC module for a football-specific dictionary includes information about frequency, attestation, and corpus usage. In this case, a domain-specific corpus was created by the name of SrFudKo, containing news articles about football in Serbian. Multi-word terms were automatically extracted from the Serbian corpus, then manually evaluated and classified as either sport or football-related. An inflection lexicon was produced and transformed into the OntoLex format, Frequency information from the extraction phase was assigned to the entries. Finally, a few lexical entries were linked with the attestations from the corpus.
- 634
- 645
- 10.34619/srmk-injj
- 978-989-54081-5-3
- повезани отворени подаци, корпус, СрФудКо, OntoLex, OntoLex-FrAC
- linked open data, corpus, SrFudKo, OntoLex, OntoLex-FrAC
