Претрага
47 items
-
Нове технологије за оживљавање старих текстова
удаљено читање, књижевни корпус, обрада српског језика, анотација врстом речи, лематизација, именовани ентитетиЦветана Крстев, Ранка Станковић, Бранислава Шандрих Тодоровић, Милица Иконић Нешић. "Нове технологије за оживљавање старих текстова" in Зборник радова Међународне научне конференције Дигитална хуманистика и словенско културно наслеђе II, Београд, 28-29 јуни 2021., Београд : Савез славистичких друштава Србије (2023)
-
Annotation of the Serbian ELTeC Collection
Ovaj rad predstavlja takozvano izdanje nivoa 2 kolekcije tekstova SrpELTeC razvijene u okviru aktivnosti Radne grupe 2 – Metode i alati COST akcije CA 16204 (Distant Reading for European Literary History) i njene specifikacije šeme. Izdanje nivoa 2 je nastavak izdanja nivoa 1, koje se koristi kao ulaz za morfosintaksičke i NER anotacije romana. Srpska obrada nivoa-2 je navedena kroz potrebne korake, uključujući metode i alate koji se koriste u tom procesu. Neki statistički podaci iz srpske kolekcije nivoa ...udaljeno čitanje, literarni korpus, tagiranje, prepoznavanje imenovanih entiteta, lematizacija, ELTeCRanka Stanković, Cvetana Krstev, Branislava Šandrih Todorović, Mihailo Škorić. "Annotation of the Serbian ELTeC Collection" in Infotheca, Faculty of Philology, University of Belgrade (2021). https://doi.org/10.18485/infotheca.2021.21.2.3
-
Serbian ELTeC Sub-Collection in Wikidata
This paper presents an example of integration of Wikidata with digital libraries and external systems, as well as some best practices for speeding up the process of data preparation and import to Wikidata, on the use case of SrpELTeC, Serbian subcollection of the ELTeC multilingual collection (European Literary Text Collection). After preliminary work on the manual Wikidata population with SrpELTeC novels, the goal was to automate the process of preparing and importing information, so different solutions were analysed and ...Milica Ikonić Nešić, Ranka Stanković, Biljana Rujević. "Serbian ELTeC Sub-Collection in Wikidata" in Infotheca, Faculty of Philology, University of Belgrade (2021). https://doi.org/10.18485/infotheca.2021.21.2.4
-
Towards the semantic annotation of SR-ELEXIS corpus: Insights into Multiword Expressions and Named Entities
Овај рад представља активности на развоју корпуса ELEXIS-sr, српском додатку вишејезичном анотираном корпусу ELEXIS-а, који се састоји од семантичких анотација и репозиторија значења речи. ELEXIS је паралелни вишејезични анотирани корпус на десет европских језика, који може да се користи као вишејезички репер за евалуацију европских језика са мање и средње развијеним ресурсима. Фокус овог рада је на вишечланим изразима и именованим ентитетима, њиховом препознавању у скупу реченица ELEXIS-sr и поређењу са анотацијама на другим језицима. Разматрају се први кораци ...Cvetana Krstev, Ranka Stanković, Aleksandra Marković, Teodora Mihajlov. "Towards the semantic annotation of SR-ELEXIS corpus: Insights into Multiword Expressions and Named Entities" in Proceedings of the Joint Workshop on Multiword Expressions and Universal Dependencies (MWE-UD) @ LREC-COLING 2024, Turin, May 25, 2024, ELRA and ICCL (2024)
-
Towards Semantic Interoperability: Parallel Corpora as Linked Data Incorporating Named Entity Linking
U radu se prikazuju rezultati istraživanja vezanih za pripremu paralelnih korpusa, fokusirajući se na transformaciju u RDF grafove koristeći NLP Interchange Format (NIF) za lingvističku anotaciju. Pružamo pregled paralelnog korpusa koji je korišćen u ovom studijskom slučaju, kao i proces označavanja delova govora, lematizacije i prepoznavanja imenovanih entiteta (NER). Zatim opisujemo povezivanje imenovanih entiteta (NEL), konverziju podataka u RDF, i uključivanje NIF anotacija. Proizvedene NIF datoteke su evaluirane kroz istraživanje triplestore-a korišćenjem SPARQL upita. Na kraju, razmatra se povezivanje Linked ...paralelni korpusi, povezivanje imenovanih entiteta, prepoznavanje imenovanih entiteta, NER, NEL, povezani podaci, NIF, VikipodaciRanka Stanković, Milica Ikonić Nešić, Olja Perisic, Mihailo Škorić, Olivera Kitanović. "Towards Semantic Interoperability: Parallel Corpora as Linked Data Incorporating Named Entity Linking" in Proceedings of the 9th Workshop on Linked Data in Linguistics @ LREC-COLING 2024, Turin, 20-25 May 2024, ELRA and ICCL (2024)
-
Development and Evaluation of Three Named Entity Recognition Systems for Serbian - The Case of Personal Names
In this paper we present a rule- and lexicon-based system for the recognition of Named Entities (NE) in Serbian news paper texts that was used to prepare a gold standard annotated with personal names. It was further used to prepare training sets for four different levels of annota tion, which were further used to train two Named Entity Recognition (NER) sys tems: Stanford and spaCy. All obtained models, together with a rule- and lexicon based system were evaluated on ...Branislava Šandrih, Cvetana Krstev, Ranka Stanković. "Development and Evaluation of Three Named Entity Recognition Systems for Serbian - The Case of Personal Names" in Proceedings - Natural Language Processing in a Deep Learning World, Incoma Ltd., Shoumen, Bulgaria (2019). https://doi.org/10.26615/978-954-452-056-4_122
-
Развој геолошког информационог система Републике Србије
Геолошки информациони систем Србије (ГеолИСС) је пројектован, првенствено, са намером ефикасног дигиталног архивирања геолошких и њима сродних података. У овом раду је приказана структура базе података као основа за развој геолошки конципираног ГИС-а. Нови, објектно орјентисани (О-О) начин моделирања омогућио је дефинисање самосталних типова објеката, хијерархијски повезаних кроз тополошке и друге релације, чиме је обезбеђена њихова медјусобна интеракција. Објектно оријентисано моделирање извршено је коришћењем унифицираног језика моделирања (UML) и CASE алата, кроз концептуални и логички ниво. Физички модел ће ...... временским интервалима. Појаве и лежишта минералних сировина су моделиране као скуп тзв. Економско-геолошких карактеристика одређених ентитета одн. група ентитета дефинисаних кроз Koncept. Оне обезбеђују услове за дефинисање врсте одн. генетског типа лежишта, његове потенцијалности, тренутног статуса ...
... од тога у ГеолИСС-у је већ у првом кораку непосредно инволвирана методолошка зависност Концепта и Опсервација (Сл. 1). cd Realni geološki entiteti Geolog istraziv ac Geol. fenomen. Koncept Opserv acije Teorija - Metodologija +klasifikovanje +Saznavanje +kategorija Kategorizacija ...
... Brodaric, 2003). Обе класе деле Opis опсервираног и дедукованог – интерпретираног, којим се текстуално и нумерички описују својства просторних ентитета (сл. 2). cd Koncept Opservacije Opis GeolISS ProstorniEntitetiGeoloskiRecnik Katalog 0..1 * * * * * 10..*0..1 + validacija ...Бранислав Благојевић, Бранислав Тривић, Ненад Бањац, Ранка Станковић, Велизар Николић. "Развој геолошког информационог система Републике Србије" in 14. конгрес геолога Србије и Црне Горе са међународним учешћем, Нови Сад, 18-20. октобар 2005, Cpпско геолошко друштво и Caвeз геолошких друштава Србије и Црне Горе (2005)
-
Побољшање ефикасности одлучивања у рударству применом линеарних оптимизационих модела
Трајче Бошевски (2021)Одлучивање и управљање у рударству је захтеван и сложен задатак изложен ризицима. Конвенционални-искуствени приступи доношења одлука, у пракси често показују слабост која се огледа у недовољној поузданости и прецизности. Предмет истраживања докторске дисертације, под називом „Побољшање ефикасности одлучивања у рударству применом линеарних оптимизационих модела“ је да, сагледавањем научних метода линеарног програмирања, приступи формирању локацијских модела који би били засновани на анализи и прилагођавању постојећих и увођењу нових претпоставки за случајеве као што је експлоатација и потрошња кречњака. У дисертацији ...Трајче Бошевски. Побољшање ефикасности одлучивања у рударству применом линеарних оптимизационих модела, [Т. Бошевски], 2021
-
Ontološki model upravljanja rizikom u rudarstvu
Olivera Kitanović (2021)Rudarska proizvodnja obuhvata kompleksne tehnološke sisteme, što nameće potrebu za uspostavljanjem i unapređivanjem sistema upravljanja rizikom. Heterogenost i obim podataka neophodnih za upravljanje rizikom zahtevaju sistem koji ih na fleksibilan način integriše i omogućava njihovo optimalno korišćenje. Osnovni cilj ove disertacije je razvoj ontologije za domen rudarstva i na njoj zasnovanog modela za upravljanje rizikom. Njegova realizacija podrazumeva i implementaciju algoritama ekstrakcije informacija za popunjavanje ontologije, kao i odgovarajuće softversko rešenje. Razvoj modela obuhvata i značajno proširenje rudarskog korpusa, kao ...rudarstvo, rizik, upravljanje rizikom, procena rizika, ontologija, semantička mreža, ekstrakcija informacija, upravljanje znanjem, računarska lingvistika... kroz postavljanje upita konstrukcijom automata sa složenijim zahtevima. Ekstrakcija domenske terminologije, mernih jedinica, za ekstrakciju imenovanih entiteta (naziva ustanova, ličnih imena, ulica...), za uspostavljanje relacija među rečima je uspešno rađena u brojnim istraživanjima (Krstev et al. ...
... rudarskih entiteta iz teksta .................................................................................................. 77 4.3.1. Entiteti rudarske opreme ...................................................................................................................... 77 4.3.2. Entiteti rudarskih ...
... 77 4.3. Ekstrakcija rudarskih entiteta iz teksta Ekstrakcija svih entiteta vrši se kroz okruženje Unitex uz pomoć prethodno pripremljenih rečnika srpskog jezika (Krstev 2008; Obradović et al. 2017; Tomašević et al. 2018). Za različite vrste i podvrste entiteta pripremljeni su različiti konačni automati ...Olivera Kitanović. Ontološki model upravljanja rizikom u rudarstvu, Beograd : [O. Kitanović], 2021
-
Увођење доменских и семантичких маркера за област рударства у српске електронске речнике
... техничког домена, конкретно рударства. За српски језик је развијен систем за препознавање именованих ентитета (Крстев и др., 2013), заснован на правилима, који ус- пешно препознаје различите типове именованих ентитета: имена особа, на- зиве локација и организација, временске и нумеричке изразе. За текстове ...
... глагола из кулинарског до- мена за српски језик дат је у (Крстев/Лазић, 2015). Један други пример употре- бе маркера јесте систем за екстракцију именованих ентитета НЕР осета (нази- ва установа, личних имена, улица...) (Крстев и др., 2016) (Крстев и др., 2014). Употребе маркера могућа је за потребе обраде ...
... времен- ски изрази. За различите области, односно домене је потребно допунити електронс- ке речнике специфичном лексиком и дефинисати нове типове ентитета. Како семантички маркери, интегрисани у графове, обезбеђују постављање комп- лексних упита за екстракцију конкорданци, то је за специфичне, доменски ...Иван Обрадовић, Александра Томашевић, Ранка Станковић, Биљана Лазић. "Увођење доменских и семантичких маркера за област рударства у српске електронске речнике" in Научни састанак слависта у Вукове дане - Српски језик и његови ресурси: теорија, опис и примене, Београд : Међународни славистички центар на Филолошком факултету, Филолошки факултет (2017). https://doi.org/10.18485/msc.2017.46.3.ch10
-
The Many Faces of SrpKor
Акроним СрпКор означава фамилију електронских корпуса савременог српског језика чија је изградња почела крајем седамдесетих година прошлога века, а која је постала шире видљива заинтересованој истраживачкој заједници објављивањем његове прве верзије на вебу 2002. године. У овом дугом периоду, посебно пре појаве корисних текстуелних ресурса на вебу, развој корпуса се састојао у прикупљању и обради грађе као и у развоју метода обраде корпуса. Наиме, електронски корпус није само колекција текстова у дигиталном облику (како се то, на пример, наводи ...Duško Vitas, Ranka Stanković, Cvetana Krstev. "The Many Faces of SrpKor" in South Slavic Languages in the Digital Environment JuDig Book of Abstracts, University of Belgrade - Faculty of Philology, Serbia, November 21-23, 2024, University of Belgrade - Faculty of Philology (2024.)
-
Развој геолошког терминолошког речника ГеолИССТерм
... the class Entitet (Entity) comprises instances of all spatial and classes of attributes and also their subclasses, namely sub- types. Among the metadata provided by the rela- tionship class SvojstvoEntiteta (EntityProperty) is the domain (Figure4). The instances of the class Entitet (Entity) are ...
... -NazivAtributaPK -Vrednost -VrednostStart -PreuzetPKOdEntiteta -TipEntiteta -Implementacija -NadInstancaID -RedniBroj -NazivAtributaSubtip Entitet -EntitetID -SvojstvoID -RedniBroj -Dozvoljen_NULL -Implementacija -Kardinalnost -TipRelacijeMetazapisa -PodrazumevanaVrednost -Domen Svoj ...Ranka Stanković, Branislav Trivić, Olivera Kitanović, Branislav Blagojević, Velizar Nikolić. "Развој геолошког терминолошког речника ГеолИССТерм" in INFOteka: časopis za informatiku i bibliotekarstvo, Beograd : Zajednica biblioteka univerziteta u Srbiji (2011)
-
SrpELTeC: A Serbian Literary Corpus for Distant Reading
U članku je predstavljen SrpELTeC, korpus razvijen u okviru akcije COST Distant Reading for European Literary History (CA16204). Svi romani u SrpELTeC-u su odabrani, pripremljeni i obeleženi korišćenjem zajedničkih principa uspostavljenih za sve jezičke zbirke u Evropskoj zbirci književnog teksta (ELTeC). Navedeni su izazovi i rešenja u pripremi SrpELTeC od nule. Svi romani su ručno kodirani u TEI sa bogatim metapodacima i strukturnim napomenama. Automatska anotacija je uključivala POS-označavanje, lematizaciju i imenovane entitete, oslanjajući se na resurse za obradu ...digital humanities, Serbian literature, text corpora, distant reading , linked data, named entity recognition, text analyticsRanka Stanković, Cvetana Krstev, Duško Vitas. "SrpELTeC: A Serbian Literary Corpus for Distant Reading" in Primerjalna književnost, Research Centre of the Slovenian Academy of Sciences and Arts (2024). https://doi.org/10.3986/pkn.v47.i2.03
-
Knowledge Graphs in the Era of Large Language Models: Opportunities and Challenges
Pojava velikih jezičkih modela (eng. Large Language Models ili LLMs) je značajno uticala na oblast veštačke inteligencije, naročito u oblastima obrade prirodnog jezika i generisanju teksta. Međutim, ključno ograničenje ovih modela leži u nedostatku strukturiranog znanja i sposobnosti zaključivanja, što otežava njihovu primenu u stvarnom svetu, gde se zahteva tačnost iznetih činjenica i zaključivanje na osnovu konteksta. S druge strane, grafovi znanja nude primamljivo rešenje. Oni pružaju bogat izvor strukturiranog znanja, tako što predstavljaju entitete i njihove relacije u ...grafovi znanja, veliki jezički modeli, obrada prirodnog jezika, strukturirano znanje, kvalitet podataka, objašnjiva veštačka inteligencija, bezbednost sadržaja na internetuDanka Jokić, Ranka Stanković, Jelena Jaćimović. "Knowledge Graphs in the Era of Large Language Models: Opportunities and Challenges" in South Slavic Languages in the Digital Environment JuDig Book of Abstracts, University of Belgrade - Faculty of Philology, Serbia, November 21-23, 2024., University of Belgrade - Faculty of Philology (2024)
-
Serbian NER&Beyond: The Archaic and the Modern Intertwinned
U ovom radu predstavljamo srpski književni korpus koji se razvija pod okriljem COST Akcije „Distant Reading for European Literary History” CA16204. Koristeći ovaj korpus romana napisanih pre više od jednog veka, razvili smo i učinili javno dostupnim Sistem za prepoznavanje imenovanih entiteta (NER) obučen da prepozna 7 različitih tipova imenovanih entiteta, sa konvolucionom neuronskom mrežom (CNN), koja ima F1 rezultat od ≈91% na test skupu podataka. Ovaj model je dalje ocenjen na posebnom skupu podataka za evaluaciju. Završavamo poređenje ...Branislava Šandrih Todorović, Cvetana Krstev, Ranka Stanković, Milica Ikonić Nešić. "Serbian NER&Beyond: The Archaic and the Modern Intertwinned" in Proceedings of the Conference Recent Advances in Natural Language Processing - Deep Learning for Natural Language Processing Methods and Applications, INCOMA Ltd. Shoumen, BULGARIA (2021). https://doi.org/10.26615/978-954-452-072-4_141
-
Geotermalne karakteristike područja Semberije , Republika Srpska
Igor Glavaš (2024)Cilj završnog rada predstavlja, opis geotermalnih karakteristika područja Semberije, Republika Srpska, BiH.Rad se sastoji od opšteg dijela u kojem se navode osnovne karakteristike područja (geomorfološke, geografske, hidrološke,hidrometeorološke, geološke, tektonske i hidrogeološke) i specijalnog dijela koji detaljnije ulazi u tematiku osobina geotermalne energije i njihovih karakteristika u zadatom području kao i definisanje geotermalnog potencijala koje to područje ima.Sa prognoznim litološkim profilima 6 dubokih istražnih bušotina su izrađena 2 regionalna geološka, a njegovom konverzijom i hidrogeološka profila na osnovu kojih je, stečena ...... u sjevernom obodnom dijelu Balkanskog poluostrva u okviru države Bosne i Hercegovine u njenom krajnjem sjeveroistočnom dijelu, u potpunosti u entitetu Republike Srpske. Smještena je između rijeka Drine (istočna granica) i Save (sjeverna granica) dok o tačnoj granici na zapadu i jugu postoji više ...
... znatne gustine nastanjenosti od 146.7 stanovnika/km?) što grad Bijeljinu čini drugim najvećim gradom u Republici Srpskoj, odmah iza glavnog grada entiteta Banja Luke. Semberiju je naselio i jedan broj izbjeglih sa prostora bivše Jugoslavije, odnosno Hercegovine, Banije, Like, Korduna, Slavonije, ...
... Slika 4.10. Prognozni litološki profil buhnara NB-1 5. ZAKLjUČAK Semberija jeste ravničarska oblast krajnjeg SI dijela Bosne ı Hercegovine, entiteta Republike Srpske. Površina proračunata iz prelomnih tačaka sa priloga Završnog rada jeste 514 km?. Obuhvata grad Bijeljinu (u potpunosti), opštine ...Igor Glavaš. Geotermalne karakteristike područja Semberije , Republika Srpska, 2024
-
Ostvarivanje dobiti pri uvođenju sistema agregatnih zamena na osnovnoj rudarskoj mehanizaciji površinskih kopova EPS
Jedan od osnovnih zadataka na površinskim kopovima uglja je ostvarivanje zadovoljavajućeg vremenskog i kapacitetnog iskorišćenja kontinualnih sistema. Da bi se to postiglo, neophodno je izvršiti izmene u postojećoj strategiji održavanja. Preduslov je uvođenje agregatne zamene vitalnih delova na rudarskim mašinama. Benefiti su višestruki. Očekivani rezultati ovakvog pristupa su: smanjenje zastoja i povećanje vremena rada; direktne materijalne uštede; bolja organizacija rada; racionalizaciju radioničkih i magacinskih kapaciteta; povećanje vrednosti mašina. Da bi se uvela agregatna zamena neophodne su investicije za nabavku ...Predrag Jovančić, Ignjatović Dragan, Đenadić Stevan. "Ostvarivanje dobiti pri uvođenju sistema agregatnih zamena na osnovnoj rudarskoj mehanizaciji površinskih kopova EPS" in X Međunarodna konferencija UGALJ, Zlatibor, Srbija, 13-16. Oktobar 2021., Jugoslovenski komitet za površinsku eksploataciju (2021)
-
Named Entity Recognition for Distant Reading in ELTeC
Francesca Frontini, Carmen Brando, Joanna Byszuk, Ioana Galleron, Diana Santos, Ranka Stanković (2020)Akcija COST „Udaljeno čitanje za evropsku književnu istoriju“, koja je počela 2017. godine, ima među svojim glavnim ciljevima stvaranje višejezične zbirke evropskih književnih tekstova (ELTeC) otvorenog koda. U ovom radu predstavljamo rad koji je obavljen na ručnom označavanju selekcije ELTeC kolekcije za imenovane entitete, kao i na proceni postojećih alata za prepoznavanje imenovanih entiteta u pogledu njihove sposobnosti da automatski urade takve anotacije. U poslednjem paragrafu se razmatraju zajedničke tačke između ove inicijative i CLARIN-a.Francesca Frontini, Carmen Brando, Joanna Byszuk, Ioana Galleron, Diana Santos, Ranka Stanković. "Named Entity Recognition for Distant Reading in ELTeC" in CLARIN Annual Conference 2020, Oct 2020, Virtual Event, France, CLARIN (2020)
-
Методологија интегралне анализе сценарија енергетског развоја
Александар Маџаревић (2019)енергетска безбедност, сценарио развоја, фази логика, сигурност снабдевања, доступност, расположивост, природни гас... енергетског развоја и то кроз стратешко планирање. Стратешким планирањем се утврђује природа и карактер посматраног енергетског сектора, енергетског ентитета или енергетског система. На основу тога се врши управљање развојем енергетског система у будућности, кроз одређивање циљева и стратегија, уз дефинисање ...
... која одражава колико различитих типова постоји у скупу података (заједница), а истовремено узима у обзир колико се равномерно дистрибуирају основни ентитети међу тим типовима (Rosenzweig, M. L., 1995). АЛЕКСАНДАР МАЏАРЕВИЋ 21 ЕНЕРГЕТСКА БЕЗБЕДНОСТ Индекс енергетске архитектуре (EAPI) ...
... компанија или инвеститора, као и приуштивост енергије са аспекта крајњих потрошача. Правац друштвене примењивости је дефинисан кроз однос свих релевантних ентитета који су укључени у процес реализације активности везаних за применљивост одређеног сценарија. Директно је повезан са националним структурама (институције ...Александар Маџаревић. Методологија интегралне анализе сценарија енергетског развоја, Рударско-геолошки факултет, 2019
-
Глаголи у кухињи и за столом
Цветана Крстев, Биљана Лазић (2015)У раду је приказано истраживање лексике на српском језику кулинарског домена које се заснива на коришћењу доменског корпуса, електронских лексичких ресурса, пре свега WordNet-а и морфолошких речника, и локалних граматика. Приказане су доменске специфичности ових ресурса, како се користе, и међусобно употпуњују. Посебно је приказано како се коришћењем доменског корпуса могу екстраховати глаголи специфични за кулинарски домен и описати начини њиховог коришћења. Дат је попис глагола са основним подацима који је добијен применом представљених метода.аутоматска обрада, коначни трансдуктори, електронски речници, семантичке мреже, локалне граматике, кулинарство... савремене информатичке технологије, пре свега, језички ресурси и онтологије. Онтологија у информатичком смислу представља именовање и дефинисање типова ентитета који постоје у одређеном домену, њихових особина и веза између њих. У свом пионирском раду (Ној и Макгинис 2001) о принципима развоја информатичких ...Цветана Крстев, Биљана Лазић. "Глаголи у кухињи и за столом" in Научни састанак слависта у Вукове дане - Српски језик и његови ресурси: теорија, опис и преимене, Вол. 44/3, Београд : Међународни славистички центар (2015)