Претрага
3199 items
-
Digital Library From A Domain Of Criminalistics As A Foundation For A Forensic Text Analysis
U ovom radu predstavljen je model koji omogućava prikupljanje, pripremu, opis metapodataka, upravljanje i eksploataciju, uključujući pretragu punog teksta dokumenata iz domena kriminalistike napisanih na srpskom jeziku. Predloženi pristup primenjuje se na veb portalu koji sakuplja različite tekstove nastale iz časopisa Akademije za kriminalistiku i policijske studije, Krivičnog zakona Srbije, konferencija „Tara“ i „Reiss“, kao i iz nekih doktorskih disertacija vezanih za ovu oblast istraživanje. Nakon obrade teksta, korpus koji sadrži preko 5500 stranica običnog teksta, kreiran je i ...... V. Karkaletsis, pp. 97-104, 2003 uc Use Case Preaživ anje korpusa Leksikograf Terminolog Pretraga po lemi Pretraga oblika reči Pretraga po sinonimima Pretraga po semantičkim obrascima Pretraga sintaksičkim grafov ima Lingv ista Urednik korpusa Terminolog Prikupljanje tekstov a ...
... 92 Дигитални репозиторијум Рударско-геолошког факултета Универзитета у Београду омогућава приступ издањима Факултета и радовима запослених доступним у слободном приступу. - Претрага репозиторијума доступна је на www.dr.rgf.bg.ac.rs The Digital repository of The University of Belgrade Faculty of Mining ...
... Korekcija prelamljenih reči Korekcija grešaka optičkog prepoznav anja Opremanje tekstov a metapodacima Analiza nepoznatih reči Dopuna morfoloških rečnika Urednik leksičke baze Dopuna terminoloških baza «extend» «extend» «extend» Figure 3. Linguistic resources applications ...Dalibor Vorkapić, Aleksandra Tomašević, Miljana Mladenović, Ranka Stanković, Nikola Vulović. "Digital Library From A Domain Of Criminalistics As A Foundation For A Forensic Text Analysis" in International Scientific Conference “Archibald Reiss Days” Thematic Conference Proceedings Of International Significance, Belgrade, 7-9 November 2017, Academy Of Criminalistic And Police Studies Belgrade (2017)
-
Претрага корпуса заснована на употреби екстерних лексичких ресурса путем веб-сервиса
У раду се разматра хибридни приступ претрази корпуса, илустрован на примеру алатки OCWB и NoSketch Engine, примењених на специјални корпус из области рударства (РудКор) и Корпус савременог српског језика (СрпКор). Разматрани приступ комбинује постојеће могућности алатки OCWB и NoSketch Engine, које своју претрагу заснивају на лингвистичкој анотацији корпуса, са новим могућностима претраге у виду консултовања екстерних језичких ресурса (морфолошки електронски речници српског језика и лексичка база података Српски ворднет). Хибридни приступ је реализован надоградњом вебсучеља која поменуте алатке користе ...... хибридног приступа претраге корпуса и илуструје могућности претраживања коришћењем семантичких проширења. Напослетку, одељак 5 наводи преглед закључака и смернице будућег развоја. Претрага заснована на лингвистичкој анотацији корпуса Алатке OCWB и NoSketch Engine подржавају изградњу и претрагу кор- пуса ...
... захтев за семантичким проширењем упита, веб-сучеље алатке за претрагу корпуса директно про- слеђује упит процесору упита и прелази се на корак (СП8); (СП3) ако је корисник задао захтев за семантичким проширењем упи- та, веб-сучеље анализира упит и прослеђује веб-сервису, поред задате леме X и осталих ...
... ји: • СМР, систем морфолошких електронских речника српског језика (Крстев 2008), • семантичка мрежа Српски ворднет10 (Крстев и др. 2004), • терминолошке базе Терми11, • онтологија из области рударства РудОнто12, • Геолошки речник ГеолИСС13, • Речник библиотекарста и информатике14. Вебр ...Милош Утвић, Ранка Станковић, Александра Томашевић, Михаило Шкорић, Биљана Лазић. "Претрага корпуса заснована на употреби екстерних лексичких ресурса путем веб-сервиса" in Научни састанак слависта у Вукове дане - Vol. 48/3 Српски језик и његови ресурси, Међународни славистички центар, Филолошки факултет, Универзитет у Београду (2019). https://doi.org/10.18485/msc.2019.48.3.ch12
-
Integracija heterogenih tekstualnih resursa
Ranka Stanković, Ivan Obradović (2007)U radu je opisan pristup integraciji heterogenih tekstualnih resursa za srpski jezik uz pomoć jednog kompleksnog softverskog alata, razvijenog specijalno za ove potrebe. Opisani su struktura i osnovne komponente razvijenog sistema. Iznete su i mogućnosti unapređivanja resursa međusobnom razmenom informacija, koje pruža razvijeno integrisano okruženje. Konačno, opisana je i mogućnost primene integrisanih heterogenih resursa za proširenje upita, kao i pretraživanje tekstova uopšte, a naznačeni su i neki od pravaca daljeg razvoja.... konceptima uz morfološko proširenje; pretraživanje po konceptima, prošireno na drugi jezik i s m tekstu ilustrovaćemo neke tipove proširenja upita. Morfološko pro anje upita sa različitim mogućnostima proširenja: morfološkim, semantičkim i dvojezičnim, sa dva primera proširenja. Kako tekst koji se ...
... razvijeni softver daje i mogućnosti kombinovanja resursa, i to na način koji otvara nove mogućnosti za obradu tekstova. U četvrtom odeljku biće opisano kako se pomoću ovog softvera mogu kombinovati morfološke informacije iz SMR i semantičke informacije iz SWN; u petom i šestom biće date nove mogućnosti ...
... upita na paralelizovanom tekstu ezultat primene proširenih upita, sa svim pomenutim opcijama proširenja, može se lepo prikazati na paralelizovanom tekstu u TMX formatu. Na osnovu proširenja upita, koje može biti morfološko, semantičko i višejezično, iz paralelizovanog teksta se izdvajaju segmenti ...Ranka Stanković, Ivan Obradović. "Integracija heterogenih tekstualnih resursa" in Zbornik radova međunarodnog simpozijuma Razlike između bosanskog/bošnjačkog, hrvatskog i srpskog jezika, Graz, Austria, April 2007, - (2007)
-
Увођење доменских и семантичких маркера за област рударства у српске електронске речнике
... кратак опис корпуса рударских текстова. 2. Значај лексичких маркера за проналажење и екстракцију информација Семантички и деривациони маркери носиоци су информација од изузет- ног значаја за проналажење и екстракцију информација из текстуелих ресур- са. Семантички маркери наведени у српским е-речницима ...
... информација из текстова рударског домена. Како би свака од рударских активности била ближе описана и како би се омогућила прецизније екстракције информација из текстова рударског домена, дефини- сани су нови доменски, поддоменски и семантички маркери. У табели 1 при- казани су постојећи и новопредложени ...
... установа, личних имена, улица...) (Крстев и др., 2016) (Крстев и др., 2014). Употребе маркера могућа је за потребе обраде текста ради екстракције домен- ске терминологије, мерних јединица, прављење релација међу речима, итд. 3. Доменски, поддоменски и семантички маркери за област рударства Рударство ...Иван Обрадовић, Александра Томашевић, Ранка Станковић, Биљана Лазић. "Увођење доменских и семантичких маркера за област рударства у српске електронске речнике" in Научни састанак слависта у Вукове дане - Српски језик и његови ресурси: теорија, опис и примене, Београд : Међународни славистички центар на Филолошком факултету, Филолошки факултет (2017). https://doi.org/10.18485/msc.2017.46.3.ch10
-
Proširivanje upita zasnovano na leksičkim resursima
U radu je opisano kako se leksički resursi za srpski jezik i softverski alati, razvijeni u okviru Grupe za jezičke tehnologije Univerziteta u Beogradu, mogu koristiti za unapređenje postavljanja upita. Rezultati pretrage mogu biti značajno unapređeni korišćenjem različitih leksičkih resursa, kakvi su morfološki rečnici i semantičke mreže. Izloženi pristup može se iskoristiti i u Sistemu naučnih, tehnoloških i poslovnih informacija, jer je efikasno pretraživanje ovog dragocenog resursa, imajući u vidu njegovu heterogenost i obim, kao i preovladavajući tekstualni sadržaj, ...... srpski jezik i softverski alati, razvijeni u okviru Grupe za jezičke tehnologije Univerziteta u Beogradu, mogu koristiti za unapređenje postavljanja upita. Rezultati pretrage mogu biti značajno unapređeni korišćenjem različitih leksičkih resursa, kakvi su morfološki rečnici i semantičke mreže. Izloženi ...
... pretraživanje tekstova je moguće po sledećim kriterijumima: jednostavno sravnjivanje niski karaktera, lema sa svim svojim flektivnim oblicima, tj. morfološko proširenje zadate leme, koncept, gde se na osnovu zadate leme bira u semantičkom resursu odgovarajući koncept i literali pomoću ...
... preciznost i time narušiti ravnotežu između odziva i preciznosti. Raznovrsne mogućnosti za podešavanje upita koje omogućava WS4QE rezultat su, kao i u slučaju WS4LR, integracije više raspoloživih resursa. WS4QE, kao i WS4LR, daje korisniku mogućnost da upit proširi morfološki, semantički ali ...Ranka Stanković, Ivan Obradović, Cvetana Krstev. "Proširivanje upita zasnovano na leksičkim resursima" in SNTPI 09 - Naučno-stručni skup Sistem naučnih, tehnoloških i poslovnih informacija, Beograd 19. i 20. jun 2009, Beograd : Fakultet informacionih tehnologija (2009)
-
Употреба веб платформе Омека за дигиталне библиотеке из домена рударства
У овом раду биће представљена Омека, веб платформа за приказивање дигиталних колекциjа и систем за управљање њиховим садржаjем. Њену примену у области техничких наука, а конкретно у области рударства, приказаћемо на примеру дигиталне библиотеке ROmeka@RGF. За Омеку смо се определили првенствено због чињенице да jе jедноставна за коришћење, има обимну пратећу документациjу и не захтева уско специфичне информатичке вештине што jе чини приступачном за већину корисника, а нарочито за рударске инжењере, коjима jе ова дигитална библиотека првенствено намењена. Документа ...... проказане предности и мане Омеке као платформе за развоj овог типа библиотеке. Уз то, показано jе колико примена морфолошких речника утиче на квалитет претраге приликом морфолошког и семантичког проширења упита. Закључак jе да комбинациjа Омеке и морфолошких речника доприноси бољоj организациjи и претраживости ...
... Stanković et al., 2016): – за морфолошко проширење упита: http://hlt.rgf.bg.ac.rs/vebran/api/delafs/ključna_reč – за семантичко и морфолошко проширење упита: http://hlt.rgf.bg.ac.rs/vebran/api/sinonimi/ključna_reč Претраживање без и са морфолошким и семантичко-морфолошким проширењима упита биће приказан ...
... ама, хомогенизациjе, хомогенизациjи, хомогенизациjо, хомогенизациjом, хомогенизациjу. Упитом са семантичким и морфолошким проширењем, у претраживање су укључени и синоними и лексичке метонимиjе, као и њихови флективни облици: homogenizacija, homogenizacijama, homogenizacije, homogenizaciji, homo ...Александра Томашевић, Биљана Лазић, Далибор Воркапић, Михаило Шкорић, Љиљана Колоња. "Употреба веб платформе Омека за дигиталне библиотеке из домена рударства" in Инфотека, Филолошки факултет, Универзитет у Београду; Универзитетска библиотека „Светозар Марковић“; Заједница библиотека универзитета у Србији (2017)
-
Integrisanje heterogenih leksičkih resursa
Osnovna aktivnost Grupe za obradu prirodnih jezika na Matematičkom fakulteta Univeziteta u Beogradu je usmerena na razvoj različitih resursa za obradu srpskog jezika. Među njima su posebno značajni sistem morfoloških rečnika srpskog jezika razvijenih u okviru mreže RELEX [1] i semantička mreža (tipa wordnet) za srpski jezik razvijena u okviru međunarodnog projekta Balkanet. Radi se o dva heterogena leksička resursa, razvijena na osnovu sasvim različitih modela, koji samim tim sadrže i različite vrste leksičkih informacija. Integracijom ovih resursa, informacije ...... sistem morfoloških rečnika srpskog jezika razvijenih u okviru mreže RELEX [1] i semantička mreža (tipa wordnet) za srpski jezik razvijena u okviru međunarodnog projekta Balkanet. Radi se o dva heterogena leksička resursa, razvijena na osnovu sasvim različitih modela, koji samim tim sadrže i različite ...
... iz morfološkog rečnika (MR) srpskog jezika u sinsetove SWN poboljšava se efikasnost korišćenja SWN u pretraživanjima. U velikom broju slučajeva ove dodatne informacije mogu da se koriste za uklanjanje dvoznačnosti, odnosno rešavanje problema homonimije. Morfološke, sintaktičke i semantičke informacije ...
... lemama u MR. Neke osnovne semantičke informacije su već pridružene lemama, kao što su +Hum (ljudski) i +Bot (botanički) za imenice, i +Col (boja) i +Mat (materijal) za prideve. Korišćenje wordneta omogućava sistematičnije i detaljnije pridruživanje oznaka za semantičkih informacija. Uz to, ove oznake ...Ranka Stanković, Cvetana Krstev, Duško Vitas, Ivan Obradović, Gordana Pavlović-Lažetić. "Integrisanje heterogenih leksičkih resursa" in Festivalski katalog 11. Festivala informatičkih dostignuća INFOFEST 2004, 26th September - 2nd October, 2004, Budva, Montenegro, INFOFEST (2004)
-
Ontološki model upravljanja rizikom u rudarstvu
Olivera Kitanović (2021)Rudarska proizvodnja obuhvata kompleksne tehnološke sisteme, što nameće potrebu za uspostavljanjem i unapređivanjem sistema upravljanja rizikom. Heterogenost i obim podataka neophodnih za upravljanje rizikom zahtevaju sistem koji ih na fleksibilan način integriše i omogućava njihovo optimalno korišćenje. Osnovni cilj ove disertacije je razvoj ontologije za domen rudarstva i na njoj zasnovanog modela za upravljanje rizikom. Njegova realizacija podrazumeva i implementaciju algoritama ekstrakcije informacija za popunjavanje ontologije, kao i odgovarajuće softversko rešenje. Razvoj modela obuhvata i značajno proširenje rudarskog korpusa, kao ...rudarstvo, rizik, upravljanje rizikom, procena rizika, ontologija, semantička mreža, ekstrakcija informacija, upravljanje znanjem, računarska lingvistika... kao i druge probleme nastale optičkim prepoznavanjem teksta (Krstev, Stanković, and Vitas 2018). Podsistem za održavanje morfoloških rečnika je omogućio pretraživanje i izdvajanje lema na osnovu poređenja sa zadatom niskom karaktera, vrstom reči, kodom flektivne klase, sintaksnim i semantičkim oznakama ...
... strukturu: nadređene i podređene sinsetove selektovanog sinseta. 48 Slika 3-7 Panel alata Leximir sa sinsetima srpskog i engleskog WordNeta Podsistem za interakciju sistema elektronskih rečnika i semantičke mreže Wordnet omogućava razmenu informacija između wordnet-a i morfoloških rečnika – morf ...
... fraza od interesa. Zahvaljujući semantičkim markerima (Obradović et.al, 2017) je moguće izdvojiti koncepte karakteristične za pojedine semantičke grupe reči. U nastavku teksta navodimo reči koje su izdvojene iz korpusa rizika i rudarstva. Plitkim parsiranjem teksta i ekstrakcijom terminologije zasnovanom ...Olivera Kitanović. Ontološki model upravljanja rizikom u rudarstvu, Beograd : [O. Kitanović], 2021
-
Речник САНУ као база терминолошких речника (на примеру речника кулинарства)
... корпусу и у општем корпусу. Коришћењем електронских речника у креираном кулинарском корпусу препознате су семантичке категорије карактеристичне за лексику кулинарских текстова (Крстев, Лазић, 2015): Табела: Примери из корпуса који су препознати семантичким маркерима за текстове кулинарског ...
... догрејати, дресинг. Екстракција термина из текста За решавање проблема екстракције и лематизације вишечланих термина из текста, одабран је приступ заснован на правилима која се ослањају на систем језичких ресурса, као што су морфолошки и електронски речници, и граматике развијене у оквиру Групе за језичке ...
... терминолошко и опште значење. применимо семантичке маркере који ће омогућити обележавање и проналажење ових речи, и у процесу дигитализације Речника видљиво обележити ову лексику да постане лако претражива, и на тај начин допринети да Речник буде редовно допуњаван новом грађом и на тај начин стално ...Рада Стијовић, Олга Сабо, Ранка Станковић. "Речник САНУ као база терминолошких речника (на примеру речника кулинарства)" in Словенска терминологија данас, Београд : Српска академија наука и уметности (2017)
-
Contrastive Analysis of Syntax Patterns in Comparable Football Corpora in Spanish and Serbian Languages
Jelena Lazarević, Olivera Kitanović (2024.)Cilj rada je istraživanje kolokabilnosti kao načina na koji se leksičke jedinice povezuju sa rečima iz različitih kategorija, formirajući veće jedinice. Istraživanje semantičkih i sintaksičkih principa ovih kombinacija u španskom i srpskom jeziku fudbala izvedeno je na komparabilnim fudbalskim korpusima SrFudKo i EsFudko, razvijenim u okviru doktorske disertacije Jelene Lazarević pod nazivom: Jezičke odlike diskursa novih medija o fudbalu: kontrastivna analiza na korpusu srpskog i španskog jezika. Korpus fudbala SrFudKo, kreiran na osnovu tekstova o fudbalu sa pet srpskih veb-portala: ...Jelena Lazarević, Olivera Kitanović . "Contrastive Analysis of Syntax Patterns in Comparable Football Corpora in Spanish and Serbian Languages" in South Slavic Languages in the Digital Environment JuDig Book of Abstracts, University of Belgrade - Faculty of Philology, Serbia, November 21-23, 2024, University of Belgrade - Faculty of Philology (2024.)
-
Чији је пример? Анализа лексичких обележја на примерима Речника САНУ
У овом раду поставља се питање: да ли се може утврдити ко је аутор неког текста уколико се анализирају искључиво његова лексичка обележја? Како бисмо покушали да добијемо одговор на ово питање, посматрали смо примере у оквиру речничког чланка појединачне лексеме Речника САНУ, који су забележени у пет томова (и то: I, II, XVIII, XIX и XX). Сваки пример је преузет из неког извора на шта упућују скраћенице, наведене у заградама. Од преко 5.000 понуђених извора, определили смо се ...... обухваћени су и други томови, што је омогућило и анализу коју приказујемо у овом раду. До сада је кориговано и импортовано у базу 5 томова и то: I, II, XVIII, XIX и XX, што представља скуп података за истраживање, презентовано у овом раду. Како се и даље интензивно ради на кориговању текста осталих то- ...
... 279–292. Вуловић/Ђинђић/Радоњић 2008: Наташа Вуловић, Марија Ђинђић и Да- нијела Радоњић, „Реч више о Речнику САНУ”, књижевност и језик LV/1–2, 171–179. Гортан-Премк 1980а: Даринка Гортан-Премк, О граматичкој информацији и семантичкој идентификацији у великим описним речницима, наш је- зик, XXIV/3, ...
... дисциплина која се бави оваквим проучавањем текста назива се стиломет- рија и њен основни задатак јесте управо утвђивање ауторства. Основним критеријумом за одређивање ауторства у писаним текстовима сматра се (нечији) рукопис. У куцаним и дигитално презентованим текстови- ма примена овог критеријума уопште ...Бранислава Б. Шандрих, Ранка М. Станковић, Мирјана С. Гочанин. "Чији је пример? Анализа лексичких обележја на примерима Речника САНУ" in Српски језик и његови ресурси, Међународни славистички центар, Филолошки факултет, Универзитет у Београду (2019). https://doi.org/10.18485/msc.2019.48.3.ch13
-
Српски језик у дигиталном добу -- The Serbian Language in the Digital Age
Duško Vitas, Ljubomir Popović, Cvetana Krstev, Ivan Obradović, Gordana Pavlović-Lažetić, Mladen Stanojević (2012)... одно- сне, временске, условне и узрочне) имају више фор- малних и семантичких подтипова. Код координативних реченица посено је комплек- сан инвентар везника за копулативне и за адверза- тивне односе. Везе међу исказима у тексту се успостављају тексту- алним координаторима и текстуалним конекторима разних ...
... ‘*Они је исало и- смо.’Паипак, већинапрограма запроверуправописа 21 улазни текст припремна обрада граматичка анализа семантичка анализа модули за специфичне задатке излаз 6: Типична архитектура система за обраду текста неће пронаћи грешке у следећем тексту [35]: I have a spelling checker ...
... структуре реченице. 3. Семантичка анализа: разрешавање вишезначно- сти (тј. утврђивање одговарајућег значења речи у датом контексту); разрешавање анафора (тј. на шта се односе заменице) и референци у изразима; и представљање значења у машински читљивом олику. Након анализе текста, модули посвећени специфич- ...Duško Vitas, Ljubomir Popović, Cvetana Krstev, Ivan Obradović, Gordana Pavlović-Lažetić, Mladen Stanojević. "Српски језик у дигиталном добу -- The Serbian Language in the Digital Age" in META-NET White Paper Series, G. Rehm, H. Uszkoreit (eds.), Springer (2012)
-
Дигиталне библиотеке у рударству и геологији са посебним освртом на представљање сиве литературе
Имајући у виду потребу за проналажењем информација похрањених у различитим облицима документације која се генерише у областима рударства и геологије на Рударско-геолошком факултету Универзитета у Београду, отпочет је процес развоја дигиталне библиотеке ROmeka@RGF, на платформи за приказивање дигиталних колекција - Омека. Значајан део документације представља такозвана сива литература која је претежно заступљена у виду вишетомне документацијe. Први савладани изазов представљало је повезивање различитих вишетомних делова пројектних извештаја у једну целину која би била лако доступна и претражива.... речници за српски језик (Крстев и др. 2008, Станковић 152 BIBLIOINFO и др. 2016) за морфолошко проширење упита (http://hlt.rgf.bg.ac.rs/ vebran/api/delafs/ključna_reč) и семантичко-морфолошко проширење упита (http://hlt.rgf.bg.ac.rs/vebran/api/sinonimi/ključna_reč). 3. Сива литература Значајан део ...
... речи, булових оператора и потпуним подударањем. У претраживање су укључени: метаподаци, документи, етикете, колекције итд. Претраживање у дигиталној библиотеци ROmeka@RGF унапређено је имплементирањем проширених упита. Коришћени су веб сервиси (Станковић и др. 2012) и морфолошки електронски речници ...
... везан за екстракцију рударске терминологије, обележавање текста, екстракцију информација и др. (Томашевић и др. 2017). Окосницу дигиталне библиотека чини 51 документ (пројектни задаци, студије и пројекти) који су део “Главног рударског пројекта површинског копа “Дрмно” за капацитет од 9×106 тона угља ...Биљана Лазић, Александра Томашевић, Михаило Шкорић. "Дигиталне библиотеке у рударству и геологији са посебним освртом на представљање сиве литературе" in Научна конференција Библиоинфо — 55 година од покретања наставе библиотекарства на високошколском нивоу, Београд 18. мај 2017., Филолошки факултет Универзитета у Београду (2019). https://doi.org/10.18485/biblioinfo.2017.ch13
-
Srbija u OneGeology Europe
Геолошки завод Србије као носилац Пројекта ОneGeologyEurope заједно са Рударско геолошким факултетом и Министарством за природне ресурсе, рударство и просторно планирање су се укључили у међународни Пројекат OneGeology Europe у мају 2013. године у већ поодмаклој фази израде Пројекта. До краја 2013. године испунили су завршене активности које треба да доведу до пуноправног укључења у Пројекат чиме је Република Србија нашла своје место на Геолошкој карти Европе 1:1М. Геолошка карта Србије 1:1М представља компилациону односно поједностављену верзију ОГК 1:500 ...... урађено семантичко усаглашавање тј. обе картиране јединице преименоване су у базалт, након чега је уследило геометријско усаглашавање граница са једне и друге стране националне границе. На крају је добијена јединица која је семантички и геометријски усклађена. Слика 3: Геометријска и семантичка хармонизација ...
... облику. Хармонизација података обухвата семантичку и вишејезичну харамонизацију метаподатака, као и усклађивање геометрије и симболизације геолошких јединица. Да би се обезбедио опис националних скупова података, потребно је да метаподаци буду упоредиви и претраживи. То је постигнуто имплементацијом ...
... термина и појмова које ти термини описују, а потом је уследило усклађивање шема класификације геолошких података, симболизације, нивоа геометријске и семантичке детаљности. На слици 2 је приказан пример усклађивања преко националне границе док слика 3 илуструје геометријску и семантичку хармонизацију ...Danka Blagojević, Ranka Stanković, Petar Stejić, Velizar Nikolić. "Srbija u OneGeology Europe" in Zapisnici Srpskog geološkog društva za 2013. godinu, Beograd : Srpsko geološko društvo (2014)
-
Integrisano okruženje za pripremu paralelizovanog korpusa
Razvoj paralelizovanih korpusa zahteva pripremu paralelnih tekstova za njihovu integraciju u paralelizovani korpus. Reč je o jednom kompleksnom zadatku koji se može rešiti na različite načine, i koji mora da se odvija u nekoliko koraka. U ovom radu najpre je iznet postupak pripreme paralelnih tekstova za paralelizovani korpus koji se koristi u Grupi za jezičke tehnologije Univerziteta u Beogradu. Potom je dat kratak pregled programa (XAlign, Concordancier, WS4LR), odnosno softverskih alata koji se pri tome koriste. Nedostatak udobnog okruženja ...... dokumenata u vertikalizovan tekst. U poslednjem koraku koristi se programski paket IMS Corpus Workbench (CWB), razvijen na Univerzitetu u Štutgartu6 koji omogućava kreiranje korpusa sa morfološkom i strukturnom anotacijom, indeksiranje tekstova i njihovu efikasnu pretragu korišćenjem regularnih izraza ...
... morfološkom i strukturnom anotacijom, indeksiranje tekstova, kao i njihovu efikasnu pretragu korišćenjem regularnih izraza. Pošto svaka varijanta teksta na pojedinačnim jezicima ima isti broj jedinica prevođenja, programski paket nema problema da uspostavi odgovarajuće veze. ...
... uparenih segmenata, kao i pretraga paralelnih konkordanci pomoću regularnih izraza. Iako je uparivanje na nivou rečenice u 90% slučajeva 1:1 (jednoj rečenici teksta u jednom jeziku odgovora jedna rečenica teksta u drugom), prilikom prevođenja, kao što je već napomenuto, moguće je i drugačije uparivanje ...Ivan Obradović, Ranka Stanković, Miloš Utvić. "Integrisano okruženje za pripremu paralelizovanog korpusa" in Zbornik radova međunarodnog simpozijuma Razlike između bosanskog/bošnjačkog, hrvatskog i srpskog jezika, Graz, Austria, April 2007, - (2007)
-
Глаголи у кухињи и за столом
Цветана Крстев, Биљана Лазић (2015)У раду је приказано истраживање лексике на српском језику кулинарског домена које се заснива на коришћењу доменског корпуса, електронских лексичких ресурса, пре свега WordNet-а и морфолошких речника, и локалних граматика. Приказане су доменске специфичности ових ресурса, како се користе, и међусобно употпуњују. Посебно је приказано како се коришћењем доменског корпуса могу екстраховати глаголи специфични за кулинарски домен и описати начини њиховог коришћења. Дат је попис глагола са основним подацима који је добијен применом представљених метода.аутоматска обрада, коначни трансдуктори, електронски речници, семантичке мреже, локалне граматике, кулинарство... језика за екстраховање и моделирање куварских поступака из рецепата (Мори и др. 2012); препоручивање и модификовање рецепата засновано на изградњи мреже састојака (Тенг и др. 2012), обележавање рецепата на основу састојака, поступака и оброка подржано семантичким мрежама (Занг и др. 2008). Наравно, изградњу ...
... представити досадашње резултате: развој доменског корпуса, доменска допуна електронских речника и семантичке мреже WordNet, почетак развоја доменске онтологије, а потом и почетак рада на веома значајном али и сложеном аспекту информатичке подршке кулинарском домену – опису гладола. 5Watson је ...
... доменског корпуса и консултовањем српског ворднета прво су одабрани адекватни семантички маркери куварске лексике (дати у Табела 1) којима су потом обележене како све постојеће јединице електронског речника тако и оне нове које су добијене екстраховањем из доменског корпуса (Вујичић Станковић и др. 2014) ...Цветана Крстев, Биљана Лазић. "Глаголи у кухињи и за столом" in Научни састанак слависта у Вукове дане - Српски језик и његови ресурси: теорија, опис и преимене, Вол. 44/3, Београд : Међународни славистички центар (2015)
-
From DELA Based Dictionary to Leximirka Lexical Database
Biljana Lazić, Mihailo Škorić (2020)In this paper, we will present an approach in transforming Serbian language Morphological dictionaries from a DELA text format to a lexical database dubbed Leximirka. Considering the benefits of storing data within a database when compared to storing them in textual documents, we will outline some of the functionality that the database has made possible. We will also show how hand-made rules that use category labels lexical entries are marked with can be used to link lexical entries. ...... accessed September 1, 2015. https://halshs.archives-ouvertes.fr/ halshs-00278316/document Krstev, Cvetana. “Jedan prilaz informatičkom modeliranju teksta i algoritmi njegove transformacije”. Phdthesis, Univerzitet u Beogradu, Matematički fakultet, 1997 Krstev, Cvetana. Processing of Serbian. Automata ...
... 94 Дигитални репозиторијум Рударско-геолошког факултета Универзитета у Београду омогућава приступ издањима Факултета и радовима запослених доступним у слободном приступу. - Претрага репозиторијума доступна је на www.dr.rgf.bg.ac.rs The Digital repository of The University of Belgrade Faculty of Mining ...
... – corpora (option Corpora), 7 Ekavian dialect the reflection of the Old-Church Slavonic “Jat” is an “e”,while in Iekavian it can be “je”, “ije” or “i”. Infotheca Vol. 19, No. 2, December 2019 89 Lazić B., Škorić M., “From DELA based dictionary to . . . ”, pp. 81–98 – evaluation (option Evaluation) ...Biljana Lazić, Mihailo Škorić. "From DELA Based Dictionary to Leximirka Lexical Database" in Infotheca, Faculty of Philology, University of Belgrade (2020). https://doi.org/10.18485/infotheca.2019.19.2.4
-
Белешка о дигитализацији речника
У раду ће се анализирати ограничења која проистичу из линеарног процеса традиционалне израде речника на примеру Речника САНУ. Начин да се превазиђу ова ограничења се састоји у формирању електронске лексикографске базе која не представља само пуку дигиталну транскрипцију папирног издања речника. Посебно се указује на чињеницу да текст речника може представљати корпус и приказују се одабрани примери анализе таквог корпуса формираног из текстове 1. и 19. тома Речника САНУ.... верзије 1. и 19. тома10 са циљем да испитамо могућност аутоматске анотације сировог текста, али и да сагледамо својства језика који чини овај текст. Први том садржи око 550.000 облика речи на 690 страна штампаног текста, а 19. том око 672.000 облика речи на 800 страна. Како текст Речника ...
... поимању својстава српске лекси- ке и њених међуодноса углавном не могу узимати у обзир • како је речник првенствено намењен истраживачкој и високо струч- ној публици, други типови корисника и њихових потреба нису уг- рађени у текст речника, а друкчије потребе и друкчији погледи на грађу не могу бити ...
... да испитамо могућност аутоматске анотације сировог текста, али и да сагледамо својства језика који чини овај текст. Први том садржи око 550.000 облика речи на 690 страна штампаног текста, а 19. том око 672.000 облика речи на 800 страна. Како текст Речника, као што је раније речено, није структурирани ...Душко М. Витас, Цветана Ј. Крстев, Ранка М. Станковић. "Белешка о дигитализацији речника" in Српски језик и његови ресурси, Међународни славистички центар, Филолошки факултет, Универзитет у Београду (2019). https://doi.org/10.18485/msc.2019.48.3.ch3
-
Sistem poslovne inteligencije za upravljanje zaštitom na radu u rudarskoj industriji
Ljiljana R. Kolonja (2016-09-23)Postojeća organizacija zaštite na radu na površinskim kopovima uglja često nije umogućnosti da blagovremeno i tačno ukaže na nedostatke, koji mogu u bližoj ilidaljoj budućnosti da budu uzrok narušavanja bezbednosti radnika, ali i uzrokoštećenja materijalnih dobara rudnika. Nemogućnost donošenja pravovremenihodluka je moguće izbeći uvođenjem softverski podržanih sistema za praćenje ianalizu bezbednosti i zaštite na radu.Osnovni cilj ove doktorske disertacije je definisanje metodologije i razvoj modelasistema upravljanja zaštitom na radu, koji će omogućiti savremen, adekvatan isveobuhvatan način praćenja i analize ...... proširenjem podređenim konceptima, rezultat pretrage će uključiti i dokumenta koja sadrže i „glava“, „noga“, „ruka“ i ostale delove koji su navedeni u ontologiji. Imajući u vidu bogatu morfologiju srpskog jezika, primenjuje se i morfološko proširenje oblicima, „nogu“, „nozi“, „ruku“ ...
... terminima koji su sinonimi polaznoj ključnoj reči i/ili uključuju podređene i nadređene, odnosno uže i šire pojmove. Na primer, pretražujući tekstove u bazi znanja vezane za rotorni bager kao ključnu reč, pretragu može proširiti i rečju „glodar“ što je sinonim koji se kolokvijalno ...
... Klasični sistemi za pronalaženje informacija nemaju podršku za srpski i mogućnost semantičke i višejezične pretrage, što se može obezbediti jedino ontološkim pristupom. 2Zvanična stranica časopisa: http://rgf.rs/publikacije/Podz ...Ljiljana R. Kolonja. "Sistem poslovne inteligencije za upravljanje zaštitom na radu u rudarskoj industriji" in Универзитет у Београду, Универзитет у Београду, Рударско-геолошки факултет (2016-09-23)
-
An Approach to Development of Bilingual Lexical Resources
... Biblimir. Serbian term semantički veb does not exist in available resources. The Dictionary of Librarianship uses English orthography {semantički web}, but in the 15 obtained concordances the term appears only as semantički veb. Hence the pair {semantic web}- {semantički veb} was entered into Biblimir ...
... 62 Дигитални репозиторијум Рударско-геолошког факултета Универзитета у Београду омогућава приступ издањима Факултета и радовима запослених доступним у слободном приступу. - Претрага репозиторијума доступна је на www.dr.rgf.bg.ac.rs The Digital repository of The University of Belgrade Faculty of Mining ...
... Librarianship contains the term user friendly (without the dash) and the corresponding Serbian terms are jednostavan za upotrebu and lak za učenje i korišćenje. The analysis of concordances obtained for the query user friendly showed that its Serbian translational counterparts in the Dictionary ...Stanković Ranka, Obradović Ivan, Trtovac Aleksandra. "An Approach to Development of Bilingual Lexical Resources" in Proceedings of the Fifth Balkan Conference in Informatics BCI 2012, Workshop on Computational Linguistics and Natural Language Processing of Balkan Languages – CLoBL 2012, September 2012, Novi Sad : BCI (2012)