Претрага
173 items
-
Old or New, We Repair, Adjust and Alter (Texts)
Cvetana Krstev, Ranka Stanković (2020)U ovom radu predstavljamo kako se e-rečnici i kaskade transduktora konačnih stanja implementirani u alatu Unitex mogu koristiti za rešavanje tri problema transformacije teksta: ispravljanje tekstova nakon OCR-a, vraćanje dijakritičkih znakova i prebacivanje između različitih jezičkih varijanti.ispravka teksta, OCR greške, restauracija dijakritika , jezičke varijante, elektronski rečnik, transduktori konačnih stanjaCvetana Krstev, Ranka Stanković. "Old or New, We Repair, Adjust and Alter (Texts)" in Infotheca, Faculty of Philology, University of Belgrade (2020). https://doi.org/10.18485/infotheca.2019.19.2.3
-
Integrisano okruženje za pripremu paralelizovanog korpusa
Razvoj paralelizovanih korpusa zahteva pripremu paralelnih tekstova za njihovu integraciju u paralelizovani korpus. Reč je o jednom kompleksnom zadatku koji se može rešiti na različite načine, i koji mora da se odvija u nekoliko koraka. U ovom radu najpre je iznet postupak pripreme paralelnih tekstova za paralelizovani korpus koji se koristi u Grupi za jezičke tehnologije Univerziteta u Beogradu. Potom je dat kratak pregled programa (XAlign, Concordancier, WS4LR), odnosno softverskih alata koji se pri tome koriste. Nedostatak udobnog okruženja ...... Naime, integrisanjem jedinica paralelizovanih tekstova u memoriji računara kreira se interna tabelarna reprezentacija (dataset), pa se tabela sa uparenim rečenicama može prikazati kao na slici 3. Korisniku se potom daje mogućnost da izvrši dodatne ispravke grešaka uparivanja (kao što je “smicanje”) ...
... Paralelni tekstovi se mogu sastojati i od više tekstova, na više jezika, pri čemu je bitno da su svi tekstovi iste sadržine, dakle potekli od istog originalnog teksta. Paralelni tekstovi se mogu upariti, tako što će se uspostaviti veze između odgovarajućih elemenata jednog i drugog teksta. To uparivanje ...
... og teksta • razlaganje TMX formata na pojedinačne tekstove u XML formatu • vertikalizacija pojedinačnih tekstova • kreiranje korpusa Prvi korak obuhvata pripremu i segmentaciju teksta, odnosno razlaganje teksta na manje jedinice (paragrafe, rečenice, reči) i obeležavanje jedinica teksta. Samo ...Ivan Obradović, Ranka Stanković, Miloš Utvić. "Integrisano okruženje za pripremu paralelizovanog korpusa" in Zbornik radova međunarodnog simpozijuma Razlike između bosanskog/bošnjačkog, hrvatskog i srpskog jezika, Graz, Austria, April 2007, - (2007)
-
Увођење доменских и семантичких маркера за област рударства у српске електронске речнике
... и SPARQL приступна тачка за RESTfulAPIs. 4. Опис корпуса рударских текстова Новопредложени маркери значајни су пре свега за екстракцију инфор- мација из корпуса текстова везаних за рударство. Прикупљање корпуса са текстовима из рударског домена је почело 2014, након чека је урађена прва допуна ...
... ошком факултету и литературу из области рударства. Ради заједничке обраде сви текстови су спојени и формирана је једна текстуална датотека величине 39 MB, са 6200 страна текста формата A4. На- кон обраде текста добијено је: 150.365 реченица, 2.719.086 (100.414 разли- читих) простих речи. У припреми ...
... рударских текстова дат је у Табели 4. 1 http://resource.geosciml.org/vocabulary/earthresourceml/2016 И в ан О б р ад о в и ћ , А л ек с ан д р а Т о м аш ев и ћ , Р ан к а С тан ко в и ћ , Б и љ ан а Л ази ћ 1 5 4Табела 4. Резултати обраде текстова за рударски корпус Тип текстова Б ...Иван Обрадовић, Александра Томашевић, Ранка Станковић, Биљана Лазић. "Увођење доменских и семантичких маркера за област рударства у српске електронске речнике" in Научни састанак слависта у Вукове дане - Српски језик и његови ресурси: теорија, опис и примене, Београд : Међународни славистички центар на Филолошком факултету, Филолошки факултет (2017). https://doi.org/10.18485/msc.2017.46.3.ch10
-
Чији је пример? Анализа лексичких обележја на примерима Речника САНУ
У овом раду поставља се питање: да ли се може утврдити ко је аутор неког текста уколико се анализирају искључиво његова лексичка обележја? Како бисмо покушали да добијемо одговор на ово питање, посматрали смо примере у оквиру речничког чланка појединачне лексеме Речника САНУ, који су забележени у пет томова (и то: I, II, XVIII, XIX и XX). Сваки пример је преузет из неког извора на шта упућују скраћенице, наведене у заградама. Од преко 5.000 понуђених извора, определили смо се ...... критеријумом за одређивање ауторства у писаним текстовима сматра се (нечији) рукопис. У куцаним и дигитално презентованим текстови- ма примена овог критеријума уопште није могућа. Рачунарска анализа, ипак, пружа могућност брзе обраде великог броја текстова, аутоматску упоредну анализу више дела истовремено ...
... природних језика решава различите проблеме у разумевању текста који се тичу препознавања говора (енгл. Speech Recognition), сажимање текста (енгл. Text Summarization), лексичког раш- члањавања (енгл. Dependency Parsing), обележавања текста према врсти речи (енгл. Part-of-Speech Tagging), лематизације ...
... именованих ентитета (енгл. Named Entity Recognition), класификације текста (енгл. Text Classification) и многих других. Под класификовањем текста подразумева се обучавање математичког модела да аутоматски, на основу сад- ржаја, тексту додели одговарајућу класу (категорију) или више њих, из скупа унапред ...Бранислава Б. Шандрих, Ранка М. Станковић, Мирјана С. Гочанин. "Чији је пример? Анализа лексичких обележја на примерима Речника САНУ" in Српски језик и његови ресурси, Међународни славистички центар, Филолошки факултет, Универзитет у Београду (2019). https://doi.org/10.18485/msc.2019.48.3.ch13
-
Integracija heterogenih tekstualnih resursa
Ranka Stanković, Ivan Obradović (2007)U radu je opisan pristup integraciji heterogenih tekstualnih resursa za srpski jezik uz pomoć jednog kompleksnog softverskog alata, razvijenog specijalno za ove potrebe. Opisani su struktura i osnovne komponente razvijenog sistema. Iznete su i mogućnosti unapređivanja resursa međusobnom razmenom informacija, koje pruža razvijeno integrisano okruženje. Konačno, opisana je i mogućnost primene integrisanih heterogenih resursa za proširenje upita, kao i pretraživanje tekstova uopšte, a naznačeni su i neki od pravaca daljeg razvoja.... konverziju resursa 8 ovani tekstovi modul za obradu tekstova koji su prethodno paralelizovani alatom 4. Razmena informacija između rečnika i w dneta jana leksička resursa, a to su morfol Paraleliz WS4LR sadrži i za paralelizaciju tekstova XAlign (Bonhomme et al. 2001). Modul ...
... omogućava prevođenje tekstova paralelizovanih XAlignom u različite formate: tektstualni, XML, tabelarni ili TMX format. Sem toga, korisniku se omogućava da izabere način vizuelizacije paralelizovanih tekstova. Tako se, uz pomoć odgovarajuće XSLT transformacije, paralelizovani tekst može prevesti u HTML ...
... upita na paralelizovanom tekstu ezultat primene proširenih upita, sa svim pomenutim opcijama proširenja, može se lepo prikazati na paralelizovanom tekstu u TMX formatu. Na osnovu proširenja upita, koje može biti morfološko, semantičko i višejezično, iz paralelizovanog teksta se izdvajaju segmenti ...Ranka Stanković, Ivan Obradović. "Integracija heterogenih tekstualnih resursa" in Zbornik radova međunarodnog simpozijuma Razlike između bosanskog/bošnjačkog, hrvatskog i srpskog jezika, Graz, Austria, April 2007, - (2007)
-
Praktikum za vežbe iz Informatike 1
Ranka Stanković, Ivan Obradović, Olivera Kitanović, Mirjana Banković. Praktikum za vežbe iz Informatike 1, Beograd : Univerzitet u Beogradu, Rudarsko-geološki fakultet, 2014
-
Белешка о дигитализацији речника
У раду ће се анализирати ограничења која проистичу из линеарног процеса традиционалне израде речника на примеру Речника САНУ. Начин да се превазиђу ова ограничења се састоји у формирању електронске лексикографске базе која не представља само пуку дигиталну транскрипцију папирног издања речника. Посебно се указује на чињеницу да текст речника може представљати корпус и приказују се одабрани примери анализе таквог корпуса формираног из текстове 1. и 19. тома Речника САНУ.... да испитамо могућност аутоматске анотације сировог текста, али и да сагледамо својства језика који чини овај текст. Први том садржи око 550.000 облика речи на 690 страна штампаног текста, а 19. том око 672.000 облика речи на 800 страна. Како текст Речника, као што је раније речено, није структурирани ...
... испитамо могућност аутоматске анотације сировог текста, али и да сагледамо својства језика који чини овај текст. Први том садржи око 550.000 облика речи на 690 страна штампаног текста, а 19. том око 672.000 облика речи на 800 страна. Како текст Речника, као што је раније речено, није ...
... само пуку дигиталну транскрипцију папирног издања речника. Посебно се указује на чињеницу да текст речника може представљати корпус и приказују се одабрани примери анализе таквог корпуса формираног из текстове 1. и 19. тома Речника САНУ. Кључне речи: лексикографија, рачунарска лексикографија, информатика ...Душко М. Витас, Цветана Ј. Крстев, Ранка М. Станковић. "Белешка о дигитализацији речника" in Српски језик и његови ресурси, Међународни славистички центар, Филолошки факултет, Универзитет у Београду (2019). https://doi.org/10.18485/msc.2019.48.3.ch3
-
Нове технологије за оживљавање старих текстова
удаљено читање, књижевни корпус, обрада српског језика, анотација врстом речи, лематизација, именовани ентитетиЦветана Крстев, Ранка Станковић, Бранислава Шандрих Тодоровић, Милица Иконић Нешић. "Нове технологије за оживљавање старих текстова" in Зборник радова Међународне научне конференције Дигитална хуманистика и словенско културно наслеђе II, Београд, 28-29 јуни 2021., Београд : Савез славистичких друштава Србије (2023)
-
New Language Models for South Slavic Languages
Mihailo Škorić (2024)Izlaganje će predstaviti izazove i perspektive modelovanja južnoslovenskih jezika, sa posebnim osvrtom opšte jezičke modele građene na arhitekturi transformera (BERT, GPT), na dostupne skupove tekstova za obučavanje tih modela, te kvantitet i kvalitet tih skupova. Izlaganje će ponuditi pregled dostupnih skupova i modela, dok će posebna pažnja biti posvećena najnovijim korpusima tekstova. Prvi korpus, Kišobran, predstavlja krovni veb korpus južnoslovenskih jezika i ujedno trenutno najveći korpus tekstova na našim prostorima koji broji preko osamnaest milijardi reči i uključuje sve ...Mihailo Škorić. "New Language Models for South Slavic Languages" in South Slavic Languages in the Digital Environment JuDig Book of Abstracts, University of Belgrade - Faculty of Philology, Serbia, November 21-23, 2024, University of Belgrade - Faculty of Philology (2024)
-
Употреба веб платформе Омека за дигиталне библиотеке из домена рударства
У овом раду биће представљена Омека, веб платформа за приказивање дигиталних колекциjа и систем за управљање њиховим садржаjем. Њену примену у области техничких наука, а конкретно у области рударства, приказаћемо на примеру дигиталне библиотеке ROmeka@RGF. За Омеку смо се определили првенствено због чињенице да jе jедноставна за коришћење, има обимну пратећу документациjу и не захтева уско специфичне информатичке вештине што jе чини приступачном за већину корисника, а нарочито за рударске инжењере, коjима jе ова дигитална библиотека првенствено намењена. Документа ...... података било због ауторских права. Сви текстови коjи су ускладиштени у дигиталну библиотеку биће даље коришћени за терминолошка истраживања. У ту сврху из текстова су уклоњени делови на страном jезику, табеле, слике, референце и линкови. Спаjањем свих текстова, ради заjедничке обраде, формирана jе jедна ...
... представља de facto стандард за анотациjу произвољних типова докумената, укључуjући правне текстове и текстове проjектне документациjе. Анотациjа у складу са смерницама TEI треба да омогући повезивање делова текста у проjектноj документациjи коjи упућуjу на чланове закона и реферисане законске регулативе ...
... измењен. У трећем, завршном кораку, врши се сама измена метаподатка (та измена може подразумевати: претраживање и замену текста, додавање новог метаподатка у одабрано поље, додавање текста у постоjеће метаподатке, уклањање дупликата и празних поља у одабраном опису обjекта, уклањање дуплираних датотека у ...Александра Томашевић, Биљана Лазић, Далибор Воркапић, Михаило Шкорић, Љиљана Колоња. "Употреба веб платформе Омека за дигиталне библиотеке из домена рударства" in Инфотека, Филолошки факултет, Универзитет у Београду; Универзитетска библиотека „Светозар Марковић“; Заједница библиотека универзитета у Србији (2017)
-
Komparativna analiza metoda ispitivanja stabilnosti zemljanih kosina-tekst i slike
Nikola najdanović (1958)Nikola najdanović. Komparativna analiza metoda ispitivanja stabilnosti zemljanih kosina-tekst i slike, Beograd:Rudarsko-geološki fakultet, 1958
-
The Many Faces of SrpKor
Акроним СрпКор означава фамилију електронских корпуса савременог српског језика чија је изградња почела крајем седамдесетих година прошлога века, а која је постала шире видљива заинтересованој истраживачкој заједници објављивањем његове прве верзије на вебу 2002. године. У овом дугом периоду, посебно пре појаве корисних текстуелних ресурса на вебу, развој корпуса се састојао у прикупљању и обради грађе као и у развоју метода обраде корпуса. Наиме, електронски корпус није само колекција текстова у дигиталном облику (како се то, на пример, наводи ...Duško Vitas, Ranka Stanković, Cvetana Krstev. "The Many Faces of SrpKor" in South Slavic Languages in the Digital Environment JuDig Book of Abstracts, University of Belgrade - Faculty of Philology, Serbia, November 21-23, 2024, University of Belgrade - Faculty of Philology (2024.)
-
Речник САНУ као база терминолошких речника (на примеру речника кулинарства)
... Речника САНУ (чија је дигитализација у току), а истраживање се такође ограничава само на лексику текстова кулинарског домена. Имајући у виду да је корпус текстова произведен аутоматски из пдф датотека, у тексту је велики број речи био преломљен (растављен), те се јавила потреба за аутоматском корекцијом ...
... кулинарском корпусу препознате су семантичке категорије карактеристичне за лексику кулинарских текстова (Крстев, Лазић, 2015): Табела: Примери из корпуса који су препознати семантичким маркерима за текстове кулинарског домена Маркер Опис маркера Примери из корпуса +DOM=Culinary кулинарски домен ...
... грицкалице; - дебрецина, дехидратор, динстати, добиберити, догрејати, дресинг. Екстракција термина из текста За решавање проблема екстракције и лематизације вишечланих термина из текста, одабран је приступ заснован на правилима која се ослањају на систем језичких ресурса, као што су морфолошки ...Рада Стијовић, Олга Сабо, Ранка Станковић. "Речник САНУ као база терминолошких речника (на примеру речника кулинарства)" in Словенска терминологија данас, Београд : Српска академија наука и уметности (2017)
-
Ontološki model upravljanja rizikom u rudarstvu
Olivera Kitanović (2021)Rudarska proizvodnja obuhvata kompleksne tehnološke sisteme, što nameće potrebu za uspostavljanjem i unapređivanjem sistema upravljanja rizikom. Heterogenost i obim podataka neophodnih za upravljanje rizikom zahtevaju sistem koji ih na fleksibilan način integriše i omogućava njihovo optimalno korišćenje. Osnovni cilj ove disertacije je razvoj ontologije za domen rudarstva i na njoj zasnovanog modela za upravljanje rizikom. Njegova realizacija podrazumeva i implementaciju algoritama ekstrakcije informacija za popunjavanje ontologije, kao i odgovarajuće softversko rešenje. Razvoj modela obuhvata i značajno proširenje rudarskog korpusa, kao ...rudarstvo, rizik, upravljanje rizikom, procena rizika, ontologija, semantička mreža, ekstrakcija informacija, upravljanje znanjem, računarska lingvistika... tip. Slika 5-3 Ispravljeni podgraf za prepoznavanje tipova i naziva bagera Evaluacija je ponovljena nakon ispravke grafova, čime se došlo do mnogo boljih rezultata (nad istim tekstom). Ostalo je samo jedno pojavljivanje opreme koji nije prepoznato, i to BTO II, tako da je odziv 99.89%. Delimični ...
... ... 115 5.1.2.2. Ispravka transduktora za entitete rudarske opreme na osnovu rezultata evaluacije ............................................................................................................................................................ 116 5.1.2.3. Ispravka transduktora za lokacije ...
... F-mera za lokacije bi bila: 95.27% -PK „RADLjEVO SEVER“ x2 5.1.2.2. Ispravka transduktora za entitete rudarske opreme na osnovu rezultata evaluacije Ispravke na glavnom transduktoru za prepoznavanje opreme svele su se na ispravljanje prepoznavanja entiteta rudarske ...Olivera Kitanović. Ontološki model upravljanja rizikom u rudarstvu, Beograd : [O. Kitanović], 2021
-
English for Geology Students. 1
Lidija Beko (2023)... Naučna istraživanja iz oblasti jezika pokazuju da polaznici najbolje uče kada se aktivno angažuju, na primer u kombinaciji teksta i prakse, teksta i realnog života ili teksta i umetnosti. Kako bismo obezbedili da se studenti sećaju akademskih termina, geoloških koncepata i jezika relevantnog u ...
... mativnu bazu i bude upotrebljiv akademski model za učenje osnovnih principa i pojmova iz oblasti engleskog jezika za geologe. Čitljivim i razumljivim tekstovima, za studente koji pohađaju svoj prvi kurs metodom CLIL, želeli smo poboljšati naučnu pismenost naših studenata na konkretan, real- ističan i ...
... kontinenata 5. Stenski ciklus, magmatske stene i vulkani 6. Površinsko raspadanje, erozija i sedimentne stene. Teme se dele na tri manje celine ili teksta, svaki prateći C1 nivo Zajedničkog evropskog referentnog okvira za jezike, pri čemu se čestim podelama na naslove i podnaslove, polaznicima omogućava ...Lidija Beko. English for Geology Students. 1, Belgrade : The Faculty of Mining and Geology, 2023
-
Претрага корпуса заснована на употреби екстерних лексичких ресурса путем веб-сервиса
У раду се разматра хибридни приступ претрази корпуса, илустрован на примеру алатки OCWB и NoSketch Engine, примењених на специјални корпус из области рударства (РудКор) и Корпус савременог српског језика (СрпКор). Разматрани приступ комбинује постојеће могућности алатки OCWB и NoSketch Engine, које своју претрагу заснивају на лингвистичкој анотацији корпуса, са новим могућностима претраге у виду консултовања екстерних језичких ресурса (морфолошки електронски речници српског језика и лексичка база података Српски ворднет). Хибридни приступ је реализован надоградњом вебсучеља која поменуте алатке користе ...... формату вертикал(изова)ног текста (Утвић 2014а: 129–130), као и у формату XML. Табела 1 илуструје како изгледа једна реченица из Андрићеве приповетке прича о везировом слону у формату вертикалног текста (прва колона), односно у формату аноти- раног вертикалног текста у корпусу СрпКор2013. Поједностављено ...
... лингвистичкој анотацији корпусних текстова, • на консултовању екстерних језичких ресурса током претраге и • на комбиновању поменутих приступа. У овом раду ће бити речи о комбинованом приступу претрази корпуса заснованој и на лингвистичкој анотацији корпусних текстова и на консулто- вању екстерних језичких ...
... лингвистичкој анотацији. Табела 1: Реченица из Андрићеве приповетке прича о везировом слону у форми вертикалног текста (прва колона), односно у форми анотираног вер- тикалног текста у корпусу СрпКор2013 (колоне 2–4 као позициони атрибути word, pos и lemma) 3. 2 Комплетна листа вредности атрибута ...Милош Утвић, Ранка Станковић, Александра Томашевић, Михаило Шкорић, Биљана Лазић. "Претрага корпуса заснована на употреби екстерних лексичких ресурса путем веб-сервиса" in Научни састанак слависта у Вукове дане - Vol. 48/3 Српски језик и његови ресурси, Међународни славистички центар, Филолошки факултет, Универзитет у Београду (2019). https://doi.org/10.18485/msc.2019.48.3.ch12
-
Српски језик у дигиталном добу -- The Serbian Language in the Digital Age
Duško Vitas, Ljubomir Popović, Cvetana Krstev, Ivan Obradović, Gordana Pavlović-Lažetić, Mladen Stanojević (2012)... јер квалитет резултата расте са порастом роја анализираних текстова. То је један од разлога што доављачипретраживачкихмашинажељнопри- купљају што је могуће више писаног материјала. Исправка правописних грешака у програмима за о- раду текста и сервиси каошто суGoogle Search иGo- ogle Translate, ослањају ...
... какав је Mi- crosoft Word наишао је на компоненту за проверу, која указује на грешке у правопису и нуди исправке. Први програми за исправку правописних грешака поредили су листу речи извађених из текста са реч- ником правилно исписаних речи. Данас су ти про- грами постали веома напредни. Коришћењем је- ...
... доро разумели, компаније су почеле све више пажње да посвећују техничкој документацији усредсређујући 22 улазни текст провера правописа провера граматике предложене исправке статистички језички модел 7: Провера језика (статистичка; заснована на правилима) се истовремено на међународно тржиште ...Duško Vitas, Ljubomir Popović, Cvetana Krstev, Ivan Obradović, Gordana Pavlović-Lažetić, Mladen Stanojević. "Српски језик у дигиталном добу -- The Serbian Language in the Digital Age" in META-NET White Paper Series, G. Rehm, H. Uszkoreit (eds.), Springer (2012)
-
Репозиторијум дигиталних идентификатора објеката – доиФил: изградња, стање и перспективе
Милош Утвић, Михаило Шкорић (2017)Филолошки факултет Универзитета у Београду је крајем јула 2015. године склопио уговор са агенцијом Crossref и тиме стекао право да својим публикацијама додељује дигитални идентификатор објекта (DOI), као и публикацијама других издавача које заступа. Истовремено, у склопу уговора, Филолошки факултет је развио репозиторијум доиФил који за све регистроване публикације чува њихове библиографске метаподатке, хипервезу ка комплетном тексту и сам DOI. После припремних радњи и разраде процеса на којима је заснован рад репозиторијума, у новембру 2016. године је репозиторијум доиФил ...... e-reference/ 86 BIBLIOINFO упоређивањем њеног садржаја са PDF-верзијом публикације. Уколико има грешака, администратор репозиторијума уноси исправке у одговарајућем пољу интерног формата BibTeX, а онда аутоматски генерише нове верзије датотеке у формату Crossref/XML и приступне странице публикације ...
... софтвер за контролу и конверзију метаподатака, као и софтвер за генерисање приступних страница; администрира репозиторијумом, тј. уноси коначне исправке метаподатака на основу извештаја горе наведених контролора, на основу унетих метаподатака генерише све излазне формате, региструје DOI-бројеве код ...
... Филолошки факултет је развио репозиторијум доиФил који за све регистроване публикације чува њихове библиографске метаподатке, хипер- везу ка комплетном тексту и сам DOI. После припремних радњи и разраде процеса на којима је заснован рад репозиторијума, у новембру 2016. године је репозиторијум доиФил званично ...Милош Утвић, Михаило Шкорић. "Репозиторијум дигиталних идентификатора објеката – доиФил: изградња, стање и перспективе" in Научна конференција Библиоинфо — 55 година од покретања наставе библиотекарства на високошколском нивоу, Београд 18. мај 2017., Филолошки факултет Универзитета у Београду (2017). https://doi.org/10.18485/biblioinfo.2017.ch7
-
Contrastive Analysis of Syntax Patterns in Comparable Football Corpora in Spanish and Serbian Languages
Jelena Lazarević, Olivera Kitanović (2024.)Cilj rada je istraživanje kolokabilnosti kao načina na koji se leksičke jedinice povezuju sa rečima iz različitih kategorija, formirajući veće jedinice. Istraživanje semantičkih i sintaksičkih principa ovih kombinacija u španskom i srpskom jeziku fudbala izvedeno je na komparabilnim fudbalskim korpusima SrFudKo i EsFudko, razvijenim u okviru doktorske disertacije Jelene Lazarević pod nazivom: Jezičke odlike diskursa novih medija o fudbalu: kontrastivna analiza na korpusu srpskog i španskog jezika. Korpus fudbala SrFudKo, kreiran na osnovu tekstova o fudbalu sa pet srpskih veb-portala: ...Jelena Lazarević, Olivera Kitanović . "Contrastive Analysis of Syntax Patterns in Comparable Football Corpora in Spanish and Serbian Languages" in South Slavic Languages in the Digital Environment JuDig Book of Abstracts, University of Belgrade - Faculty of Philology, Serbia, November 21-23, 2024, University of Belgrade - Faculty of Philology (2024.)
-
Proširivanje upita zasnovano na leksičkim resursima
U radu je opisano kako se leksički resursi za srpski jezik i softverski alati, razvijeni u okviru Grupe za jezičke tehnologije Univerziteta u Beogradu, mogu koristiti za unapređenje postavljanja upita. Rezultati pretrage mogu biti značajno unapređeni korišćenjem različitih leksičkih resursa, kakvi su morfološki rečnici i semantičke mreže. Izloženi pristup može se iskoristiti i u Sistemu naučnih, tehnoloških i poslovnih informacija, jer je efikasno pretraživanje ovog dragocenog resursa, imajući u vidu njegovu heterogenost i obim, kao i preovladavajući tekstualni sadržaj, ...... bolje iskorišćenje paralelizovanih tekstova koji predstavljaju resurs velikih mogućnosti, a koji zahteva veoma mnogo napora i znanja da bi se konstruisao. Objedinjavanje raspoloživih resursa se ilustruje pravljenjem konkordansi, odnosno izdvajanjem delova teksta koji zadovoljavaju određeni kriterijum ...
... aktuelnim sistemima za pronalaženje informacija svodi na različite varijante poređenja karakterskih niski. Pri tome se ni ključne reči, ni sami tekstovi ne tretiraju kao objekti koji su organizovani prirodnim jezikom. Proširivanjem upita zasnovanom na leksičkim resursima mogu se dobiti znatno ...
... se koriste i razvijaju i grafovi, koji se u lingvističkim softverima koriste za formalizaciju lingvističkih fenomena i za obradu (parsiranje) teksta. Pored njih, i dvojezične, paralelne liste, kao pomoćni resurs pri pretraživanju i prevođenju. Konačno, Grupa učestvuje i u razvoju višejezične ...Ranka Stanković, Ivan Obradović, Cvetana Krstev. "Proširivanje upita zasnovano na leksičkim resursima" in SNTPI 09 - Naučno-stručni skup Sistem naučnih, tehnoloških i poslovnih informacija, Beograd 19. i 20. jun 2009, Beograd : Fakultet informacionih tehnologija (2009)