Претрага
177 items
-
Savremeni principi inženjerskogeološke klasifikacije stena
Vojislav Jovanović (1974)Vojislav Jovanović. Savremeni principi inženjerskogeološke klasifikacije stena, Beograd:Rudarsko Geološki Fakultet, 1974
-
Integrisano okruženje za pripremu paralelizovanog korpusa
Razvoj paralelizovanih korpusa zahteva pripremu paralelnih tekstova za njihovu integraciju u paralelizovani korpus. Reč je o jednom kompleksnom zadatku koji se može rešiti na različite načine, i koji mora da se odvija u nekoliko koraka. U ovom radu najpre je iznet postupak pripreme paralelnih tekstova za paralelizovani korpus koji se koristi u Grupi za jezičke tehnologije Univerziteta u Beogradu. Potom je dat kratak pregled programa (XAlign, Concordancier, WS4LR), odnosno softverskih alata koji se pri tome koriste. Nedostatak udobnog okruženja ...... Paralelni tekstovi se mogu sastojati i od više tekstova, na više jezika, pri čemu je bitno da su svi tekstovi iste sadržine, dakle potekli od istog originalnog teksta. Paralelni tekstovi se mogu upariti, tako što će se uspostaviti veze između odgovarajućih elemenata jednog i drugog teksta. To uparivanje ...
... og teksta • razlaganje TMX formata na pojedinačne tekstove u XML formatu • vertikalizacija pojedinačnih tekstova • kreiranje korpusa Prvi korak obuhvata pripremu i segmentaciju teksta, odnosno razlaganje teksta na manje jedinice (paragrafe, rečenice, reči) i obeležavanje jedinica teksta. Samo ...
... priprema tekstova za korpus. 1. Uvod Paralelni tekst ili bitekst se najčešće formira od dva teksta od kojih je jedan originalan, a drugi je nastao njegovim prevođenjem. Radi se dakle o dva teksta iste sadržine, najčešće na dva različita jezika. Treba, međutim, napomenuti da paralelni tekstovi mogu ...Ivan Obradović, Ranka Stanković, Miloš Utvić. "Integrisano okruženje za pripremu paralelizovanog korpusa" in Zbornik radova međunarodnog simpozijuma Razlike između bosanskog/bošnjačkog, hrvatskog i srpskog jezika, Graz, Austria, April 2007, - (2007)
-
Увођење доменских и семантичких маркера за област рударства у српске електронске речнике
... и SPARQL приступна тачка за RESTfulAPIs. 4. Опис корпуса рударских текстова Новопредложени маркери значајни су пре свега за екстракцију инфор- мација из корпуса текстова везаних за рударство. Прикупљање корпуса са текстовима из рударског домена је почело 2014, након чека је урађена прва допуна ...
... ошком факултету и литературу из области рударства. Ради заједничке обраде сви текстови су спојени и формирана је једна текстуална датотека величине 39 MB, са 6200 страна текста формата A4. На- кон обраде текста добијено је: 150.365 реченица, 2.719.086 (100.414 разли- читих) простих речи. У припреми ...
... рударских текстова дат је у Табели 4. 1 http://resource.geosciml.org/vocabulary/earthresourceml/2016 И в ан О б р ад о в и ћ , А л ек с ан д р а Т о м аш ев и ћ , Р ан к а С тан ко в и ћ , Б и љ ан а Л ази ћ 1 5 4Табела 4. Резултати обраде текстова за рударски корпус Тип текстова Б ...Иван Обрадовић, Александра Томашевић, Ранка Станковић, Биљана Лазић. "Увођење доменских и семантичких маркера за област рударства у српске електронске речнике" in Научни састанак слависта у Вукове дане - Српски језик и његови ресурси: теорија, опис и примене, Београд : Међународни славистички центар на Филолошком факултету, Филолошки факултет (2017). https://doi.org/10.18485/msc.2017.46.3.ch10
-
Чији је пример? Анализа лексичких обележја на примерима Речника САНУ
У овом раду поставља се питање: да ли се може утврдити ко је аутор неког текста уколико се анализирају искључиво његова лексичка обележја? Како бисмо покушали да добијемо одговор на ово питање, посматрали смо примере у оквиру речничког чланка појединачне лексеме Речника САНУ, који су забележени у пет томова (и то: I, II, XVIII, XIX и XX). Сваки пример је преузет из неког извора на шта упућују скраћенице, наведене у заградама. Од преко 5.000 понуђених извора, определили смо се ...... вања именованих ентитета (енгл. Named Entity Recognition), класификације текста (енгл. Text Classification) и многих других. Под класификовањем текста подразумева се обучавање математичког модела да аутоматски, на основу сад- ржаја, тексту додели одговарајућу класу (категорију) или више њих, из скупа ...
... критеријумом за одређивање ауторства у писаним текстовима сматра се (нечији) рукопис. У куцаним и дигитално презентованим текстови- ма примена овог критеријума уопште није могућа. Рачунарска анализа, ипак, пружа могућност брзе обраде великог броја текстова, аутоматску упоредну анализу више дела истовремено ...
... природних језика решава различите проблеме у разумевању текста који се тичу препознавања говора (енгл. Speech Recognition), сажимање текста (енгл. Text Summarization), лексичког раш- члањавања (енгл. Dependency Parsing), обележавања текста према врсти речи (енгл. Part-of-Speech Tagging), лематизације ...Бранислава Б. Шандрих, Ранка М. Станковић, Мирјана С. Гочанин. "Чији је пример? Анализа лексичких обележја на примерима Речника САНУ" in Српски језик и његови ресурси, Међународни славистички центар, Филолошки факултет, Универзитет у Београду (2019). https://doi.org/10.18485/msc.2019.48.3.ch13
-
Integracija heterogenih tekstualnih resursa
Ranka Stanković, Ivan Obradović (2007)U radu je opisan pristup integraciji heterogenih tekstualnih resursa za srpski jezik uz pomoć jednog kompleksnog softverskog alata, razvijenog specijalno za ove potrebe. Opisani su struktura i osnovne komponente razvijenog sistema. Iznete su i mogućnosti unapređivanja resursa međusobnom razmenom informacija, koje pruža razvijeno integrisano okruženje. Konačno, opisana je i mogućnost primene integrisanih heterogenih resursa za proširenje upita, kao i pretraživanje tekstova uopšte, a naznačeni su i neki od pravaca daljeg razvoja.... konverziju resursa 8 ovani tekstovi modul za obradu tekstova koji su prethodno paralelizovani alatom 4. Razmena informacija između rečnika i w dneta jana leksička resursa, a to su morfol Paraleliz WS4LR sadrži i za paralelizaciju tekstova XAlign (Bonhomme et al. 2001). Modul ...
... omogućava prevođenje tekstova paralelizovanih XAlignom u različite formate: tektstualni, XML, tabelarni ili TMX format. Sem toga, korisniku se omogućava da izabere način vizuelizacije paralelizovanih tekstova. Tako se, uz pomoć odgovarajuće XSLT transformacije, paralelizovani tekst može prevesti u HTML ...
... upita na paralelizovanom tekstu ezultat primene proširenih upita, sa svim pomenutim opcijama proširenja, može se lepo prikazati na paralelizovanom tekstu u TMX formatu. Na osnovu proširenja upita, koje može biti morfološko, semantičko i višejezično, iz paralelizovanog teksta se izdvajaju segmenti ...Ranka Stanković, Ivan Obradović. "Integracija heterogenih tekstualnih resursa" in Zbornik radova međunarodnog simpozijuma Razlike između bosanskog/bošnjačkog, hrvatskog i srpskog jezika, Graz, Austria, April 2007, - (2007)
-
Praktikum za vežbe iz Informatike 1
Ranka Stanković, Ivan Obradović, Olivera Kitanović, Mirjana Banković. Praktikum za vežbe iz Informatike 1, Beograd : Univerzitet u Beogradu, Rudarsko-geološki fakultet, 2014
-
Белешка о дигитализацији речника
У раду ће се анализирати ограничења која проистичу из линеарног процеса традиционалне израде речника на примеру Речника САНУ. Начин да се превазиђу ова ограничења се састоји у формирању електронске лексикографске базе која не представља само пуку дигиталну транскрипцију папирног издања речника. Посебно се указује на чињеницу да текст речника може представљати корпус и приказују се одабрани примери анализе таквог корпуса формираног из текстове 1. и 19. тома Речника САНУ.... да испитамо могућност аутоматске анотације сировог текста, али и да сагледамо својства језика који чини овај текст. Први том садржи око 550.000 облика речи на 690 страна штампаног текста, а 19. том око 672.000 облика речи на 800 страна. Како текст Речника, као што је раније речено, није структурирани ...
... испитамо могућност аутоматске анотације сировог текста, али и да сагледамо својства језика који чини овај текст. Први том садржи око 550.000 облика речи на 690 страна штампаног текста, а 19. том око 672.000 облика речи на 800 страна. Како текст Речника, као што је раније речено, није ...
... само пуку дигиталну транскрипцију папирног издања речника. Посебно се указује на чињеницу да текст речника може представљати корпус и приказују се одабрани примери анализе таквог корпуса формираног из текстове 1. и 19. тома Речника САНУ. Кључне речи: лексикографија, рачунарска лексикографија, информатика ...Душко М. Витас, Цветана Ј. Крстев, Ранка М. Станковић. "Белешка о дигитализацији речника" in Српски језик и његови ресурси, Међународни славистички центар, Филолошки факултет, Универзитет у Београду (2019). https://doi.org/10.18485/msc.2019.48.3.ch3
-
Нове технологије за оживљавање старих текстова
удаљено читање, књижевни корпус, обрада српског језика, анотација врстом речи, лематизација, именовани ентитетиЦветана Крстев, Ранка Станковић, Бранислава Шандрих Тодоровић, Милица Иконић Нешић. "Нове технологије за оживљавање старих текстова" in Зборник радова Међународне научне конференције Дигитална хуманистика и словенско културно наслеђе II, Београд, 28-29 јуни 2021., Београд : Савез славистичких друштава Србије (2023)
-
Extraction of Bilingual Terminology Using Graphs, Dictionaries and GIZA++
Branislava Šandrih, Ranka Stanković (2020)U nauci, industriji i mnogim istraživačkim oblastima, terminologija se brzo razvija. Najčešće, jezik koji je „lingua franca“ za većinu ovih oblasti je engleski. Kao posledica toga, za mnoga polja termini domena su koncipirani na engleskom, a kasnije se prevode na druge jezike. U ovom radu predstavljamo pristup za automatsko izdvajanje dvojezične terminologije za englesko-srpski jezički par koji se oslanja na usaglašeni dvojezični korpus domena, ekstraktor terminologije za ciljni jezik i alat za usklađivanje delova. Ispitujemo performanse metode na domenu ...Branislava Šandrih, Ranka Stanković. "Extraction of Bilingual Terminology Using Graphs, Dictionaries and GIZA++" in Infotheca, Faculty of Philology, University of Belgrade (2020). https://doi.org/10.18485/infotheca.2019.19.2.6
-
New Language Models for South Slavic Languages
Mihailo Škorić (2024)Izlaganje će predstaviti izazove i perspektive modelovanja južnoslovenskih jezika, sa posebnim osvrtom opšte jezičke modele građene na arhitekturi transformera (BERT, GPT), na dostupne skupove tekstova za obučavanje tih modela, te kvantitet i kvalitet tih skupova. Izlaganje će ponuditi pregled dostupnih skupova i modela, dok će posebna pažnja biti posvećena najnovijim korpusima tekstova. Prvi korpus, Kišobran, predstavlja krovni veb korpus južnoslovenskih jezika i ujedno trenutno najveći korpus tekstova na našim prostorima koji broji preko osamnaest milijardi reči i uključuje sve ...Mihailo Škorić. "New Language Models for South Slavic Languages" in South Slavic Languages in the Digital Environment JuDig Book of Abstracts, University of Belgrade - Faculty of Philology, Serbia, November 21-23, 2024, University of Belgrade - Faculty of Philology (2024)
-
Употреба веб платформе Омека за дигиталне библиотеке из домена рударства
У овом раду биће представљена Омека, веб платформа за приказивање дигиталних колекциjа и систем за управљање њиховим садржаjем. Њену примену у области техничких наука, а конкретно у области рударства, приказаћемо на примеру дигиталне библиотеке ROmeka@RGF. За Омеку смо се определили првенствено због чињенице да jе jедноставна за коришћење, има обимну пратећу документациjу и не захтева уско специфичне информатичке вештине што jе чини приступачном за већину корисника, а нарочито за рударске инжењере, коjима jе ова дигитална библиотека првенствено намењена. Документа ...... података било због ауторских права. Сви текстови коjи су ускладиштени у дигиталну библиотеку биће даље коришћени за терминолошка истраживања. У ту сврху из текстова су уклоњени делови на страном jезику, табеле, слике, референце и линкови. Спаjањем свих текстова, ради заjедничке обраде, формирана jе jедна ...
... представља de facto стандард за анотациjу произвољних типова докумената, укључуjући правне текстове и текстове проjектне документациjе. Анотациjа у складу са смерницама TEI треба да омогући повезивање делова текста у проjектноj документациjи коjи упућуjу на чланове закона и реферисане законске регулативе ...
... измењен. У трећем, завршном кораку, врши се сама измена метаподатка (та измена може подразумевати: претраживање и замену текста, додавање новог метаподатка у одабрано поље, додавање текста у постоjеће метаподатке, уклањање дупликата и празних поља у одабраном опису обjекта, уклањање дуплираних датотека у ...Александра Томашевић, Биљана Лазић, Далибор Воркапић, Михаило Шкорић, Љиљана Колоња. "Употреба веб платформе Омека за дигиталне библиотеке из домена рударства" in Инфотека, Филолошки факултет, Универзитет у Београду; Универзитетска библиотека „Светозар Марковић“; Заједница библиотека универзитета у Србији (2017)
-
Komparativna analiza metoda ispitivanja stabilnosti zemljanih kosina-tekst i slike
Nikola najdanović (1958)Nikola najdanović. Komparativna analiza metoda ispitivanja stabilnosti zemljanih kosina-tekst i slike, Beograd:Rudarsko-geološki fakultet, 1958
-
The Many Faces of SrpKor
Акроним СрпКор означава фамилију електронских корпуса савременог српског језика чија је изградња почела крајем седамдесетих година прошлога века, а која је постала шире видљива заинтересованој истраживачкој заједници објављивањем његове прве верзије на вебу 2002. године. У овом дугом периоду, посебно пре појаве корисних текстуелних ресурса на вебу, развој корпуса се састојао у прикупљању и обради грађе као и у развоју метода обраде корпуса. Наиме, електронски корпус није само колекција текстова у дигиталном облику (како се то, на пример, наводи ...Duško Vitas, Ranka Stanković, Cvetana Krstev. "The Many Faces of SrpKor" in South Slavic Languages in the Digital Environment JuDig Book of Abstracts, University of Belgrade - Faculty of Philology, Serbia, November 21-23, 2024, University of Belgrade - Faculty of Philology (2024.)
-
Речник САНУ као база терминолошких речника (на примеру речника кулинарства)
... Речника САНУ (чија је дигитализација у току), а истраживање се такође ограничава само на лексику текстова кулинарског домена. Имајући у виду да је корпус текстова произведен аутоматски из пдф датотека, у тексту је велики број речи био преломљен (растављен), те се јавила потреба за аутоматском корекцијом ...
... кулинарском корпусу препознате су семантичке категорије карактеристичне за лексику кулинарских текстова (Крстев, Лазић, 2015): Табела: Примери из корпуса који су препознати семантичким маркерима за текстове кулинарског домена Маркер Опис маркера Примери из корпуса +DOM=Culinary кулинарски домен ...
... грицкалице; - дебрецина, дехидратор, динстати, добиберити, догрејати, дресинг. Екстракција термина из текста За решавање проблема екстракције и лематизације вишечланих термина из текста, одабран је приступ заснован на правилима која се ослањају на систем језичких ресурса, као што су морфолошки ...Рада Стијовић, Олга Сабо, Ранка Станковић. "Речник САНУ као база терминолошких речника (на примеру речника кулинарства)" in Словенска терминологија данас, Београд : Српска академија наука и уметности (2017)
-
Ontološki model upravljanja rizikom u rudarstvu
Olivera Kitanović (2021)Rudarska proizvodnja obuhvata kompleksne tehnološke sisteme, što nameće potrebu za uspostavljanjem i unapređivanjem sistema upravljanja rizikom. Heterogenost i obim podataka neophodnih za upravljanje rizikom zahtevaju sistem koji ih na fleksibilan način integriše i omogućava njihovo optimalno korišćenje. Osnovni cilj ove disertacije je razvoj ontologije za domen rudarstva i na njoj zasnovanog modela za upravljanje rizikom. Njegova realizacija podrazumeva i implementaciju algoritama ekstrakcije informacija za popunjavanje ontologije, kao i odgovarajuće softversko rešenje. Razvoj modela obuhvata i značajno proširenje rudarskog korpusa, kao ...rudarstvo, rizik, upravljanje rizikom, procena rizika, ontologija, semantička mreža, ekstrakcija informacija, upravljanje znanjem, računarska lingvistika... Obeleženi tekst se može vizuelizovati (Slika 4-24) u alatu za anotaciju teksta brat69 (Stenetorp et al. 2012) Slika 4-24 Vizuelizacija obeleženog teksta 69 https://brat.nlplab.org/ https://brat.nlplab.org/ 85 4.3.5. Organizovanje pojmova u hijerarhiju Sinonimi i klasifikacije koncepata ...
... tehnika iskopavanja iz teksta, nakon čega sledi klasifikacija koja omogućava kategorizaciju rizika u cilju proaktivnog upravljanja rizikom. Implementirani prototip alata koristi algoritam CART (Classification And Regression Trees for Machine Learning) za iskopavanje iz teksta, kojim se identifikuju ...
... 4.1. Ontološke platforme za upravljanje rizikom ................................................................................ 26 2.4.2. Klasifikacija teksta u upravljanju rizicima .................................................................................... 30 2.5. Ekstrakcija koncepata ...Olivera Kitanović. Ontološki model upravljanja rizikom u rudarstvu, Beograd : [O. Kitanović], 2021
-
Inženjerskogeološka istraživanja za potrebe izgradnje tunela T1 na putnom pravcu Požega-Kotroman
Andrija Popović (2024)Tokom izrade završnog rada korišćeni su podaci koje sam dobio u saradnji sa firmom „Saobraćajni institut CIP d.o.o.“, kao i ostala odgovarajuća stručna literatura.Osnovni cilj pisanja rada jeste definisanje određenih fizičko mehaničkih parametara i predlog podgrade i načina iskopa tunela na osnovu RMR klasifikacije.... predstavljeni dalje u tekstu. Diplomski rad: Inženjerskogeološka istraživanja za potrebe izrade tunela TI na putnom pravcu Požega- Kotroman Strana: 17 Rudarsko-geološki fakultet, univerzitet u Beogradu 4.5. RMQR klasifikacija Aydan i dr. (2013) uvode modifikaciju RMR klasifikacije tzv. RMQR (Rock ...
... 4.3 Prednosti i mane RMR klasifikacije 4.4 Modifikacije RMR klasifikacije 4.5 RMQR klasifikacija ... naaaaaaaa a aaaaaaaaaaeaaaataaaaaaaaaatattt 18 4.6 SMR klasifikacija .....daaa a anaaaaaaaaaaaaaaaaaaaaaeaaaaaeaaaaaaaaNett 19 4.7 MRMR klasifikacija ..aataaa a anaaaaaaaaaaaaaaaaaaaaaaaaaaea ...
... KOHEZIJA 300 — 400 KPa Klasifikacija po Bieniawskom (1976) (O) ODNOS Q I RMR KLASIFIKACIJE POENI o= — 10.3— 31.3 Q ZNAČENJE KLASE KATEGORIJA PREPORUČENE PODGRADE, = 20,00 B – dobra stena 2)-B 3.0m na 2.0 – 3.0m Klasifikacija GSI po M.Cai-u PARAMERTI ZA KLASIFIKACIJU rastojanje _ro# GSI ...Andrija Popović. Inženjerskogeološka istraživanja za potrebe izgradnje tunela T1 na putnom pravcu Požega-Kotroman, 2024
-
English for Geology Students. 1
Lidija Beko (2023)... Naučna istraživanja iz oblasti jezika pokazuju da polaznici najbolje uče kada se aktivno angažuju, na primer u kombinaciji teksta i prakse, teksta i realnog života ili teksta i umetnosti. Kako bismo obezbedili da se studenti sećaju akademskih termina, geoloških koncepata i jezika relevantnog u ...
... mativnu bazu i bude upotrebljiv akademski model za učenje osnovnih principa i pojmova iz oblasti engleskog jezika za geologe. Čitljivim i razumljivim tekstovima, za studente koji pohađaju svoj prvi kurs metodom CLIL, želeli smo poboljšati naučnu pismenost naših studenata na konkretan, real- ističan i ...
... kontinenata 5. Stenski ciklus, magmatske stene i vulkani 6. Površinsko raspadanje, erozija i sedimentne stene. Teme se dele na tri manje celine ili teksta, svaki prateći C1 nivo Zajedničkog evropskog referentnog okvira za jezike, pri čemu se čestim podelama na naslove i podnaslove, polaznicima omogućava ...Lidija Beko. English for Geology Students. 1, Belgrade : The Faculty of Mining and Geology, 2023
-
Litostratigrafske osobine proučavanih karbonatnih naslaga otoka Hvara, Korčule, Mljeta, Lastova te poluotoka Pelješca sa prijedlogom klasifikacije reklistaliziranih karbonatnih naslaga
Berislav Šeberčić (1977)Berislav Šeberčić. Litostratigrafske osobine proučavanih karbonatnih naslaga otoka Hvara, Korčule, Mljeta, Lastova te poluotoka Pelješca sa prijedlogom klasifikacije reklistaliziranih karbonatnih naslaga, Zagreb:, 1977
-
Претрага корпуса заснована на употреби екстерних лексичких ресурса путем веб-сервиса
У раду се разматра хибридни приступ претрази корпуса, илустрован на примеру алатки OCWB и NoSketch Engine, примењених на специјални корпус из области рударства (РудКор) и Корпус савременог српског језика (СрпКор). Разматрани приступ комбинује постојеће могућности алатки OCWB и NoSketch Engine, које своју претрагу заснивају на лингвистичкој анотацији корпуса, са новим могућностима претраге у виду консултовања екстерних језичких ресурса (морфолошки електронски речници српског језика и лексичка база података Српски ворднет). Хибридни приступ је реализован надоградњом вебсучеља која поменуте алатке користе ...... формату вертикал(изова)ног текста (Утвић 2014а: 129–130), као и у формату XML. Табела 1 илуструје како изгледа једна реченица из Андрићеве приповетке прича о везировом слону у формату вертикалног текста (прва колона), односно у формату аноти- раног вертикалног текста у корпусу СрпКор2013. Поједностављено ...
... лингвистичкој анотацији корпусних текстова, • на консултовању екстерних језичких ресурса током претраге и • на комбиновању поменутих приступа. У овом раду ће бити речи о комбинованом приступу претрази корпуса заснованој и на лингвистичкој анотацији корпусних текстова и на консулто- вању екстерних језичких ...
... лингвистичкој анотацији. Табела 1: Реченица из Андрићеве приповетке прича о везировом слону у форми вертикалног текста (прва колона), односно у форми анотираног вер- тикалног текста у корпусу СрпКор2013 (колоне 2–4 као позициони атрибути word, pos и lemma) 3. 2 Комплетна листа вредности атрибута ...Милош Утвић, Ранка Станковић, Александра Томашевић, Михаило Шкорић, Биљана Лазић. "Претрага корпуса заснована на употреби екстерних лексичких ресурса путем веб-сервиса" in Научни састанак слависта у Вукове дане - Vol. 48/3 Српски језик и његови ресурси, Међународни славистички центар, Филолошки факултет, Универзитет у Београду (2019). https://doi.org/10.18485/msc.2019.48.3.ch12
-
Српски језик у дигиталном добу -- The Serbian Language in the Digital Age
Duško Vitas, Ljubomir Popović, Cvetana Krstev, Ivan Obradović, Gordana Pavlović-Lažetić, Mladen Stanojević (2012)... резимирање текста и ге- нерисање текста. Резимирање се, очигледно, односи на задатак скраћивања дугачког текста, и њега као функцију нуди MS Word. Оно ради углавном на ста- тистичким основама, тако што прво идентификује „важне” речи у тексту (на пример, речи које се у кон- кретном тексту често јављају ...
... подацима може да покрије специфичности језика које измичу 27 статистичко машинско превођење изворни текст циљни текст анализа текста (форматирање, морфологија, синтакса, итд.) Генерисање текста правила превођења 10: Машинско превођење (статистичко; засновано на правилима) системима заснованимна ...
... стичу језичко знање из огромних колекција конкретних примера текстова. За оучавање система за проверу правописа, на пример, довољно је кори- шћење текстова на једном језику, али су за оучавање машинских преводилаца потрени тзв. паралелни текстови на два (или више) језика. Алгоритам ма- шинског учења затим ...Duško Vitas, Ljubomir Popović, Cvetana Krstev, Ivan Obradović, Gordana Pavlović-Lažetić, Mladen Stanojević. "Српски језик у дигиталном добу -- The Serbian Language in the Digital Age" in META-NET White Paper Series, G. Rehm, H. Uszkoreit (eds.), Springer (2012)