يعرض 1 - 1 نتائج من 1 نتيجة بحث عن '"TRANSLATING & interpreting"', وقت الاستعلام: 1.34s تنقيح النتائج
  1. 1
    دورية أكاديمية

    Alternate Title: PARALLEL CORPORA IN SERBIA – POSSIBILITIES FOR SIMULTANEOUS INFORMATION RETRIEVAL IN TWO OR MORE LANGUAGES.

    المؤلفون: Андоновски, Јелена С.1 andonovski@unilib.rs

    المصدر: Bibliotekar (0006-1816). 2021, Vol. 63 Issue 1, p51-74. 24p.

    مصطلحات جغرافية: Serbia

    Reviews & Products: Republic, The (Book : Plato)

    Abstract (English): Aligned multilingual corpora have become essential resources in multilingual Natural Language Processing (NLP) in the last decades, as well as one of the major resources for researchers in various areas of linguistics and related language disciplines. Parallel corpora are language corpora that contain a collection of one or more original texts in one language and their translations into one or more other languages. Original texts and their translations are aligned at some level of text divisions (e.g. sentence, paragraph, and chapter level). In most cases, parallel corpora contain texts in only two languages but also there are examples of one-language parallel corpora containing a collection of different editions of the same text in one language. In Serbia, JeRTeh, Language Resources and Technologies Society (former Group for Language Technologies) has been developing parallel corpora containing Serbian texts for decades. Until today, JeRTeh has developed: Serbian-French aligned corpus (SrpFranKor) and Serbian-English aligned corpus (SrpEngKor), digital library Biblisha with several parallel collections, and multilingual edition Multilingual Vern. In addition, corpora texts in the Serbian language are part of multilingual parallel corpora Plato’s Republic and Orwell’s 1984 developed during the international projects, as well as part of some corpora developing now in the region and the world. This paper presents corpora developed by Group for Language Technologies, their structure and purpose, as well as possibilities for information retrieval in them. [ABSTRACT FROM AUTHOR]

    Abstract (Serbian): Паралелни корпуси представљају врсту вишејезичних корпуса који су последњих деценија постали изузетно значајни у области обраде природних језика (енгл. Natural Language Processing – NLP) и један од важнијих ресурса за ис-траживаче у различитим областима лингвистике и сродним језичким дисципли-нама. Под паралелним корпусима подразумевају се језички корпуси који садрже један текст или више оригиналних текстова и њихове преводе на један језик или више језика, поравнате на једном нивоу или више структурних нивоа текста (на пример, на нивоу реченице, пасуса и одељка). Они су најчешће двојезични, али није ретко да постоје и на једном језику што подразумева да корпусни садржај чине различита издања истог текста на одабраном језику. Паралелне корпусе који обухватају српски језик у Србији развија Група за језичке технологије која је у међувремену прерасла у Друштво за језичке ресурсе и технологије – ЈеРТех. До данас су развијени следећи корпуси: два већа корпуса, српско-француски (Срп-ФранКор) и српско-енглески (СрпЕнгКор) корпус, затим, дигитална библиотека Библиша која садржи више паралелних двојезичних колекција и вишејезична ко-лекција Вишејезични Верн. Поред ових корпуса текстови на српском језику део су и вишејезичних корпуса Платонова Република и Орвелова 1984 који су развијени у оквиру међународних пројеката, али и неких корпуса који се тренутно развијају у региону и свету. У раду ће бити приказани корпуси које развија Друштво за језичке ресурсе и технологије, њихова структура и намена, као и могућности за проналажење информација у њима. [ABSTRACT FROM AUTHOR]