NAZIEF-ADRIANI STEMMER DENGAN IMBUHAN TAK BAKU PADA NORMALISASI BAHASA PERCAKAPAN DI MEDIA SOSIAL

التفاصيل البيبلوغرافية
العنوان: NAZIEF-ADRIANI STEMMER DENGAN IMBUHAN TAK BAKU PADA NORMALISASI BAHASA PERCAKAPAN DI MEDIA SOSIAL
المؤلفون: Sebastianus A. S. Mola, Adriana Fanggidae, Katarina N. Lakonawa
المصدر: J-ICON : Jurnal Komputer dan Informatika; Vol 9 No 1 (2021): March 2021; 65-73
J-ICON : Jurnal Komputer dan Informatika; Vol 9 No 1 (2021): Maret 2021; 65-73
بيانات النشر: Universitas Nusa Cendana, 2021.
سنة النشر: 2021
مصطلحات موضوعية: Statistics, Word usage, Mean reciprocal rank, Word (group theory), Mathematics
الوصف: The use of non-standard language is increasingly prevalent in communication on social media. The use of indefinite language is not limited to sentences, clauses, or phrases but also word usage. In this study, the nonstandard word (NSW) will be normalized to the Indonesian standard word (SW). The Nazief-Adriani stemmer (NAS) method was developed into a nonstandard stemmer (NSS) by increasing its ability to detect non-standard additives. The Needleman-Wunsch similarity algorithm is used to weight the matches. The test results with the Mean Reciprocal Rank (MRR) of 3,438 NSW found that the use of NSS with the number of queries = 9 (Q = 9) had the highest of 79.26% with an average of 50.48%. Meanwhile, MRR testing using NAS with Q = 9 got the highest result of 72.87% and an average of 47.23%. Of the two MRR tests carried out, there were 3 letters that had the highest stemming results, both in tests using NAS and using NSS, namely the initial letters r, f and j. The most significant increase in MRR value occurs in the initial letters 'd', 'n' and 't' which are the initial letters of some non-standard affixes.
Penggunaan bahasa tak baku semakin marak dalam komunikasi di media sosial. Penggunaan bahasa tak baku tidak terbatas pada kalimat, klausa, atau frasa saja namun juga pada penggunaan kata. Pada penelitian ini, akan dilakukan normalisasi kata yang tak baku/ nonstandard word (NSW) tersebut ke kata baku/ standard word (SW) Bahasa Indonesia. Metode stemmer Nazief-Adriani (Nazief-Adriani stemmer (NAS)) dikembangkan menjadi nonstandard stemmer (NSS) dengan meningkatkan kemampuannya untuk mendeteksi imbuhan tak baku. Tujuan penelitian ini adalah membandingkan penggunaan NAS dan NSS dalam normalisasi NSW. Algoritma kemiripan Needleman-Wunsch digunakan untuk membobot hasil pencocokan. Hasil pengujian dengan Mean Reciprocal Rank (MRR) pada sebanyak 3.438 NSW didapatkan penggunaan NSS dengan jumlah kueri = 9 (Q=9) memiliki tertinggi sebesar 79.26% dengan rata-rata sebesar 50.48%. Sedangkan pengujian MRR menggunakan NAS dengan Q=9 mendapatkan hasil tertinggi sebesar 72.87% dan rata-rata sebesar 47.23%. Dari dua pengujian MRR yang dilakukan, ada 3 huruf yang memiliki hasil stemming tertinggi, baik dalam pengujian menggunakan NAS maupun menggunakan NSS yaitu huruf awal r, f dan j. Peningkatan nilai MRR paling signifikan terjadi pada huruf awal ‘d’, ‘n’ dan ‘t’ yang merupakan huruf awal dari sebagian imbuhan tak standar.
وصف الملف: application/pdf
تدمد: 2654-4091
2337-7631
DOI: 10.35508/jicon.v9i1
URL الوصول: https://explore.openaire.eu/search/publication?articleId=doi_dedup___::a15255b2e39127bf9d2f7a164577e1ba
https://doi.org/10.35508/jicon.v9i1.3749
حقوق: OPEN
رقم الأكسشن: edsair.doi.dedup.....a15255b2e39127bf9d2f7a164577e1ba
قاعدة البيانات: OpenAIRE
الوصف
تدمد:26544091
23377631
DOI:10.35508/jicon.v9i1