دورية أكاديمية

در علم اطالعات و دانش‌شناسی با استفاده از...

التفاصيل البيبلوغرافية
العنوان: در علم اطالعات و دانش‌شناسی با استفاده از... (Arabic)
Alternate Title: Identification of Hot Topics and Trends in Knowledge and Information Science, based on Text Mining Techniques. (English)
المؤلفون: الهه اخوان حریری, علی منصوری, حسین کارشناس نجف
المصدر: Iranian Journal of Information Processing & Management; Winter2023, Vol. 38 Issue 2, p35-62, 32p
مصطلحات موضوعية: KNOWLEDGE management, INFORMATION science, TECHNOLOGICAL innovations, DATABASES, TEXT mining, PYTHON programming language
Abstract (English): Identification of hot topics in research areas has always been of interest. Making smart decisions about what is needed to be studied is always a fundamental factor for researchers and can be challenging for them. The goal of this study is to identify hot topics and thematic trend analysis of articles indexed in Scopus database in the field of Knowledge and Information Science (KIS), between 2010 and 2019, using Text Mining techniques. The population consists of 50995 articles published in 249 journals indexed in Scopus database in the field of KIS from 2010 to 2019. To identify thematic clusters, algorithms of Latent Dirichlet Allocation (LDA) technique were used and the data were analyzed using libraries in Python software. To do this, by implementing the word weighting algorithm, using the TF-IDF method, and weighting all of the words and forming a text matrix, the topics in the documents and the coefficients for assigning each document to each topic (theta) were determined. The output of the LDA algorithm led to the identification of the optimal number of 260 topics. Each topic was labeled based on the words with the highest weight assigned to each topic and with considering of experts’ opinions. Then, Topic clustering, keywords and topics identification were done. By performing calculations with 95% confidence, 63 topics were selected from 260 main topics. By calculating the average theta in years, 24 topics with a positive trend or slope (hot topic) and 39 topics with a negative trend or negative slope (cold topic) were determined. According to the results, measurement studies, e-management/ e-marketing, content retrieval, data analysis and e-skills, are considered as hot topics and training, archive, knowledge management, organization and librarians’ health, were identified as cold topics in the field of KIS, in the period 2010 to 2019. The analysis of the findings shows that due to the interest of the most researchers in the last 10 years in using of emerging technologies, technology-based topics have attracted them more. In contrast, basic issues are less considered to be developed. [ABSTRACT FROM AUTHOR]
Abstract (Arabic): شناســایی موضوعــات داغ در حوزههــای پژوهشــی همــواره مــورد توجــه بــوده اســت. تصمیمگیــری هوشــمندانه در مــورد آنچــه بایــد مــورد مطالعــه قــرار گیــرد، همــواره عاملــی اساســی بــرای محققــان بــوده و میتوانــد بــرای پژوهشــگران موضوعــی چالشبرانگیــز باشــد. هــدف پژوهــش حاضــر شناســایی موضوعــات داغ در مقــاالت نمایهشــده در پایــگاه »اســکوپوس« در حــوزة علــم اطالعــات و دانششناســی در ســالهای 2010 تــا 2019 بــا اســتفاده از تکنیکهـای متـنکاوی اسـت. جامعـة آمـاری شـامل 50995 مقالـة منتشرشـده در 249 عنـوان مجلـة نمایهشـده در پایـگاه »اسـکوپوس« در ایـن حـوزه در بـازة زمانـی 2010 تـا 2019 اسـت. بـرای شناسـایی خوشـههای موضوعـی ایـن حـوزه از الگوریتمهــای تکنیــک تخصیــص »دیریکلــت پنهــان« )LDA )اســتفاده شــد و دادههــا بــا اســتفاده از کتابخانههــای متــنکاوی در نرمافــزار »پایتــون« مــورد تحلیــل قــرار گرفــت. بــرای ایــن کار بــا اجــرای الگوریتــم وزندهــی لغــات بــه روش IDF-TF و تشــکیل ماتریــس متنــی، موضوعــات در پیکــرة اســناد تعییــن و ضرایــب اختصــاص هــر ســند بــه هــر موضــوع )تتــا( مشــخص شــد. خروجــی اجـرای الگوریتـم LDA منجـر بـه شناسـایی تعـداد 260 موضـوع شـد. تخصیـص برچســب بــه هــر یــک از خوشــههای موضوعــی بــر اســاس کلمــات بــا باالتریــن وزن اختصاصیافتــه بـه هـر موضـوع و بـا نظـر کارشناسـان حـوزة موضوعـی انجـام گرفـت. بـا انجـام محاسـبات بـا ضریـب اطمینـان 95 درصـد، تعـداد 63 موضـوع از بیـن 260 موضـوع اصلـی انتخـاب شـد. بـا محاسـبة میانگیـن تتــا بــر حســب ســال، تعــداد 24 موضــوع دارای رونــد مثبــت )موضــوع داغ( و تعــداد 39 موضــوع دارای رونــد منفــی )موضــوع ســرد( تعییــن شــد. بــر اســاس نتایــج، موضوعــات مطالعــات سنجشــی، مدیریـت الکترونیـک/ بازاریابـی الکترونیـک، بازیابـی محتـوا، تحلیـل داده و مهـارت الکترونیـک، از جملـه موضوعـات داغ بـود و موضوعـات آمـوزش، آرشـیو، مدیریـت دانـش، سـازماندهی و سـامت کتابـداران از جملـه موضوعـات سـرد در حـوزة علـم اطالعـات و دانششناسـی در بـازة زمانـی 2010 تـا 2019 شناسـایی شـد. تحلیـل یافتههـا نشـانگر آن اسـت کـه بهدلیـل رویکـرد اغلـب پژوهشـگران در 10 سـال گذشـته بـه اسـتفاده از فناوریهـای نوپدیـد، موضوعـات مبتنـی بـر فنـاوری بیشـتر باعـث جـذب آنـان شـده و در مقابـل، موضوعـات پایـهای ایـن حـوزه کمتـر مـورد توجـه قـرار گرفتهانـد. [ABSTRACT FROM AUTHOR]
Copyright of Iranian Journal of Information Processing & Management is the property of Iranian Information & Documentation Center (IRANDOC) and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
قاعدة البيانات: Supplemental Index