بررسی دعاهای صحیفه سجادیه از منظر روش های متن کاوی

نوع مقاله : علمی- پژوهشی

نویسندگان

1 دکترای تخصصی آمارزیستی ، استادیار ( استاد مدعو)، دانشکده بیمه اکو، دانشگاه علامه طباطبائی، تهران، ایران

2 گروه آمارزیستی، دانشکده پیراپزشکی، دانشگاه علوم پزشکی شهیدبهشتی، تهران، ایران

چکیده

اهداف: مطالعات زیادی با استفاده از روش های متن کاوی به بررسی الگوهای نهفته، کلمات پرتکرار، مقایسه آثار، بررسی اصل بودن متن کتاب های معروف در علوم مذهبی مانند قرآن کریم، کتاب مقدس یا ادبیات کلاسیک مانند آثار شعرای بنام فارسی، آثار ویلیام شکسپیر، یوهان ولفگانگ فون گوته و ... انجام شده است. در این میان، صحیفه سجادیه منسوب به امام علی-بن-الحسین زین‌العابدین (ع) ، یکی از شناخته شده ترین منابع مطالعاتی در علوم شیعی پیرامون دعاست. اما تا کنون، مطالعه ی متن کاوی در این متن صورت نگرفته است و این تحقیق اولین گام در این راستاست.

روش ها: ابتدا تمام 54 دعاهای این متن از کتاب ها و اینترنت استخراج شده است و سپس برای تحلیل آماده سازی شده اند. با استفاده از نرم افزار R لغات هر دعا تفکیک شده است و آمارهای توصیفی، شبکه متن دعاها و کلمات، ابرکلمات و خوشه بندی براساس محتویات آنها انجام شده است.

یافته ها: در مجموع 15,881 واژه تشخیص داده شد که عبارت های "اللهم" ، "محمد"، "اله"، "صل"و "کل" به تفکیک دارای بیشترین تکرار برابر 285، 239، 208 و 144 مورد بود و به همراه سایر کلمات به صورت ابر کلمات نشان داده شده است. همچنین، ابر کلمات به تفکیک هر دعا ، در ضمیمه رسم شده اند. آمارهای توصیفی، خوشه بندی دعاها و شبکه متنی آنها نیز براورد شده است.

نتایج: این تحقیق به بررسی ساختار دعاها با چند روش می پردازد. همچنین، به بررسی محتوایی آنها با موضوع های مرتبط با بیمه، مثال هایی ارائه می کند.

کلیدواژه‌ها


Studying the al-Sahifa al-Sajjadiyya Supplications with the Text Mining Methods

 Nezhat Shakeri[1] , Mohammad Fayaz[2] *

 

Abstract

Many studies using text mining methods to investigate hidden patterns, frequent words, comparison purposes, checking the originality of the text of famous books in religious sciences such as the Holy Quran, the Holy Bible or classical literature such as the works of Persian poets, the works of William Shakespeare, Johann Wolfgang von Goethe and ... have been done. In the meantime, the al-Sahifa al-Sajjadiyya Supplications attributed to Imam Ali ibn Husayn Zayn al-Abidin (AS) is one of the most well-known sources of studies in Shiite sciences about prayer. But so far, the text mining study has not been done in this text and this work examines a descriptive method called world cloud in these prayers. This is the first step for further research in this field. First, all 54 prayers of this text were extracted from books and the internet, and then they were prepared for analysis. The words of each prayer have been separated with R and their descriptive statistics, text and word networks, word clouds and clustering based on them are conducted. A total of 15,881 words were recognized. The words "Allahomma", "Muhammad", "Allah", "Sal" and "Kol" had the highest frequency of 285, 239, 208 and 144 respectively, and together with other words, the word cloud is shown. Also, word cloud for each prayer are drawn in the appendix separately. The descriptive statistics, clustering and text networks are estimated. This research examines the patterns of repetition of words in each prayer. It also presents some related examples with the insurance subjects. The limitations and future directions of this work in developing the text mining and data analysis methods are pointed out.

Keywords: al-Sahifa al-Sajjadiyya, Text Mining, Word Cloud, R Language

 

[1]-Department of Biostatistics, School of Allied Medical Sciences, Shahid Beheshti University of Medical sciences, Tehran, nezhat2000@yahoo.com

[2]-PhD in Biostatistics, Assistant Professor (Visiting Professor), ECO College of Insurance, Allameh Tabataba'i University, Mohammad.Fayaz.89@gmail.com

  • منابع

    • Alhawarat, M., Hegazi, M., & Hilal, A. (2015). Processing the text of the Holy Quran: a text mining study. International Journal of Advanced Computer Science and Applications, 6(2), 262-267.
    • Elmitwally, N. S., & Alsayat, A. (2020). The multi-class classification for the first six surats of the Holy Quran. International Journal of Advanced Computer Science and Applications, 11(1).
    • Jang, D. H. (2014). English Bible Text Visualization Using Word Clouds and Dynamic Graphics Technology. The Korean Journal of Applied Statistics, 27(3), 373-386.
    • Ohge, C., Olsen-Smith, S., Smith, E. B., Brimhall, A., Howley, B., Shanks, L., & Smith, L. (2018). At the Axis of Reality: Melville's Marginalia in The Dramatic Works of William Shakespeare. Leviathan, 20(2), 37-67.
    • Barth, F., Kim, E., Murr, S., & Klinger, R. (2018). A reporting tool for relational visualization and analysis of character mentions in literature. In DHd 2018-University of Cologne.
    • Elyasi, N., & Moghadam, M. H. (2019). An introduction to a new text classification and visualization for natural language processing using topological data analysis. arXiv preprint arXiv:1906.01726.
    • Akef, S., & Bahrani, M. Fine-Tuning BERT for Persian Poet Identification.
    • ویلیام سی چیتیک، الصحیفه الکامله السجادیه (عربی-انگلیسی)، انتشارات انصاریان، شابک 13 رقمی 9789644382420، سال 1384
    • Charrad M, Ghazzali N, Boiteau V, Niknafs A. NbClust: an R package for determining the relevant number of clusters in a data set. Journal of statistical software. 2014 Nov 3;61:1-36.
    • Wickham H. ggplot2. Wiley interdisciplinary reviews: computational statistics. 2011 Mar;3(2):180-5.
    • Nielsen, Rich, and Maintainer Rich Nielsen. "Package ‘arabicStemR’." (2017).
    • Lang, D., Chien, G. T., LazyData, T. R. U. E., & Lang, M. D. (2018). Package ‘wordcloud2’.
    • Dowle, M., Srinivasan, A., Gorecki, J., Chirico, M., Stetsenko, P., Short, T., ... & Tan, X. (2019). Package ‘data. table’. Extension of ‘data. frame.
    • Eder, Maciej, Jan Rybicki, Mike Kestemont, and Maintainer Maciej Eder. "Package ‘stylo’." (2015).
    • Bail, Chris, Graph-Based Automated Text Analysis, Package ‘textnets’, (2023), https://github.com/cbail/textnets

     

    • پژوهشکده بیمه، اصول، مقررات و رشته­های بیمه (دو جلد)، انتشارات پژوهشکده بیمه، شابک 9786226814171، سال 1401، چاپ یازدهم