RIYADHO, ARIF (2019) FUZZY STRING MATCHING DAN WORD EMBEDDING UNTUK EFEKTIFITAS PENCARIAN JURNAL PADA PERPUSTAKAAN. S1 thesis, Universitas Mercu Buana Jakarta.
Text (JURNAL MAHASISWA)
41514120099 ARIF RIYADHO.pdf Restricted to Registered users only Download (1MB) |
Abstract
The purpose of this research are to explain the process of journals searching and display recommendations for other journals that have relevance to journals from the search result. Search engine algorithms applied to the current web library only match input words with existing word databases using exact methods, find the exact same word. If you find the similar word, it will be displayed as a result, but if there are no similar words then the result is empty. Mistake while entering the word is one of the causes of the results not found. With this research, it is expected to be able to create a web-based search engine in the library that will make it easier for someone to search and find the desired journal even though there are errors in entering the key word. And also provide other journal recommendations that still have relevance to the selected journal. For the search process using Levenshtein Distance algorithm, in the recommendation system uses the Doc2Vec algorithm. The Levenshtein Distance algorithm used to looking for the similarity of words based on similarity weights, and the Doc2Vec algorithm will look for proximity between documents based on the closest vector. Keywords : Fuzzy String Matching, FuzzyWuzzy, Levenshtein Distance, Word Embedding, Doc2Vec, Word2Vec Penelitian Tugas Akhir ini dilakukan untuk menjelaskan proses pencarian suatu jurnal dan juga menampilkan rekomendasi jurnal-jurnal lain yang mempunyai keterkaitan dengan jurnal dari hasil pencarian tersebut. Algoritma mesin pencari yang diterapkan pada web perpustakaan saat ini hanya mencocokan kata masukan dengan database kata yang ada dengan metode mencari kata yang sama persis. Jika menemukan kata yang sama, maka akan ditampilkan sebagai hasil, namun jika tidak ada kata yang sama maka hasilnya adalah kosong. Kesalahan dalam memasukan kata merupakan salah satu penyebab dari hasil tidak diketemukan tersebut. Dengan penelitian ini diharapkan dapat dibuat sebuah mesin pencari berbasis web di perpustakaan yang akan memudahkan seseorang untuk mencari dan menemukan jurnal yang diinginkan walaupun terdapat kesalahan dalam memasukan kata. Dan juga memberikan rekomendasi jurnal lain yang masih mempunyai keterkaitan dengan jurnal yang dipilih. Untuk proses pencarian digunakan algoritma Levenshtein Distance, sedangkan dalam sistem rekomendasi menggunakan algoritma Doc2Vec. Algoritma Levenshtein Distance digunakan untuk mencari kemiripan kata berdasarkan bobot similarity, sedangkan algoritma Doc2Vec akan mencari kedekatan antar dokumen berdasarkan vektor yang terdekat. Kata kunci : Fuzzy String Matching, FuzzyWuzzy, Levenshtein Distance, Word Embedding, Doc2Vec, Word2Vec
Actions (login required)
View Item |