FUZZY STRING MATCHING DAN WORD EMBEDDING UNTUK EFEKTIFITAS PENCARIAN JURNAL PADA PERPUSTAKAAN

RIYADHO, ARIF (2019) FUZZY STRING MATCHING DAN WORD EMBEDDING UNTUK EFEKTIFITAS PENCARIAN JURNAL PADA PERPUSTAKAAN. S1 thesis, Universitas Mercu Buana Jakarta.

[img] Text (JURNAL MAHASISWA)
41514120099 ARIF RIYADHO.pdf
Restricted to Registered users only

Download (1MB)

Abstract

The purpose of this research are to explain the process of journals searching and display recommendations for other journals that have relevance to journals from the search result. Search engine algorithms applied to the current web library only match input words with existing word databases using exact methods, find the exact same word. If you find the similar word, it will be displayed as a result, but if there are no similar words then the result is empty. Mistake while entering the word is one of the causes of the results not found. With this research, it is expected to be able to create a web-based search engine in the library that will make it easier for someone to search and find the desired journal even though there are errors in entering the key word. And also provide other journal recommendations that still have relevance to the selected journal. For the search process using Levenshtein Distance algorithm, in the recommendation system uses the Doc2Vec algorithm. The Levenshtein Distance algorithm used to looking for the similarity of words based on similarity weights, and the Doc2Vec algorithm will look for proximity between documents based on the closest vector. Keywords : Fuzzy String Matching, FuzzyWuzzy, Levenshtein Distance, Word Embedding, Doc2Vec, Word2Vec Penelitian Tugas Akhir ini dilakukan untuk menjelaskan proses pencarian suatu jurnal dan juga menampilkan rekomendasi jurnal-jurnal lain yang mempunyai keterkaitan dengan jurnal dari hasil pencarian tersebut. Algoritma mesin pencari yang diterapkan pada web perpustakaan saat ini hanya mencocokan kata masukan dengan database kata yang ada dengan metode mencari kata yang sama persis. Jika menemukan kata yang sama, maka akan ditampilkan sebagai hasil, namun jika tidak ada kata yang sama maka hasilnya adalah kosong. Kesalahan dalam memasukan kata merupakan salah satu penyebab dari hasil tidak diketemukan tersebut. Dengan penelitian ini diharapkan dapat dibuat sebuah mesin pencari berbasis web di perpustakaan yang akan memudahkan seseorang untuk mencari dan menemukan jurnal yang diinginkan walaupun terdapat kesalahan dalam memasukan kata. Dan juga memberikan rekomendasi jurnal lain yang masih mempunyai keterkaitan dengan jurnal yang dipilih. Untuk proses pencarian digunakan algoritma Levenshtein Distance, sedangkan dalam sistem rekomendasi menggunakan algoritma Doc2Vec. Algoritma Levenshtein Distance digunakan untuk mencari kemiripan kata berdasarkan bobot similarity, sedangkan algoritma Doc2Vec akan mencari kedekatan antar dokumen berdasarkan vektor yang terdekat. Kata kunci : Fuzzy String Matching, FuzzyWuzzy, Levenshtein Distance, Word Embedding, Doc2Vec, Word2Vec

Item Type: Thesis (S1)
Call Number CD: JM/TI. 19 240
NIM/NIDN Creators: 41514120099
Uncontrolled Keywords: Fuzzy String Matching, FuzzyWuzzy, Levenshtein Distance, Word Embedding, Doc2Vec, Word2Vec
Subjects: 000 Computer Science, Information and General Works/Ilmu Komputer, Informasi, dan Karya Umum > 000. Computer Science, Information and General Works/Ilmu Komputer, Informasi, dan Karya Umum > 005 Computer Programmming, Programs, Data/Pemprograman Komputer, Program, Data > 005.5 General Purpose Application Programs/Program Aplikasi dengan Kegunaan Khusus
600 Technology/Teknologi > 650 Management, Public Relations, Business and Auxiliary Service/Manajemen, Hubungan Masyarakat, Bisnis dan Ilmu yang Berkaitan > 658 General Management/Manajemen Umum > 658.01-658.09 [Management of Enterprises of Specific Sizes, Scopes, Forms; Data Processing]/[Pengelolaan Usaha dengan Ukuran, Lingkup, Bentuk Tertentu; Pengolahan Data]
600 Technology/Teknologi > 650 Management, Public Relations, Business and Auxiliary Service/Manajemen, Hubungan Masyarakat, Bisnis dan Ilmu yang Berkaitan > 658 General Management/Manajemen Umum > 658.01-658.09 [Management of Enterprises of Specific Sizes, Scopes, Forms; Data Processing]/[Pengelolaan Usaha dengan Ukuran, Lingkup, Bentuk Tertentu; Pengolahan Data] > 658.05 Data Processing Computer Applications/Pengolahan Data Aplikasi Komputer
Divisions: Fakultas Ilmu Komputer > Informatika
Depositing User: Dede Muksin Lubis
Date Deposited: 01 Sep 2022 02:17
Last Modified: 01 Sep 2022 02:17
URI: http://repository.mercubuana.ac.id/id/eprint/68720

Actions (login required)

View Item View Item