Pengembangan Vector Space Model Pada Pengukuran Kemiripan Publikasi Ilmiah

stephanie betha hersianie(1*)

(1) Universitas Wiralodra
(*) Corresponding Author

Sari


Publikasi ilmiah dapat mengandung lebih dari satu topik atau kategori bidang penelitian. Identifikasi topik atau bidang penelitian dapat dilihat hanya dari membaca judul publikasi ilmiah tersebut. Namun, judul publikasi ilmiah tidak dapat digunakan untuk menentukan kemiripannya dengan kategori bidang penelitian tertentu karena judul publikasi ilmiah belum tentu dapat mencerminkan bidang penelitiannya. Hal ini membuat pencarian judul publikasi ilmiah yang dilakukan oleh penulis jurnal menjadi kurang efektif. Kemiripan publikasi ilmiah dengan kategori bidang penelitiannya dapat ditentukan menggunakan Vector Space Model. Permasalahan  pertama yang terjadi adalah skema pembobotan TFIDF pada Vector Space Model tidak dapat diimplementasikan pada penelitian ini. Penyebabnya adalah skema tersebut belum dapat mewakili kategori bidang penelitian.  Selain itu, matriks pembobotan TFIDF juga memerlukan penyesuaian kolom untuk memproses dataset yang berjumlah besar. Permasalahan  kedua yaitu pengukuran kemiripan dokumen antara query dengan panjang vektor dokumen. Panjang vektor dokumen pada penelitian sebelumnya diperoleh dari jumlah kata yang ada pada suatu dokumen.   Sedangkan pada penelitian ini dibutuhkan pengukuran kemiripan dokumen yang berupa judul publikasi ilmiah dengan kategori bidangnya.  Oleh karena itu, penelitian ini bertujuan untuk mengembangkan Vector Space Model dalam mengukur kemiripan judul publikasi ilmiah dengan kategori bidang penelitiannya. Penelitian ini menghasilkan nila rata-rata recall sebesar 89,7 % dan presisi sebesar 90%.

 

Keyword : Vector Space Model,Pembobotan TFIDF, Publikasi Ilmiah


Teks Lengkap:

PDF

Referensi


Sejati, FB dkk,“Deteksi Plagiarisme Karya Ilmiah dengan Pemanfaatan Daftar Pustaka Dalam Pencarian Kemiripan Tema Menggunakan Cosine Similarity”, Jurnal Komtika. ,Vol.2 No.2, hal.85-94, 2019.

Betha, Stephanie, “Penentuan Multimembership Dokumen”, Majalah Ilmiah Unikom, Vol.15 No.2, hal.211-220, 2017.

Fauziah, Siti dkk, Optimasi Algoritma Vector Space Model Dengan Algoritma K- Nearest Neighbour Pada Pencarian Judul Artikel Ilmiah, Jurnal PILAR Nusa Mandiri, Vol.15 No.1, hal.21-26.

Sekarwati dkk, “Pengukuran Kemiripan Dokumen Menggunakan Tools Gensim ”, Prosiding SNST ke-6, 2015.

Yisti, V dan Retno, M, “Deteksi Kemiripan Dokumen Publikasi Skripsi Mahasiswa Menggunakan Algoritma Modifikasi Cosine Similarity “, JIEET, Volume 03 Nomor 02, 2019.

Eva dkk, “A Comparison of Vector Space Model Method and Winnowing Algorithm to Measure the Similarity of Documents”, The 5 th International Conference on Information Technology and Bussiness, 2019.

Sharma, A, “Information System using Word2vec based Vactor Space Model “, Internet: https://www.analyticsvidhya.com/blog/2020/08/information-retrieval-using-word2vec-based-vector-space-model/, 2020 [Oct 15, 2021].

Dedi dkk, “Implementasi Algoritma Cosine Similarity pada Sistem Arsip Dokumen di Universitas Islam Sultan Agung”, TRANSFORMTIKA, Vol.17 No.2, pp. 124 – 132, 2020.

Aziz, Abdul dan Bayu, Indra, “Implementasi Vector Space Model dalam Pencarian Dokumen”, Prosiding Seminar Nasional Matematika dan Pendidikan Matematika, 2013.

Amburika dkk, “Teknik Vector Space Model Dalam Penentuan Penanganan Dampak Game Online pada Anak”, Prosiding Prosiding SNST ke-7, 2016.

Aditya, Christian dan Nastiti, Vinna,” Sistem Temu Kembali Buku Hadist Menggunakan Pembobotan Term Frequency Inverse Document Frequency dan Cosine Similarity”, Seminar Nasional Teknologi dan Rekayasa (SENTRA), eISSN (Online) 2527-6050, 2019.

Anna dan Hendini,Ana, “Implementasi Vector Space Model Pada Sistem Pencarian Karoke”, Jurnal Evolusi, Vol. 6 No.1, 2018.

Kartina, Linda dkk, “Efektivitas Sistem Temu Kembali Informasi Online Public Access atalog (OPAC) Dengan Tinjauan Precision Menggunakan Pendekatan Judul dan Subjek di Perpustakaan Universitas Muhammadiyah Bengkulu”, Pustaloka : Jurnal Kajian Informasi dan Perpustakaan”,Vol.11 No.2.2019.

Nengsih, Warnia, “Analisa Recall dan Precision Menggunakan VSM pada Text Mining”, InfoTekJar : Jurnal Nasional dan Teknologi Jaringan, Vol.5 No.1, 2020.




DOI: http://dx.doi.org/10.31602/tji.v13i2.6471

Refbacks

  • Saat ini tidak ada refbacks.


© 2019 Technologia   p-ISSN: 2086-6917    e-ISSN: 2656-8047

-------------------------------------------------------------------------------------------

This work is licensed under a Creative Commons Attribution 4.0 International License.