Selasa, 15 Januari 2019

Softskill Jurnal "Semantic Similarity between Documents Using Tree View Ontology"


Semantic Similarity between
Documents Using Tree View Ontology
(Kesamaan Semantik antara
Dokumen Menggunakan Tree View Ontology)





Kelompok 17 :
Daniel Pardamean (51416700)
Halit Triwanda (58416167)
Ricky Mazaya (56416321)


Abstrak

Dalam lingkungan hari ini sebagian besar mesin pencari web didasarkan pada pemeriksaan semantik yang memberikan bantuan untuk mengetahui dokumen yang bermakna dari web. Mereka umumnya mengandalkan pencocokan kata kunci sambil mengembalikan dokumen sebagai respons terhadap permintaan pengguna. Ada banyak dokumen yang saling terkait dengan cara semantik. Dokumen-dokumen ini secara semantik sama. Maka pencocokan kata kunci tidak memberikan hasil yang tepat untuk mengembalikan dokumen yang hampir sama secara semantik ini sebagai tanggapan terhadap permintaan pengguna.

Makalah ini mengusulkan metode baru untuk menemukan kesamaan dokumen semantik berdasarkan ontologi tampilan pohon. Relasi ditingkatkan dengan menggunakan istilah yang relevan dan menghitung fraksi dari relasi ini berdasarkan tampilan pohon. Dalam makalah ini kami memberikan hasil kinerja di antara metode yang berbeda yang menunjukkan lebih baik dari skema yang diusulkan.

Inti Jurnal

Pendahuluan


Umumnya dokumen dikatakan sama jika mereka diperkirakan akan menyampaikan ide yang sama atau subjek dan sinonim ini memeriksa dari kata ke kata kemudian kalimat kalimat dan akhirnya untuk mendokumentasikan untuk mendokumentasikan. Tapi dalam kasus tidak ada yang sinonim hadir antara kedua dokumen. ”Hubungan” kata menunjukkan jika kedua dokumen memberikan informasi tentang subjek yang sama atau subjek yang terkait dalam beberapa cara. Menggunakan ontologi kita dapat meningkatkan rute dengan penambahan konsep yang tidak hadir dalam dokumen. Sinonim dapat digunakan untuk ekspansi paralel dan ekspansi vertikal untuk subclass.

Makalah ini mengatur ontologi di pohon tampilan format untuk menghitung kesamaan. Metode ini akan memberikan kesamaan semantik menggunakan tampilan pohon ontologis yang akan menciptakan melalui beberapa perangkat tambahan di tapak.

Model Kesamaan Binary

Model ini berdasarkan termasuk kata-berbasis, kata kunci berbasis dan n-gram ukuran untuk memeriksa kesamaan. Model ini mudah tetapi tidak begitu banyak konsisten karena berdasarkan kesamaan eksterior tidak pada kesamaan semantik. Hal ini tidak begitu banyak yang sesuai pada waktu itu ketika bahasa alami' orang menyampaikan pendapat yang sama mereka melalui kata-kata yang berbeda.

Model kesamaan LSA

Model analisis Semantic laten didasarkan pada fungsi pembobotan lokal dan global. fungsi pembobotan ini digunakan untuk menghasilkan representasi corpus tertimbang dan dikenakan dekomposisi nilai singular.

Metode Diusulkan

Ontologi disebut kosakata yang menggambarkan domain yang menarik dan menentukan arti dari istilah yang digunakan dalam spesifik kosakata.Kami menggunakan tampilan struktur pohon ontologi bersama dengan kesamaan.Memeriksa pada setiap simpul akar sepanjang jalan. Jadi kita memberikan nama dari kesamaan biner, model kesamaan LSA, hitung kesamaan dan model kesamaan ontologi berbasis. Metode berbasis ontologi yang ada biasanya didasarkan pada metode ini adalah kesamaan semantik menggunakan tampilan pohon ontologi.

Ontologi Tree View

Tujuan utama kami adalah untuk memeriksa berapa banyak kesamaan terjadi antara dua atau lebih dokumen. Kami memilih disimpan dokumen dan dokumen lainnya yang memasukkan dokumen untuk perbandingan. Kami akan membuat ontologi tampilan pohon untuk kedua dokumen untuk perbandingan yang dibuat di tingkat ke tingkat dan ditingkatkan baik tampilan pohon melalui referensi mereka kata domain. Beberapa langkah yang terlibat untuk menghitung kesamaan semantik berdasarkan tampilan struktur pohon ontologis. Langkah-langkah ini:
·      >>> Menyediakan baik dokumen yang ada di tingkat pertama.
·      >>> Terapkan NLP parser dan prosedur penghapusan stopword.
·      >>> Perbandingan dimulai dari root (Pertama menerapkan metode pencocokan kata kunci dan jika      
          akan  ada kegagalan pencocokan kata kunci kemudian memeriksa dengan kesamaan 
          semantik). Jika simpul akar doc disimpan tidak akan cocok dengan simpul akar Doc masukan 
          maka akar Doc disimpan akan diperiksa oleh node di sublevel di masukan Doc dan kami akan 
          mengulang semua iterasi sampai semua node akan selesai atau tidak cocok akan terjadi 
          sebagai hasilnya. Dalam kasus tidak ada yang cocok ditemukan kita dapat 
          mengatakan bahwa tidak ada kesamaan hadir.






Penilaian

Untuk mengevaluasi kinerja metode yang diusulkan pada kesamaan semantik, beberapa eksperimen dilakukan. Hasil set berdasarkan persentase mendapatkan dari metode yang berbeda. Metode ini menggunakan model ruang vektor untuk menghitung kesamaan antara dokumen. Persentase yang tinggi menunjukkan hasil yang efisien yang diberikan dengan metode yang diusulkan.

Percobaan Hasil

       Dalam sistem yang asli, kita memiliki dua dokumen tergantung pada pemilihan pengguna untuk pemetaan kesamaan semantik berdasarkan tampilan struktur pohon ontologi. Kami sekarang meneliti hasil yang dihasilkan oleh metode yang berbeda. Pertama kata kunci metode pencocokan memberikan hasil ketika ada perbandingan antara kedua dokumen. Hasilnya adalah 4 persen dalam hal ini yang ditentukan oleh sistem yang diterapkan. Metode kedua adalah semantik kesamaan yang didasarkan pada kata-kata semantik. Pengecekan kata semantik dilakukan melalui WordNet yang berisi banyak sinonim dari setiap kata yang ada dalam dokumen. Metode ini memberikan hasil yang lebih baik dibandingkan dengan metode pencocokan kata kunci. Metode ini memberikan hasil persen 6 dalam output yang lebih baik daripada pencocokan kata kunci.


Sekarang metode yang diusulkan semantik kesamaan didasarkan pada pandangan pohon ontologi memberikan hasil yang lebih baik dibandingkan dengan kedua metode menunjukkan efisiensi. Ini memberikan hasil yang lebih baik setelah menggunakan atribut tambahan yang diakui sebagai istilah-istilah yang menciptakan hubungan antara kedua dokumen dengan melihat pada kedua dokumen bekerja sebagai ontologi. Metode ini menunjukkan hasil tertinggi yaitu 12 persen.


Kesimpulan

Makalah ini mengusulkan sebuah metode yang mengubah dokumen dalam ontologi pribadi. Berikut ontologi menunjukkan bahwa ada hubungan yang menyajikan antara dokumen dalam realitas atau tidak. Perbandingan dari semua metode menunjukkan bahwa metode yang diusulkan memberikan hasil kemiripan tertinggi. Hal ini memberikan hasil yang lebih baik dalam hal jika ada ada hubungan jika tidak ada hasil yang lebih baik daripada metode lainnya.

Pekerjaan Mendatang

Dalam hal ini kita akan membuat tampilan struktur pohon dan membandingkannya dengan simpul akar dengan metode ruang vektor dan menemukan beberapa kesamaan antara dokumen. Tapi kita akan melakukannya dengan menggunakan kata-kata domain mencari tahu melalui pohon parsing. analisisnya dapat dibuat mudah jika kita akan menggunakan beberapa alat untuk tampilan pohon di masa depan. Jadi kita akan menerapkan pohon pandangan ontologi dinamis secara langsung melalui kata kunci domain disimpan dan masukan file menggunakan beberapa alat sehingga kita dapat mengimpor langsung tampilan struktur pohon data dari database di masa depan.

Kelebihan

Jurnal ini berisikan materi yang sangat lengkap dari abstraksi, pendahuluan dan juga berupa penjelasan dari beberapa metode

Kekurangan

            Jurnal ini bertuliskan penjelasan yang rumit di mengerti dan bahasanya sangat bertele tele, sehingga mengurangi minat pembaca

Saran

            Menurut kami seharusnya penulis dapat menggunakan kata kata yang mudah dimengerti dan mudah di pahami agar menumbuhkan rasa minat si pembaca untuk membaca jurnal yang telah tulis

















0 komentar:

Posting Komentar