Semantic
Similarity between
Documents
Using Tree View Ontology
(Kesamaan Semantik antara
(Kesamaan Semantik antara
Dokumen Menggunakan Tree
View Ontology)
Kelompok 17 :
Daniel Pardamean (51416700)
Halit Triwanda (58416167)
Ricky Mazaya (56416321)
Abstrak
Dalam
lingkungan hari ini sebagian besar mesin pencari web didasarkan pada
pemeriksaan semantik yang memberikan bantuan untuk mengetahui dokumen yang
bermakna dari web. Mereka umumnya mengandalkan pencocokan kata kunci sambil
mengembalikan dokumen sebagai respons terhadap permintaan pengguna. Ada banyak
dokumen yang saling terkait dengan cara semantik. Dokumen-dokumen ini secara
semantik sama. Maka pencocokan kata kunci tidak memberikan hasil yang tepat
untuk mengembalikan dokumen yang hampir sama secara semantik ini sebagai
tanggapan terhadap permintaan pengguna.
Makalah ini
mengusulkan metode baru untuk menemukan kesamaan dokumen semantik berdasarkan
ontologi tampilan pohon. Relasi ditingkatkan dengan menggunakan istilah yang
relevan dan menghitung fraksi dari relasi ini berdasarkan tampilan pohon. Dalam
makalah ini kami memberikan hasil kinerja di antara metode yang berbeda yang
menunjukkan lebih baik dari skema yang diusulkan.
Inti Jurnal
Pendahuluan
Untuk mengakses informasi yang relevan oleh pengguna web dan
mempertahankan informasi dengan mesin apapun. Hal ini karena konten web
disajikan terutama dalam bahasa alami, dan ditargetkan untuk pembaca manusia.
Namun, beberapa mesin pencari seperti Google, Yahoo dll yang digunakan oleh
pengguna untuk mengakses hasil yang diinginkan.Jenis informasi yang diinginkan
berdasarkan pengecekan kesamaan.Tepat mengukur kesamaan semantik antara dokumen
teks merupakan tantangan besar karena kesulitan dan ambiguitas semantik bahasa
alami.
Umumnya dokumen
dikatakan sama jika mereka diperkirakan akan menyampaikan ide yang sama atau
subjek dan sinonim ini memeriksa dari kata ke kata kemudian kalimat kalimat dan
akhirnya untuk mendokumentasikan untuk mendokumentasikan. Tapi dalam kasus
tidak ada yang sinonim hadir antara kedua dokumen. ”Hubungan” kata menunjukkan
jika kedua dokumen memberikan informasi tentang subjek yang sama atau subjek
yang terkait dalam beberapa cara. Menggunakan ontologi kita dapat meningkatkan
rute dengan penambahan konsep yang tidak hadir dalam dokumen. Sinonim dapat
digunakan untuk ekspansi paralel dan ekspansi vertikal untuk subclass.
Makalah ini
mengatur ontologi di pohon tampilan format untuk menghitung kesamaan. Metode
ini akan memberikan kesamaan semantik menggunakan tampilan pohon ontologis yang
akan menciptakan melalui beberapa perangkat tambahan di tapak.
Model Kesamaan Binary
Model ini berdasarkan termasuk kata-berbasis, kata
kunci berbasis dan n-gram ukuran untuk memeriksa kesamaan. Model ini mudah
tetapi tidak begitu banyak konsisten karena berdasarkan kesamaan eksterior
tidak pada kesamaan semantik. Hal ini tidak begitu banyak yang sesuai pada
waktu itu ketika bahasa alami' orang menyampaikan pendapat yang sama mereka
melalui kata-kata yang berbeda.
Model kesamaan LSA
Model analisis
Semantic laten didasarkan pada fungsi pembobotan lokal dan global. fungsi
pembobotan ini digunakan untuk menghasilkan representasi corpus tertimbang dan
dikenakan dekomposisi nilai singular.
Metode
Diusulkan
Ontologi disebut kosakata yang
menggambarkan domain yang menarik dan menentukan arti dari istilah yang
digunakan dalam spesifik kosakata.Kami menggunakan tampilan struktur pohon
ontologi bersama dengan kesamaan.Memeriksa pada setiap simpul akar sepanjang jalan.
Jadi kita memberikan nama dari kesamaan biner, model kesamaan LSA, hitung
kesamaan dan model kesamaan ontologi berbasis. Metode berbasis ontologi yang
ada biasanya didasarkan pada metode ini adalah kesamaan semantik menggunakan
tampilan pohon ontologi.
Ontologi
Tree View
Tujuan utama kami adalah untuk memeriksa berapa banyak kesamaan terjadi
antara dua atau lebih dokumen. Kami memilih disimpan dokumen dan
dokumen lainnya yang memasukkan dokumen untuk perbandingan. Kami akan membuat
ontologi tampilan pohon untuk kedua dokumen untuk perbandingan yang dibuat di
tingkat ke tingkat dan ditingkatkan baik tampilan pohon melalui referensi
mereka kata domain. Beberapa langkah yang terlibat untuk menghitung kesamaan
semantik berdasarkan tampilan struktur pohon ontologis. Langkah-langkah ini:
· >>> Menyediakan baik
dokumen yang ada di tingkat pertama.
· >>> Terapkan NLP parser
dan prosedur penghapusan stopword.
· >>> Perbandingan dimulai
dari root (Pertama menerapkan metode pencocokan kata kunci dan jika
akan ada
kegagalan pencocokan kata kunci kemudian memeriksa dengan kesamaan
semantik). Jika simpul akar doc disimpan tidak akan cocok dengan simpul akar Doc masukan
maka akar Doc disimpan akan diperiksa oleh node di sublevel di masukan Doc dan
kami akan
mengulang semua iterasi sampai semua node akan selesai atau tidak
cocok akan terjadi
sebagai hasilnya. Dalam kasus tidak ada yang cocok ditemukan
kita dapat
mengatakan bahwa tidak ada kesamaan hadir.
Penilaian
Untuk mengevaluasi kinerja metode yang diusulkan
pada kesamaan semantik, beberapa eksperimen dilakukan. Hasil set berdasarkan
persentase mendapatkan dari metode yang berbeda. Metode ini menggunakan model
ruang vektor untuk menghitung kesamaan antara dokumen. Persentase yang tinggi
menunjukkan hasil yang efisien yang diberikan dengan metode yang diusulkan.
Percobaan
Hasil
Dalam sistem yang asli, kita memiliki dua dokumen tergantung pada
pemilihan pengguna untuk pemetaan kesamaan semantik berdasarkan tampilan
struktur pohon ontologi. Kami sekarang meneliti hasil yang dihasilkan oleh
metode yang berbeda. Pertama kata kunci metode pencocokan memberikan hasil
ketika ada perbandingan antara kedua dokumen. Hasilnya adalah 4 persen dalam
hal ini yang ditentukan oleh sistem yang diterapkan. Metode kedua adalah
semantik kesamaan yang didasarkan pada kata-kata semantik. Pengecekan kata
semantik dilakukan melalui WordNet yang berisi banyak sinonim dari setiap kata
yang ada dalam dokumen. Metode ini memberikan hasil yang lebih baik
dibandingkan dengan metode pencocokan kata kunci. Metode ini memberikan hasil
persen 6 dalam output yang lebih baik daripada pencocokan kata kunci.
Sekarang metode yang diusulkan semantik kesamaan
didasarkan pada pandangan pohon ontologi memberikan hasil yang lebih baik dibandingkan
dengan kedua metode menunjukkan efisiensi. Ini memberikan hasil yang lebih baik
setelah menggunakan atribut tambahan yang diakui sebagai istilah-istilah yang
menciptakan hubungan antara kedua dokumen dengan melihat pada kedua dokumen
bekerja sebagai ontologi. Metode ini menunjukkan hasil tertinggi yaitu 12
persen.
Kesimpulan
Makalah ini
mengusulkan sebuah metode yang mengubah dokumen dalam ontologi pribadi. Berikut
ontologi menunjukkan bahwa ada hubungan yang menyajikan antara dokumen dalam
realitas atau tidak. Perbandingan dari semua metode menunjukkan bahwa metode
yang diusulkan memberikan hasil kemiripan tertinggi. Hal ini memberikan hasil
yang lebih baik dalam hal jika ada ada hubungan jika tidak ada hasil yang lebih
baik daripada metode lainnya.
Pekerjaan
Mendatang
Dalam hal ini kita akan membuat tampilan struktur
pohon dan membandingkannya dengan simpul akar dengan metode ruang vektor dan
menemukan beberapa kesamaan antara dokumen. Tapi kita akan melakukannya dengan
menggunakan kata-kata domain mencari tahu melalui pohon parsing. analisisnya
dapat dibuat mudah jika kita akan menggunakan beberapa alat untuk tampilan
pohon di masa depan. Jadi kita akan menerapkan pohon pandangan ontologi dinamis
secara langsung melalui kata kunci domain disimpan dan masukan file menggunakan
beberapa alat sehingga kita dapat mengimpor langsung tampilan struktur pohon
data dari database di masa depan.
Kelebihan
Jurnal ini
berisikan materi yang sangat lengkap dari abstraksi, pendahuluan dan juga
berupa penjelasan dari beberapa metode
Kekurangan
Jurnal ini
bertuliskan penjelasan yang rumit di mengerti dan bahasanya sangat bertele
tele, sehingga mengurangi minat pembaca
Saran
Menurut kami seharusnya penulis
dapat menggunakan kata kata yang mudah dimengerti dan mudah di pahami agar
menumbuhkan rasa minat si pembaca untuk membaca jurnal yang telah tulis
0 komentar:
Posting Komentar