Softskill Jurnal "Semantic Similarity between Documents Using Tree View Ontology"

Semantic Similarity between
Documents Using Tree View Ontology
(Kesamaan Semantik antara
Dokumen Menggunakan Tree View Ontology)



Kelompok 17 :
Daniel Pardamean (51416700)
Halit Triwanda (58416167)
Ricky Mazaya (56416321)







Abstrak



Dalam lingkungan hari ini sebagian besar mesin pencari web didasarkan pada pemeriksaan semantik yang memberikan bantuan untuk mengetahui dokumen yang bermakna dari web. Mereka umumnya mengandalkan pencocokan kata kunci sambil mengembalikan dokumen sebagai respons terhadap permintaan pengguna. Ada banyak dokumen yang saling terkait dengan cara semantik. Dokumen-dokumen ini secara semantik sama. Maka pencocokan kata kunci tidak memberikan hasil yang tepat untuk mengembalikan dokumen yang hampir sama secara semantik ini sebagai tanggapan terhadap permintaan pengguna.
Makalah ini mengusulkan metode baru untuk menemukan kesamaan dokumen semantik berdasarkan ontologi tampilan pohon. Relasi ditingkatkan dengan menggunakan istilah yang relevan dan menghitung fraksi dari relasi ini berdasarkan tampilan pohon. Dalam makalah ini kami memberikan hasil kinerja di antara metode yang berbeda yang menunjukkan lebih baik dari skema yang diusulkan.


Inti Jurnal

Pendahuluan

Untuk mengakses informasi yang relevan oleh pengguna web dan mempertahankan informasi dengan mesin apapun. Hal ini karena konten web disajikan terutama dalam bahasa alami, dan ditargetkan untuk pembaca manusia. Namun, beberapa mesin pencari seperti Google, Yahoo dll yang digunakan oleh pengguna untuk mengakses hasil yang diinginkan.Jenis informasi yang diinginkan berdasarkan pengecekan kesamaan.Tepat mengukur kesamaan semantik antara dokumen teks merupakan tantangan besar karena kesulitan dan ambiguitas semantik bahasa alami.
Umumnya dokumen dikatakan sama jika mereka diperkirakan akan menyampaikan ide yang sama atau subjek dan sinonim ini memeriksa dari kata ke kata kemudian kalimat kalimat dan akhirnya untuk mendokumentasikan untuk mendokumentasikan. Tapi dalam kasus tidak ada yang sinonim hadir antara kedua dokumen. ”Hubungan” kata menunjukkan jika kedua dokumen memberikan informasi tentang subjek yang sama atau subjek yang terkait dalam beberapa cara. Menggunakan ontologi kita dapat meningkatkan rute dengan penambahan konsep yang tidak hadir dalam dokumen. Sinonim dapat digunakan untuk ekspansi paralel dan ekspansi vertikal untuk subclass.
Makalah ini mengatur ontologi di pohon tampilan format untuk menghitung kesamaan. Metode ini akan memberikan kesamaan semantik menggunakan tampilan pohon ontologis yang akan menciptakan melalui beberapa perangkat tambahan di tapak.

Model Kesamaan Binary
Model ini berdasarkan termasuk kata-berbasis, kata kunci berbasis dan n-gram ukuran untuk memeriksa kesamaan. Model ini mudah tetapi tidak begitu banyak konsisten karena berdasarkan kesamaan eksterior tidak pada kesamaan semantik. Hal ini tidak begitu banyak yang sesuai pada waktu itu ketika bahasa alami' orang menyampaikan pendapat yang sama mereka melalui kata-kata yang berbeda.

Model kesamaan LSA
Model analisis Semantic laten didasarkan pada fungsi pembobotan lokal dan global. fungsi pembobotan ini digunakan untuk menghasilkan representasi corpus tertimbang dan dikenakan dekomposisi nilai singular.

Metode Diusulkan
Ontologi disebut kosakata yang menggambarkan domain yang menarik dan menentukan arti dari istilah yang digunakan dalam spesifik kosakata.Kami menggunakan tampilan struktur pohon ontologi bersama dengan kesamaan.Memeriksa pada setiap simpul akar sepanjang jalan. Jadi kita memberikan nama dari kesamaan biner, model kesamaan LSA, hitung kesamaan dan model kesamaan ontologi berbasis. Metode berbasis ontologi yang ada biasanya didasarkan pada metode ini adalah kesamaan semantik menggunakan tampilan pohon ontologi.

Ontologi Tree View
Tujuan utama kami adalah untuk memeriksa berapa banyak kesamaan terjadi antara dua atau lebih dokumen. Kami memilih disimpan dokumen dan dokumen lainnya yang memasukkan dokumen untuk perbandingan. Kami akan membuat ontologi tampilan pohon untuk kedua dokumen untuk perbandingan yang dibuat di tingkat ke tingkat dan ditingkatkan baik tampilan pohon melalui referensi mereka kata domain. Beberapa langkah yang terlibat untuk menghitung kesamaan semantik berdasarkan tampilan struktur pohon ontologis. Langkah-langkah ini:
·       Menyediakan baik dokumen yang ada di tingkat pertama.
·       Terapkan NLP parser dan prosedur penghapusan stopword.
·       Perbandingan dimulai dari root (Pertama menerapkan metode pencocokan kata kunci dan jika akan ada kegagalan pencocokan kata kunci kemudian memeriksa dengan kesamaan semantik). Jika simpul akar doc disimpan tidak akan cocok dengan simpul akar Doc masukan maka akar Doc disimpan akan diperiksa oleh node di sublevel di masukan Doc dan kami akan mengulang semua iterasi sampai semua node akan selesai atau tidak cocok akan terjadi sebagai hasilnya. Dalam kasus tidak ada yang cocok ditemukan kita dapat mengatakan bahwa tidak ada kesamaan hadir.

d

Penilaian
Untuk mengevaluasi kinerja metode yang diusulkan pada kesamaan semantik, beberapa eksperimen dilakukan. Hasil set berdasarkan persentase mendapatkan dari metode yang berbeda. Metode ini menggunakan model ruang vektor untuk menghitung kesamaan antara dokumen. Persentase yang tinggi menunjukkan hasil yang efisien yang diberikan dengan metode yang diusulkan.
Percobaan Hasil
         Dalam sistem yang asli, kita memiliki dua dokumen tergantung pada pemilihan pengguna untuk pemetaan kesamaan semantik berdasarkan tampilan struktur pohon ontologi. Kami sekarang meneliti hasil yang dihasilkan oleh metode yang berbeda. Pertama kata kunci metode pencocokan memberikan hasil ketika ada perbandingan antara kedua dokumen. Hasilnya adalah 4 persen dalam hal ini yang ditentukan oleh sistem yang diterapkan. Metode kedua adalah semantik kesamaan yang didasarkan pada kata-kata semantik. Pengecekan kata semantik dilakukan melalui WordNet yang berisi banyak sinonim dari setiap kata yang ada dalam dokumen. Metode ini memberikan hasil yang lebih baik dibandingkan dengan metode pencocokan kata kunci. Metode ini memberikan hasil persen 6 dalam output yang lebih baik daripada pencocokan kata kunci.

Sekarang metode yang diusulkan semantik kesamaan didasarkan pada pandangan pohon ontologi memberikan hasil yang lebih baik dibandingkan dengan kedua metode menunjukkan efisiensi. Ini memberikan hasil yang lebih baik setelah menggunakan atribut tambahan yang diakui sebagai istilah-istilah yang menciptakan hubungan antara kedua dokumen dengan melihat pada kedua dokumen bekerja sebagai ontologi. Metode ini menunjukkan hasil tertinggi yaitu 12 persen.

Kesimpulan
Makalah ini mengusulkan sebuah metode yang mengubah dokumen dalam ontologi pribadi. Berikut ontologi menunjukkan bahwa ada hubungan yang menyajikan antara dokumen dalam realitas atau tidak. Perbandingan dari semua metode menunjukkan bahwa metode yang diusulkan memberikan hasil kemiripan tertinggi. Hal ini memberikan hasil yang lebih baik dalam hal jika ada ada hubungan jika tidak ada hasil yang lebih baik daripada metode lainnya.




Pekerjaan Mendatang
Dalam hal ini kita akan membuat tampilan struktur pohon dan membandingkannya dengan simpul akar dengan metode ruang vektor dan menemukan beberapa kesamaan antara dokumen. Tapi kita akan melakukannya dengan menggunakan kata-kata domain mencari tahu melalui pohon parsing. analisisnya dapat dibuat mudah jika kita akan menggunakan beberapa alat untuk tampilan pohon di masa depan. Jadi kita akan menerapkan pohon pandangan ontologi dinamis secara langsung melalui kata kunci domain disimpan dan masukan file menggunakan beberapa alat sehingga kita dapat mengimpor langsung tampilan struktur pohon data dari database di masa depan.

Kelebihan
Jurnal ini berisikan materi yang sangat lengkap dari abstraksi, pendahuluan dan juga berupa penjelasan dari beberapa metode

Kekurangan
            Jurnal ini bertuliskan penjelasan yang rumit di mengerti dan bahasanya sangat bertele tele, sehingga mengurangi minat pembaca

Saran
            Menurut kami seharusnya penulis dapat menggunakan kata kata yang mudah dimengerti dan mudah di pahami agar menumbuhkan rasa minat si pembaca untuk membaca jurnal yang telah tulis











Komentar

Postingan populer dari blog ini

TUGAS MATEMATIKA INFORMATIKA TREE 2IA03

Animasi 3D