Penerapan Algoritma Breadth-first Search

Penerapan Algoritma Breadth-first Search Pada FTP Search Engine


Breadth-first Search

1.    Pengertian Breadth First Search

Breadth-first search adalah algoritma yang melakukan pencarian secara melebar yang mengunjungi simpul secara preorder yaitu mengunjungi suatu simpul kemudian mengunjungi semua simpul yang bertetangga dengan simpul tersebut terlebih dahulu. Selanjutnya, simpul yang belum dikunjungi dan bertetangga dengan simpul- simpul yang tadi dikunjungi , demikian seterusnya. Jika graf berbentuk pohon berakar, maka semua simpul pada aras d dikunjungi lebih dahulu sebelum simpul-simpul pad aras d+1.

Algoritma ini memerluka-n sebuah antrian q untuk menyimpan simpul yang telah dikunjungi. Simpul- simpul ini diperlukan sebagai acuan untuk mengunjungi simpul-simpul yang bertetanggaan dengannya. Tiap simpul yang telah dikunjungu masuk ke dalam antrian hanya satu kali.

Algoritma ini juga membutuhkan table Boolean untuk menyimpan simpul yang te lah dikunjungi sehingga tidak ada simpul yang dikunjungi lebih dari satu kali

 

2.    Metode Pencarian

Salah   satu     contoh kakas  pencarian        yang menggunakan metode BFS adalah WebCrawler.

WebCrawler adalah suatu kakas yang membuat indeks isi dari suatu dokumen di Web yang selanjutnya akan dimanfaatkan oleh mesin pencari. Terdapat tiga langkah yang dilakukan oleh WebCrawler ini ketika mengunjungi dokumen, yaitu menandai bahwa suatu dokumen telah dikunjungi, mengenali link yang terdapat pada dokumen tersebut, kemudian isinya didaftarkan pada daftar indeks.

Pada akhirnya, WebCrawler akan menampilkan file yang paling banyak berkaitan dengan kata kunci.

Contoh hasil pencarian dengan WebCrawler

Kata kunci : "molecular biology human genome project"

Hasil pencarian :

1000 Guide to Molecular Biology Databases 0754 Guide to Molecular Biology Databases 0562 Biology Links

0469 bionet newsgroups

0412 Motif BioInformatics Server

0405 LBL Catalog of Research Abstracts (1993) 0329 Molecular Biology Databases

0324 GenomeNet WWW server

0317 DOE White Paper on Bio-Informatics 0292 Molecular biology

0277 Oxford University Molecular Biology Data Centre Home Page

0262 Biology Internet Connections

0244 Harvard Biological Laboratories - Genome Research

0223 About the GenomeNet 0207 Biology Index

 

Algoritma BFS yang diterapkan pada WebCrawler ini adalah mendaftarkan setiap link yang ada dan menyimpannya dalam data base kemudian mengunjunginya satu persatu sambil mencatat link yang berhubungan

 

3.    Metode Pencarian

Algoritma DFS yang diterapkan pada mesin pencari dalam melakukan pengindeksan adalah mengunjungi suatu server kemudian menyimpan semua link yang berhubungan dengan server tersebut baru kemudian mengunjungi server lain.

Salah satu yang menerapkan algoritma DFS pada mesin pencarian adalah FTPSearch. FTPSearch akan menampilkan daftar hasil pencarian berdasarkan server. File-file yang tersimpan pada suatu server akan ditampilkan terlebih dahulu kemudian baru berpindah pada server lain. FTPSearch tidak memperhatikan file mana yang lebih berkaitan dengan kata kunci karena FTPSearch tidak melakukan observasi sampai pada isi dokumen tapi hanya melihat judul dokumen.

 

4.    Hasil Eksperimen

Pada eksperimen yang dilakukan oleh penelitian yang dilakukan oleh Kerstin Klockner, Nadine Wirshum, Anthony Jameson, empat puluh satu subjek diberi waktu sepuluh menit untuk mendapatkan informasi tentang “Assessment centers” dengan cara membuka dokumen yang relevan yang dikembalikan oleh Google sebagai respon pencarian. Sebuah daftar hasil pencarian terdiri dari 25 hasil telah disiapkan sebelumnya dan disajikan dalam sebuah halaman web. Subjek harus menggulung layer untuk dapat melihat keseluruhan halaman. Gerakan mata para subjek dan aksi klik tetikus direkam dengan bantuan pendeteksi ASL

Berdasarkan rekaman video yang dibuat melalui pendeteksi itu, pemrosesan hasil pencarian yang dilakukan para subjek dianalisis. Tiga kategori diidentifikasi : Sebagian besar subjek (65%) mengaplikasikan strategi DFS. Kebalikannya, minoritas subjek mengaplikasikan pola strategi BFS yang ekstrim, melihat ke seluruh daftar hasil pencarian sebelum membuka sebuah dokemen. Pola BFS yang parsial ditunjukkan oleh sisa 20% subjek, yang terkadang melihat ke beberapa entri berikutnya sebelum memilih dokumen yang akan dibuka.

Pada eksperimen dua, dua puluh tujuh subjek diminta untuk melakukan dua aktivitas yang sama dengan eksperimen satu, dengan waktu 5 menit untuk masing-masing aktivitas. Untuk menciptakan situasi yang membuat BFS terlihat relative menarik, kita memperbolehkan subjek untuk membuka maksimal sepuluh dari 25 dokumen yang di daftar, memberi penghargaan kepada mereka untuk setiap penemuan dokumen yang relevan (hamper setengah dari dokumen relevan). Di sini, strategi yang berlawanan ditemukan lagi : 52% subjek tidak menunjukkan niat untuk melihat keseluruhan daftar. Minoritas subjek sebanyak 11% menggunakan strategi BFS yang ekstrim, melihat ke seluruh daftar sebelum membuka sebuah dokumen; sisanya sebanyak 37% mengaplikasikan strategi campuran, melihat dulu ke dua sampai enam dokumen berikutnya dalam daftar.

 

5.    Analisis

Berdasarkan penelitian yang dilakukan oleh Kerstin Klockner, Nadine Wirshum, Anthony Jameson pada makalahnya yang berjudul “Depth- and Breadth-First Processing of Search Result” kita dapat menyimpulkan bahwa pengguna cenderung melakukan pencarian secara strictly depth-first strategy . Yaitu melihat suatu link yang paling atas dari hasil pencarian kemudian mengaksesnya dan terus menelusuri link yang terdapat pada document tersebut yang berkaitan dengan kata kunci yang dicari.

Sehingga agar pencarian oleh FTP search lebih efektif perlu ada penyesuaian dengan algoritma mesin pencari. Algoritma yang menurut kami paling sesuai adalah algoritma BFS pada mesin pencari yang akan menampilkan daftar file yang paling dekat relefansinya dengan kata kunci.

Metode FTP search melakukan hal yang sama dengan WebCrawler yaitu mengunjungi setiap server, mencatat link file dan memasukkannya ke dalam basis data. Sehingga file yang paling relevan ditempatkan di bagian paling atas daftar hasil pencarian. Perbedaan dengan web crawler ftp search akan mengelompokkan file-file tersebut berdasarkan server.

Kelebihan metode baru ini bagi pengguna FTP search adalah pengguna akan dapat langsung melihat file yang paling relevan pada bagian atas daftar hasil pencarian dan meminimalisasi pengaksesan lintas server.

 

6.    Kesimpulan

Berdasarkan analisis yang dilakukan maka algoritma BFS pada mesin pencarian dengan memperhatikan kebiasaan pengguna dalam membuka file daftar hasil pencarian akan mengefektifkan pencarian file di ftp search. Sehingga daftar hasil pencarian FTP search dapat lebih memudahkan pengguna dalam melakukan pencarian.

 

Sumber Referensi :   

[1]     informatika.stei.itb.ac.id › Makalah › MakalahStmik33

[2]     Pinkerton    Brian.1994.”Finding    What    People   Want:   Experiences   with   the   WebCrawler”

[3]     Kl ̈ockner  Kerstin.  2005  “Depth-  and  Breadth-First    Processing    of    Search    Result  Lists:  An  Example  Paper  in  the  SIGCHI Style”

[4]     Salter Richard http://www.cs.oberlin.edu/classes/dragn/labs/graphs/graphs5.html.           Diakses           tanggal 17 Mei 2005 [

[5]     Munir   Rinaldi.   2005.   ”Diktat   Kuliah   Strategi Algoritmik”


Komentar

Postingan populer dari blog ini

Pelatihan Pembuatan Paving Block

Kecerdasan Buatan " Graf Simetris "

Model Spiral Dalam Software Development Life Cycle