peranti lunak mesin pencari
Pada dasarnya ada tiga peranti lunak yang menjadi jantung mesin pencari. Yakni:
1. Spider.
“Laba-laba” ini pekerjaanya merayap ke mana-mana, mencari halaman-halaman web baru, kemudian mengumpulkan dan menyimpannya indeks mesin pencarian. Itulah metafora yang sering didengungkan oleh banyak ahli. Namun, sesungguhnya cara kerja laba-laba tidak seperti itu. Spider meminta halaman sebagai mana layaknya browser meminta halaman web dari situs yang diakses agar bisa tampil di layar komputer.
Bedanya, spider tidak mengumpulkan gambar dan bentuk. Spider hanya tertarik pada teks dan tautan serta URL. Mengapa spider doyan tautan? Gampang saja, begitu menemukan tautan, maka ia akan menemukan halaman web lain. Begitu seterusnya. Jadi, rahasianya adalah segitiga: teks, tautan, URL.
2. Index.
Piranti lunak Index menangkap halaman web apapun yang dilempar oleh Spider. Tentu ini juga metafora. Sesungguhnya, piranti lunak Index ini mengelola lautan teks, tautan dan URL dengan algoritma (formula matematika rumit yang mengindeks kata, pasangan kata, dan seterusnya).
Pada dasarnya pekerjaan algoritma adalah menganalisa halaman dan tautan untuk berbagai kombinasi kata, kemudian memberi nilai, sehingga search engine dapat memberikan penilaian seberapa penting sebuah halaman bagi si pencarinya. Informasi mengenai hal ini disimpan sebaik mungkin agar bisa diakses oleh pencari.
3. Query.
Inilah yang kita lihat ketika kita berkunjung ke search engine — tampilan (front-end) yang seringkali kita anggap sebagai search engine. Fitur utama query adalah kotak kecil di mana kita mengetikkan kata yang ingin kita cari. Coba ketikkan kata yang Anda cari, kemudian enter atau tekan tombol search, maka mesin pencarian akan menampilkan hasil terbaik dari data yang disimpan di mesin indeks.
1. Spider.
“Laba-laba” ini pekerjaanya merayap ke mana-mana, mencari halaman-halaman web baru, kemudian mengumpulkan dan menyimpannya indeks mesin pencarian. Itulah metafora yang sering didengungkan oleh banyak ahli. Namun, sesungguhnya cara kerja laba-laba tidak seperti itu. Spider meminta halaman sebagai mana layaknya browser meminta halaman web dari situs yang diakses agar bisa tampil di layar komputer.
Bedanya, spider tidak mengumpulkan gambar dan bentuk. Spider hanya tertarik pada teks dan tautan serta URL. Mengapa spider doyan tautan? Gampang saja, begitu menemukan tautan, maka ia akan menemukan halaman web lain. Begitu seterusnya. Jadi, rahasianya adalah segitiga: teks, tautan, URL.
2. Index.
Piranti lunak Index menangkap halaman web apapun yang dilempar oleh Spider. Tentu ini juga metafora. Sesungguhnya, piranti lunak Index ini mengelola lautan teks, tautan dan URL dengan algoritma (formula matematika rumit yang mengindeks kata, pasangan kata, dan seterusnya).
Pada dasarnya pekerjaan algoritma adalah menganalisa halaman dan tautan untuk berbagai kombinasi kata, kemudian memberi nilai, sehingga search engine dapat memberikan penilaian seberapa penting sebuah halaman bagi si pencarinya. Informasi mengenai hal ini disimpan sebaik mungkin agar bisa diakses oleh pencari.
3. Query.
Inilah yang kita lihat ketika kita berkunjung ke search engine — tampilan (front-end) yang seringkali kita anggap sebagai search engine. Fitur utama query adalah kotak kecil di mana kita mengetikkan kata yang ingin kita cari. Coba ketikkan kata yang Anda cari, kemudian enter atau tekan tombol search, maka mesin pencarian akan menampilkan hasil terbaik dari data yang disimpan di mesin indeks.
Comments
Post a Comment