Bagaimana Sebenarnya Cara Search Engine Bekerja

Posted by in Get Pedia .
Bagaimana Sebenarnya Cara Search Engine Bekerja

Search Engine atau mesin pencari selalu bergerak tanpa henti menyusuri jejaring, melintasi jutaan halaman untuk mendapatkan data yang digunakan untuk disajikan di halaman pencarian dalam hitungan mili detik. Google adalah sebuah contoh dari sebuah mesin pencari yang paling populer, dimana kita akan menjadikan metode pencarian dari Google sebagai bahasan kita kali ini.

Secara sederhana, apa yang search engine lakukan adalah seperti berikut:

Mengindex informasi.
search engine mencari dan menyimpan data dan informasi hingga lebih dari 30 milyar laman web di ranah internet.

Menyajikan data.
Dengan menggunakan urutan algoritma dan kecerdasan buatan yang rumit, search engine kemudian mempelajari, mengidentifikasi dan menyajikan halaman web yang paling relevan dengan query pencarian yang dimasukkan.

Proses Crawl dan Indeksasi

Selama 18 tahun terakhir, Google telah meng-crawl jejaring, halaman demi halaman. Dengan menggunakan program yang disebut “crawler” -atau sering juga disebut robot, bot atau spider- Google mengunjungi  satu per satu laman web untuk di index konten dan tautan yang terdapat di dalamnya. Software Crawler milik Google disebut Googlebot, milik Bing disebut Bingbot dan milik Yahoo disebut Slurp.

Ketika Bot menemukan suatu halaman, ia merekam informasi yang terdapat dalam halaman tersebut, termasuk didalamnya adalah konten teks, kode HTML, informasi tentang tautan yang ada dan bagaimana ia memiliki tautan tersebut. Seiring proses crawling, maka sang bot akan terus menemukan link baru terus menerus, yang terkadang akan menemukan tautan yang sama berulang kali seperti yang terdapat di dalam header atau footer dari sebuah laman. Sang bot kemudian akan mencoba mencatat hubungan dari kedua halaman berdasarkan tautan tersebut dan melanjutkan perjalannannya ke halaman unik berikutnya.

Seluruh informasi yang didapat dari proses crawling dan indeksasi tersebut disimpan dalam database berukuran luar biasa besar yang berada dalam data center raksasa milik Google. jika anda ingin mendapatkan bayangan tentang kecocokan penerapan istilah raksasa dalam data center Google anda bisa melihat video official tour ke dalam salah satu data center milik Google seperti berikut.

Indeks dari halaman yang telah dikumpulkan oleh bot tersebut kemudian disusun secara rapi, disimpan bersama informasi relevan yang didapat. Seperti apakah konten tersebut adalah konten baru, atau hanya update, konteks isi, struktur tautan, sinonim dari kata kata yang terdapat dalam halaman tersebut, kapan laman tersebut diluncurkan dan apakah halaman tersebut mengandung gambar atau video.


Menyajikan Hasil Pencarian

Setelah data di index, langkah berikutnya adalah penyajian hasil pencarian. Bagaimana cara penyajian hasil pencarian adalah sangat bergantung kepada algoritma yang digunakan oleh masing masing search engine, yang biasanya juga merupakan rahasia yang disimpan rapat ra[at oleh perusahaan masing masing.

Gambaran yang bisa didapat adalah berdasar penjelasan dari Google Search Quality Senior Strategist, Andrey Lipattsev yang mengatakan bahwa 3 faktor utama dari proses ranking Google adalah konten, tautan dan RankBrain.

Konten adalah penentu dari relevansi kontekstual. Dari daftar kata dalam sebuah laman, digabung bersama pemaknaan konteks yang memiliki tautan relevan adalah sebagai penentu bagaimana sebuah konten di indeks dan disajikan sebagai hasil dari query pencarian tertentu.

Tautan, seperti yang telah dibahas diatas adalah sebagai penentu otoritas dan relevansi. Otoritas atau Authority ditentukan berdasar pengukuran hubungan dan kualitas dari halaman yang saling berkaitan dengan halaman individual lainnya. Dengan mempelahari hal tersebutm algoritma search engine tersebut kemudian mempelajari dan menentukan konteks dan otoritas dari sebuah halaman dan tautan yang bisa mencapai ratusan hingga ribuan perhitungan untuk disajikan dalam halaman hasil pencarian.

Related Posts:

ICANN

ICANN, singkatan dari Internet Corporation for Assigned Names and Numbers, adalah organisasi nirlaba pengatur penamaan domain, lalu apakah untuk mendaftar domain harus ke lembaga tersebut?

Domain

Nama domain (domain name) adalah nama unik yang diberikan untuk mengidentifikasi nama server komputer seperti web server atau email server di jaringan komputer ataupun internet.

1366 x 768 adalah resolusi layar paling populer untuk saat ini

1366 x 768 adalah resolusi layar yang paling populer atau paling banyak digunakan untuk saat ini

Pengertian Propagasi

Masa propagasi nama domain adalah jeda waktu yang diperlukan sebuah nama domain untuk mengenali atau tersambung dengan server hosting

Comments

Leave a Comment

Leave a Reply

Name: *
E-mail: * (Not Published)
Website: (Site url with http://)
Comment: *
Verification code: Submit