ReCAPTCHA

Posted by in Get Pedia .
ReCAPTCHA

ReCAPTCHA adalah sebuah layanan CAPTCHA gratis yang membantu proses digitalisasi buku, koran dan siaran radio pada masa lalu.

CAPTCHA sendiri adalah sebuah program yang bisa menentukan apakah seseorang itu sebuah komputer atau manusia
(biasanya berupa gambar dari sebuah kata yang dibuat terdistorsi).
CAPTCHA biasanya digunakan untuk menghindari serangan bot dan spam pada suatu website.
Karena sampai saat ini belum ada program komputer yang dapat membaca kata-kata yang terdistorsi sebaik manusia.

Sekitar 200 juta CAPTCHA dapat dipecahkan oleh manusia setiap harinya.
Rata-rata manusia membutuhkan waktu sekitar 10 detik untuk dapat memecahkan kata yang terdapat dalam CAPTCHA.
Sebenarnya itu termasuk waktu yang cukup singkat, namun jika dikalikan dengan jumlah CAPTCHA yang dipecahkan setiap harinya,
maka setara dengan 150.000 jam kerja setiap harinya.
Agar jam kerja tersebut tidak terbuang dengan sia-sia maka dibuatlah sistem CAPTCHA yang bernama reCAPTCHA.

Lantas apa bedanya CAPTCHA dan reCAPTCHA ? Bedanya hanya terletak pada sumber kata-katanya saja.
Jika CAPTCHA menggunakan kata-kata secara random (acak),
maka reCAPTCHA menggunakan kata-kata yang berasal dari proyek digitalisasi buku.
Jadi secara tidak langsung dengan menggunakan reCAPTCHA kita telah membantu proyek digitalisasi buku di dunia ini.
Sampai sekarang reCAPTCHA telah membantu proses digitalisasi versi lama New York Times serta buku-buku dari Google Books

Terus bagaimana cara kerja reCAPTCHA ? Pada awalnya buku-buku di scan secara terlebih dahulu.
Setelah itu dirubah menjadi teks menggunakan Optical Character Recognition (OCR).
Proses perubahan diperlukan untuk mengubah buku yang berformat image menjadi text
sehingga ukurannya bakal lebih ringan dan juga lebih mudah dibaca tentunya.
OCR sendiri merupakan software yang tidak sempurna karena tidak mampu mengenali semua karakter dengan baik.
Disinilah tugas reCAPTCHA untuk dapat membantunya.
reCAPTCHA membantu proses digitalisasi buku dengan mengirimkan kata-kata yang tidak dapat dikenali komputer,
ke suatu website dalam bentuk CAPTCHA.
Hal ini dimungkinkan karena hampir semua program OCR dapat membedakan apakah suatu kata dapat terbaca dengan baik atau tidak.

Terus bagaimana komputer tahu bahwa kata yang kita masukan adalah kata sebenarnya ?
Begini, setiap kata yang tidak dapat dibaca dengan baik oleh program OCR akan,
digabungkan dengan suatu kata yang telah diketahui kebenarannya.
Pengguna kemudian diharuskan untuk menjawab keduanya.
Jika mereka dapat meemecahkan kata yang telah diketahui kebenarannya maka,
sistem akan menganggap benar jawaban untuk kata lainnya.
Itulah mengapa reCAPTCHA terdiri dari dua buah kata.

Jadi kesimpulannya dilihat dari segi efektifitas dan keuntungan,
penggunaan reCAPTCHA sebagai image verification lebih baik dibanding CAPTCHA sebelumnya

Tujuan penggunaan ReCaptcha adalah :

1. Menghadang penggunaan bot / auto script yg membanjiri website
2. Membantu proyek digitalisasi buku sejarah


Terkait point no.2 , saya harus menekankan bahwa apa yg akan dibahas dibawah ini SEBAIKNYA TIDAK DILAKUKAN

Paling2 gunakan saja apabila menghadapi kasus brutal dimana kata-nya bener2 amburadul tidak terbaca, misalnya ini :




ReCAPTCHA ~ TIPS & TRICKS

Tahukah anda bahwa sebenernya ReCaptcha cuma membutuhkan input SATU KATA saja, sedangkan kata lainnya cuma dummy

Seninya disini adalah menentukan mana kata yg valid dan yg dummy


PENGENALAN DASAR :

1. KATA YG HURUFNYA BERBAYANG



Kata yg valid adalah kata yg tampak buram / berbayang dan sulit dibaca.
sedangkan kata yg jelas terbaca adalah kata dummy-nya.
At least ini mempermudah kita untuk memilih kata yg valid : CUKUP TULIS KATA YG BERBAYANG SAJA


2. KATA YANG TIDAK TERBACA



Kata yg amburadul tidak jelas adalah 100% dummy.
Cukup masukkan kata satunya lagi yg terbaca aja.


3. KATA YANG MENGANDUNG KOMPONEN ANGKA



Walaupun katanya jelas terbaca, tapi kalau semua/sebagian adalah ANGKA, maka itu dummy
Masukkan saja kata yg sama sekali tak ada angkanya.


4. KATA YANG MENGANDUNG TANDA BACA / SIMBOL



Walaupun katanya jelas terbaca, tapi kalau ada tanda baca atau simbol (koma, titik dua, tanda kutip, dash, titik ~ apapun) maka itu dummy.
Anda hanya memerlukan kata yg bersih tanpa tanda baca.


5. KATA YANG MENGANDUNG WARNA PUTIH



Apabila salah satu katanya ada yg mengandung WARNA PUTIH, maka itu adalah kata yg valid.
Kata lainnya yg tercetak hitam biasa adalah dummy.
Jadi, cukup masukkan kata yg mengandung warna putihnya saja seperti contoh diatas.



PENGENALAN LANJUTAN : BUT WHAT IF ...

1. KEDUA KATANYA TERLIHAT VALID ?



Kalau ada satu kata yg cuma terdiri dari 3 atau 4 huruf, sedangkan kata lainnya jauh lebih panjang, maka kemungkinan besar kata yg lebih dikit hurufnya adalah dummy


2. KEDUA KATANYA TERLIHAT VALID DAN JUMLAH HURUFNYA HAMPIR SAMA ?





1. Pilih kata yg tidak lazim atau tidak memiliki arti
Seringkali, kata yg punya arti adalah dummy ~ walaupun tidak selalu

Pada sample pertama diatas, yg valid adalah bscian (apa itu ?), sedangkan school (kata yg umum) adalah dummy word.

Pada sample kedua, yg valid adalah ureter (istilah biologi yg tidak umum dipakai sehari2), sedangkan citizen (kata yg umum) adalah dummy word.

2. Pilih kata yg font nya lebih tebal / bold
seringkali, yg bold adalah kata valid, yg tipis adalah dummy seperti kedua contoh diatas ~ walaupun tidak selalu


TAMBAHAN

1. NON-CASE SENSITIVE



Kata yg valid ini non case-sensitive, jadi anda bisa abaikan soal huruf besar-kecilnya.
Di contoh ini saya sengaja pake huruf besar-kecil tak beraturan, dan dianggap benar ~ asalkan hurufnya tepat.


2. TOLERANSI KESALAHAN





Pada kata yg valid, tidak usah mengetikkan seluruh hurufnya ~ max. 1 huruf yg hilang akan tetap dianggap benar.
Misalnya disini kata yg valid adalah trupper, tapi saya hanya memasukkan kata truppe (sengaja tidak lengkap 1 huruf ) dan masih dianggap benar

Juga di sample ke-2, kata valid nya adalah tooply, tapi apabila diketik toopli maka masih dianggap benar juga.

Hanya aja kalo udah sampe 2 huruf / lebih yg hilang atau diganti, maka langsung dianggap salah


3. MENGGANTI DUMMY WORD



Bisa juga memasukkan kata kedua secara RANDOM sesuai pilihan anda ~ asalkan kata yg benar sudah dimasukan, maka kata kedua yg merupakan dummy tidak akan diperhatikan oleh komputer
Misalnya disini saya memasukan kata dummy nya adalah duck

Tapi sebaiknya hal ini tidak dilakukan karena bisa berpotensi mengacaukan proses digitalisasinya.
Lebih baik dikosongkan saja daripada diisi asal-asalan, ok ?


4. RESET BUTTON



Saat semua jalan telah gagal, berarti anda memang kurang beruntung, tekan reset button recaptcha nya.


5. AYO BERLATIH !

Google ternyata menyediakan juga tempat untuk berlatih ReCaptcha
Coba kunjungi kesini : http://www.google.com/recaptcha/demo/



Disini anda bisa berkali-kali mencoba tanpa batas.
Cukup ketik input nya dan klik tombol submit, nanti akan langsung dikasih tahu apakah correct atau incorrect.

Atau meninggalkan komentar anda dibawah ini :)


KESIMPULAN :

- Cukup masukkan SATU kata yg jelas terbaca / tanpa tanda baca / tanpa komponen angka / mengandung warna putih / berbayang

- Penggunaan hurufnya adalah non-case sensitive, dan ada toleransi kesalahan max. 1 huruf

- Kalau masih sering salah juga, berlatihlah lebih banyak di tempat yg disediakan Google

 

Selamat Mencoba

sumber 1

sumber 2

Related Posts:

ICANN

ICANN, singkatan dari Internet Corporation for Assigned Names and Numbers, adalah organisasi nirlaba pengatur penamaan domain, lalu apakah untuk mendaftar domain harus ke lembaga tersebut?

Domain

Nama domain (domain name) adalah nama unik yang diberikan untuk mengidentifikasi nama server komputer seperti web server atau email server di jaringan komputer ataupun internet.

1366 x 768 adalah resolusi layar paling populer untuk saat ini

1366 x 768 adalah resolusi layar yang paling populer atau paling banyak digunakan untuk saat ini

1 Comments

Leave a Comment

Leave a Reply

Name: *
E-mail: * (Not Published)
Website: (Site url with http://)
Comment: *
Verification code: Submit