ReCAPTCHA adalah sebuah layanan CAPTCHA gratis yang membantu proses digitalisasi buku, koran dan siaran radio pada masa lalu.
CAPTCHA sendiri adalah sebuah program yang bisa menentukan apakah seseorang itu sebuah komputer atau manusia
(biasanya berupa gambar dari sebuah kata yang dibuat terdistorsi).
CAPTCHA biasanya digunakan untuk menghindari serangan bot dan spam pada suatu website.
Karena sampai saat ini belum ada program komputer yang dapat membaca kata-kata yang terdistorsi sebaik manusia.
Sekitar 200 juta CAPTCHA dapat dipecahkan oleh manusia setiap harinya.
Rata-rata manusia membutuhkan waktu sekitar 10 detik untuk dapat memecahkan kata yang terdapat dalam CAPTCHA.
Sebenarnya itu termasuk waktu yang cukup singkat, namun jika dikalikan dengan jumlah CAPTCHA yang dipecahkan setiap harinya,
maka setara dengan 150.000 jam kerja setiap harinya.
Agar jam kerja tersebut tidak terbuang dengan sia-sia maka dibuatlah sistem CAPTCHA yang bernama reCAPTCHA.
Lantas apa bedanya CAPTCHA dan reCAPTCHA ? Bedanya hanya terletak pada sumber kata-katanya saja.
Jika CAPTCHA menggunakan kata-kata secara random (acak),
maka reCAPTCHA menggunakan kata-kata yang berasal dari proyek digitalisasi buku.
Jadi secara tidak langsung dengan menggunakan reCAPTCHA kita telah membantu proyek digitalisasi buku di dunia ini.
Sampai sekarang reCAPTCHA telah membantu proses digitalisasi versi lama New York Times serta buku-buku dari Google Books
Terus bagaimana cara kerja reCAPTCHA ? Pada awalnya buku-buku di scan secara terlebih dahulu.
Setelah itu dirubah menjadi teks menggunakan Optical Character Recognition (OCR).
Proses perubahan diperlukan untuk mengubah buku yang berformat image menjadi text
sehingga ukurannya bakal lebih ringan dan juga lebih mudah dibaca tentunya.
OCR sendiri merupakan software yang tidak sempurna karena tidak mampu mengenali semua karakter dengan baik.
Disinilah tugas reCAPTCHA untuk dapat membantunya.
reCAPTCHA membantu proses digitalisasi buku dengan mengirimkan kata-kata yang tidak dapat dikenali komputer,
ke suatu website dalam bentuk CAPTCHA.
Hal ini dimungkinkan karena hampir semua program OCR dapat membedakan apakah suatu kata dapat terbaca dengan baik atau tidak.
Terus bagaimana komputer tahu bahwa kata yang kita masukan adalah kata sebenarnya ?
Begini, setiap kata yang tidak dapat dibaca dengan baik oleh program OCR akan,
digabungkan dengan suatu kata yang telah diketahui kebenarannya.
Pengguna kemudian diharuskan untuk menjawab keduanya.
Jika mereka dapat meemecahkan kata yang telah diketahui kebenarannya maka,
sistem akan menganggap benar jawaban untuk kata lainnya.
Itulah mengapa reCAPTCHA terdiri dari dua buah kata.
Jadi kesimpulannya dilihat dari segi efektifitas dan keuntungan,
penggunaan reCAPTCHA sebagai image verification lebih baik dibanding CAPTCHA sebelumnya
Tujuan penggunaan ReCaptcha adalah :
1. Menghadang penggunaan bot / auto script yg membanjiri website
2. Membantu proyek digitalisasi buku sejarah
Terkait point no.2 , saya harus menekankan bahwa apa yg akan dibahas dibawah ini SEBAIKNYA TIDAK DILAKUKAN
Paling2 gunakan saja apabila menghadapi kasus brutal dimana kata-nya bener2 amburadul tidak terbaca, misalnya ini :
ReCAPTCHA ~ TIPS & TRICKS
Tahukah anda bahwa sebenernya ReCaptcha cuma membutuhkan input SATU KATA saja, sedangkan kata lainnya cuma dummy
Seninya disini adalah menentukan mana kata yg valid dan yg dummy
PENGENALAN DASAR :
1. KATA YG HURUFNYA BERBAYANG
Kata yg valid adalah kata yg tampak buram / berbayang dan sulit dibaca.
sedangkan kata yg jelas terbaca adalah kata dummy-nya.
At least ini mempermudah kita untuk memilih kata yg valid : CUKUP TULIS KATA YG BERBAYANG SAJA
2. KATA YANG TIDAK TERBACA
Kata yg amburadul tidak jelas adalah 100% dummy.
Cukup masukkan kata satunya lagi yg terbaca aja.
3. KATA YANG MENGANDUNG KOMPONEN ANGKA
Walaupun katanya jelas terbaca, tapi kalau semua/sebagian adalah ANGKA, maka itu dummy
Masukkan saja kata yg sama sekali tak ada angkanya.
4. KATA YANG MENGANDUNG TANDA BACA / SIMBOL
Walaupun katanya jelas terbaca, tapi kalau ada tanda baca atau simbol (koma, titik dua, tanda kutip, dash, titik ~ apapun) maka itu dummy.
Anda hanya memerlukan kata yg bersih tanpa tanda baca.
5. KATA YANG MENGANDUNG WARNA PUTIH
Apabila salah satu katanya ada yg mengandung WARNA PUTIH, maka itu adalah kata yg valid.
Kata lainnya yg tercetak hitam biasa adalah dummy.
Jadi, cukup masukkan kata yg mengandung warna putihnya saja seperti contoh diatas.
PENGENALAN LANJUTAN : BUT WHAT IF ...
1. KEDUA KATANYA TERLIHAT VALID ?
Kalau ada satu kata yg cuma terdiri dari 3 atau 4 huruf, sedangkan kata lainnya jauh lebih panjang, maka kemungkinan besar kata yg lebih dikit hurufnya adalah dummy
2. KEDUA KATANYA TERLIHAT VALID DAN JUMLAH HURUFNYA HAMPIR SAMA ?
1. Pilih kata yg tidak lazim atau tidak memiliki arti
Seringkali, kata yg punya arti adalah dummy ~ walaupun tidak selalu
Pada sample pertama diatas, yg valid adalah bscian (apa itu ?), sedangkan school (kata yg umum) adalah dummy word.
Pada sample kedua, yg valid adalah ureter (istilah biologi yg tidak umum dipakai sehari2), sedangkan citizen (kata yg umum) adalah dummy word.
2. Pilih kata yg font nya lebih tebal / bold
seringkali, yg bold adalah kata valid, yg tipis adalah dummy seperti kedua contoh diatas ~ walaupun tidak selalu
TAMBAHAN
1. NON-CASE SENSITIVE
Kata yg valid ini non case-sensitive, jadi anda bisa abaikan soal huruf besar-kecilnya.
Di contoh ini saya sengaja pake huruf besar-kecil tak beraturan, dan dianggap benar ~ asalkan hurufnya tepat.
2. TOLERANSI KESALAHAN
Pada kata yg valid, tidak usah mengetikkan seluruh hurufnya ~ max. 1 huruf yg hilang akan tetap dianggap benar.
Misalnya disini kata yg valid adalah trupper, tapi saya hanya memasukkan kata truppe (sengaja tidak lengkap 1 huruf ) dan masih dianggap benar
Juga di sample ke-2, kata valid nya adalah tooply, tapi apabila diketik toopli maka masih dianggap benar juga.
Hanya aja kalo udah sampe 2 huruf / lebih yg hilang atau diganti, maka langsung dianggap salah
3. MENGGANTI DUMMY WORD
Bisa juga memasukkan kata kedua secara RANDOM sesuai pilihan anda ~ asalkan kata yg benar sudah dimasukan, maka kata kedua yg merupakan dummy tidak akan diperhatikan oleh komputer
Misalnya disini saya memasukan kata dummy nya adalah duck
Tapi sebaiknya hal ini tidak dilakukan karena bisa berpotensi mengacaukan proses digitalisasinya.
Lebih baik dikosongkan saja daripada diisi asal-asalan, ok ?
4. RESET BUTTON
Saat semua jalan telah gagal, berarti anda memang kurang beruntung, tekan reset button recaptcha nya.
5. AYO BERLATIH !
Google ternyata menyediakan juga tempat untuk berlatih ReCaptcha
Coba kunjungi kesini : http://www.google.com/recaptcha/demo/
Disini anda bisa berkali-kali mencoba tanpa batas.
Cukup ketik input nya dan klik tombol submit, nanti akan langsung dikasih tahu apakah correct atau incorrect.
Atau meninggalkan komentar anda dibawah ini :)
KESIMPULAN :
- Cukup masukkan SATU kata yg jelas terbaca / tanpa tanda baca / tanpa komponen angka / mengandung warna putih / berbayang
- Penggunaan hurufnya adalah non-case sensitive, dan ada toleransi kesalahan max. 1 huruf
- Kalau masih sering salah juga, berlatihlah lebih banyak di tempat yg disediakan Google
Selamat Mencoba
sumber 1
sumber 2