ben de reCAPTCHA ile ilgili bir bildiri hazırlamıştım ama ""delizade"" isimli arkadaşımız benden önce davranmış :) Belki bu konu hakkında daha fazla bilgi edinmek isteyen olur diye kendi bildirimin metnini buraya kopyalıyorum.
---------------------
1. Öncelikle CAPTCHA nedir?
Muhtemelen CAPTCHA yöntemini daha önceden duydunuz, gördünüz veya kullandınız. Neredeyse her web sitesinin üyelik başvuru formunda CAPTCHA yöntemi kullanılıyor. Bu yöntemin amacı sizin bir insan olup olmadığınızı kontrol etmek. Çünkü spamcılar özel yazılımlar ile üyelik başvuru formlarını kötüye kullanıp bir web sitesinde aynı anda binlerce hesap açabiliyorlar. Bu kötü durumu engelleyen CAPTCHA yöntemi sayesinde size bir resim içerisinde hafif çarpıtılmış karakterler gösteriliyor. Bu karakterleri çözümleyerek aynısını forma giriyorsunuz. Eğer girdiğiniz karakterler resimdekilerle uyuşuyorsa sizin bir insan olduğunuz doğrulanmış oluyor. Spamcıların kullandıkları otomatik form doldurma yazılımları ise bu çarpıtılmış karakterleri okuyamadıkları için veya yanlış okudukları için kötü amaçlarına ulaşamamış oluyorlar.
2. reCAPTCHA nedir?
Tahminlere göre dünyada her gün 60 milyon CAPTCHA insanlar tarafından çözümleniyor. Bu da CAPTCHA çözümleyen her bir insanın, ömründen yaklaşık olarak 10 saniyenin bu işe harcanması demek. İnsanları tek tek ele aldığımızda fazla bir süreymiş gibi gelmeyebilir ama olayı genel olarak düşündüğümüzde her gün 150.000 saatin CAPTCHA çözümlemek uğruna tüketildiği belirtiliyor. Peki, insanların bu eforunu pozitif bir yönde kullanmak mümkün mü? İşte reCAPTCHA, bu eforun "kitapların sayısallaştırılması" adına harcanmasını sağlayan çok faydalı bir proje.
3. Neden reCAPTCHA?
Bilgiyi arşivlemek için ve bilgiyi daha fazla erişilebilir kılmak için birçok proje, bilgisayar çağından önce yazılmış kitapları şu anda bile sayısal ortama aktarmakla uğraşıyor. Bunun için kitap sayfaları fotoğrafik olarak taranıyorlar ve sonra aranabilir olmaları için OCR (Optical Character Recognition) adı verilen teknik ile metne (yazıya) dönüştürülüyorlar. Metne dönüştürmek şunun için faydalıdır: Bir kitabın taranması, resimler oluşturulması demektir. Fakat resimlerin küçük aygıtlarda depolanması zordur, bilgisayara indirilmesi pahalıya mal olur ve en önemlisi de aranabilir değillerdir. Bir başka problem de resim içindeki metinlerin yazıya dönüştürülmesini sağlayan OCR tekniğinin ne yazıkki mükemmel derecede iyi çalışmamasıdır.
4. reCAPTCHA nasıl çalışıyor?
reCAPTCHA, kitapları sayısal ortama aktarma işlemini geliştiren bir yöntem. reCAPTCHA sayesinde, bilgisayarlar tarafından okunamayan sözcükler bir havuzda toplanıyorlar. Daha sonra insanların çözümlemesi için CAPTCHA kullanan web formlarına gönderiliyorlar. Bu yöntemde, OCR yazılımları tarafından doğru okunamayan her sözcük bir resim içerisine yerleştiriliyor ve bir CAPTCHA olarak kullanılması sağlanıyor. Birçok OCR yazılımının bir sözcüğü doğru olarak okuyamadığında uyarı vermesi, reCAPTCHA yönteminin geçerliliğini mümkün kılıyor.
Normal CAPTCHA yönteminde kullanıcıdan yalnızca 1 adet sözcüğün doğrulanması istenirken, reCAPTCHA yönteminde 2 tane sözcüğün doğrulanması isteniyor. Bu sözcüklerin birisi daha önceden çözümlenmiş bir sözcük oluyor ve formu dolduranın gerçekten bir insan olup olmadığını kontrol etmek için kullanılıyor. Diğer sözcük ise OCR yazılımıyla doğru olarak okunamamış sözcük oluyor ve metne dönüştürme işleminde kullanılıyor. Yani bir yandan sisteme insan olduğunuzu kanıtlıyorsunuz, diğer yandan da kitapların sayısal ortama aktarılmasında insanlığa bir faydanız dokunmuş oluyor.