ちょっとしたこと、捨てずに。

秋元@サイボウズラボ・プログラマー・ブログ: reCAPTCHA - キャプチャを利用した人力高性能OCR
これはすごい。上手いこと考えるもんです。コメントspam対策などによく使われる、例のゆがんだ文字を読ませる仕組み。CAPTCHAって言うけど、これに便乗してOCRで認識できなかった文字列を読んでもらおうってサービス。
普通にvalidates_captchaなんかを使って自分で実装した場合、この読ませた内容は認証に使ったあとは捨ててしまう。それに、自前で画像の生成をやらないといけないから、RMagickの導入も必要だし、生成時のサーバ負荷もかかる。対してこのサービスを組み込むと、画像生成から認証までは向こうでやってくれるからこっちの手間はかからず、サーバ資源にも影響はない。また、視覚障害者向けの音声認証もちゃんと付いてるから、CAPTCHAのみ実装した場合のアクセシビリティに対する問題も回避できる。
サービスの開発者からすれば高機能なCAPTCHA認証機能が容易に扱えるようになり、ユーザからすればどうせCAPTCHAを解くのには変わりないから変化がない。その上このサービスによって電子化されたテキストが増えるわけで、誰も損せず*1今まで捨てていたリソースが有効に活用される。


reCAPTCHA API Documentationをざっくり訳してみました。これで利用が少しでも進むことを願って。
reCAPTCHA API Documentation日本語訳 - カケラの樹

*1:spammerは損するかな