Ochrana proti spamu v Drupalu I. - Úvod
Spam již dávno není jen doménou e-mailu, ale také webových serverů, které umožňují uživatelům vkládat jakýkoliv obsah. Spamové záznamy zvláště v komentářích se objevují dnes a denně a není výjimkou server, na kterém najdete tisíce spamů. Spam se nevyhýbá ani serverům, které používají Drupal (hlavně osobní blogy), zkusíme se podívat na to, jak v Drupalu se spamem bojovat.
Pozadí spamu
Spam ve většině případů na servery vkládají roboti, kteří procházejí všechny stránky a hledají vhodné formuláře, do kterých poté vyplní text do <textarea> a nasimulují stisk všech tlačítek. Tím se dostáváme k možnostem ochrany proti spamu:
- Turingův test - jednoduchý test, který má určit, zda uživatel je člověk, či počítač. V tomto případě většinou jednoduchý početní test typu "Kolik je 2+2?" (Wikipedia::Turingův Test)
- Captcha - Completely Automated Public Turing Test to Tell Computers and Humans Apart. Jedna z metod turingova testu, obrázek, na kterém je text, který by neměl být rozpoznán počítačem.
- Ochranné tlačítko - většinou závislé na JavaScriptu a předpokladu, že jím roboti nedisponují. Celkem spolehlivá metoda, avšak zde se jí nebudeme zabývat. Zjednodušeně funguje tak, že přidává do stránky turingův výpočetní test, který vyplňuje JavaScriptem. Pokud uživatel JavaScript nemá, může test vyplnit sám, robot má smůlu. Občas také schované submit tlačítko ve formuláři - robot z 99% odešle všechna tlačítka.
- Bayes a dns databáze - většina z nás zná ze svých e-mailových schránek, Bayes teorém se zabývá pravděpodobností výskytu nějakého slova v textu podle své databáze (Wikipedia::Bayes). DNS databáze zase vyhledává v textu webové adresy a dotazuje se na ně známých blacklistů. Některé testy analyzují chování robota a dle toho vyhodnocují, zda bude příspěvek vložen.
- Několik dalších doplňkových technik, které popíšu později.
Toto nejsou všechny možnosti, jsou to však ty nejpoužívanější.
Drupal a jeho možnosti
Drupal nabízí díky svému modulárnímu systému a API několik možností ochrany proti spamu. V současné době můžete použít Bayes a DNS databáze, několik forem Turingova testu a hodnotící filtr. V příštím díle seriálu se budeme zabývat turingovy testy.
Poslat nový komentář