Dnešní díl seriálu bude pojednávat o Bayes databázích a DNS blacklistech pro odchytávání spamu v Drupalu.
Modul spam je již druhou verzí sama sebe, jeho autorem je Jeremy Andrews z webu kerneltrap.org. Je dostupný na adrese http://www.kerneltrap.org/jeremy/drupal/spam/, z originální stránky modulu na Drupal.org vede pouze odkaz.
Tento modul si udržuje vlastní Bayes databázi spamů a na její základě spamy hodnotí komentáře a automaticky je schovává v případě spamu. Součástí detekce je i detekce URL v komentáři, které jsou pak porovnávány s online DNS blacklistem SURBL.
Stáhněte modul pro Vaši verzi Drupalu a dle vzoru Captcha ho umístěte do adresáře modules. Po aktivaci modulu v záložce modules se vrhneme na nastavení.
Modul má k dispozici 2 rozhraní pro své nastavení. První najdete na adrese http://www.vas-drupal.com/admin/spam, druhé na http://www.vas-drupal.com/admin/settings/spam. To první slouží k zobrazení logu modulu a nastavení vlastních filtrů. Máte možnost si definovat filtr na libovolný regulární výraz nebo url a akci, která se provede, pokud nějaký komentář obsahuje daný výraz (zahodit jako spam, nastavit jako ham).
V druhém nastavení doporučuji zvláště hodnoty Maximum allowed URLs a Maximum repeat URLs. První říká, kolik URL se může objevit v jednom příspěvku, druhá říká, kolik URL se v příspěvku může opakovat. Spamy většinou obsahují mnoho URL a většinou se opakují. Toto nastavení je tak velice užitečné.
V záložce akce zaškrtněte Unpublish spam a Notify user. Pokud je některý příspěvek vyhodnocen jako spam, bude automaticky schován a uživateli bude na obrazovku vypsáno upozornění. Kdyby totiž došlo k nechtěnému označení příspěvku jako spam i v případě, že se o spam nejedná, bude o tom uživatel alespoň vědět.
Nezapomeňte se podívat na nastavení kontrola přístupu na adrese http://www.vas-drupal.com/admin/access. Zde nastavte potřebné role pro Vaše uživatele, nejdůležitější je možnost report spam, kterou by měli mít přihlášení uživatelé. U každého komentáře se jim poté zobrazí tlačítka, kterým daný příspěvek mohou označit jako spam. Toto je nutné pro počáteční učení Bayes databáze.
V příštím a závěrečném díle seriálu použijeme hodnotící filtry a některé menší vychytávky pro komentáře.