Spamassassin и utf-8

При использовании Mail::SpamAssassin::Plugin::TextCat, имеем сообщения:

textcat: loaded 73 language models
 
.....
 
message: no encoding detected
 
.....
 
textcat: language possibly: en

По этому поводу нашел статью «Русский язык SpamAssassin» и понял, что не хватает кодировки utf-8 в файле language.
Лекарство в статье не было (как я понял решили подождать). Поэтому порылся в различных исходниках и выдернул файл ru.utf-8.lm (и честно сказать не помню где :( )
Для того, чтобы добавить файл нужно взять из репозитория http://svn.apache.org/repos/asf/spamassassin/trunk последнюю версию. Бросаем в каталог lm файл и собираем командой build.pl.
Скомпилированный файл лежит в каталоге rules. Переносим languages в рабочий каталог spamassasin-а.
Запускаем и видим в логе:

textcat: loaded 74 language models
.....
textcat: language possibly: ru.utf8

Теперь при «normalize_charset 1» можно писать правила на русском языке.

Прикрепленные файлы: ru.utf8, language

Теги:

Ваш отзыв