<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<meta name="Generator" content="Microsoft Exchange Server">
<!-- converted from text --><style><!-- .EmailQuote { margin-left: 1pt; padding-left: 4pt; border-left: #800000 2px solid; } --></style>
</head>
<body>
<div>
<div style="font-family:Calibri,Arial,Helvetica,sans-serif; font-size:12.0pt; line-height:1.3; color:#1F497D">
<div>The bayes_auto_learn is probably working against you. You should never turn that on until you have made absolutely sure your bayes filter is trained just right which usually happens after 200 spam and ham messages. I personally never turn that on even
 after I train my spam filter. <br>
<br>
What messages are you running your cron script against? <br>
</div>
<div><br>
</div>
</div>
<hr style="border:none; height:1px; color:#E1E1E1; background-color:#E1E1E1">
<div style="border:none; padding:3.0pt 0cm 0cm 0cm"><span style="font-size:11.0pt; font-family:Calibri,Arial,Helvetica,sans-serif"><b>From:</b> sse450 <sse450@gmail.com><br>
<b>Sent:</b> Saturday, May 23, 2020 4:07 AM<br>
<b>To:</b> amavis-users@amavis.org<br>
<b>Subject:</b> Is my Bayes working?<br>
</span></div>
<br type="attribution">
</div>
<font size="2"><span style="font-size:10pt;">
<div class="PlainText">Hello,<br>
<br>
I setup amavisd (2.12.0), spamassassin (3.4.2), postfix, dovecot on <br>
CentOS8 about one month ago and run sa-learn every night as a crontab <br>
entry. There are considerable data accumulated on the database. But, <br>
still, I get BAYES_00=-1.9 for a very spammy mail:<br>
<br>
X-Spam-Flag: YES<br>
X-Spam-Score: 29.813<br>
X-Spam-Level: *****************************<br>
X-Spam-Status: Yes, score=29.813 tagged_above=-999 required=3 <br>
tests=[AXB_XMAILER_MIMEOLE_OL_024C2=0.001, BAYES_00=-1.9, <br>
CUSTOM_DMARC_FAIL=2, DCC_CHECK=1.1, DCC_REPUT_70_89=0.1, <br>
DIGEST_MULTIPLE=0.293, DKIM_ADSP_CUSTOM_MED=0.001, DMARC_NONE=0.1, <br>
FORGED_GMAIL_RCVD=2.5, FORGED_MUA_OUTLOOK=1.927, FORM_FRAUD_5=0.001, <br>
FREEMAIL_ENVFROM_END_DIGIT=0.25, FREEMAIL_FROM=0.001, <br>
FREEMAIL_REPLYTO=1, FREEMAIL_REPLYTO_END_DIGIT=0.25, <br>
FROM_MISSPACED=0.001, FROM_MISSP_EH_MATCH=0.001, <br>
FROM_MISSP_FREEMAIL=2.01, <br>
FROM_MISSP_MSFT=0.001,FROM_MISSP_REPLYTO=1.717, FROM_MISSP_XPRIO=0.001, <br>
FROM_NOT_REPLYTO=2, FSL_BULK_SIG=0.001, FSL_CTYPE_WIN1251=0.001, <br>
FSL_NEW_HELO_USER=0.001, HK_SCAM=0.001, KAM_DMARC_NONE=0.25, <br>
KAM_DMARC_STATUS=0.01, MALFORMED_FREEMAIL=1.142, MISSING_HEADERS=1.021, <br>
MISSING_MID=0.497, NML_ADSP_CUSTOM_MED=0.9, NSL_RCVD_HELO_USER=0.001, <br>
PYZOR_CHECK=1.392,RCVD_IN_MSPIKE_BL=0.001, RCVD_IN_MSPIKE_L4=0.001, <br>
RCVD_IN_RP_RNBL=1.31, RCVD_IN_SBL_CSS=3.335, <br>
REPLYTO_WITHOUT_TO_CC=1.552, SPF_HELO_PASS=-0.001, <br>
SPF_SOFTFAIL=0.665,SPOOFED_FREEMAIL=1.999, SPOOFED_FREEM_REPTO=0.693, <br>
TO_NO_BRKTS_FROM_MSSP=1.655, TO_NO_BRKTS_MSFT=0.001, <br>
T_DEAR_BENEFICIARY=0.01, T_FILL_THIS_FORM_SHORT=0.01, <br>
T_HK_NAME_FM_MR_MRS=0.01] autolearn=no autolearn_force=no<br>
<br>
It seems to me that Bayes is not working. But I don't know why. Here are <br>
some info from my server:<br>
<br>
/etc/mail/spamassassin/local.cf:<br>
<br>
# bayes<br>
use_bayes           1<br>
bayes_auto_learn    1<br>
bayes_auto_expire   1<br>
# Store bayesian data in MySQL<br>
bayes_store_module Mail::SpamAssassin::BayesStore::MySQL<br>
bayes_sql_dsn      DBI:mysql:sa_bayes:127.0.0.1:3306<br>
bayes_sql_username sa_bayes<br>
bayes_sql_password xxxxxxxxx<br>
bayes_sql_override_username amavis<br>
<br>
root@winsvr:/# sa-learn -D --dump magic<br>
<br>
May 23 09:57:00.510 [23968] dbg: config: read file <br>
/etc/mail/spamassassin/local.cf<br>
...<br>
May 23 09:57:02.270 [23968] dbg: plugin: <br>
Mail::SpamAssassin::Plugin::Bayes=HASH(0x5621708f6b48) implements <br>
'learner_new', priority 0<br>
May 23 09:57:02.270 [23968] dbg: bayes: learner_new <br>
self=Mail::SpamAssassin::Plugin::Bayes=HASH(0x5621708f6b48), <br>
bayes_store_module=Mail::SpamAssassin::BayesStore::MySQL<br>
May 23 09:57:02.293 [23968] dbg: bayes: using username: amavis<br>
May 23 09:57:02.293 [23968] dbg: bayes: learner_new: got <br>
store=Mail::SpamAssassin::BayesStore::MySQL=HASH(0x5621725b6cd0)<br>
May 23 09:57:02.293 [23968] dbg: plugin: <br>
Mail::SpamAssassin::Plugin::Bayes=HASH(0x5621708f6b48) implements <br>
'learner_is_scan_available', priority 0<br>
May 23 09:57:02.304 [23968] dbg: bayes: database connection established<br>
May 23 09:57:02.304 [23968] dbg: bayes: found bayes db version 3<br>
May 23 09:57:02.305 [23968] dbg: bayes: Using userid: 1<br>
May 23 09:57:02.305 [23968] dbg: config: score set 3 chosen.<br>
May 23 09:57:02.306 [23968] dbg: dns: EDNS, UDP payload size 4096<br>
May 23 09:57:02.306 [23968] dbg: dns: servers obtained from Net::DNS : <br>
[xxx.162.133.5]:53, [xxx.162.130.5]:53, [xxx.162.137.5]:53<br>
May 23 09:57:02.306 [23968] dbg: dns: nameservers set to xxx.162.133.5, <br>
xxx.162.130.5, xxx.162.137.5<br>
May 23 09:57:02.307 [23968] dbg: dns: using socket module: <br>
IO::Socket::IP version 0.39<br>
May 23 09:57:02.307 [23968] dbg: dns: is Net::DNS::Resolver available? yes<br>
May 23 09:57:02.307 [23968] dbg: dns: Net::DNS version: 1.15<br>
May 23 09:57:02.307 [23968] dbg: sa-learn: spamtest initialized<br>
May 23 09:57:02.307 [23968] dbg: plugin: <br>
Mail::SpamAssassin::Plugin::Bayes=HASH(0x5621708f6b48) implements <br>
'learner_dump_database', priority 0<br>
0.000          0          3          0  non-token data: bayes db version<br>
0.000          0       5785          0  non-token data: nspam<br>
0.000          0      14487          0  non-token data: nham<br>
0.000          0     323279          0  non-token data: ntokens<br>
0.000          0 1587406453          0  non-token data: oldest atime<br>
0.000          0 1590215255          0  non-token data: newest atime<br>
0.000          0          0          0  non-token data: last journal <br>
sync atime<br>
0.000          0 1590176626          0  non-token data: last expiry atime<br>
0.000          0      43200          0  non-token data: last expire <br>
atime delta<br>
0.000          0     202221          0  non-token data: last expire <br>
reduction count<br>
May 23 09:57:02.308 [23968] dbg: plugin: <br>
Mail::SpamAssassin::Plugin::Bayes=HASH(0x5621708f6b48) implements <br>
'learner_close', priority 0<br>
<br>
root@winsvr:~# su amavis -c 'sa-learn -D --dump magic'<br>
<br>
plugin: failed to parse plugin (from @INC): Can't locate <br>
Mail/SpamAssassin/Plugin/SpamCop.pm: <br>
lib/Mail/SpamAssassin/Plugin/SpamCop.pm: Permission denied at (eval 50) <br>
line 1.<br>
plugin: failed to parse plugin (from @INC): Can't locate <br>
Mail/SpamAssassin/Plugin/AutoLearnThreshold.pm: <br>
lib/Mail/SpamAssassin/Plugin/AutoLearnThreshold.pm: Permission denied at <br>
(eval 51) line 1.<br>
...<br>
ERROR: Bayes dump returned an error, please re-run with -D for more <br>
information<br>
<br>
If,<br>
<br>
chown -R amavis.amavis /usr/share/perl5/vendor_perl/Mail/SpamAssassin<br>
<br>
Then,<br>
<br>
root@winsvr:/# su amavis -c 'sa-learn -D --dump magic'<br>
<br>
May 23 10:05:47.129 [24046] dbg: config: read file <br>
/etc/mail/spamassassin/local.cf<br>
...<br>
May 23 10:05:48.785 [24046] dbg: plugin: <br>
Mail::SpamAssassin::Plugin::Bayes=HASH(0x55a459ba3a08) implements <br>
'learner_new', priority 0<br>
May 23 10:05:48.785 [24046] dbg: bayes: learner_new <br>
self=Mail::SpamAssassin::Plugin::Bayes=HASH(0x55a459ba3a08), <br>
bayes_store_module=Mail::SpamAssassin::BayesStore::MySQL<br>
May 23 10:05:48.808 [24046] dbg: bayes: using username: amavis<br>
May 23 10:05:48.808 [24046] dbg: bayes: learner_new: got <br>
store=Mail::SpamAssassin::BayesStore::MySQL=HASH(0x55a45ad4d5a8)<br>
May 23 10:05:48.808 [24046] dbg: plugin: <br>
Mail::SpamAssassin::Plugin::Bayes=HASH(0x55a459ba3a08) implements <br>
'learner_is_scan_available', priority 0<br>
May 23 10:05:48.818 [24046] dbg: bayes: database connection established<br>
May 23 10:05:48.819 [24046] dbg: bayes: found bayes db version 3<br>
May 23 10:05:48.819 [24046] dbg: bayes: Using userid: 1<br>
May 23 10:05:48.819 [24046] dbg: config: score set 3 chosen.<br>
May 23 10:05:48.820 [24046] dbg: dns: EDNS, UDP payload size 4096<br>
May 23 10:05:48.821 [24046] dbg: dns: servers obtained from Net::DNS : <br>
[xxx.162.133.5]:53, [xxx.162.130.5]:53, [xxx.162.137.5]:53<br>
May 23 10:05:48.821 [24046] dbg: dns: nameservers set to xxx.162.133.5, <br>
xxx.162.130.5, xxx.162.137.5<br>
May 23 10:05:48.821 [24046] dbg: dns: using socket module: <br>
IO::Socket::IP version 0.39<br>
May 23 10:05:48.821 [24046] dbg: dns: is Net::DNS::Resolver available? yes<br>
May 23 10:05:48.821 [24046] dbg: dns: Net::DNS version: 1.15<br>
May 23 10:05:48.821 [24046] dbg: sa-learn: spamtest initialized<br>
May 23 10:05:48.821 [24046] dbg: plugin: <br>
Mail::SpamAssassin::Plugin::Bayes=HASH(0x55a459ba3a08) implements <br>
'learner_dump_database', priority 0<br>
0.000          0          3          0  non-token data: bayes db version<br>
0.000          0       5785          0  non-token data: nspam<br>
0.000          0      14487          0  non-token data: nham<br>
0.000          0     323279          0  non-token data: ntokens<br>
0.000          0 1587406453          0  non-token data: oldest atime<br>
0.000          0 1590215255          0  non-token data: newest atime<br>
0.000          0          0          0  non-token data: last journal <br>
sync atime<br>
0.000          0 1590176626          0  non-token data: last expiry atime<br>
0.000          0      43200          0  non-token data: last expire <br>
atime delta<br>
0.000          0     202221          0  non-token data: last expire <br>
reduction count<br>
May 23 10:05:48.822 [24046] dbg: plugin: <br>
Mail::SpamAssassin::Plugin::Bayes=HASH(0x55a459ba3a08) implements <br>
'learner_close', priority 0<br>
<br>
Interestingly, even after chown, su amavis -c 'sa-learn -D --dump magic' <br>
still gives permission denied error sometimes.<br>
<br>
root@winsvr:/# sa-learn -D --spam <br>
/usr/share/doc/spamassassin/sample-spam.txt<br>
...<br>
May 23 10:27:35.496 [24330] dbg: bayes: <br>
31dcbefd2524b07c65d551d282ce77902f3804c7@sa_generated already learnt <br>
correctly, not learning twice<br>
Learned tokens from 0 message(s) (1 message(s) examined)<br>
May 23 10:27:35.496 [24330] dbg: plugin: <br>
Mail::SpamAssassin::Plugin::Bayes=HASH(0x5573c2433810) implements <br>
'learner_close', priority 0<br>
<br>
root@winsvr:/# su amavis  -c 'sa-learn -D --spam <br>
/usr/share/doc/spamassassin/sample-spam.txt'<br>
...<br>
May 23 10:18:38.666 [24267] dbg: bayes: <br>
31dcbefd2524b07c65d551d282ce77902f3804c7@sa_generated already learnt <br>
correctly, not learning twice<br>
Learned tokens from 0 message(s) (1 message(s) examined)<br>
May 23 10:18:38.666 [24267] dbg: plugin: <br>
Mail::SpamAssassin::Plugin::Bayes=HASH(0x561762cc7150) implements <br>
'learner_close', priority 0<br>
<br>
Is the BAYES_00=-1.9 normal for the sample spam email? Perhaps, I need <br>
to accumulate more training data. Or, is something look wrong with my setup?<br>
<br>
I would appreciate any help.<br>
<br>
Thank you.<br>
<br>
<br>
</div>
</span></font>
</body>
</html>