Lo spam letterario che beffa i filtri.

Di Paolo Attivissimo.

Nuove tecniche degli spammer per eludere i filtri antispam: i messaggi mutaforma. Difficile difendersi pienamente, possibile un contenimento del fastidio.

ZEUS News.

www.zeusnews.it.

28-05-2005
La battaglia contro lo spam pareva vinta, ma gli spammer si sono vendicati. I filtri bayesiani antispam adottati da molti provider sembravano aver risolto
il problema alla radice: in cambio di un canone mensile estremamente modico, presso la maggior parte dei provider  da tempo possibile chiedere l'attivazione
di un filtro antispam estremamente efficace e selettivo, con un tasso d'errore inferiore a quello umano.

Nella mia casella di posta su Tin.it, per esempio, si accumulano in media 3000 spam ogni settimana. Tutti vengono sistematicamente filtrati e non li vedo
neppure. Cosa pi importante, non perdo tempo e denaro a scaricarli, cosa preziosa specialmente in un periodo in cui viaggio molto e sono spesso online
tramite GPRS o connessioni Wifi a pagamento negli alberghi.

Con l'introduzione di questi filtri, il numero di spam che ricevevo in casella e che quindi dovevo eliminare a mano era sceso a un livello sopportabilissimo;
una piacevole esperienza condivisa da molti utenti che hanno optato per la formula "meglio pagare qualcosina e lavorare bene piuttosto che avere tutto
gratis e tribolare".

Ma le cose sono cambiate. Stanno infatti iniziando a circolare dei messaggi mutaforma che scavalcano gli attuali filtri antispam. Meritano attenzione perch
hanno un aspetto decisamente insolito: spesso sembrano messaggi privi di ogni richiamo pubblicitario, come potete vedere in questa
immagine.

Dopo averne ricevuti a decine nonostante i miei filtri antispam, ho cominciato a chiedermi che senso avesse inviare spam che non promuove alcun prodotto
ma contiene invece soltanto una citazione letteraria (altri esempi che imperversano in questi giorni sono costituiti da testi latini). Certo, le parole
rare e i nomi contenuti nella citazione aiutano a superare i filtri bayesiani, che per loro natura tendono ad accettare messaggi contenenti pi di un tot
di parole raramente frequenti nello spam. Ma lo scopo primario dello spam  vendere, per cui un messaggio senza link o nomi di prodotti sembra un assurdo.

Ho pensato anche a un trucco da tempo caro agli spammer, ossia inserire il testo del messaggio pubblicitario come immagine allegata, ma questo spam non
 accompagnato da immagini.

Poi finalmente mi si  accesa la lampadina. Come ogni navigatore della Rete che abbia a cuore la sicurezza e non sia ansioso di trovarsi nella posta pornografia
e altre sorprese, ho impostato il mio client di posta (
Thunderbird)
in modo che non interpreti l'HTML eventualmente presente nei messaggi. In questo modo, vedo soltanto il testo semplice del messaggio, evitando immagini
os e altre trappole.

Ho provato a riattivare l'interpretazione dell'HTML per quel messaggio, e con grande sorpresa ho trovato che ha cambiato completamente contenuto. Da citazione
letteraria si  trasformato in una chiarissima rclame di farmaci, con tanto di link cliccabile.

Questo, insomma,  quello che avrebbe visto qualsiasi utente che avesse ricevuto questo spam e non avesse disattivato l'interpretazione dell'HTML: uno spam
perfetto, chiaramente leggibile e addirittura privo degli errori di ortografia che solitamente appestano lo spam. Uno spam che ha eluso agilmente i filtri
antispam. Come  possibile?

Il trucco viene rivelato esaminando
l'HTML del messaggio.

Dopo una prima parte di testo semplice, che contiene la citazione letteraria, c' una parte in HTML che ospita il testo pubblicitario. In questa seconda
parte, le parole-chiave che avrebbero allertato i filtri antispam sono spezzate inserendovi codici HTML e frammenti della citazione. Le ho evidenziate
in grassetto qui sotto per chiarezza e ho sostituito le parentesi angolari dell'HTML con parentesi quadre.

In questo modo, il filtro antispam non capisce che "V[SPAN style=3D"DISPLAY: none"]of the shed where = the Governor was standing at the moment.[/SPAN]lAGRA
VA[SPAN = style=3D"DISPLAY: none"]with that of his unfortunate fellow-convicts = bring him the[/SPAN]LlUM" verr letto come "Viagra Valium" (con la L minuscola
usata come I) e viene quindi beffato.

Non resta che attendere la prossima generazione di filtri antispam, capace di interpretare l'HTML e analizzare il messaggio tenendo conto anche di come
verrebbe visualizzato, anzich limitarsi ad analizzarne il testo. Nel frattempo, almeno per ora, gli spammer hanno vinto.

Rimane comunque valido il consiglio di non attivare l'interpretazione dell'HTML nel vostro programma di posta: cos, perlomeno, vedrete la citazione letteraria
al posto delle scempiaggini degli spammer.

Paolo Attivissimo.

