|
|
|
|
一封电子邮件,从邮件分析的角度可以大致分为以下五部分:邮件头、发件人、收件人、邮件主题、邮件内容。
刚才我们也说了,客户端是一个被动接收的角色,我们现在还没有足够的权利去做其它的事情。我们只能采用过滤技术来摆脱垃圾邮件,通过对电子邮件在五个部分比较明显的标志位我们还是可以基本上确认这封邮件是不是垃圾邮件的。
1、对发件人地址的过滤。
这项技术就是依据发件人地址进行判断是否是垃圾邮件,比如不合法的邮件地址会就会认为是垃圾邮件,如????@163.net,和一些不合规范的邮件地址及空地址,如lakdjfhkiu@lkdfnehgugnuoi、lkjsfu#iern@nfiehrng.net。对于这些邮件就会判断认为是垃圾邮件。
2、对收件人地址的过滤。
大家可能会说,收件地址不就我的邮箱地址吗?这还需要过滤?呵呵,当然,收件人地址也是可以用来发送垃圾邮件的。这种情况就是考虑到邮件列表了,因为邮件列表在发送的时候,收件人地址只是一个列表的名称,所以,虽然有些邮件收件人不是你,但是,是以邮件列表的形式发送的,所以,你还是会收到的。对于收件人地址的检查和过滤也是必要的。
3、对邮件主题的过滤。
这个应该算是比较重要的一个过滤了,一般一些垃圾邮件的主题还是有一些共同的特性的。比如前一段时间闹的比较凶的SoBig.F病毒,一共以9个题来发送病毒邮件,发件人和收件人地址都不确定,只要你过滤掉这9个主题,你就不会受到SoBig.F病毒所发送的垃圾邮件骚扰了。
4、对邮件内容关键字的过滤。
邮件内容的过滤一般以一个关键字词或多个关键字词为判断依据。根据关键字词的命中率来确认这封邮件是否是垃圾邮件。如果命中率超过了设置的阀值,就认为是垃圾邮件。同时关键字词还可以是短语和短句。
5、对邮件头信息过滤。
邮件头信息是记录邮件投递过程的原始信息,这一点对垃圾邮件有着非常重要的信息。虽然垃圾邮件发送者在发送垃圾邮件的时候,可以利用各种的工具随机伪造不同的收发件人、主题和内容,但是在邮件头信息中,这些邮件还是有一些共同的信息的,主要是IP、主机名、X-标识。通过对这些信息的过滤,就可以把由同一地址发出的但收发信地址和主题随机的垃圾邮件从众多的邮件找出来。
|
|
|