Beberapa dari kita terganggu oleh serangan puluhan bahkan ratusan email yang tidak diinginkan yang menyapa kita ketika kita membuka akun email kita memiliki harapan untuk istirahat dalam bentuk filter spam Bayesian. Selama bertahun-tahun spammer dapat tetap selangkah lebih maju dari pemblokir spam hanya karena kreativitas dan kemampuan mereka untuk menyesuaikan dan menghindari pemblokiran setiap kali filter spam baru dikembangkan. Akibatnya, pengembang perangkat lunak antispam yakin akan tugas di depan mereka; untuk mengembangkan perangkat lunak yang dapat terus belajar dari teknik spammer baru dan kreatif dan sebagai hasilnya tidak pernah ketinggalan dalam permainan pemblokiran spam.
IAML5.12: Naif Bayes untuk deteksi spam
Hanya baru-baru ini, solusi semacam itu telah dikembangkan dalam bentuk filter Bayesian. Metode statistik Bayesian, yang menjadi dasar filter, bekerja berdasarkan premis membagi email ke dalam beberapa kategori. Perangkat lunak ini mengambil log dari email yang Anda pilih untuk dibuka dan yang Anda hapus. Sementara itu, ia memonitor karakteristik dari kedua email yang Anda buka dan yang tidak Anda buka. Seiring waktu, ia belajar dari angka agregat ini. Ini akan mengenali kata-kata tertentu yang sering muncul di email-email itu yang selalu Anda abaikan. Perangkat lunak kemudian akan lebih rentan untuk mengkategorikan email dengan frekuensi tinggi dari kata tertentu sebagai spam.
Tapi jangan sampai Anda khawatir bahwa tidak membuka beberapa email dari Bibi Sue Anda tiba-tiba akan menyebabkan semua email dengan kata ';Sue'; dikategorikan sebagai spam, Anda harus tahu bahwa filter Bayesian bekerja secara agregat. Ini berarti, bahwa sementara keputusan Anda tentang email mana yang dibuka dan yang tidak akan mempengaruhi algoritma, demikian juga aktivitas ribuan jika tidak puluhan ribu pengguna lain. Tersebar di sekumpulan besar pengguna, dan mengumpulkan data selama periode tersebut, hanya ada sedikit bahaya pelabelan palsu. Sebaliknya, apa yang Anda dapatkan adalah alat jangka panjang yang sangat akurat untuk memblokir spam. Sayangnya, karakteristik yang sama yang mencegah pemblokiran palsu juga membatasi filter spam Bayesian untuk memblokir gelombang depan teknik spamming baru. Jadi, seringkali efeknya adalah beberapa hari atau minggu dari suatu teknik baru dalam spamming menyelinap melalui celah-celah sampai itu dikerjakan ke dalam algoritma.
Dengan cara yang sama, bagaimanapun, salah satu manfaat besar dari filter spam Bayesian adalah bahwa mereka dapat individual. Jika Anda menerima jumlah spam yang tidak proporsional berdasarkan minat online Anda, Anda sebenarnya dapat memodifikasi pemblokir spam Bayesian untuk memperlakukan kata-kata tertentu yang secara khusus merupakan spam bagi Anda. Dengan kata lain, bahwa meskipun filter Bayesian yang tidak diproteksi akan berhati-hati untuk menghindari pemblokiran yang berlebihan, ketika diminta oleh pengguna, perangkat lunak dapat dibuat untuk memblokir segala jenis email spam spesifik..
Hanya baru-baru ini teknologi tersebut tersedia secara komersial. Saat ini ia ditawarkan dalam sejumlah program perangkat lunak anti spam yang dapat dibeli dan yang memindai setiap bagian dari email sebelum dibuka. Bentuk lain adalah yang sebenarnya tertanam ke dalam perangkat lunak server surat itu sendiri, yang berarti bahwa email pelanggan sudah dipindai dan diklasifikasikan bahkan sebelum dia membuka penyedia email mereka