Text mining

Dengan berkembangnya sosial media yang berbasis teks, pengolahan data teks juga semakin berkembang.  Terdapat beberapa aturan-aturan yang subjektif yang sering dipakai untuk penentuan kata-kata dalam teks yang akan dianalisa. Berikut ini adalah hasil visual data mining dari sms spam yang saya kumpulkan sampai saat ini.

Distribusi kata yang sering muncul dalam sms spam

 

Distribusi kata dalam kumpulan beberapa dokumen (corpus)

 

Leave a Reply

Your email address will not be published. Required fields are marked *

*

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>