01 June 2012

DATA MINING MENGGUNAKAN WEKA

Weka adalah aplikasi data mining open source berbasis Java. Aplikasi ini dikembangkan pertama kali oleh Universitas Waikato di Selandia Baru sebelum menjadi bagian dari Pentaho. Weka terdiri dari koleksi algoritma machine learning yang dapat digunakan untuk melakukan generalisasi / formulasi dari sekumpulan data sampling. Walaupun kekuatan Weka terletak pada algoritma yang makin lengkap dan canggih, kesuksesan data mining tetap terletak pada faktor pengetahuan manusia implementornya. Tugas pengumpulan data yang berkualitas tinggi dan pengetahuan pemodelan dan penggunaan algoritma yang tepat diperlukan untuk menjamin keakuratan formulasi yang diharapkan.

Empat tombol diatas dapat digunakan untuk menjalanankan Aplikasi : 

  1. Explorer digunkan untuk menggali lebih jauh data dengan aplikasi WEKA 
  2. Experimenter digunakan untuk melakukan percobaan dengan pengujian statistic skema belajar 
  3. Knowledge Flow digunakan untuk pengetahuan pendukung 
  4. Simple CLI antar muka dengan menggunakan tampilan command-line yang memungkinkan langsung mengeksekusi perintah weka untuk Sistem Operasi yg tidak menyediakan secara langsung
Pada bagian atas window, tepatnya pada bawah judul bar. Terdapat deretan data, seperti Prepocess,Classify,Cluster,Associate,Select Attributes Visualize. Namun yang aktif hanya Prepocess ini dikarenakan sebelum menggunakan algoritma diatas pastikan sudah melakukan set file yang akan dieksekusi Berikut langkah-langkahnya :
Buka file yang akan dieksekusi oleh Weka, pergunakan extensi file .csv (Command Separated Values). Perlu diingat bahwa sebelumnya kita sudah harus menyediakan data-data pada file tersebut. Disini menggunakan contoh TRANSAKSI.csv sebagai berikut

Disini terdapat atribut sebagai berikut ini :
Kode_pelanggan, 
warna merah, putih, pink, biru, hitam, 
ukuran small, medium, large, extra-large, 
bahan cotton, wol, 
harga 15.000, 15.000-20.000, 20.000-25.000, 30.000.
Kemudian pilih algoritma yang akan digunakan seperti tampilan berikut ini :
Algoritma yang akan digunakan adalah J48. Perbedaan ID3, C4.5 dan J48 sebagai berikut ini:
ID3 merupakan algoritma yang dipergunakan untuk membangun sebuah decision tree atau pohon keputusan. Algoritma ini ditemukan oleh J. Ross Quinlan, dengan memanfaatkan Teori Informasi atau Information Theory milik Shanon. ID3 sendiri merupakan singkatan dari Iterative Dichotomiser 3.
Idenya, adalah membuat pohon dengan percabangan awal adalah atribut yang paling signifikan. Maksudnya signifikan adalah yang paling bisa mempartisi antara iya dan tidak. 
Bisa dilihat, bahwa atribut “patron” membagi 3, dimana hasil pembagiannya cukup ideal. Maksudnya ideal adalah setiap cabang terdiri dari hijau saja atau merah saja. Memang, untuk cabang “full” tidak satu warna (hijau saja atau merah saja). Tapi, pemilihan atribut patron jelas lebih baik daripada atribut type.
Untuk menentukan atribut mana yang lebih dahulu dipergunakan untuk membuat cabang pohon, digunakanlah teori informasi. 
Pada WEKA, ada pilihan untuk menggunakan ID3 ini, dengan nama yang sama. Namun, jelas semua atribut harus bertipe nominal, dan tidak boleh ada yang kosong
Sedangkan, C4.5 merupakan pengembangan dari ID3. Beberapa perbedaannya antara lain :
1. Mampu  menangani atribut dengan tipe diskrit atau kontinu.
2. Mampu  menangani atribut yang kosong (missing value)
3. Bisa memangkas cabang.
Dan J48 merupakan implementasi C4.5 di WEKA.
Jadi, ketika ingin melakukan klasifikasi dengan menggunakan WEKA, akan ada 4 (empat) buah pilihan, yang disebut dengan test options. Test options ini digunakan untuk mengetes hasil dari klasifikasi yang telah dilakukan. Berikut penjelasan mengenai masing-masing option.
1. Use training set
Pengetesan dilakukan dengan menggunakan data training itu sendiri.
2. Supplied test set
Pengetesan dilakukan dengan menggunakan data lain. Dengan menggunakan option inilah, kita bisa melakukan prediksi terhadap data tes.
3. Cross-validation
Pada cross-validation, akan ada pilihan berapa fold yang akan digunakan. Nilai default-nya adalah 10. Mekanisme-nya adalah sebagai berikut:
Data training dibagi menjadi k buah subset (subhimpunan). Dimana k adalah nilai dari fold. Selanjutnya, untuk tiap dari subset, akan dijadikan data tes dari hasil klasifikasi yang dihasilkan dari k-1 subset lainnya. Jadi, akan ada 10 kali tes. Dimana, setiap datum akan menjadi data tes sebanyak 1 kali, dan menjadi data training sebanyak k-1 kali.
Kemudian, error dari k tes tersebut akan dihitung rata-ratanya.
4. Percentage split
Hasil klasifikasi akan dites dengan menggunakan k% dari data tersebut. k merupakan masukan dari user.
Untuk melihat decision tree-nya liat tampilan sebagai berikut ini :
Akan muncul decision sebagai berikut ini :
Penjelasan :
Bahwa dari decision tree tersebut maka root node pada pink menunjukkan cabang sebelah kiri untuk False dengan harga 15000-20000, dimana yang true dengan harga tersebut adalah kode pelanggan dengan A05 sebanyak 4 dan false dengan kode pelanggan A01 sebanyak 6.
Sedangkan disebelah kanan menunjukkan True dengan warna node selanjutnya putih dimana disebelah kiri dengan node warna merah yang disebelah kiri menunjukkan True untuk kode pelanggan A04 sebanyak 2, dan sebelah kanan menunjukkan False dengan kode pelanggan A03 sebanyak 3. Artinya bahwa pelanggan lebih menyukai warna pink kemudian diikuti warna putih selanjutnya diikuti dengan warna merah dimana tidak dengan harga 15000-20000 per pakaian.


52 komentar:

blh minta dataset nya gan?
kirim email aja ke elfbeauty53@gmail.com

Tks pencerahanx...blh minta datasetx bang? Jika berkenan kirim ke email p3ai_ustj@yahoo.co.id

Tks pencerahanx...blh minta datasetx bang? Jika berkenan kirim ke email p3ai_ustj@yahoo.co.id

Tks pencerahanx...blh minta datasetx bang? Jika berkenan kirim ke email p3ai_ustj@yahoo.co.id

Terimakasih pecerahannya ..gan
Jika berkenan minta databasenya kirim ke email ini
zainudin.dinata1@gmail.com

sip, kalo berkenan saya juga minta gan sent to email : tiyok213@gmail.com

terimahkasih pencerahannya gan

kirim keaku juga ya di anis.rohmadi@gmail.com

Makasih penjelasannya.kalo boleh saya minta databasenya kirim ke email ndaties@gmail.com

siang mas bro, boleh minta mentahanya ngak mas bro? kalo boleh bisa dikirimkan ke rendnata@gmail.com terima kasih banyak mas bro..

Misi mas bro, sis. Kalo boleh minta mentahannya sama minta data setnya dong hehe. Yg berkenan bisa dikirim ke bimowinset@gmail.com
Makasih

Assalamualaikum.... Mas boleh minta tolong....

Saya sedang ada tugas komparasi data mining antara rapid miner dan weka....

Tugas saya menjabarkan kenapa hasil dari rapid miner n weka bisa berbeda walalupun menggunakan algortima yang sama( kasus saya:decision tree n naive bayes

Assalamualaikum.... Mas boleh minta tolong....

Saya sedang ada tugas komparasi data mining antara rapid miner dan weka....

Tugas saya menjabarkan kenapa hasil dari rapid miner n weka bisa berbeda walalupun menggunakan algortima yang sama( kasus saya:decision tree n naive bayes

Assalamualaikum.... Mas boleh minta tolong....

Saya sedang ada tugas komparasi data mining antara rapid miner dan weka....

Tugas saya menjabarkan kenapa hasil dari rapid miner n weka bisa berbeda walalupun menggunakan algortima yang sama( kasus saya:decision tree n naive bayes

siang mas klo di perkenankan saya boleh mintak data shett nya
terima kasih

Malam mas bro.., boleh di kirim data sheetnya ke theyjunk@gmail.com
trims mas sblmny.., :)

terimakasih atas pbjlsnnya
maaf boleh minta databasenya? krim email devi.heryana@yahoo.com

boleh minta dataset nya mas? kirim ke email rhsukarna@gmail.com

Boleh minta data set nya gak mas? Klo boleh kirim ke email diyahpuji11@gmail.com

I believe there are many more pleasurable opportunities ahead for individuals that looked at your site.

Data Science Training in Bangalore


Boleh mintak data sheetnya gan
rusdi0393@gmail.com

boleh minta dataset nya .. dimpos.aditra06@gmail.com

Thanks a lot for the blog.Really http://www.gotrainings.com
thank you! Really Great.

Thank you for the information.
Best Training and Real Time Support
http://www.kitsonlinetrainings.com
Active Directory Online Training


Thank you for the information. gan, boleh minta datasetnya? kirim ke sansanhayyu@gmail.com, saya sedang belajar nih. thanks yo. sukses

Try to play popular games in the best online casino in history. great gambling slots Play a lot and get even more wins.

Если вы ищете rgb контроллер то я знаю где он может быть можете заглянуть в Ekodio

boleh kah minta dataset nya buat menyelesaikan tugas bang, kirim ke email saya zaenurrozikin8@gmail.com??

There might be occasions once you might face some form of delay in reaching us, let’s say during the time of filing taxes since there is a lot of hush-hush then. We assure you that individuals will revert for your requirements in less time and work out us accessible to you at QuickBooks Support Number.

All the clients are extremely satisfied with us. We've got many businessmen who burn off our QuickBook Support You can easily come and find the ideal service to your requirements.

Most of us is responsible and makes certain to deliver hundred percent assistance by working 24*7 to meet your requirements. Go ahead and mail us at our QuickBooks Support Phone Number email id whenever you have been in need. You can reach us via call at our toll-free number.

Dial QuickBooks payroll support number so that our experts can guide you to run your payroll services easily, efficiently without facing QuickBooks errors. Our QuickBooks online Payroll support team provides you QuickBooks Payroll Tech Support to help you to pay employees, after low-taxes and deductions. Our QuickBooks support number covers a large part of QB services.

Are you wandering here and there so that you can seek out the proper means to run the QuickBooks Enterprise software for your needs? We now have come with a lot of permanent answers to fix your problems in a few seconds with a great QuickBooks Enterprise customer care. Just dial our QuickBooks Enterprise Support Number USA to contact QuickBooks enterprise help team anytime & anywhere.

How to contact QuickBooks Payroll support?
Different styles of queries or QuickBooks related issue, then you're way in the right direction. You simply give single ring at our toll-free intuit QuickBooks Desktop Payroll Support Phone Number . we are going to help you right solution according to your issue. We work on the internet and can get rid of the technical problems via remote access not only is it soon seeing that problem occurs we shall fix the same.

Our QuickBooks Customer Technical Support Number team is prepared beforehand with the answers for some common errors in QuickBooks.
We make sure the solutions we give you would be best suited to your software, both for the present situation as well as for future.

when you feel something went wrong together with your accounting software and may not discover a way out, you could get tech support team from our experts’ team, working day and night to improve any problems with respect to QuickBooks Tech Support Phone Number.

Well! The QuickBooks Payroll Tech Support Number world is extremely crucial and important as well. The only that has deficiencies in knowledge battle to experience along with options. You can either perform payment processing in desktop or cloud, both ways are only just a little different but provde the same results.

QuickBooks Enterprise Support Phone Number provides end-to end business accounting experience. With feature packed tools and features, this application is effective at managing custom reporting, inventory, business reports etc. all at one place.

You may encounter QuickBooks Error 6000-301 when attempting to access/troubleshoot/open the company file in your QuickBooks. Your workflow gets hindered with a mistake message that says– “QuickBooks Desktop tried to get into company file. Please try again.”

Given that user can very quickly cope with vendors and wholesalers and payment (pending or advance) pertaining to vendors and wholesalers. Our QuickBooks Tech Support Number team will surely there for you to guide and assist you in inventory management.

Take delight in with an array of outshined customer service services for QuickBooks via QuickBooks Support at any time and from anywhere. It signifies that one can access our tech support for QuickBooks at any moment.

QuickBooks Support Phone Number advisors are certified Pro-advisors’ and has forte in furnishing any kind of technical issues for QuickBooks. They have been expert and certified technicians of these domains like QuickBooks accounting,QuickBooks Payroll, Point of Sales, QuickBooks Merchant Services and Inventory issues to provide 24/7 service to our esteemed customers. QuickBooks payroll Services provide methods to all your valuable QuickBooks problem and in addition assists in identifying the errors with QuickBooks data files and diagnose them thoroughly before resolving these problems

Get the most affordable remote help at your doorsteps. Our QuickBooks Tech Support Number help desk is open 24x7 over summer and winter to work with you into the software.

QuickBooks is present for users around the globe even though the best tool to provide creative and innovative features for business account management to small and medium-sized business organizations. If you’re encountering any type of QuickBooks’ related problem, you will definately get all of that problems solved simply by using the QuickBooks Tech Support.

Our QuickBooks Support Phone Number team for QuickBooks provides you incredible assistance in the shape of amazing solutions. The caliber of our services is justified because of the following reasons.

Our dedicated team is sure with you. These are typically surely working at any hour to assist and make suggestions if you run into any QuickBooks error/s. Our QuickBooks Support Phone Number team surely have in-depth knowledge regarding the issues and complications of QuickBooks.

Your accounting application is the QuickBooks Tech Support Number lifeline of your business along with your software can be a home to n number of junks, virus as well as other infected files.

The Quickbooks Tech Support is available 24/7 to produce much-needed integration related support and also to promptly take advantage of QuickBooks Premier with other Microsoft Office software applications.

Post a Comment