October 30, 2018

Pengertian, Metode, dan Tahapan Data Mining

Karena artikel pengertian dan metode data mining terbagi dalam 3 bagian yang meliputi pengertian data mining, metode data mining, dan tahapan data mining kamu bisa memilih list dibawah ini untuk langsung menuju ke topik yang ingin dibaca

Pengertian Data Mining

  • Metode Data Mining
  • Tahapan Data Mining
  • Pengertian Data Mining

Istilah data mining memiliki beberapa penyebutan seperti knowledge discovery ataupun pattern recognition. kedua istilah tersebut sebenarnya memiliki arti masing-masing tapi masih saling berhubungan.

Istilah knowledge discovery adalah tujuan utama dari data mining karena metode data mining memang untuk mendapatkan pengetahuan yang masih tersembunyi didalam bongkahan data

Pengertian, Metode, dan Tahapan Data Mining

Istilah pattern recognition memiliki tujuan untuk menggali pola-pola yang mungkin masih perlu digali dari dalam bongkahan data yang sedang diamati

dari kedua istilah diatas sebenarnya sama saja dengan data mining karena data mining merupakan disiplin ilmu yang tujuan utamanya adalah untuk menemukan, menggali, atau menambang pengetahuan dari data atau informasi yang dimiliki

Menurut wikipedia penggalian data adalah ekstraksi pola yang menarik dari data dalam jumlah besar. Suatu pola dikatakan menarik apabila pola tersebut tidak sepele, implisit, tidak diketahui sebelumnya, dan berguna. Pola yang disajikan haruslah mudah dipahami, berlaku untuk data yang akan diprediksi dengan derajat kepastian tertentu, berguna, dan baru

Menurut ahli data mining adalah penambangan atau penemuan informasi baru dengan mencari pola atau aturan tertentu dari sejumlah data yang sangat besar (Davies, 2004)

Intinya pengertian data mining adalah menganalisis data untuk menemukan pola yang ada didalam sebuah data, biasanya pekerjaan ini dilakukan oleh sistem analis

Karakterisik Data Mining

Data mining berhubungan dengan penemuan sesuatu yang tersembunyi dan pola data tertentu yang tidak diketahui sebelumnya.

Data mining biasa menggunakan data yang sangat besar. Biasanya data yang besar digunakan untuk membuat hasil lebih dipercaya.

Data mining berguna untuk membuat keputusan yang kritis, terutama dalam strategi (Davies, 2004).

Metode Data Mining

Dalam data mining ada beberapa metode yang dilakukan untuk mengetahui data yang terbagi kedalam 5 metode

Klasifikasi

Klasifikasi adalah fungsi pembelajaran yang mengklasifikasi sebuah unsur data ke dalam salah satu dari beberapa kelas yang sudah didefinisikan.

Kelebihan menggunakan metode Klasifikasi

  • Predictive accuracy
  • Hit rate
  • Speed
  • Model building; predicting
  • Robustness
  • Scalability
  • Interpretability
  • Transparency, explainability
  • Regresi

Regresi adalah fungsi pembelajaran yang mengklasifikasikan sebuah unsur data ke sebuah variabel prediksi yang bernilai nyata. Aplikasi dari regresisi ini misalnya adalah pada prediksi volume biomasa di hutan dengan didasari pada pengukuran gelombang mikro penginderaan jarak jauh (remotely-sensed), prediksi kebutuhan pelanggan terhadap sebuah produk baru sebagai fungsi dari pembiayaan advertensi, dll

Pengelompokan

Pengelompokan atau clustering adalah merupakan tugas deskripsi yang banyak digunakan dalam mengidentifikasi sebuah himpunan terbatas pada kategori atau cluster untuk mendeskripsikan data yang ditelaah. Kategori-kategori ini dapat bersifat eksklusif dan ekshaustif mutual, atau mengandung representasu yang lebih kaya seperti kategori yang hirarkis atau saling menumpu (overlapping)

Metode Clustering juga bisa dibilang metode yang digunakan untuk mengelompokan data yang memiliki kemiripan

Association

Association atau Market Basket Analysis. Sebuah masalah bisnis yang khas adalah menganalisa tabel transaksi penjualan dan mengidentifikasi produk-produk yang seringkali dibeli bersamaan oleh pelanggan.

Penggunaan metode Association bertujuan untuk

  • Mencari produk apa yang biasanya terjual bersamaan
  • Mencari tahu apa aturan yang menyebabkan kesamaan tersebut

Metode Pohon Keputusan

Metode Pohon keputusan atau sering juga disebut Metode Keputusan adalah pemetaan mengenai alternatif-alternatif pemecahan masalah yang dapat diambil dari masalah tersebut dan juga memperlihatkan faktor-faktor kemungkinan/probablitas yang akan mempengaruhi alternatif keputusan tersebut.

Kelebihan pohon keputusan

  1. Mem-break down proses pengambilan keputusan yang kompleks menjadi lebih sederhana sehingga pengambilan keputusan akan lebih menafsirkan solusi permasalahan.
  2. Pohon Keputusan juga berguna untuk mengeksplorasi data, menemukan hubungan tersembunyi antara sejumlah calon variabel input dengan sebuah variabel target.
  3. Pohon keputusan memadukan antara eksplorasi data dan pemodelan, sehingga sangat bagus sebagai langkah awal dalam proses pemodelan bahkan ketika dijadikan sebagai model akhir dari beberapa teknik lain.

Selain memiliki 5 metode yang memiliki kelebihannya masing – masing untuk melakukan data mining terdapat 7 tahapan yang harus dilakukan oleh seorang analis, berikut 7 tahapan data mining

6 Tahapan Data Mining

Pembersihan data (data cleaning)

Pembersihan data merupakan proses menghilangkan data yang tidak konsisten atau tidak relevan. Pada umumnya data yang diperoleh, baik dari database suatu perusahaan maupun hasil eksperimen, memiliki isian-isian yang tidak sempurna seperti data yang hilang atau atribut yang tidak relevan. Jadi intinya Pembersihan data adalah untuk menghilangkan data yang tidak berguna atau cacat

Integrasi Data (Integration Data)

Integrasi data adalah penggabungan data dari berbagai basis data ke dalam satu basis data baru. Integrasi data dilakukan pada atribut-aribut yang mengidentifikasikan entitas-entitas yang unik seperti atribut nama, jenis produk, nomor induk dan lainnya. Integrasi data harus dilakukan secara tepat karena kesalahan pada integrasi data bisa menghasilkan hasil yang menyimpang dan membuat pengambilan keputusan yang salah. Inti dari Integrasi data adalah menghubungkan beberapa data untuk memudahkan pengambilan keputusan

Seleksi Data (Data Selection)

Tahap seleksi data merupakan pemilihan data yang ada pada database yang tidak terpakai, maka dari itu hanya data yang sesuai untuk dianalisis yang akan diambil dari database.

Transformasi data (Data Transformation)

Data diubah atau digabung ke dalam format yang sesuai untuk diproses dalam data mining. Beberapa metode data mining membutuhkan format data yang khusus sebelum bisa diaplikasikan.

Penggalian Data (Data Mining)

Seperti pengertian data mining diatas yang merupakan proses utama saat metode diterapkan untuk menemukan pengetahuan berharga dan tersembunyi dari data.

Evaluasi Pola (Pattern Evaluation)

Mengidentifikasi pola-pola unik kedalam knowledge based yang ditemukan. Tahap ini merupakan hasil dari teknik data mining berupa pola-pola yang khas maupun model prediksi evaluasi untuk menilai apakah hipotesa yang ada memang tercapai. Bila ternyata hasil yang diperoleh tidak sesuai hipotesa ada beberapa alternatif yang dapat diambil seperti menjadikannya umpan balik untuk memperbaiki proses data mining, mencoba metode data mining lain yang lebih sesuai, atau menerima hasil ini sebagai suatu hasil yang di luar dugaan yang mungkin bermanfaat

Presentasi pengetahuan (Knowledge Presentation)

Tahap terakhir dari proses data mining yang Merupakan visualisasi dan penyajian pengetahuan mengenai metode yang digunakan untuk memperoleh pengetahuan yang diperoleh pengguna dan bagaimana memformulasikan keputusan dari hasil analisis yang didapat

Share

You may also like...

Leave a Reply

Your email address will not be published. Required fields are marked *