BerandaIstilahData Mining

Data Mining

Data mining / Penambangan Data adalah proses mencari dan menganalisis sejumlah besar data mentah untuk mengidentifikasi pola dan mengekstrak informasi yang berguna. Perusahaan menggunakan perangkat lunak data mining untuk mempelajari lebih lanjut tentang pelanggan mereka. Hal ini dapat membantu mereka mengembangkan strategi pemasaran yang lebih efektif, meningkatkan penjualan, dan mengurangi biaya. Data mining bergantung pada pengumpulan data yang efektif, pergudangan, dan pemrosesan komputer.

Bagaimana Data Mining Bekerja

Data mining melibatkan eksplorasi dan analisis blok informasi yang besar untuk mendapatkan pola dan tren yang berarti. Ini digunakan dalam manajemen risiko kredit, deteksi penipuan, dan penyaringan spam. Ini juga merupakan alat riset pasar yang membantu mengungkapkan sentimen atau opini dari sekelompok orang. Proses penggalian data dibagi menjadi empat langkah:

  • Data dikumpulkan dan dimasukkan ke dalam gudang data di tempat atau di layanan cloud.
  • Analis bisnis, tim manajemen, dan profesional teknologi informasi mengakses data dan menentukan bagaimana mereka ingin mengaturnya.
  • Perangkat lunak aplikasi khusus menyortir dan mengatur data.
  • Pengguna akhir menyajikan data dalam format yang mudah dibagikan, seperti grafik atau tabel.

Perangkat Lunak Penyimpanan dan Data Mining

Program Data Mining menganalisis hubungan dan pola dalam data berdasarkan permintaan pengguna. Program ini mengorganisasikan informasi ke dalam kelas-kelas. Sebagai contoh, sebuah restoran mungkin ingin menggunakan data mining untuk menentukan menu spesial apa yang harus ditawarkan dan pada hari apa. Data dapat diatur ke dalam kelas-kelas berdasarkan kapan pelanggan berkunjung dan apa yang mereka pesan. Dalam kasus lain, penambang data menemukan kelompok informasi berdasarkan hubungan logis atau melihat asosiasi dan pola berurutan untuk menarik kesimpulan tentang tren perilaku konsumen. Pergudangan merupakan aspek penting dalam penggalian data. Pergudangan adalah sentralisasi data organisasi ke dalam satu database atau program. Hal ini memungkinkan organisasi untuk memisahkan segmen data untuk dianalisis dan digunakan oleh pengguna tertentu sesuai dengan kebutuhan mereka.

Teknik Data Mining

Data mining menggunakan algoritma dan berbagai teknik lain untuk mengubah koleksi data yang besar menjadi output yang berguna. Jenis teknik data mining yang paling populer meliputi:

  • Aturan asosiasi, juga disebut sebagai analisis keranjang pasar, mencari hubungan antar variabel. Hubungan ini dengan sendirinya menciptakan nilai tambahan dalam kumpulan data karena berusaha menghubungkan potongan-potongan data. Sebagai contoh, aturan asosiasi akan mencari riwayat penjualan perusahaan untuk melihat produk mana yang paling sering dibeli secara bersamaan; dengan informasi ini, toko dapat merencanakan, mempromosikan, dan meramalkan.
  • Klasifikasi menggunakan kelas-kelas yang sudah ditentukan sebelumnya untuk menetapkan objek. Kelas-kelas ini menggambarkan karakteristik item atau mewakili kesamaan yang dimiliki oleh masing-masing titik data. Teknik Data Mining ini memungkinkan data yang mendasarinya dikategorikan dengan lebih rapi dan dirangkum di seluruh fitur atau lini produk yang serupa.
  • Pengelompokan mirip dengan klasifikasi. Namun, pengelompokan mengidentifikasi kesamaan antara objek, kemudian mengelompokkan item tersebut berdasarkan apa yang membuat mereka berbeda dari item lainnya. Sementara klasifikasi dapat menghasilkan kelompok seperti “sampo”, “kondisioner”, “sabun”, dan “pasta gigi”, pengelompokan dapat mengidentifikasi kelompok seperti “perawatan rambut” dan “kesehatan gigi”.
  • Pohon keputusan digunakan untuk mengklasifikasikan atau memprediksi hasil berdasarkan daftar kriteria atau keputusan yang telah ditetapkan. Pohon keputusan digunakan untuk meminta masukan dari serangkaian pertanyaan bertingkat yang mengurutkan kumpulan data berdasarkan respons yang diberikan. Terkadang digambarkan sebagai visual seperti pohon, pohon keputusan memungkinkan adanya arahan khusus dan masukan dari pengguna saat menggali lebih dalam ke dalam data.
  • K-Nearest Neighbor (KNN) adalah sebuah algoritma yang mengklasifikasikan data berdasarkan kedekatannya dengan data lain. Dasar dari KNN berakar pada asumsi bahwa titik data yang dekat satu sama lain lebih mirip satu sama lain dibandingkan dengan data lainnya. Teknik non-parametrik dan terawasi ini digunakan untuk memprediksi fitur-fitur dari suatu kelompok berdasarkan titik data individual.
  • Jaringan syaraf memproses data melalui penggunaan node. Node-node ini terdiri dari input, bobot, dan output. Data dipetakan melalui pembelajaran yang diawasi, mirip dengan cara otak manusia saling berhubungan. Model ini dapat diprogram untuk memberikan nilai ambang batas untuk menentukan keakuratan model.
  • Analisis prediktif berusaha memanfaatkan informasi historis untuk membangun model grafis atau matematis guna meramalkan hasil di masa depan. Tumpang tindih dengan analisis regresi, teknik ini bertujuan untuk mendukung angka yang tidak diketahui di masa depan berdasarkan data saat ini yang ada.

Proses Data Mining

Agar lebih efektif, analis data biasanya mengikuti alur tugas tertentu di sepanjang proses data mining. Tanpa struktur ini, seorang analis mungkin akan menemukan masalah di tengah-tengah analisis mereka yang seharusnya dapat dengan mudah dicegah jika mereka mempersiapkannya lebih awal. Proses data mining biasanya dibagi menjadi beberapa langkah berikut.

Langkah 1: Memahami Bisnis

Sebelum data disentuh, diekstrak, dibersihkan, atau dianalisis, penting untuk memahami entitas yang mendasari dan proyek yang sedang dikerjakan. Apa tujuan yang ingin dicapai perusahaan dengan menambang data? Bagaimana situasi bisnis mereka saat ini? Apa saja temuan dari analisis SWOT? Sebelum melihat data apa pun, proses penambangan dimulai dengan memahami apa yang akan menentukan keberhasilan di akhir proses.

Langkah 2: Memahami Data

Setelah masalah bisnis didefinisikan dengan jelas, saatnya untuk mulai berpikir tentang data. Hal ini termasuk sumber apa saja yang tersedia, bagaimana data tersebut akan diamankan dan disimpan, bagaimana informasi akan dikumpulkan, dan seperti apa hasil akhir atau analisisnya. Langkah ini juga termasuk menentukan batasan data, penyimpanan, keamanan, dan pengumpulan serta menilai bagaimana batasan-batasan ini akan mempengaruhi proses data mining.

Langkah 3: Menyiapkan Data

Data dikumpulkan, diunggah, diekstrak, atau dihitung. Data tersebut kemudian dibersihkan, distandarisasi, dibersihkan dari outlier, dinilai dari kesalahan, dan diperiksa kewajarannya. Selama tahap penggalian data ini, data juga dapat diperiksa ukurannya karena kumpulan informasi yang terlalu besar dapat memperlambat perhitungan dan analisis.

Langkah 4: Membangun Model

Dengan kumpulan data yang sudah bersih, saatnya untuk menghitung angka-angka. Ilmuwan data menggunakan jenis-jenis penggalian data di atas untuk mencari hubungan, tren, asosiasi, atau pola berurutan. Data juga dapat dimasukkan ke dalam model prediktif untuk menilai bagaimana informasi sebelumnya dapat diterjemahkan ke dalam hasil di masa depan.

Langkah 5: Mengevaluasi Hasil

Aspek yang berpusat pada data dari data mining diakhiri dengan menilai temuan dari model data atau model. Hasil dari analisis dapat dikumpulkan, ditafsirkan, dan dipresentasikan kepada para pengambil keputusan yang sebagian besar telah dikecualikan dari proses data mining hingga saat ini. Pada langkah ini, organisasi dapat memilih untuk mengambil keputusan berdasarkan hasil temuan.

Langkah 6: Menerapkan Perubahan dan Memantau

Proses data mining diakhiri dengan manajemen mengambil langkah untuk menanggapi temuan analisis. Perusahaan dapat memutuskan bahwa informasi yang didapat tidak cukup kuat atau temuannya tidak relevan, atau perusahaan dapat melakukan perubahan strategis berdasarkan temuan. Dalam kedua kasus tersebut, manajemen meninjau dampak akhir dari bisnis dan membuat ulang putaran penggalian data di masa depan dengan mengidentifikasi masalah atau peluang bisnis baru.

Aplikasi Data Mining

Di era informasi saat ini, hampir semua departemen, industri, sektor, atau perusahaan dapat memanfaatkan data mining.

Penjualan

Data mining mendorong penggunaan modal yang lebih cerdas dan lebih efisien untuk mendorong pertumbuhan pendapatan. Pertimbangkan mesin kasir di kedai kopi lokal favorit Anda. Untuk setiap penjualan, kedai kopi tersebut mengumpulkan waktu pembelian dan produk apa yang terjual. Dengan menggunakan informasi ini, kedai kopi tersebut dapat menyusun lini produknya secara strategis.

Pemasaran

Setelah kedai kopi di atas mengetahui produk yang ideal, saatnya untuk menerapkan perubahan. Namun, untuk membuat upaya pemasarannya lebih efektif, kedai ini dapat menggunakan penggalian data untuk memahami di mana kliennya melihat iklan, demografi apa yang ditargetkan, di mana menempatkan iklan digital, dan strategi pemasaran apa yang paling beresonansi dengan pelanggan. Hal ini termasuk menyelaraskan kampanye pemasaran, penawaran promosi, penawaran penjualan silang, dan program dengan temuan penggalian data.

Manufaktur

Untuk perusahaan yang memproduksi barang mereka sendiri, data mining memainkan peran penting dalam menganalisis berapa biaya setiap bahan baku, bahan apa yang digunakan paling efisien, bagaimana waktu yang dihabiskan selama proses produksi, dan hambatan apa yang berdampak negatif pada proses tersebut. Penggalian data membantu memastikan aliran barang tidak terganggu.

Deteksi Penipuan

Inti dari data mining adalah menemukan pola, tren, dan korelasi yang menghubungkan titik-titik data. Oleh karena itu, perusahaan dapat menggunakan data mining untuk mengidentifikasi outlier atau korelasi yang seharusnya tidak ada. Sebagai contoh, sebuah perusahaan dapat menganalisis arus kasnya dan menemukan transaksi yang berulang ke akun yang tidak dikenal. Jika hal ini tidak terduga, perusahaan mungkin ingin menyelidiki apakah ada dana yang salah dikelola.

Sumber Daya Manusia

Departemen sumber daya manusia sering kali memiliki berbagai macam data yang tersedia untuk diproses, termasuk data tentang retensi, promosi, kisaran gaji, tunjangan perusahaan, penggunaan tunjangan tersebut, dan survei kepuasan karyawan. Penggalian data dapat menghubungkan data ini untuk mendapatkan pemahaman yang lebih baik tentang mengapa karyawan keluar dan apa yang menarik karyawan baru.

Layanan Pelanggan

Kepuasan pelanggan dapat disebabkan (atau dihancurkan) karena berbagai alasan. Bayangkan sebuah perusahaan yang mengirimkan barang. Seorang pelanggan mungkin tidak puas dengan waktu pengiriman, kualitas pengiriman, atau komunikasi. Pelanggan yang sama mungkin frustrasi dengan waktu tunggu telepon yang lama atau respon email yang lambat. Data mining mengumpulkan informasi operasional tentang interaksi pelanggan dan meringkas temuan untuk menunjukkan titik lemah dan menyoroti apa yang dilakukan perusahaan dengan benar.

Keuntungan dan Kerugian Data Mining

Kelebihan Data Mining

  • Mendorong profitabilitas dan efisiensi
  • Dapat diterapkan pada semua jenis data dan masalah bisnis
  • Dapat mengungkap informasi dan tren yang tersembunyi

Kekurangan dari Data Mining

  • Kompleksitas
  • Hasil dan manfaat tidak dijamin
  • Bisa jadi mahal

Kelebihan Dijelaskan

  • Penggalian data memastikan perusahaan mengumpulkan dan menganalisis data yang dapat diandalkan. Proses ini sering kali merupakan proses yang lebih kaku dan terstruktur yang secara formal mengidentifikasi masalah, mengumpulkan data yang terkait dengan masalah tersebut, dan berusaha untuk merumuskan solusi. Oleh karena itu, data mining membantu bisnis menjadi lebih menguntungkan, lebih efisien, atau lebih kuat secara operasional.
  • Data mining dapat terlihat sangat berbeda di berbagai aplikasi, tetapi proses keseluruhannya dapat digunakan dengan hampir semua aplikasi baru atau lama. Pada dasarnya, semua jenis data dapat dikumpulkan dan dianalisis, dan hampir semua masalah bisnis yang bergantung pada bukti yang memenuhi syarat dapat ditangani dengan menggunakan data mining.
  • Tujuan akhir dari data mining adalah untuk mengambil potongan-potongan informasi mentah dan menentukan apakah ada kohesi atau korelasi di antara data tersebut. Manfaat data mining ini memungkinkan perusahaan untuk menciptakan nilai dengan informasi yang mereka miliki yang sebelumnya tidak terlalu terlihat. Meskipun model data bisa jadi rumit, model data juga dapat memberikan hasil yang menarik, menggali tren yang tersembunyi, dan menyarankan strategi yang unik.

Kekurangannya Dijelaskan

  • Kompleksitas data mining ini adalah salah satu kelemahan terbesarnya. Analisis data sering kali membutuhkan keahlian teknis dan perangkat lunak tertentu. Perusahaan yang lebih kecil mungkin menganggap hal ini sebagai penghalang masuk yang terlalu sulit untuk diatasi.
  • Penggalian data tidak selalu menjamin hasil. Sebuah perusahaan dapat melakukan analisis statistik, membuat kesimpulan berdasarkan data yang kuat, mengimplementasikan perubahan, dan tidak menuai manfaat apa pun. Melalui temuan yang tidak akurat, perubahan pasar, kesalahan model, atau populasi data yang tidak tepat, data mining hanya dapat memandu keputusan dan tidak menjamin hasil.
  • Ada juga komponen biaya dalam penggalian data. Alat-alat data mungkin memerlukan langganan yang mahal, dan beberapa bit data mungkin mahal untuk didapatkan. Masalah keamanan dan privasi dapat diatasi, meskipun infrastruktur TI tambahan mungkin juga mahal. Data mining juga dapat menjadi sangat efektif ketika menggunakan kumpulan data yang sangat besar; namun, kumpulan data ini harus disimpan dan membutuhkan daya komputasi yang besar untuk dianalisis.

Data Mining dan Media Sosial

Salah satu aplikasi data mining yang paling menguntungkan telah dilakukan oleh perusahaan media sosial. Platform seperti Facebook, TikTok, Instagram, dan platform X (sebelumnya Twitter) mengumpulkan banyak sekali data tentang pengguna mereka, berdasarkan aktivitas online mereka. Data tersebut dapat digunakan untuk membuat kesimpulan tentang preferensi mereka. Pengiklan dapat menargetkan pesan mereka kepada orang-orang yang tampaknya paling mungkin merespons secara positif. Data Mining di media sosial telah menjadi perdebatan besar, dengan beberapa laporan investigasi dan pengungkapan yang menunjukkan betapa intrusifnya Data Mining pengguna. Inti dari masalah ini, pengguna mungkin menyetujui syarat dan ketentuan dari situs-situs tersebut tanpa menyadari bagaimana informasi pribadi mereka dikumpulkan atau kepada siapa informasi mereka dijual.

Contoh Data Mining

Data Mining bisa digunakan untuk kebaikan, atau bisa juga digunakan untuk kejahatan. Berikut ini adalah contoh dari keduanya.

eBay dan e-Commerce

eBay mengumpulkan banyak sekali informasi setiap hari dari penjual dan pembeli. Perusahaan ini menggunakan data mining untuk mengaitkan hubungan antar produk, menilai kisaran harga yang diinginkan, menganalisis pola pembelian sebelumnya, dan membentuk kategori produk.

eBay menguraikan proses rekomendasi sebagai berikut:

  1. Metadata barang mentah dan data historis pengguna dikumpulkan.
  2. Skrip dijalankan pada model terlatih untuk menghasilkan dan memprediksi item dan pengguna.
  3. Pencarian KNN dilakukan.
  4. Hasilnya ditulis ke dalam database.
  5. Rekomendasi real-time mengambil ID pengguna, memanggil hasil database, dan menampilkannya kepada pengguna.

Skandal Facebook-Cambridge Analytica

Contoh lain yang patut diwaspadai dari Data Mining adalah skandal data Facebook-Cambridge Analytica. Selama tahun 2010-an, perusahaan konsultan Inggris Cambridge Analytica Ltd. mengumpulkan data pribadi dari jutaan pengguna Facebook. Informasi ini kemudian dianalisis untuk digunakan dalam kampanye presiden Ted Cruz dan Donald Trump pada tahun 2016. Diduga bahwa Cambridge Analytica ikut campur dalam peristiwa penting lainnya seperti referendum Brexit. Sehubungan dengan Data Mining yang tidak tepat dan penyalahgunaan data pengguna ini, Facebook setuju untuk membayar $100 juta karena menyesatkan investor tentang penggunaan data konsumen. Komisi Sekuritas dan Bursa mengklaim bahwa Facebook menemukan penyalahgunaan tersebut pada tahun 2015 tetapi tidak memperbaiki pengungkapannya selama lebih dari dua tahun.

Kesimpulan

Bisnis modern memiliki kemampuan untuk mengumpulkan informasi tentang pelanggan, produk, lini produksi, karyawan, dan etalase mereka. Potongan-potongan informasi acak ini mungkin tidak menceritakan sebuah cerita, namun penggunaan teknik, aplikasi, dan alat penggalian data dapat membantu menyatukan informasi tersebut. Tujuan akhir dari proses data mining adalah untuk mengumpulkan data, menganalisis hasil, dan menjalankan strategi operasional berdasarkan hasil data mining.

Baca Artikel Lainnya

Artikel Sebelumnya
Artikel Berikutnya