Title: Aplikasi dan Kecenderungan dalam Data Mining
1Aplikasi dan Kecenderungan dalam Data Mining
- Aplikasi data mining
- Sistem produk dan protetipe riset data mining
- Tema tambahan pada data mining
- Dampak tentang data mining
- Kecenderungan yang terdapat pada data mining
- Ringkasan
2Aplikasi Data Mining
- Data Mining adalah suatu aplikasi terbaru yang
berbeda dan lebih luas - Masih adanya perbedaan pendapat antara prinsip
umum dan pembagian wilayah secara khusus pada
aplikasi data mining, khususnya pada keefektifan
alat bantu data mining untuk aplikasi tertentu - Beberapa aplikasi domein (yang tercantum pada bab
ini) - Biomedical dan analisa data DNA
- Analisa data keuangan
- Industri penjualan eceran
- Industri telekomunikasi
3Biomedical dan Analisa Data DNA
- Urutan DNA 4 dasar yang membangun blok (
nucleotides) adenine ( A), cytosine ( C),
guanine ( G), dan thymine ( T) - Gen suatu urutan dari beratus-ratus individu
nucleotides yang diatur secara tertentu - Manusia mempunyai sekitar 30,000 gen
- Hal yang paling luar biasa yaitu jumlah jalan
yang terdapat pada nucleotides sehingga dapat
dipecah dan diurutkan kembali untuk membentuk gen
yang terpisah - Pengintegrasian pembagian heterogen yang
semantik, dalam genome database - Sekarang terbagi-bagi, Generasi yang tak
terkendali dan penggunaan data DNA secara luas - Metoda pembersihan dan pengintegrasian data yang
dikembangkan dalam Data Mining akan sangat
membantu
4Contoh Analisa DNA
- Pencarian persamaan dan perbandingan antar urutan
DNA - Perbandingan sering terjadi pada pola tiap kelas
( sebagai contoh, sehat dan sakit) - Mengidentifikasi urutan pola gen yang berperan
dalam berbagai penyakit - Analisa asosiasi identifikasi dari co-occurring
urutan gen - Kebanyakan penyakit tidaklah dicetuskan oleh gen
tunggal tetapi oleh suatu kombinasi gen yang
bertindak bersama-sama - Analisa asosiasi dapat membantu menentukan macam
gen yang mungkin terjadi bersama-sama dalam
target percontohan - Analisa alur menghubungkan gen pada masa
pengembangan penyakit lain - Gen yang berbeda bisa menjadi aktip pada penyakit
yang berbeda - Intervensi pada masa perkembang farmasi yang
mentargetkan langkah-langkah yang berbeda secara
terpisah - Penggambaran alat bantu dan analisa data genetik
5Data Mining pada Analisa Data Keuangan
- Data keuangan yang dikumpulkan oleh bank dan
lembaga keuangan relatif lebih lengkap, dapat
dipercaya, dan bermutu tinggi - Disain dan konstruksi dari gudang data untuk
multidimensional analisa data dan data mining - Gambaran dari hutang perbulan, perdaerah,
persektor, dan faktor lain - Mengakses informasi statistik seperti maximum,
minimum, total, rata-rata, kecenderungannya, dan
lain lain - Analisa pembayaran peminjaman kebijakan kredit
secara prediksi per pelanggan - Seleksi di masa depan dan perlunya penggolongan
secara atribut - Pencapaian pembayaran peminjaman
- Nilai kredit konsumen
6Keuangan Data Mining
- Penggolongan dan pengelompokan pelanggan untuk
target pemasaran - Segmentasi multidimensional berdasarkan metode
terdekat, penggolongan, alur keputusan, dan lain
lain untuk mengidentifikasi penggolongan
persediaan sekelompok pelanggan atau pelanggan
baru - Mendeteksi pencucian uang dan kejahatan keuangan
lain - pengintegrasian dari berbagai DBs ( sebagai
contoh, transaksi bank, DBs sejarah kejahatan
federal/negara) - Alat bantu data gambar, analisa pertalian,
penggolongan, alat penggabungan, analisa orang
asing, dan analisa pola alat percontohan
(ditemukan urutan akses secara tidak biasa)
7Data Mining pada Industri Retail
- Industri Retail besarnya data penjualan, sejarah
belanja pelanggan, dan lain-lain - Aplikasi dari Retail data mining
- Mengidentifikasi perilaku pembelian pelanggan
- Menentukan kecenderungan pola belanja pelanggan
- Meningkatkan mutu dari layanan pelanggan
- Mencapai kepuasan pelanggan
- Tingkatkan perbandingan konsumsi barang-barang
- Mendisain keefektifan distribusi dan transportasi
barang
8Contoh Data Mining pada Industri Retail
- Disain dan konstruksi dari gudang data yang
didasarkan keuntungan penggunaan data mining - Analisa multidimensional dari penjualan,
pelanggan, produk, waktu, dan daerah - Analisa dari efektivitas dari kampanye penjualan
- Ingatan pelanggan Analisa dari kesetiaan
pelanggan - Menggunakan informasi kartu kesetiaan pelanggan
untuk mendaftarkan urutan dari pembelian dari
pelanggan tertentu - Menggunakan pola mining untuk menyelidiki
perubahan dalam konsumsi atau kesetiaan pelanggan
- Menyarankan penyesuaian penetapan harga dan
variasi barang-barang - Referensi pembelian dan perbandingan materi
9Data Mining pada Industri Telekomunikasi ( 1)
- Perkembangan yang sangat cepat dan industri yang
sangat kompetitif dan permintaan yang besar untuk
data mining - Memahami bisnis yang terlibat
- Mengidentifikasi pola telekomunikasi
- Menangkap aktivitas curang
- Mempergunaan sumber daya secara lebih baik
- Meningkatkan mutu dari layanan
- Analisa multidimensional dari data telekomunikasi
- Hakekat multidimensional tempo pemanggilan,
jangka waktu, lokasi dari pemanggil, jenis
panggilan, dan lain lain
10Data Mining pada Industri Telekomunikasi ( 2)
- Analisa pola kecurangan dan identifikasi pola
yang tidak lazim - Mengidentifikasi pola para pengguna yang
berpotensi curang dan penggunaan yang tidak lazim - Mendeteksi usaha kecurangan masukan ke dalam
rekening pelanggan - Menemukan pola yang tidak biasa memerlukan
perhatian khusus - Multidimensional asosiasi dan percontohan pola
analisa - Temukan pola satu set jasa komunikasi berdasarkan
kelompok pelanggan, bulan, dan lain lain - Mempromosikan penjualan dari jasa spesifik
- Meningkatkan ketersediaan dari jasa tertentu pada
suatu daerah - Penggunaan alat bantu penggambaran dalam analisa
data telekomunikasi
11Bagaimana cara memilih suatu Sistem Data Mining?
- Secara komersil sistem data mining mempunyai
sedikit kesamaan - Perbedaan kemampuan atau metodologi Data Mining
- Dapat bekerja dengan bermacam-macam data yang
berbeda - Memerlukan berbagai pandangan yang dimensional
dalam pemilihan - Jenis data relational, tanggapan, teks, urutan
waktu, ruang? - Isu sistem
- Hanya berjalan pada satu atau beberapa sistem
operasi? - Arsitektur client/server?
- Menyediakan tampilan berbasis Web dan mengijinkan
data XML sebagai masukan atau keluaran?
12Bagaimana cara memilih suatu Sistem Data Mining?
( 2)
- Sumber data
- File teks ASCII, berbagai sumber data relational
- Mendukung koneksi ODBC ( OLE DB, JDBC)?
- Fungsi dan metodologi Data mining
- Satu melawan berbagai fungsi data mining
- Satu melawan berbagai macam variasi perfungsi
- Fungsi lain data mining dan metoda perfungsinya
menyediakan pengguna dengan analisa dan
fleksibilitas yang lebih besar - Menggabungkan dengan DB dan/atau sistem data
gudang - Empat format penggabungan tidak ada
penggabungan, penggabungan lepas, penggabungan
semi ketat, dan penggabungan ketat - Idealnya, suatu sistem data mining harus di
gabungkan dengan ketat dengan suatu sistem
database
13Bagaimana cara memilih suatu Sistem Data Mining?
( 3)
- Scalabilitas
- Scalabilitas perbaris ( atau ukuran database)
- Scalabilitas perkolom ( atau dimensi)
- Kutukan dari dimensionalitas jauh lebih
menantang untuk membuat suatu skala sistem kolom
dari pada skala sistem baris - Alat bantu gambar
- "Suatu gambar dapat berharga seribu kata-kata
- Kategori penggambaran data gambar, hasil
gambaran, proses penggambaran, dan gambaran data
mining - Bahasa query pada Data mining dan tampilan grafis
pengguna - Mudah digunakan dan grafis yang berkualitas
tinggi - Pentingnya buku pedoman, data mining yang sangat
interaktip
14Contoh Sistem Data Mining ( 1)
- Miner IBM yang cerdas
- Suatu cakupan luas dari algoritma data mining
- Skala algoritma data mining
- Alat bantu algoritma jaringan neural, metode
statistik, persiapan data, dan alat bantu
penggambaran data gambar - Pengintegrasian yang ketat IBM dengan relational
sistem database DB2 - Perusahaan SAS miner
- Berbagai alat bantu analisa yang statistik
- Alat bantu data gudang dan berbagai data
algoritma mining - Microsoft SQLServer 2000
- Mengintegrasikan DB dan OLAP dengan mining
- Mendukung OLEDB untuk DM standard
15Contoh Sistem Data Mining ( 2)
- Sgi Mineset
- Berbagai algoritma dan statistik tingkat lanjut
data mining - Alat bantu penggambaran tingkat lanjut
- Clementine (SPSS)
- Pengembangan lingkungan data mining yang
terintegrasi untuk pengguna akhir dan pengembang - Berbagai algoritma data mining dan alat bantu
penggambaran - DBMiner ( DBMiner Teknologi Inc.)
- Berbagai modul data mining analisa OLAP
discovery-driven, asosiasi, penggolongan, dan
pengelompokan - efisien, Asosiasi dan sequential-pattern fungsi
mining, dan alat penggolongan visuil - Mining antara database relational dan data gudang
16Visuallisasi Data Mining
- Visualisasi penggunaan grafik komputer untuk
menciptakan gambaran visuil yang membantu
pemahaman yang ruwet, penyajian presentasi data
yang kokoh - Visualisasi Data mining proses menemukan
kandungan yang tersembunyi dapat menjadi
pengetahuan yang bermanfaat khususnya dari data
yang besar dengan menggunakan teknik visualisasi
17Visualisasi
- Tujuan visualisasi
- Memperoleh masukan ruang informasi dengan
mempetakan data ke dalam grafis sederhana - Menyediakan ikhtisar yang kwalitatif dari data
yang besar - Mencari contoh pola, kecenderungan, struktur,
ketidakteraturan, hubungan antar data. - Bantuan untuk menemukan daerah menarik dan
parameter yang pantas untuk analisis kuantitatif
lebih lanjut. - Menyediakan suatu bukti yang visuil tentang
memperoleh penyajian komputer
18Visualisasi Data Mining Visualisasi Data
- Pengintegrasian dari visualisasi data mining
- Visualisasi data
- Hasil Visualisasi data mining
- Proses visualisasi data mining
- Visualisasi data mining yang interaktip
- Visualisasi data
- Data dalam database atau data gudang terlihat
- Pada tingkat abstrak yang berbeda
- Sebagai kombinasi yang berbeda tentang atribut
atau dimensi - Data dapat dipersentasikan dalam berbagai format
visual
19Hasil Visualisasi Data Mining
- Presentasi dari hasil atau pengetahuan yang
diperoleh dari format visual data mining - Contoh
- Menyebar alur cerita dan boxplots (yang diperoleh
dari data mining) - Alur keputusan
- Aturan Asosiasi
- Kelompok
- Asing
- Aturan disamaratakan
20Boxplots dari Statsoft Berbagai Combinasi
Variabel
21Visualisasi dari Data Mining pada Perusahaan SAS
Miner Menyebaran Plots
22Visualisasi dari Peraturan Asosiasi SGI/MineSet
3.0