Kamis, 03 Juni 2010

Implementasi Data Mining Dengan Metode Interpolasi Untuk Memprediksi Minat Konsumen Asuransi (Studi Kasus Asuransi Metlife)

Nama : Dhita Dwiputri Rizanur
Npm : 50406194
Kelas : 4IA07
Mata Kuliah : Konsep Data Mining


Dunia bisnis asuransi yang penuh persaingan membuat para pelakunya harus selalu memikirkan strategi-strategi terobosan yang dapat menjamin kelangsungan bisnis asuransi mereka. Salah satu aset utama yang dimiliki oleh perusahaan asuransi adalah data bisnis dalam jumlah yang luar biasa banyak. Ini melahirkan kebutuhan akan adanya teknologi yang dapat memanfaatkannya untuk membangkitkan pengetahuan-pengetahuan baru, yang dapat membantu dalam pengaturan strategi bisnis asuransi. Prediksi minat konsumen sangat penting bagi suatu perusahaan asuransi, dimana dengan adanya prediksi minat konsumen perusahaan asuransi dapat mengambil suatu keputusan atau strategi yang benar dan tepat bagi konsumennya. Teknologi data mining hadir sebagai solusi. Aplikasi data mining ini memanfaatkan data masukan berupa data nasabah, pendapatan nasabah, dan transaksi pembayaran premi asuransi. Dari data
tersebut, akan diolah dengan metode clustering dan untuk menganalisis data.
Definisi Data mining
Data mining adalah kombinasi secara logis antara pengetahuan data, dan analisa statistik yang dikembangkan dalam pengetahuan bisnis atau suatu proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, tiruan dan
machine-learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat bagi pengetahuan yang terkait dari berbagai database besar (TherlingK., 2006).

Data mining cerdas menemukan informasi di dalam data warehouse dimana laporan dan query tidak bisa ungkapkan secara efektif. Piranti data mining menemukan pola-pola di dalam data dan bahkan menyimpulkan aturan dari data
tersebut (Therling K., 2006). Ada tiga tipe metode yang digunakan untuk mengidentifikasi pola-pola di dalam data:
1. Model sederhana (query berbasis SQL, OLAP, pertimbangan manusia)
2. Model sedang (regresi, pohon keputusan, clustering)
3. Model kompleks (jaringan syaraf, induksi aturan lain)
Pola dan aturan ini dapat digunakan untuk memandu pengambilan keputusan dan meramalkan efek keputusan. Data mining dapat mempercepat analisis dengan memusatkan perhatian pada variabel yang paling penting.

Interpolasi Newton
Interpolasi Newton dinyatakan:
Pn(μ) = a0 + a1(μ- μ0) + a2(μ- μ0) (μ- μ1) + … + an(μ- μ0)…(μ- μn-1) …………[2.1]
Dengan nilai konstanta a0, a1, …, an yang bersesuaian. Maka fungsi Pn(μ) saat
μ = μ0 adalah titik yang dikenai proses interpolasi dan mempunyai suatu konstanta
yaitu a0
a0 = Pn(μ) = f (x0)
dengan cara yang sama pada μ = μ1 Fungsi Pn(μ1) adalah
f (x0) + a1(μ- μ0) = Pn(μ) = f (x1)
a1 =
1 0
1 0
x - x
f (x ) - f (x )
Metode Divided difference untuk ke-k
f [μi, μi+1, …, μi + k-1, μi + k] =
i
f f
i k
i i k i i k
μ μ
μ μ μ μ


+
[ + 1,..., + ] [ ,..., + − 1] .……...…[2.2]
maka bentuk polinomial Newton pers [2.1] menjadi
Pn(μ) = f[μ0] + f[μ0, μ1](μ-μ0) + a1(μ-μ0) (μ-μ1)
+ …+ an(μ-μ0) (μ-μ1)…(μ-μn-1) …………[2.3]
Pn(μ) = f[μ0] + Σ=
n
k 1
f[μ0, μ1, …, μk] (μ-μ0) …(μ-μk-1) …………[2.4]
Persamaan [2.4] dikenal dengan Newton Interpolatory divided difference formula.
2.2.2 Algoritma Interpolasi Newton
Algoritma interpolasi newton sebagai berikut:
Input Number μ0, μ1, …, μn ; value f (x0), f (x1), …, f (xn)
Output The Number F0,0 , F1,1, …, Fn,n where
P(μ) = Σ Π−
= =

1
1 0
, ( )
i
j
n
i
Fi i μ μj
Step1 For i = 1,2, …, n
For j = 1,2, …, i
Set Fi,j =
i i j
Fi j Fi j

− − −


μ μ
, 1 1, 1
Step2 Output (F0,0 , F1,1, …, Fn,n); (Fi,i is f[μ0, μ1, …, μi])
Stop

Metode Perancangan
Perancangan sistem dipakai untuk memberikan perencanaan dalam membangun sistem aplikasi data mining. Perancangan ini dimulai dari menentukan alur kerja sistem berikut data yang mengalir dalam sub sistem yang ada, dilanjutkan dengan merancang database, dan merancang proses-proses yang ada di setiap sub sistem. Metode yang digunakan adalah metode terstruktur menggunakan data flow diagram sebagai tool dalam perancangan sistem.

Perancangan Model Proses dengan menggunakan Diagram Konteks (Context Diagram)
Diagram konteks (context diagram) digunakan untuk menggambar hubungan input/output antara sistem dengan dunia luarnya, suatu diagram konteks selalu mengandung satu proses saja yang mewakili proses seluruh sistem.
Perancangan data flow diagram dimulai dari menentukan entitas yang terlibat dalam sistem serta aliran data yang keluar dan masuk sistem dari entitasentitas tersebut. Terdapat entitas Bagian Sistem Informasi Manajemen (SIM),
Pimpinan dan Bagian Pemasaran. Sistem Data Mining sendiri terletak diluar sistem informasi manajemen yang ada. Hubungan entitas tersebut digambarkan dalam data flow diagram (DFD) diagram konteks yang ditampilkan pada


Diagram gambar 2 menerangkan gambaran dari seluruh sistem secara umum, dimana Bagian SIM memberikan data nasabah dan transaksinya ke system data mining, pimpinan memberikan data produk asuransi, serta bagian pemasaran memberikan data pendapatan nasabah. Hasil output yang diinginkan adalah prediksi nilai angsuran terbaik bagi calon nasabah tersebut.

Perancangan Model Proses dengan menggunakan Diagram Arus Data
(Data Flow Diagram / DFD) Level 1
Proses pada diagram arus data level 1 dibagi menjadi lima proses, yaitu proses SIM, proses rekap, proses data cleaning, proses clustering, proses analisis, seperti yang ditampilkan pada gambar 3.


Perancangan Model Proses dengan menggunakan Diagram Arus Data (Data Flow Diagram / DFD) Level 2 Proses SIM.
Proses pada diagram arus data level 2 proses SIM ini dibagi menjadi 2proses, yaitu pelayanan nasabah dan pendataan produk, seperti yang ditampilkan pada gambar 4.


Bagian SIM menginputkan data nasabah dan transaksi, kemudian data nasabah disimpan pada tabel nasabah dan data pembayaran premi disimpan pada tabel pembayaran premi, selain itu bagian SIM juga menginputkan data besar
angsuran. Kemudian data besar angsuran disimpan pada tabel besarangsuran. Bagian pimpinan menginputkan data produk asuransi, kemudian data produk asuransi disimpan pada tabel produk.