 |
 |
| |
|
Search Engine |
|
Manfaatkan Google untuk memperoleh sejumlah informasi
yang Anda inginkan dalam hansmichael.com.
|
|
| Kutipan |
In its pure form, Pascal is a toy language, suitable for teaching but not for real programming. (Epilog of "Why Pascal is Not My Favorite Programming Language")
Brian W. Kernighan
|
|
|
Tokoh Hari Ini
|
|
David A. Huffman
Dikenal sebagai penemu Huffman Code yang digunakan untuk kompresi data digital pada komputer, facsimile, modem, televisi dan banyak peripheral lainnya. Ia meninggal pada 7 Oktober 1999 dalam usia 74 tahun. Huffman Code disajikannya melalui sebuah paper saat ia kuliah di M.I.T. Ia menerima Golden Jubilee Award untuk inovasi teknologi dari IEEE Information Theory Society pada tahun 1998. Ia juga menerima Medali Richard W. Hamming dari IEEE pada tahun 1999 untuk kontribusinya yang luar biasa di Information Sciences. Pada akhir hidupnya Huffman adalah staf Departemen Computer Science di University of California di Santa Cruz, Amerika Serikat.
|
|
|
|
|
Knowledge Discovery in Databases (IS704)
dan Data Mining (CS704)
Contoh Soal
| 1. |
Tunjukkan kebenaran
pernyataan-pernyataan ini (Cukup tulis BENAR atau SALAH):
- Minimum confidence tidak diperlukan dalam fase
pencarian large item sets.
- Algoritma PRISM (Cendrowska) menghasilkan
classification rules, sedangkan pasangan APRIORI dan SIMPLE Algoritma (Agrawal)
menghasilkan association rules.
Jumlah dan elemen dari large itemsets L1,
L2, sampai Lk
yang dihasilkan algoritma Apriori akan tepat sama dengan yang dihasilkan
algoritma AIS.
Jika r1=0.35 dan r2=-0.65
masing-masing adalah nilai korelasi Pearson, maka r2 memiliki korelasi
yang lebih kuat (stronger correlation) dibanding r1.
Rule: age(X, "20…29")
AND buys(X,
"laptop") ---> buys(X, "color printer") termasuk dalam kategori
hybrid-dimension association rule.
Hirarki konsep digunakan untuk klasifikasi
association rules berdasarkan dimensi data.
Rule: buys(X, KodeBarang1) a buys(X,
KodeBarang2) termasuk dalam kategori intradimension dan single level
association rules, jika KodeBarang1 dan KodeBarang2 adalah primitive
(raw) data.
Rule: "Customer yang membeli LaserJet pada Juni 2001 cenderung
untuk memesan Cartridge baru dalam bulan Desember 2003i" termasuk
output Sequential Pattern Discovery dalam Link Analysis.
|
| 2. |
Sebutkan (tak perlu dijelaskan) 5 pendekatan
yang dapat dipakai dalam Data Transformation. |
| 3. |
Sebutkan dengan urut (tak perlu dijelaskan,
tetapi urutan yang salah tidak akan dinilai) 5 fase Sequential Pattern
Mining. |
| 4. |
Tulislah rumus yang digunakan untuk
Pearson Correlation Analysis. Jelaskan dengan singkat semua komponen
rumus tersebut, termasuk untuk mengukur apakah nilai yang diperoleh. |
|
5. |
Jika
attribute memiliki value-value : 28, 21, 26, 4, 34, 8, 9, 15, 29, 21, 25,
24 tulislah value-value baru dengan urutan yang sama setelah smoothing
diterapkan dengan menggunakan:
-
bin means, depth 3
-
bin medians, depth 3
-
bin boundaries, depth 4
|
| 6. |
Jika
sebuah attribute memiliki value-value : 1800, -27500, 800, 9900, -500, tulislah
value-value baru dengan urutan yang sama hasil normalisasi dengan
menggunakan:
-
Decimal scaling normalization
-
Min-Max normalization, dengan range baru [1..10]
-
z-score normalization
|
|
7. |
Dengan
minimum support = 60% dapatkan rule-rule yang memiliki nilai support yang
sama, tetapi dengan nilai confidence yang berbeda. Tulis rule-rule
tersebut lengkap dengan nilai confidence masing-masing. (Caranya terserah
Anda. Algoritma tidak penting. Hanya hasil akhir yang dilihat)
T1
: Hulk, Nemo, Shrek
T2
: Hulk, LiloStich, Nemo, Pinocchio, Shrek
T3
: Antz, Sinbad
T4
: Antz, Nemo
T5 : Antz, Hulk,
LiloStich, Nemo, Shrek |
|
8. |
Pada
pencarian large itemsets dengan menggunakan algoritma AIS dan minimum
supportnya = 30%, tunjukkan nilai-nilai L1
, Lt
, Ct ,
C2
,
dan L2
(masing-masing menggunakan tabel) untuk kumpulan transaksi di bawah ini:
T10 : 1, 2
T20 : 1, 2, 3
T30 : 1, 2, 3, 4
T40 : 1, 4
T50 : 2, 4 |
|
9. |
Algoritma Apriori diterapkan untuk kumpulan transaksi
di bawah dengan minimum support = 40%. Anda hanya diminta menulis semua
pruning yang terjadi, saat algoritma melakukan operasi join, atau (
Cn=
Lm
JOIN Lm
) untuk
semua nilai n yang mungkin, dimana m = n - 1. Setiap kali pruning harus
diawali dengan penomoran P1, P2, P3, dan seterusnya. Ingat: dalam
sebuah operasi join, mungkin terjadi lebih dari sebuah pruning.
T10 : 1, 3, 4
T20 : 2, 3, 5
T30 : 1, 2, 3, 5
T40 : 2, 5 |
|
10. |
Tulislah
Transformed Database Setelah Pemetaan untuk kumpulan transaksi di bawah
ini, ketika Sequential Pattern Mining dilakukan dengan minimum support =
25%. Anda tidak diminta mencari rulenya.
|
|
 |
 |