Latihan Soal Data Mining Universitas BSI Semester 7
Pertemuan 1
1.
Tujuan utama dari data mining adalah
A. Pencarian data
B. Pencarian pola
C. Pencarian database
D. Pencarian relationship
E. Pengeditan data
A. Pencarian data
B. Pencarian pola
C. Pencarian database
D. Pencarian relationship
E. Pengeditan data
2.
Masalah yang dapat
diselesaikan dengan metode data mining adalah sebagai berikut, kecuali
A. Estimasi
B. Prediksi
C. Klasifikasi
D. Relationship
A. Estimasi
B. Prediksi
C. Klasifikasi
D. Relationship
3.
Salah satu bidang ilmu yang berhubungan dengan data mining adalah
sistem pemroses informasi dengan karakteristik dan performa yang mendekati
syaraf biologis, yang disebut dengan
A. Information science
B. Machine learning
C. Neural network
D. Information retrieval
E. High performance computing
A. Information science
B. Machine learning
C. Neural network
D. Information retrieval
E. High performance computing
4.
Banyaknya jumlah atribut dalam data yang akan diproses pada data
mining, disebut
A. Scalability
B. Dimensionality
C. Data quality
D. Streaming data
E. Privacy preservation
A. Scalability
B. Dimensionality
C. Data quality
D. Streaming data
E. Privacy preservation
5.
Data mining digunakan untuk melakukan information discovery yang
ditujukan untuk:
A. data analyst
B. programmer
C. network enginer
D. database administrator
E. operator komputer
A. data analyst
B. programmer
C. network enginer
D. database administrator
E. operator komputer
Pertemuan 2
1.
Membagi pasar kedalam sub-set pelanggan yang berbeda dimana suatu
sub-set mungkin dapat dipilih sebagai target pasar yang dicapai dengan satu
kombinasi pemasaran yang berbeda, maka teknik data mining yang gunakan adalah
A. klasterisasi
B. asosiasi
C. klasifikasi
D. regresi
E. Prediksi
A. klasterisasi
B. asosiasi
C. klasifikasi
D. regresi
E. Prediksi
2.
Untuk memprediksi kasus-kasus transaksi curang dengan menggunakan
kartu kredit
(fraud detection) digunakan teknik data mining
A. klasterisasi
B. asosiasi
C. klasifikasi
D. regresi
E. Prediksi
(fraud detection) digunakan teknik data mining
A. klasterisasi
B. asosiasi
C. klasifikasi
D. regresi
E. Prediksi
3.
Teknik data mining yang digunakan untuk prediksi adalah:
A. klasifikasi dan regresi
B. klastering dan association rule discovery
C. klasifikasi dan klustering
D. regresi dan sequential pattern discovery
E. regresi dan klastering
A. klasifikasi dan regresi
B. klastering dan association rule discovery
C. klasifikasi dan klustering
D. regresi dan sequential pattern discovery
E. regresi dan klastering
4.
Untuk mengetahui kelompok pengguna kartu kredit yang bermasalah, maka
atribut-atribut akan diperlukan dalam proses knowledge discovery in
databases, kecuali
A. nama bank pemberi kartu kredit
B. tanggal pelunasan kredit
C. produk yang dibeli
D. tanggal pembelian
E. nama pemegang kartu
A. nama bank pemberi kartu kredit
B. tanggal pelunasan kredit
C. produk yang dibeli
D. tanggal pembelian
E. nama pemegang kartu
5.
Data diatur oleh subyek yang hanya mengandung informasi yang
diperlukan untuk pengolahan pendukung keputusan, adalah karakteristik data
warehouse dari sisi
A. subject oriented
B. intergrated
C. time variant
D. non volatile
E. Volatile
A. subject oriented
B. intergrated
C. time variant
D. non volatile
E. Volatile
Pertemuan 3
1.
Jika ingin mengetahui pola belanja konsumen ditoko, dengan
tujuan menentukan
penempatan barang ditoko, maka digunakan teknik data mining
A. klasterisasi
B. asosiasi
C. klasifikasi
D. regresi
E. Prediksi
penempatan barang ditoko, maka digunakan teknik data mining
A. klasterisasi
B. asosiasi
C. klasifikasi
D. regresi
E. Prediksi
2.
Kumpulan dari objek dan atributnya disebut dengan
A. data
B. himpunan
C. himpunan data
D. atribut data
E. objek data
A. data
B. himpunan
C. himpunan data
D. atribut data
E. objek data
3.
Kodepos, dan
atribut yang memiliki himpunan nilai yang berhingga maupun yang tak berhingga
tetapi bisa dihitung termasuk dalam kelompok atribut
A. diskrit
B. kontinyu
C. interval
D. nominal
E. Biner
A. diskrit
B. kontinyu
C. interval
D. nominal
E. Biner
4.
Angka 0,75 atau ¾
, berdasarkan jumlah nilainya dapat dikelompokkan kedalam atribut
A. diskrit
B. biner
C. interval
D. nominal
E. Kontinyu
A. diskrit
B. biner
C. interval
D. nominal
E. Kontinyu
5.
Tipe dari suatu
atribut tergantung pada sifat yang dimiliki berikut ini, kecuali
A. pembeda
B. urutan
C. penjumlahan
D. pengurangan
E. Perkalian
A. pembeda
B. urutan
C. penjumlahan
D. pengurangan
E. Perkalian
Pertemuan 4
1.
Pengukuran dilakukan dengan menggunakan standar deviasi, adalah jenis
kesalahan pengukuran
A. noise
B. bias
C. presisi
D. akurasi
E. Prediksi
kesalahan pengukuran
A. noise
B. bias
C. presisi
D. akurasi
E. Prediksi
2.
Penanganan missing value dapat dilakukan dengan cara sebagai
berikut, kecuali:
A. menambah objek data
B. mengurangi objek data
C. memperkirakan missing value
D. mengabaikan missing value pada saat analisis
E. mengganti dengan semua nilai yang mungkin
A. menambah objek data
B. mengurangi objek data
C. memperkirakan missing value
D. mengabaikan missing value pada saat analisis
E. mengganti dengan semua nilai yang mungkin
3.
Proses mengkombinasikan dua atau lebih atribut-atribut atau
objek-objek kedalam satu atribut tunggal adalah
A. sampling
B. dimensionality reduction
C. feature subset selection
D. agregation
E. discretization and binerization
A. sampling
B. dimensionality reduction
C. feature subset selection
D. agregation
E. discretization and binerization
4.
Membagi kelompok umur kedalam range [11-20],[21-30],[31-40] adalah
contoh discretization dengan pendekatan
A. equal frequency
B. equal width
C. unsupervised
D. supervised
E. Binarization
A. equal frequency
B. equal width
C. unsupervised
D. supervised
E. Binarization
5.
Objek data dengan sifat yang berbeda sekali dari kebanyakan objek data
dalam data-set disebut
A. noise
B. missing value
C. outliers
D. precision
E. duplicate data
A. noise
B. missing value
C. outliers
D. precision
E. duplicate data
Pertemuan 5
1.
Diketahui vektor
data biner dari dua objek x,y adalah x={1,0,1,1,1,1} dan y={0,0,1,1,0,0} maka
similaritas dari dua objek tersebut jika diukur dengan koefisien jaccard adalah
A. 1/6
B. 2/6
C. 1/4
D. 2/5
E. 3/6
A. 1/6
B. 2/6
C. 1/4
D. 2/5
E. 3/6
2.
Untuk soal no 1
jika similaritas dari dua objek tersebut diukur dengan simple matching maka
hasilnya adalah
A. 1/6
B. 2/6
C. 1/4
D. 2/5
E. 3/6
A. 1/6
B. 2/6
C. 1/4
D. 2/5
E. 3/6
3.
Range nilai
similaritas adalah
A. [0]
B. [1]
C. [0,1]
D. [1,0]
E. [10]
A. [0]
B. [1]
C. [0,1]
D. [1,0]
E. [10]
4.
Model klasifikasi
yang dapat berfungsi sebagai suatu alat penjelasan untuk membedakan objek-objek
dalam kelas-kelas yang berbeda disebut
A. pemodelan deskriptif
B. pemodelan prediktif
C. pemodelan naratif
D. pemodelan klasifikasi
E. pemodelan regresi
A. pemodelan deskriptif
B. pemodelan prediktif
C. pemodelan naratif
D. pemodelan klasifikasi
E. pemodelan regresi
5.
Dalam decision
tree, struktur datanya terdiri dari
A. simpul dan rusuk
B. simpul akar dan cabang
C. simpul cabang dan daun
D. akar, cabang, dan daun
E. simpul, rusuk, dan akar
A. simpul dan rusuk
B. simpul akar dan cabang
C. simpul cabang dan daun
D. akar, cabang, dan daun
E. simpul, rusuk, dan akar
Pertemuan 6
Id_Trans
|
Roti
|
Keju
|
Susu
|
Jus
|
Air
|
111
|
1
|
1
|
0
|
0
|
0
|
112
|
1
|
0
|
1
|
0
|
0
|
113
|
1
|
1
|
1
|
0
|
0
|
114
|
1
|
1
|
1
|
1
|
1
|
1.
Dari tabel
diatas, support count untuk itemset [roti, keju, susu] adalah
A. 0%
B. 25%
C. 50%
D. 75%
E. 100%
A. 0%
B. 25%
C. 50%
D. 75%
E. 100%
Id_Trans
|
Roti
|
Keju
|
Susu
|
Jus
|
Air
|
111
|
1
|
1
|
0
|
0
|
0
|
112
|
1
|
0
|
1
|
0
|
0
|
113
|
1
|
1
|
1
|
0
|
0
|
114
|
1
|
1
|
1
|
1
|
1
|
2.
Dari tabel
diatas, support count untuk itemset [roti, keju] adalah
A. 0%
B. 25%
C. 50%
D. 75%
E. 100%
A. 0%
B. 25%
C. 50%
D. 75%
E. 100%
3.
Gambar disamping
merupakan clustering dengan tipe
A. partition
B. hierarchical
C. exclusive
D. fuzzy
E. Partial
A. partition
B. hierarchical
C. exclusive
D. fuzzy
E. Partial
4.
Tidak ada titik
dalam sebuah cluster yang lebih mirip, hal ini dapat dikategorikan dalam tipe
cluster
A. shared property
B. density based
C. contiguous cluster
D. center based
E. well-separated cluster
A. shared property
B. density based
C. contiguous cluster
D. center based
E. well-separated cluster
5.
Ketika terdapat
noise dan outlier, tipe dari cluster berupa
A. shared property
B. density based
C. contiguous cluster
D. center based
E. well-separated cluster
A. shared property
B. density based
C. contiguous cluster
D. center based
E. well-separated cluster
= = = = = = = = = = = = = = = = = = = = = = = = = = = = = =
Baca juga materi Semester 7 Universitas BSI lainnya:
- Latihan Soal Proses Bisnis TI Universitas BSI Semester 7
- Latihan Soal Sistem Penunjang Keputusan SPK Universitas BSI Semester 7
- Latihan Soal Rekayasa Perangkat Lunak RPL Universitas BSI Semester 7
- Latihan Soal Penelitian Sistem Informasi Universitas BSI Semester 7
- Latihan Soal Data Mining Universitas BSI Semester 7
Komentar
Posting Komentar