Pre-processing_Data Mining (Pertemuan 3)
Data Preprocessing
A. Data Cleaning
Data cleaning adalah proses identifikasi, koreksi, dan penghapusan kesalahan serta ketidaksesuaian dalam dataset agar data tersebut dapat digunakan secara efektif dalam analisis.
Dalam Google Colab :
.str.replace("","") mengganti satu string di setiap baris kolom dengan string lainnya
.str.split("") mengambil sebuah string dan memungkinkan Anda membagi kolom menjadi dua berdasarkan string tersebut
.astype() memungkinkan Anda mengonversi kolom dari satu tipe ke tipe lainnya
B. Data Collection
Data collection adalah proses pengumpulan informasi atau data dari berbagai sumber untuk tujuan analisis, penelitian, atau pengambilan keputusan.
Dalam Google Collab :
Collecting data dari Roboflow untuk selanjutnya dilakukan training
C. Data Transform
Data transform adalah proses manipulasi atau perubahan struktur data dari satu bentuk ke bentuk lainnya untuk memenuhi kebutuhan analisis atau pengolahan data tertentu.
Dalam Google Collab :
Transformasi tabel menjadi histogram
D. Data Reduction
Data reduction adalah proses mengurangi jumlah data yang tidak relevan, kompleks, atau redundan dalam suatu dataset.
Dalam Google Colab :
Komentar
Posting Komentar