Pre-processing_Data Mining (Pertemuan 3)

 Data Preprocessing 

A. Data Cleaning

    Data cleaning adalah proses identifikasi, koreksi, dan penghapusan kesalahan serta ketidaksesuaian dalam dataset agar data tersebut dapat digunakan secara efektif dalam analisis.

Dalam Google Colab :

.str.replace("","") mengganti satu string di setiap baris kolom dengan string lainnya
.str.split("") mengambil sebuah string dan memungkinkan Anda membagi kolom menjadi dua berdasarkan string tersebut
.astype() memungkinkan Anda mengonversi kolom dari satu tipe ke tipe lainnya



B. Data Collection

    Data collection adalah proses pengumpulan informasi atau data dari berbagai sumber untuk tujuan analisis, penelitian, atau pengambilan keputusan.

Dalam Google Collab :


Collecting data dari Roboflow untuk selanjutnya dilakukan training


C. Data Transform 
    Data transform adalah proses manipulasi atau perubahan struktur data dari satu bentuk ke bentuk lainnya untuk memenuhi kebutuhan analisis atau pengolahan data tertentu.

Dalam Google Collab :

Transformasi tabel menjadi histogram


D. Data Reduction 
    Data reduction adalah proses mengurangi jumlah data yang tidak relevan, kompleks, atau redundan dalam suatu dataset.

Dalam Google Colab :



Komentar

Postingan populer dari blog ini

PHYSICAL MODEL

Tahapan Data Mining (pertemuan 1)

Apa Yang Diharapkan Dari MK Basis Data