
non-Programmer
5 Langkah Dasar Data Cleaning di Excel/Google Sheets untuk Non-Programmer
Pernah buka file spreadsheet, lalu isinya campur aduk: nama dobel, kolom kosong di mana-mana, format tanggal random… dan kamu cuma bisa bengong?
Tenang, kamu nggak sendiri. Di artikel ini kita bahas cara merapikan data berantakan di excel, google sheets tanpa perlu bisa coding sama sekali.ms
Setelah membaca panduan ini, kamu akan bisa:
- Menghapus duplikasi data dengan aman.
- Merapikan format tanggal, angka, dan teks.
- Menangani data kosong dengan lebih rapi.
- Mengecek dan memvalidasi data supaya siap dianalisis.
Kenapa Data Cleaning Itu Penting?
Data kotor = kesimpulan ngawur. Kalau kamu pakai Excel atau Google Sheets untuk laporan, analisis sederhana,
atau sekadar rekap keuangan, data yang nggak rapi bisa bikin:
- Total jadi salah karena ada duplikat.
- Grafik jadi aneh karena format tanggal/angka kacau.
- Filter dan pivot table nggak bekerja maksimal.
Di dunia analisis data profesional, data cleaning adalah langkah wajib sebelum analisis apa pun dilakukan. Jadi, makin cepat kamu kebiasaan rapihin data, makin enak hidupmu nanti.
Persiapan: Duplikat File Dulu, Baru Main
Aturan emas: jangan langsung utak-atik file asli.
- Di Excel: Simpan dengan nama baru, misalnya
data_penjualan_bersih.xlsx. - Di Google Sheets: Klik File > Make a copy lalu beri nama versi “bersih”.
Jadi kalau ada salah langkah, kamu masih punya cadangan. Ini juga kebiasaan baik ala “data analyst beneran”
[Link to relevant internal study].
Langkah 1: Rapikan Format Data (Tanggal, Angka, dan Teks)
1.1. Samakan Format Tanggal
Masalah klasik: ada yang 01/02/2025, ada yang 1-Feb-25, ada yang malah teks “Februari 1”.
- Excel: Blok kolom tanggal > klik kanan > Format Cells > pilih kategori Date dan format yang kamu mau.
- Google Sheets: Blok kolom > Format > Number > Date atau Custom date and time.
1.2. Samakan Format Angka
Pastikan kolom angka (harga, jumlah, kuantitas) benar-benar dikenali sebagai angka, bukan teks.
- Cek: kalau kamu pakai fungsi
=SUM()dan hasilnya 0 padahal jelas ada angka, kemungkinan datanya masih bentuk teks. - Gunakan Format Cells / Number (Excel) atau Format > Number (Sheets) untuk mengubahnya.
1.3. Bersihkan Spasi & Teks Aneh
Nama “Budi ” (ada spasi di belakang) dan “Budi” itu beda buat Excel/Sheets. Ini sering bikin duplikat palsu.
- Pakai rumus
=TRIM(A2)di sel baru untuk menghapus spasi berlebih (berlaku di Excel & Google Sheets). - Copy hasilnya > Paste Special > Values untuk menggantikan data lama.
Langkah 2: Hapus Data Duplikat dengan Aman
2.1. Identifikasi Duplikat
Duplikat bisa berupa baris yang sama persis (nama, tanggal, transaksi) atau hanya di kolom tertentu (misalnya email).
2.2. Hapus Duplikat di Excel
- Blok range data kamu (termasuk header).
- Buka tab Data > klik Remove Duplicates.
- Pilih kolom mana yang mau dicek duplikatnya (misalnya kolom Email saja, atau semua kolom).
- Klik OK. Excel akan kasih info berapa baris terhapus.
2.3. Hapus Duplikat di Google Sheets
- Blok range data.
- Buka menu Data > Data cleanup > Remove duplicates.
- Cek opsi Data has header row kalau baris pertama adalah judul kolom.
- Pilih kolom yang mau dicek > klik Remove duplicates.
Tips: sebelum hapus duplikat, kamu bisa tambahkan kolom “Catatan” untuk menandai baris tertentu yang jangan dihapus, jika perlu.
Langkah 3: Tangani Data Kosong (Missing Values)
Kolom kosong nggak selalu masalah, tapi kalau kolom penting (misalnya harga, email, tanggal), harus diurus.
3.1. Cari Data Kosong dengan Filter
- Aktifkan Filter (ikon corong).
- Di header kolom penting, pilih filter untuk menampilkan hanya sel kosong (biasanya ada pilihan “(Blanks)”).
3.2. Apa yang Harus Dilakukan?
- Isi manual kalau datanya bisa dilacak (misalnya dari sistem lain).
- Isi dengan nilai default (misalnya 0 atau “Tidak diketahui”) asal konsisten.
- Hapus baris kalau datanya benar-benar nggak bisa diselamatkan dan tidak kritis.
Langkah 4: Standardisasi Teks (Nama, Kota, Kategori)
Masalah klasik lain: “Jakarta”, “jakarta”, “JKT”, dan “Jakrta” (typo). Buat komputer, itu semua beda.
4.1. Ubah Huruf Besar/Kecil
=UPPER(A2)untuk semua huruf besar.=LOWER(A2)untuk semua huruf kecil.=PROPER(A2)untuk huruf depan tiap kata jadi kapital (cocok buat nama orang).
4.2. Find & Replace untuk Kategori
Misalnya kamu mau samakan “JKT” dan “Jakrta” jadi “Jakarta”:
- Tekan Ctrl + H (Excel & Sheets) untuk buka Find & Replace.
- Find:
JKT> Replace with:Jakarta. - Ulangi untuk variasi tulisan lainnya.
Langkah 5: Validasi Data Supaya Tetap Rapi
Setelah dibersihkan, kita pasang “pagar” supaya data baru yang masuk nggak berantakan lagi.
5.1. Gunakan Data Validation
- Excel: Data > Data Validation.
- Google Sheets: Data > Data validation.
Contoh penggunaan:
- Batasi input angka antara 0–100.
- Batasi input hanya boleh pilih dari dropdown list (misalnya kategori “Retail”, “Online”, “Wholesale”).
- Pastikan tanggal minimal di tahun tertentu.
5.2. Cek Lagi dengan Filter
Setelah semua langkah, gunakan filter untuk cek:
- Apakah masih ada “kategori aneh” yang cuma muncul 1 baris?
- Apakah masih ada nilai kosong di kolom penting?
- Apakah jumlah baris sudah sesuai (duplikat berkurang)?
Kamu Sudah “Data Cleaner” Tanpa Sadar
Tanpa satu baris kode pun, kamu baru saja melakukan data cleaning yang biasa dipakai analis data:
merapikan format, menghapus duplikat, menangani data kosong, menstandardisasi teks, dan memvalidasi input.
Langkah berikutnya? Coba terapkan panduan ini setiap kali kamu buka file baru di Excel atau Google Sheets.
Simpan panduan ini, dan jadikan sebagai checklist pribadi. Semakin sering kamu melakukan ini,
semakin cepat kamu naik level dari “sekadar pengguna spreadsheet” jadi “pengguna excel, google sheets yang kece dan percaya diri”.
Kalau kamu mau lanjut, kamu bisa eksplor teknik lanjutan seperti pivot table dan fungsi logika (=IF, =VLOOKUP, =XLOOKUP) di artikel berikutnya.
