Đối với dữ liệu sau khi được nhập có thể chưa đưa ngay vào phân tích vì gặp phải các lỗi như lỗi nhập liệu, câu trả lời khảo sát không đúng do hiểu sai câu hỏi, chất lượng của việc khảo sát không cao,…. Vì thế bạn cần các phương pháp để làm sạch dữ liệu trong spss, làm đẹp dữ liệu thuận tiện cho việc chạy và phân tích dữ liệu được dễ dàng hơn. Trong bài viết này Top 10 Hà Nội sẽ giới thiệu tới bạn 3 phương pháp làm sạch dữ liệu trong SPSS như sau:
Mục Lục Bài Viết
1. Làm sạch dữ liệu trong spss bằng cách dùng bảng tần số
Bước 1: Tìm các dữ liệu bị nhập nhầm, dữ liệu lỗi
Để tìm các lỗi dữ liệu bị nhầm, ta có thể lập bảng tần số để tìm ra những dữ liệu lạ để sửa.Chẳng hạn, trong file dữ liệu LamSachDuLieu.sav các biến GioiTinh và Nghe đều được mã hóa (Biến GioiTinh có hai giá trị là 0 và 1, biến Nghe có ba giá trị là 1,2,3,4), nếu ta lập bảng tần số cho biến GioiTinh thấy kết quả như sau:
Từ kết quả thì ta biết ngay là các giá trị là 11 đã bị nhập nhầm. Để tìm ra các giá trị sai này để sửa ta có thể dùng lệnh Find để tìm, cụ thể như sau:
Trong cửa sổ Data View bôi đen cột GioiTinh và vào Edit > Find… , màn hình hiện ra hộp thoại tìm kiếm dữ liệu. Chúng ta cần nhập dữ liệu sai đã giá trị 11 ở trên.
Điền dữ liệu sai cần tìm trong cột GioiTinh, ở đây là 11 trong dòng Find What và ấn Find Next. Khi đó những ô dữ liệu sai trong cột dữ liệu sẽ được hiện trắng, ta ấn Find Next lên tiếp để tìm và sửa những dữ liệu sai theo ý muốn.
Bước 2. Chỉnh sửa dữ liệu về đúng giá trị
Sau khi tìm được các dữ liệu sai, chúng ta tự chỉnh sửa thủ công các giá trị bị nhầm lẫn về các giá trị theo đúng quy chuẩn.
2. Dùng lệnh Sort case để tìm dữ liệu sau trên cửa sổ Data View
Trong cách làm sạch dữ liệu trong spss thứ 2 thì ta có thể sử dụng lệnh Sort Case trong Data để tìm những lỗi đơn giản ngay trên cửa sổ dữ liệu (Data View). Chẳng hạn với dữ liệu về giới tính, ta chỉ cần chọn lệnh sắp xếp dữ liệu theo thứ tự tăng dần và nếu có những dữ liệu lớn hơn 1 thì đó chính là những dữ liệu lỗi. Cụ thể ta tiến hành như sau:
Bước 1. Chọn công cụ Sortcase
Vào Data > Sort Cases…, màn hình hiện ra hộp thoại:
Bước 2: Lọc các dữ liệu chứa giá trị lỗi
Chọn biến GioiTinh bên trái để đưa vào khung Sort by bên phải, trong khung SortOrder ta chọn Ascending và ấn OK.
Sau khi lọc được các dữ liệu bị sai ở hàng số 97 98 99 100 thì chúng ta tiến hành chỉnh sửa các giá trị sai thành giá các trị đã được quy chuẩn.
3. Dùng bảng phối hợp 2 biến hay 3 biến
Khi lập bảng tần số kết hợp biến tuổi và biến nghề nghiệp bạn thấy có trường hợp nhân viên văn phòng (mã hóa 3) mà tuổi chỉ có 8 nên bạn nghĩ rằng một trong hai biến đã nhập sai.
Trong trường hợp này ta phải tìm ra ô nhập sai và sửa lại. Để tìm ra ô nhập sai trong trường hợp này ta dùng lệnh Select Cases, cụ thể như sau:
Bước 1: Đưa ra điều kiện để lọc biến
– Vào Data chọn Select Cases..., khi màn hình hiện ra hộp thoại thì ta chọn If Condi-tion is satisfied để nút If hiện ra và ấn vào.
– Chọn biến Tuoi và biến NgheNghiep bên trái để đưa vào khung bên phải với điều kiện logic Tuoi=8 & NgheNghiep=”2″. Sua đó chọn tiếp Continue và chọn tiếp OK.
Bước 2. Tìm kiếm biến theo điều kiện và tiến hành chỉnh sửa
Khi lệnh này được thực hiện, SPSS sẽ tạo ra một biến mới là filter $ , biến này nhận giá trị 0 tại tất cả các tình huống không thỏa mãn và 1 tại tình huống thỏa mãn điều kiện của lệnh If. Những giá trị là 1 trong biến filter $ chính là những trường hợp sai mà ta cần tìm để sửa.
Trên đây là 3 cách làm sạch dữ liệu trong spss dễ dàng và đơn giản mà chúng tôi tìm hiểu và tổng hợp được. Nếu bạn còn gặp khó khăn gì trong quá trình chạy dữ liệu spss, bạn có thể tìm hiểu thêm thông tin về dịch vụ và giá chạy Spss của Luận văn 1080.
Chào mừng bạn đến với Top 10 Hà Nội! Top 10 Hà Nội là Cộng đồng đánh giá chất lượng dịch vụ, sản phẩm, công ty, thương hiệu, Shop…uy tín tại Hà Nội. Chúng tôi luôn cập nhật và lắng nghe sự góp ý và phản hồi của bạn đọc để hoàn thiện Cộng đồng chung!