Mục lục:

Làm thế nào để bạn đối phó với các giá trị NA trong R?
Làm thế nào để bạn đối phó với các giá trị NA trong R?

Video: Làm thế nào để bạn đối phó với các giá trị NA trong R?

Video: Làm thế nào để bạn đối phó với các giá trị NA trong R?
Video: 3 cách người khôn ngoan trừng trị kẻ xấu tính | GNV 2024, Tháng tư
Anonim

Khi bạn nhập tập dữ liệu từ các ứng dụng thống kê khác, giá trị bị mất có thể được mã hóa bằng một số, ví dụ: 99. Để cho NS biết rằng đó là một thiếu giá trị bạn cần phải giải mã lại nó. Một chức năng hữu ích khác trong NS đến đối phó với các giá trị bị thiếu Là na . omit () xóa các quan sát không đầy đủ.

Vậy, làm thế nào để bạn đối phó với NA trong R?

Các tùy chọn NA trong R

  1. lược bỏ và na. loại trừ: trả về đối tượng với các quan sát bị loại bỏ nếu chúng chứa bất kỳ giá trị nào bị thiếu; Có thể thấy sự khác biệt giữa bỏ qua và loại trừ NA trong một số hàm dự đoán và hàm dư.
  2. pass: trả về đối tượng không thay đổi.
  3. fail: chỉ trả về đối tượng nếu nó không chứa các giá trị bị thiếu.

Tương tự, làm cách nào để bạn xử lý dữ liệu phân loại bị thiếu trong R? Có nhiều cách khác nhau để xử lý các giá trị bị thiếu của các cách phân loại.

  1. Bỏ qua các quan sát về các giá trị bị thiếu nếu chúng ta đang xử lý các tập dữ liệu lớn và ít bản ghi có các giá trị bị thiếu.
  2. Bỏ qua biến, nếu nó không đáng kể.
  3. Phát triển mô hình để dự đoán các giá trị còn thiếu.
  4. Coi dữ liệu bị thiếu chỉ là một danh mục khác.

Tương tự, người ta có thể hỏi, làm thế nào để bạn đặt các giá trị bị thiếu trong R?

Trong NS , giá trị bị mất được đại diện bởi biểu tượng NA (Không có sẵn). Không thể nào giá trị (ví dụ: chia cho không) được biểu thị bằng ký hiệu NaN (không phải số). Không giống như SAS, NS sử dụng cùng một biểu tượng cho ký tự và số dữ liệu . Để có thêm thực hành về cách làm việc với dữ liệu bị mất , hãy thử khóa học này về làm sạch dữ liệu trong R.

Na Rm có nghĩa là gì trong R?

Khi sử dụng hàm khung dữ liệu na . rm trong NS đề cập đến tham số logic cho biết hàm có xóa hay không NA các giá trị từ phép tính. Nó theo nghĩa đen nghĩa là NA tẩy. Nó không phải là một chức năng cũng không phải là một hoạt động. Nó chỉ đơn giản là một tham số được sử dụng bởi một số hàm khung dữ liệu.

Đề xuất: