Định dạng của dữ liệu Mnist là gì?
Định dạng của dữ liệu Mnist là gì?

Video: Định dạng của dữ liệu Mnist là gì?

Video: Định dạng của dữ liệu Mnist là gì?
Video: Train model PyTorch CNN với tập MNIST Dataset 2024, Tháng mười một
Anonim

MNIST (Cơ sở dữ liệu hỗn hợp của Viện Tiêu chuẩn và Công nghệ Quốc gia) là tập dữ liệu cho các chữ số viết tay, được phân phối bởi Yann Lecun's THE MNIST CƠ SỞ DỮ LIỆU của trang web chữ số viết tay. Các tập dữ liệu bao gồm cặp, "hình ảnh chữ số viết tay" và "nhãn". Các chữ số nằm trong khoảng từ 0 đến 9, có nghĩa là tổng cộng 10 mẫu.

Theo cách này, dữ liệu Mnist được lưu trữ như thế nào?

ĐỊNH DẠNG TẬP TIN CHO MNIST CƠ SỞ DỮ LIỆU Tất cả các số nguyên trong tệp là cất giữ ở định dạng MSB đầu tiên (cao cấp) được hầu hết các bộ xử lý không phải của Intel sử dụng. Người dùng bộ xử lý Intel và các máy cấp thấp khác phải lật từng byte của tiêu đề. Tập huấn luyện chứa 60000 ví dụ và tập kiểm tra 10000 ví dụ.

Sau đó, câu hỏi đặt ra là Mnist đại diện cho điều gì? Viện Tiêu chuẩn và Công nghệ Quốc gia sửa đổi

Một câu hỏi nữa là, kích thước của tập dữ liệu Mnist là bao nhiêu?

Các Tập dữ liệu MNIST là từ viết tắt của Viện Tiêu chuẩn và Công nghệ Quốc gia Sửa đổi tập dữ liệu . Nó là một tập dữ liệu trong tổng số 60.000 hình ảnh thang độ xám hình vuông nhỏ 28 × 28 pixel gồm các chữ số đơn viết tay từ 0 đến 9.

Mất bao lâu để đào tạo Mnist?

Phiên bản đơn giản của mạng chuyển tiếp cho MNIST (chắc chắn đạt được tỷ lệ lỗi thấp hơn 5%) khá dễ thực hiện. Nó có thể mất khoảng 2-4 giờ mã hóa và 1-2 giờ đào tạo nếu được thực hiện bằng Python và Numpy (giả sử khởi tạo tham số hợp lý và một bộ siêu tham số tốt).

Đề xuất: