Mô hình GoogLeNet là gì?
Mô hình GoogLeNet là gì?

Video: Mô hình GoogLeNet là gì?

Video: Mô hình GoogLeNet là gì?
Video: Phân loại ảnh sử dụng convolutional neural network. 2024, Tháng mười một
Anonim

GoogLeNet là một người được đào tạo trước người mẫu đã được đào tạo trên một tập hợp con của cơ sở dữ liệu ImageNet được sử dụng trong Thử thách nhận dạng hình ảnh quy mô lớn ImageNet (ILSVRC).

Đơn giản vậy, GoogLeNet là gì?

GoogLeNet là một mạng nơ-ron phức hợp có độ sâu 22 lớp. Bạn có thể tải mạng được đào tạo trên bộ dữ liệu ImageNet [1] hoặc Places365 [2] [3]. Mạng được đào tạo trên ImageNet phân loại hình ảnh thành 1000 loại đối tượng, chẳng hạn như bàn phím, chuột, bút chì và nhiều động vật.

mô hình Vgg là gì? VGG là một mạng nơ ron phức hợp người mẫu được đề xuất bởi K. Zisserman từ Đại học Oxford trong bài báo “Mạng lưới kết hợp rất sâu để nhận dạng hình ảnh quy mô lớn”. Các người mẫu đạt độ chính xác trong bài kiểm tra top 5 là 92,7% trong ImageNet, là tập dữ liệu của hơn 14 triệu hình ảnh thuộc 1000 lớp.

Cũng cần biết là, AlexNet và GoogLeNet là gì?

AlexNet là mạng nơ-ron tích chập nổi tiếng đầu tiên (CNN). Sau đó, các mạng tương tự đã được sử dụng bởi nhiều người khác. GoogleNet có một kiến trúc khá khác so với cả hai: nó sử dụng kết hợp các mô-đun khởi động, mỗi mô-đun bao gồm một số gộp, tích chập ở các quy mô khác nhau và các phép toán nối.

Mạng khởi động là gì?

Bài báo đề xuất một kiểu kiến trúc mới - GoogLeNet hoặc Khởi đầu v1. Về cơ bản nó là một nơ-ron phức tạp mạng (CNN) sâu 27 lớp. Lớp chuyển đổi 1 × 1 trước khi áp dụng lớp khác, chủ yếu được sử dụng để giảm kích thước.

Đề xuất: