AWS MapReduce là gì?
AWS MapReduce là gì?

Video: AWS MapReduce là gì?

Video: AWS MapReduce là gì?
Video: What is Amazon EMR and how can I use it for processing data? 2024, Có thể
Anonim

Amazon đàn hồi MapReduce (EMR) là một Dịch vụ Web của Amazon ( AWS ) công cụ để xử lý và phân tích dữ liệu lớn. Amazon EMR xử lý dữ liệu lớn trên một cụm máy chủ ảo Hadoop trên Amazon Elastic Compute Cloud (EC2) và Amazon Simple Storage Service (S3).

Theo cách này, AWS EMR hoạt động như thế nào?

Dịch vụ bắt đầu một số lượng phiên bản Amazon EC2 do khách hàng chỉ định, bao gồm một nút chính và nhiều nút khác. Amazon EMR chạy phần mềm Hadoop trên các trường hợp này. Nút chủ chia dữ liệu đầu vào thành các khối và phân phối quá trình xử lý của các khối cho các nút khác.

Ngoài phần trên, sự khác biệt giữa ec2 và EMR là gì? không giống EMR , EC2 không phân loại các nút nô lệ thành các nút lõi và nút nhiệm vụ. Điều này làm tăng nguy cơ mất dữ liệu HDFS trong trường hợp một nút bị xóa / mất. EC2 sử dụng các thư viện Apache (s3a) để truy cập dữ liệu trên s3. Mặt khác, EMR sử dụng mã độc quyền của AWS để có quyền truy cập nhanh hơn vào s3.

Ngoài ra, AWS EMR có được quản lý đầy đủ không?

Amazon Bản đồ co giãn ( EMR ) là một quản lý đầy đủ Nền tảng Hadoop và Spark từ Amazon Dịch vụ Web ( AWS ). Với EMR , AWS khách hàng có thể nhanh chóng xoay vòng các cụm Hadoop nhiều nút để xử lý khối lượng công việc dữ liệu lớn.

AWS có sử dụng Hadoop không?

Amazon Dịch vụ web sử dụng Apache mã nguồn mở Hadoop công nghệ điện toán phân tán để giúp dễ dàng truy cập lượng lớn sức mạnh tính toán để chạy các tác vụ đòi hỏi nhiều dữ liệu. Hadoop , phiên bản mã nguồn mở của MapReduce của Google, đã được các công ty như Yahoo và Facebook sử dụng.

Đề xuất: