Amazon EFS (Elastic File System) là một giải pháp lưu trữ tệp tin được phát triển bởi AWS. Trong bài viết này, mình sẽ sẽ nói về cách hoạt động của nó, các chế độ hiệu suất, ứng dụng thực tế và cả cách tiết kiệm chi phí nhé.
Xem thêm:
AWS Budget – Thiết lập ngân sách và cảnh báo chi phí – Bài 3
Amazon EC2 là gì? Các loại EC2 Instance phổ biến – Bài 4
Hướng dẫn tạo EC2 Instance chạy Amazon Linux trên AWS – Bài 5
1. Amazon EFS là gì?
Amazon Elastic File System (EFS) là một dịch vụ lưu trữ tệp tin fully managed, sử dụng giao thức NFS, cho phép nhiều EC2 truy cập cùng lúc vào một hệ thống file chung. Bạn chỉ cần mount là dùng được, không cần lo chuyện cấu hình phức tạp.
Giống như bạn có một ổ đĩa dùng chung giữa nhiều máy chủ vậy, nhưng ổ đĩa này chạy trên cloud và AWS lo hết phần backend cho bạn.

2. Những điểm hay của EFS
Khả năng truy cập đa vùng khả dụng (Multi-AZ): Amazon EFS được thiết kế để tự động phân tán dữ liệu trên nhiều Availability Zones (AZs) trong cùng một khu vực AWS. Điều này đảm bảo dữ liệu luôn có sẵn, duy trì tính sẵn sàng cao (high availability) và khả năng chịu lỗi (fault tolerance) ngay cả khi một AZ cụ thể gặp sự cố. Vì vậy, EFS đặc biệt phù hợp với các ứng dụng yêu cầu độ bền và độ tin cậy cao.
Tự động mở rộng quy mô lưu trữ: EFS cung cấp khả năng tự động tăng hoặc giảm dung lượng lưu trữ khi dữ liệu được thêm vào hoặc xóa khỏi hệ thống tệp. Bạn không cần thiết lập trước dung lượng lưu trữ, giúp tiết kiệm thời gian quản lý, giảm bớt rủi ro thiếu hụt hoặc dư thừa tài nguyên.
Hiệu suất linh hoạt: Với Amazon EFS, hiệu suất lưu trữ được tối ưu hoá tự động theo nhu cầu sử dụng của bạn. Bạn có thể lựa chọn các chế độ hiệu suất khác nhau (General Purpose hoặc Max I/O) tùy thuộc vào đặc thù của ứng dụng, từ các ứng dụng web phổ thông đến những hệ thống xử lý và phân tích dữ liệu lớn phức tạp.
Quản lý đơn giản, tiết kiệm chi phí:Không cần setup phức tạp, không cần lo phần cứng hay HA. AWS lo hết. Bạn chỉ việc mount vào EC2 là dùng.
Amazon EFS hiện tại chỉ hỗ trợ các hệ thống tệp dựa trên Linux: Hoạt động tốt với các AMI Linux như Amazon Linux, Ubuntu, Red Hat Enterprise Linux (RHEL), CentOS và SUSE. Không hỗ trợ Windows Server, bởi Windows sử dụng giao thức SMB (Server Message Block) thay vì NFS.

3. Chi phí sử dụng Amazon EFS
EFS tính phí theo dung lượng thật sự bạn sử dụng. Không cần đặt trước capacity như EBS. Tuy nhiên, giá mỗi GB thường cao hơn EBS từ 2.5 đến 3 lần, vì nó hỗ trợ multi-AZ, truy cập đồng thời, và tự động mở rộng.
Mẹo tiết kiệm: Nếu dữ liệu bạn không truy cập thường xuyên, có thể bật tính năng Lifecycle Management để chuyển file sang các lớp rẻ hơn như Infrequent Access hoặc Archive.
4. Trường hợp sử dụng phổ biến của Amazon EFS
Amazon EFS lý tưởng cho các ứng dụng cần lưu trữ linh hoạt, chia sẻ dữ liệu và truy cập đa vùng:
- Hệ thống quản lý nội dung (CMS): WordPress, Joomla, Drupal,…
- Lưu trữ trang web: Các trang web có nhiều máy chủ cần truy cập chung dữ liệu.
- Phân tích dữ liệu lớn (Big Data): Xử lý khối lượng dữ liệu lớn theo thời gian thực.
- Hạ tầng DevOps & CI/CD: Lưu trữ mã nguồn và quy trình triển khai phần mềm.
- Bộ nhớ cho container: Hoạt động tốt với EKS, ECS, và Kubernetes.
5. Các chế độ hiệu suất Amazon EFS
5.1. General Purpose (GP)
Độ trễ thấp → hợp với ứng dụng yêu cầu phản hồi nhanh.
Phù hợp với web servers, hệ thống quản lý nội dung (CMS như WordPress, Drupal), các hệ thống home directories (tệp người dùng cá nhân).
Lưu ý: Không nên dùng chế độ này nếu cần throughput cực cao hoặc số lượng lớn các máy chủ EC2 truy cập song song, vì nó có giới hạn quy mô truy cập đồng thời.
5.2. Max I/O
Tối ưu cho workload lớn, truy cập đồng thời cao.
Phù hợp với Big Data, streaming, training ML.
Lưu ý: Khi đã chọn Max I/O cho hệ thống file, bạn không thể chuyển ngược về General Purpose.
5.3. Chế độ Throughput Bursting
Đặc điểm: Throughput của file system tự động tỷ lệ thuận với dung lượng dữ liệu lưu trữ.
Quy tắc cơ bản:
Cứ mỗi 1 GiB lưu trữ => ~50 KBps throughput.
Ví dụ: 1 TiB (≈ 1024 GiB) lưu trữ => ~51.2 MBps throughput cơ bản.
Có thể bùng nổ (burst) lên gấp đôi throughput cơ bản trong ngắn hạn, nhờ cơ chế “credit”.
Ưu điểm:
- Thích hợp cho ứng dụng có lưu lượng truy cập thỉnh thoảng tăng cao.
- Không cần cấu hình hoặc tính toán trước.
Ứng dụng phù hợp:
- File sharing văn phòng.
- Web hosting trung bình – nhỏ.
- Lưu trữ dữ liệu logs, backups.
5.4. Chế độ Provisioned Throughput
Đặc điểm: Cho phép thiết lập trước throughput cố định, không phụ thuộc vào dung lượng lưu trữ.
Ưu điểm:
- Giúp đảm bảo throughput ổn định cho các ứng dụng nhạy cảm với tốc độ I/O.
- Không cần tăng dung lượng file system để tăng tốc độ.
Ứng dụng phù hợp:
- Các ứng dụng enterprise critical cần throughput ổn định.
- Các hệ thống phân tích, machine learning pipelines lớn.
5.5. Chế độ Elastic Throughput (ra mắt 2023)
- Tự co giãn theo nhu cầu workload.
- Không cần cấu hình thủ công.
- Hợp với backend app, API server, batch jobs có lưu lượng dao động.
6. Lớp lưu trữ của EFS
Amazon Elastic File System (EFS) cung cấp nhiều lớp lưu trữ (Storage Classes) khác nhau nhằm tối ưu hóa chi phí dựa trên tần suất truy cập dữ liệu. Mỗi lớp được thiết kế cho một mục đích sử dụng cụ thể, giúp doanh nghiệp linh hoạt cân đối giữa hiệu suất và chi phí.
| Lớp lưu trữ | Trường hợp sử dụng | Tiết kiệm chi phí |
| EFS Standard | Dữ liệu truy cập thường xuyên | Lớp mặc định |
| EFS Infrequent Access (EFS-IA) | Dữ liệu truy cập không thường xuyên | Chi phí thấp hơn nhiều, tính thêm phí truy xuất |
| EFS Archive | Dữ liệu truy cập rất ít (1–2 lần mỗi năm) | Chi phí thấp nhất, tiết kiệm tối đa |
Quản lý vòng đời dữ liệu với Lifecycle Policies:
Amazon EFS cung cấp Lifecycle Management – một tính năng tự động chuyển dữ liệu giữa các lớp lưu trữ dựa trên số ngày không truy cập, giúp tối ưu chi phí mà không cần thao tác thủ công.
Cách hoạt động: Bạn định nghĩa chính sách thời gian không truy cập (ví dụ: 30, 60, 90, hoặc 180 ngày).
Sau khoảng thời gian đó, các tệp không được truy cập sẽ:
- Chuyển từ Standard → EFS-IA.
- Hoặc từ EFS-IA → EFS Archive (nếu bật tính năng Archive Transition).
Ví dụ thực tế:
Một hệ thống lưu trữ log web server:
- Dữ liệu log 30 ngày đầu lưu ở EFS Standard để dễ dàng truy vấn.
- Sau 60 ngày không truy cập, tự động chuyển sang EFS-IA để tiết kiệm chi phí.
- Sau 1 năm, các log cũ tiếp tục chuyển sang EFS Archive để lưu trữ lâu dài với chi phí thấp nhất.
7. Ưu điểm và nhược điểm của Amazon EFS
Ưu điểm nổi bật:
- Mở rộng tự động: Dung lượng lưu trữ tăng/giảm theo nhu cầu thực tế mà không cần quản lý thủ công.
- Truy cập đồng thời từ nhiều EC2 Instance: Hệ thống phân tán, tối ưu cho các ứng dụng nhiều node.
- Khả năng chịu lỗi cao (High Availability): Dữ liệu được nhân bản đa vùng (Multi-AZ), đảm bảo tính sẵn sàng và độ bền.
- Bảo mật mạnh mẽ: Kết hợp IAM policy, Security Groups và mã hóa AWS KMS ở trạng thái nghỉ và khi truyền.
- Thanh toán linh hoạt: Chỉ trả tiền cho dung lượng và throughput thực tế sử dụng.
Nhược điểm cần lưu ý:
- Chi phí cao hơn EBS: Chi phí lưu trữ trung bình của EFS (~0.30 USD/GB/tháng) cao gấp khoảng 2.5–3 lần so với EBS GP2 (~0.10 USD/GB/tháng).
- Chỉ hỗ trợ Linux: EFS hiện chỉ hỗ trợ các hệ thống file Linux (NFS); Windows Server cần dùng Amazon FSx for Windows File Server.
- Chế độ Max I/O có độ trễ cao: Dù cho throughput cao hơn, Max I/O làm tăng latency, có thể ảnh hưởng đến ứng dụng nhạy cảm với độ trễ.
8. So sánh Amazon EBS và EFS
| Tiêu chí | Amazon EBS | Amazon EFS |
|---|---|---|
| Loại lưu trữ | Block Storage (lưu trữ khối) | File Storage (lưu trữ dạng tệp) |
| Gắn với EC2 | Một EC2 tại một thời điểm (trừ Multi-Attach trên io1/io2) | Nhiều EC2 cùng lúc |
| Khả năng mở rộng | Phải mở rộng thủ công | Tự động mở rộng khi cần |
| Phạm vi khả dụng | Giới hạn trong một Availability Zone | Hỗ trợ Multi-AZ (đa vùng sẵn sàng) |
| Hệ điều hành hỗ trợ | Linux và Windows | Chỉ hỗ trợ Linux |
| Chi phí | Tối ưu hơn | Cao hơn nhưng có thể tối ưu bằng Storage Tier |
Bằng cách làm theo hướng dẫn trên, bạn đã có thể quản lý hiệu quả ngân sách AWS và tránh rủi ro phát sinh chi phí không mong muốn. Hy vọng bài viết này hữu ích. Cảm ơn bạn đã tham khảo AWS Certified Solutions Architect Associate trên ttnguyen.net.
Bài viết cùng chủ đề:
EC2 Placement Groups trong AWS – Bài 6
AWS IPv4 Public – Cách tính phí mới nhất – Bài 7
EBS Volumes – EBS Snapshot – Lưu trữ cho EC2 Instances – Bài 8