A. Mục đích: Xây dựng, quản lý và tối ưu các hệ thống thu thập, lưu trữ, xử lý và truyền tải dữ liệu để phục vụ cho việc phân tích và ra quyết định bao gồm:
- Thiết kế và xây dựng hệ thống dữ liệu.
- Làm sạch và chuyển đổi dữ liệu (ETL/ELT).
- Quản lý Data Lakehouse.
- Tối ưu hóa performance data.
B. Mô tả công việc:
- Thiết kế, xây dựng và duy trì hệ thống xử lý dữ liệu lớn (data pipelines) phục vụ cho các nhu cầu phân tích, báo cáo hoặc vận hành hệ thống.
- Thu thập, xử lý và chuyển đổi dữ liệu từ nhiều nguồn khác nhau (SAP S4, DMS, API, database, file logs, third-party, GA v.v.).
- Tối ưu hóa luồng dữ liệu, nâng cao hiệu suất lưu trữ và truy xuất dữ liệu.
- Làm việc với các công nghệ dữ liệu như Spark, Hadoop, Kafka, Airflow, Snowflake, BigQuery, Redshift….
- Phối hợp với BI Analyst và các phòng ban khác để đảm bảo chất lượng và độ tin cậy của dữ liệu.
- Xây dựng và duy trì hệ thống giám sát dữ liệu (data monitoring, data quality checks, data governance).
- Đảm bảo chất lượng và bảo mật dữ liệu 8 Đảm bảo các hệ thống dữ liệu tuân thủ quy định bảo mật và quyền riêng tư (GDPR, PDPA, v.v.).
- Hợp tác với Data Analyst và Data Scientist.