Làm sao để phân biệt DA với DE, DS, BA và DBA? Trong bài viết trước, chúng ta đã tìm hiểu về các nhiệm vụ, vai trò của một Data Analyst. Tuy nhiên công việc của một DA rất dễ bị hiểu nhầm với các vị trí khác như BA (chuyên viên phân tích kinh doanh), DE (kỹ sư dữ liệu), DS (nhà khoa học dữ liệu) hay DBA (nhà quản trị cơ sở dữ liệu). Trong bài viết này, chúng ta sẽ cùng nhau phân biệt rõ vai trò và công việc của từng vị trí.
Các nội dung chính
Data Analyst (DA)
Một DA cho phép các doanh nghiệp tối đa hóa giá trị của dữ liệu thông qua các công cụ trực quan hóa và báo cáo như Power BI. Các DA chịu trách nhiệm mô tả làm sạch và chuyển đổi dữ liệu, thiết kế và xây dựng các mô hình dữ liệu có thể mở rộng, đồng thời kích hoạt và triển khai các khả năng phân tích nâng cao vào các báo cáo để phân tích. Họ làm việc với các bên liên quan để xác định dữ liệu và các yêu cầu báo cáo thích hợp và cần thiết, sau đó được giao nhiệm vụ biến dữ liệu thô thành những insight có liên quan và có ý nghĩa.
Một DA cũng chịu trách nhiệm quản lý nội dung Power BI, bao gồm báo cáo, trang tổng quan, không gian làm việc và các tập dữ liệu cơ bản được sử dụng trong báo cáo. Họ có nhiệm vụ triển khai và thiết kế các quy trình bảo mật phù hợp, cùng với các yêu cầu của các bên liên quan, để đảm bảo duy trì an toàn cho tất cả các dữ liệu trong Power BI.
DA làm việc với các DE để xác định và định vị các nguồn dữ liệu thích hợp đáp ứng yêu cầu của các bên liên quan, đồng thời làm việc với cả DS và DBA để đảm bảo DA có quyền truy cập vào các nguồn dữ liệu cần thiết. DA cũng làm việc với DE để xác định các quy trình mới hoặc cải tiến các quy trình hiện có để thu thập dữ liệu để phân tích.
Business Analyst (BA)
Mặc dù có một số điểm tương đồng giữa data analyst (DA) và business analyst (BA), nhưng điểm khác biệt chính giữa hai vai trò là những gì họ làm với dữ liệu. Một BA gần gũi hơn với doanh nghiệp và là một chuyên gia về việc giải thích dữ liệu có được từ việc trực quan hóa. Thường thì DA và BA có thể là coi là một người.
Data Engineer (DE)
DE cung cấp và thiết lập các công nghệ nền tảng dữ liệu trên đám mây (on- cloud) và tại chỗ (on-premises), nơi quản lý và bảo mật luồng dữ liệu có cấu trúc và phi cấu trúc từ nhiều nguồn. Nền tảng dữ liệu mà họ sử dụng có thể bao gồm cơ sở dữ liệu quan hệ, cơ sở dữ liệu không quan hệ, luồng dữ liệu và kho lưu trữ tệp. Các DE cũng đảm bảo rằng các dịch vụ dữ liệu tích hợp một cách an toàn và liền mạch.
Các nhiệm vụ chính của DE bao gồm việc sử dụng các dịch vụ và công cụ dữ liệu đám mây và tại chỗ để nhập, xuất và chuyển đổi dữ liệu từ nhiều nguồn. DE cộng tác với các bên liên quan trong kinh doanh để xác định và đáp ứng các yêu cầu về dữ liệu. Họ thiết kế và thực hiện các giải pháp.
Mặc dù nhiệm vụ và trách nhiệm của DE và DBA khá giống nhau, phạm vi công việc của DE còn hơn cả việc chăm sóc cơ sở dữ liệu và máy chủ nơi dữ liệu được lưu trữ và thường không bao gồm quản lý dữ liệu vận hạn tổng thể.
Một DE bổ sung giá trị to lớn cho cả các dự án khoa học dữ liệu và trí tuệ kinh doanh. Khi DE tập hợp dữ liệu lại với nhau, thường được mô tả là Data Wrangling, các dự án sẽ được tiến hành nhanh hơn vì các DS có thể tập trung vào các lĩnh vực công việc của mình.
Là một DA, bạn làm việc thường xuyên với một DE để đảm bảo rằng bạn có thể truy cập vào nhiều nguồn dữ liệu có cấu trúc và không có cấu trúc. Điều đó sẽ hỗ trợ bạn trong việc tối ưu hóa các mô hình dữ liệu thường được cung cấp từ kho chứa dữ liệu (data warehouse) hoặc hồ chứa dữ liệu (data lake).
Cả DBA và chuyên gia DBA đều có thể dễ dàng chuyển đổi sang vai trò DE. Họ chỉ cần tìm hiểu các công cụ và công nghệ được sử dụng để xử lý một lượng lớn dữ liệu.
Data Scientist (DS)
Các DS thực hiện phân tích nâng cao để trích xuất giá trị từ dữ liệu. Công việc của họ có thể thay đổi từ phân tích mô tả đến phân tích dự đoán. Phân tích mô tả đánh giá dữ liệu thông qua một quá trình được gọi là phân tích dữ liệu khám phá (EDA). Phân tích dự đoán được sử dụng trong học máy machine learning để áp dụng các kỹ thuật mô hình hóa nhằm phát hiện các điểm bất thường hoặc các khuôn mẫu. Đây là một phần quan trọng của các mô hình dự báo.
Phân tích mô tả và dự đoán chỉ là một khía cạnh trong công việc của các DS. Một số DS thậm chí có thể làm việc trong lĩnh vực học sâu (deep learning), thử nghiệm lặp đi lặp lại để giải quyết một vấn đề dữ liệu phức tạp bằng cách sử dụng các thuật toán tùy chỉnh.
Bằng chứng cho thấy rằng hầu hết công việc trong một dự án khoa học dữ liệu được dành cho việc data wrangling và feature engineering. Các DS có thể tăng tốc quá trình thử nghiệm khi các DE sử dụng các kỹ năng của họ để xử lý dữ liệu thành công.
Nhìn bề ngoài, có vẻ như một DS và DA khác xa nhau trong công việc họ làm, nhưng không phải vậy. DS xem xét dữ liệu để xác định các câu hỏi cần câu trả lời và thường sẽ đưa ra giả thuyết hoặc thử nghiệm và nhờ DA hỗ trợ trực quan hóa dữ liệu và báo cáo.
Database Administrator (DBA)
Nhà quản trị cơ sở dữ liệu (DBA) triển khai và quản lý các khía cạnh hoạt động của các giải pháp nền tảng dữ liệu kết hợp đám mây được xây dựng trên các dịch vụ dữ liệu Microsoft Azure và Microsoft SQL Server. Họ chịu trách nhiệm về tính khả dụng tổng thể và hiệu suất nhất quán và tối ưu hóa của các giải pháp cơ sở dữ liệu. Họ làm việc với các bên liên quan để xác định và thực hiện các chính sách, công cụ và quy trình cho các kế hoạch sao lưu và phục hồi dữ liệu.
Vai trò của DBA khác với vai trò của DE. DBA giám sát và quản lý tình trạng tổng thể của cơ sở dữ liệu và phần cứng của cơ sở dữ liệu, trong khi DE tham gia vào quá trình xử lý dữ liệu, tức là nhập, chuyển đổi, xác thực và làm sạch dữ liệu để đáp ứng nhu cầu và yêu cầu của doanh nghiệp.
DBA cũng chịu trách nhiệm quản lý tính bảo mật tổng thể của dữ liệu, cấp và hạn chế quyền truy cập và đặc quyền của người dùng đối với dữ liệu được xác định bởi nhu cầu và yêu cầu của doanh nghiệp.
Như vậy, chúng ta vừa điểm qua những khía cạnh nổi bật của mỗi vai trò. Mình hy vọng rằng thông qua bài viết này, các bạn có thể hiểu rõ được sự khác nhau và tương đồng, từ đó có những lựa chọn tối ưu. Ngoài ra, các bạn có thể tham khảo thêm về khóa học của DataPot tại đây nhé.