Scheduled refresh (lên lịch làm mới dữ liệu) trong Power BI Service là một tính năng hữu ích, cho phép bạn xác định tần suất và khoảng thời gian để làm mới, cập nhật một bộ dữ liệu cụ thể. Ở bài viết lần này, mình sẽ chia sẻ tính năng Lên lịch để refresh dữ liệu, từ đó giúp bạn tiết kiệm thời gian và đảm bảo rằng người dùng cuối có thể truy cập dữ liệu cập nhật nhất.
Ví dụ như bạn đang tạo một báo cáo nhưng dữ liệu bán hàng bạn đang sử dụng không phải là bản cập nhật nhất. Bạn kiểm tra trạng thái refresh và thấy rằng nó đã được refresh lần cuối cách đây những 10 ngày! Và chưa hề có ai đặt lịch để refresh dữ liệu cả!

Rõ ràng bạn cần phải tìm ra giải pháp để làm bộ dữ liệu được cập nhật và chính xác. Dữ liệu thường được cập nhật mỗi tuần nhưng bạn sẽ phải làm thủ công hàng tuần, và bạn không thích làm điều đó, thi thoảng bạn còn quên nữa. Bạn quyết định sử dụng chức năng Power BI’s scheduled refresh để giải quyết vấn đề này.
Các nội dung chính
Thiết lập lịch làm mới dữ liệu (Scheduled Refresh)
Trước khi bạn có thể thiết lập một lịch trình refresh dữ liệu, bạn phải tạo kết nối cổng kết nối.
Để thiết lập lịch trình refresh dữ liệu, đi đến trang Datasets + dataflows. Di chuột qua bộ dữ liệu mà bạn muốn thiết lập lịch trình sau đó, chọn biểu tượng Schedule refresh.

Trên trang Settings, bạn hãy bật tính năng refresh theo lịch trình. Tiếp theo, chọn tần suất refresh, và hãy nhớ kiểm tra múi giờ. Sau đó, bạn thêm (các) mốc thời gian mà bạn muốn thực hiện refresh. Bạn có thể thiết lập tối đa 8 lần refresh mỗi ngày nếu bộ dữ liệu đang được chia sẻ, hoặc nếu bạn dùng Power BI Premium, bạn có thể tạo đến 48 lần. Sau đó hãy chọn Apply.
LƯU Ý: Power BI sẽ không thực hiện refresh dữ liệu vào chính xác thời gian đã được đặt mà sẽ tự động thực hiện tác vụ theo cách mà Power BI cảm thấy là hiệu quả nhất. Có thể bạn đặt lịch refresh dữ liệu sau mỗi 15 phút, nhưng PBI có thể sẽ bị trễ lên đến 1 giờ đồng hồ nếu Power BI Service không phân bổ được các dữ liệu cần thiết từ trước đó.
Trong ví dụ này, bạn muốn hệ thống refresh dữ liệu Salesvào 6:00 AM, 10:00 AM, và 3:00 PM hàng ngày, như hình dưới đây.

Sau khi thiết lập xong lịch refresh, trang dataset settings sẽ thông báo cho bạn về lần refresh tiếp theo như hình sau.

Thực hiện làm mới theo yêu cầu
Ngoài việc lên lịch tự động refresh, bạn có thể refresh bộ dữ liệu bất cứ lúc nào bằng cách thực hiện on-demand refresh – refresh theo yêu cầu. Loại refresh này không ảnh hưởng đến thời gian refresh theo lịch trình tiếp theo.
Chẳng hạn, bây giờ bạn cần refresh ngay lập tức bởi vì bạn cần xem dữ liệu gần đây nhất và không thể chờ đến lần refresh tiếp theo, hoặc bạn muốn kiểm tra cổng kết nối và nguồn dữ liệu của mình ngay bây giờ.
Để làm được, trên trang Datasets + dataflows, di chuột qua bộ dữ liệu mà bạn muốn refresh, sau đó chọn biểu tượng Refresh now.

Kiểm tra trạng thái và lịch sử làm mới
Bạn có thể kiểm tra trạng thái refresh và lịch sử các lần refresh bất cứ lúc nào bạn cần. Điều này sẽ rất hữu hiệu nếu bạn cần xem lần refresh gần nhất là khi nào, lần tiếp theo là khi nào và kiểm tra xem liệu có lỗi gì xảy ra trong các lần refresh hay không.
LƯU Ý: Power BI sẽ hủy kích hoạt lịch refresh của bạn sau 4 lần thất bại liên tiếp hoặc khi Power BI phát hiện lỗi không thể phục hồi chẳng hạn như credentials không hợp lệ hoặc hết hạn, mà lỗi đó cần phải được xử lý thủ công. Bạn cũng không thể thay đổi ngưỡng 4 lần liên tiếp thất bại kia thành một con số khác.
Một cách nhanh chóng để kiểm tra trạng thái refresh là xem danh sách các bộ dữ liệu trong workspace.

Nếu bạn nhìn thấy có một biểu tượng cảnh báo nho nhỏ ở bên cạnh, bạn sẽ biết rằng bộ dữ liệu hiện đang gặp sự cố. Chọn biểu tượng cảnh báo để xem kỹ hơn sự cố đó.

Thỉnh thoảng bạn cũng nên kiểm tra lịch sử refresh, bằng cách mở trang dataset’s settings và chọn Refresh history.

Vậy là bạn vừa học thêm về tính năng Lên lịch làm mới dữ liệu trong Power BI, và mình tin rằng nó sẽ giúp ích rất nhiều cho bạn trong quá trình làm việc. Bên cạnh đó, các bạn có thể tham khảo thêm về khóa học của Datapot tại đây.