BigQuery là một kho dữ liệu trên đám mây, giúp bạn chạy những truy vấn có hiệu suất cao trên các tập dữ liệu lớn.
Bạn có thể xuất tất cả sự kiện thô từ tài sản Google Analytics 4 (bao gồm cả tài sản phụ và tài sản tổng hợp) sang BigQuery, sau đó dùng cú pháp giống như SQL để truy vấn dữ liệu đó. Trong BigQuery, bạn có thể chọn xuất dữ liệu sang bộ nhớ ngoài hoặc nhập dữ liệu bên ngoài để kết hợp dữ liệu đó với dữ liệu của Analytics.
Khi xuất dữ liệu sang BigQuery, bạn sẽ sở hữu dữ liệu đó và có thể sử dụng tệp ACL của BigQuery để quản lý quyền truy cập đối với các dự án và tập dữ liệu.
Hệ thống sẽ xuất toàn bộ dữ liệu 1 lần/ngày. Hệ thống cũng sẽ xuất dữ liệu liên tục suốt cả ngày (xem mục Xuất luồng dữ liệu bên dưới).
Bạn có thể xuất sang phiên bản BigQuery miễn phí (hộp cát BigQuery), nhưng phải trả phí cho những lượt xuất vượt quá hạn mức của hộp cát.
Đối với tài sản chuẩn, tính năng BigQuery Export có thể xuất 1 triệu sự kiện mỗi ngày. Tìm hiểu thêm về các hạn mức khác của BigQuery Export
Sự khác biệt giữa giao diện Google Analytics và BigQuery Export
Tính năng xuất sự kiện BigQuery cung cấp quyền truy cập vào dữ liệu cấp người dùng và sự kiện thô, không bao gồm mọi giá trị do Google Analytics thêm vào dữ liệu trong báo cáo chuẩn và dữ liệu khám phá. Vì lý do này, dữ liệu có nguồn gốc từ tính năng xuất sự kiện BigQuery có thể khác với dữ liệu trong giao diện Google Analytics.
Để hiểu rõ sự khác biệt về dữ liệu giữa tính năng xuất sự kiện BigQuery và giao diện Google Analytics, đồng thời khám phá các cách để giảm thiểu những khác biệt này khi có thể, hãy xem bài viết Thu hẹp sự khác biệt về dữ liệu giữa giao diện người dùng Google Analytics và tính năng xuất dữ liệu BigQuery.
Xuất trực tuyến
Bạn có thể chọn tùy chọn xuất trực tuyến khi liên kết thuộc tính Google Analytics 4 với BigQuery.
Tùy chọn xuất trực tuyến của BigQuery cung cấp dữ liệu của ngày hiện tại trong vòng vài phút thông qua tính năng BigQuery Export.
Khi bạn sử dụng tùy chọn xuất này, BigQuery cung cấp thông tin mới hơn về người dùng và lưu lượng truy cập của người dùng trên tài sản của bạn, và bạn có thể phân tích thông tin này.
Mỗi ngày, tính năng xuất trực tuyến sẽ tạo ra một bảng mới:
events_intraday_YYYYMMDD
: Một bảng nội bộ, được chia theo giai đoạn và bao gồm các bản ghi hoạt động của phiên diễn ra trong ngày. Xuất trực tuyến là cách hiệu quả nhất và có thể không bao gồm mọi dữ liệu vì một số lý do, chẳng hạn như do phải xử lý các sự kiện gửi muộn và/hoặc do tải lên không thành công. Hệ thống sẽ xuất dữ liệu liên tục suốt cả ngày. Bảng này có thể bao gồm các bản ghi của một phiên khi phiên đó kéo dài qua nhiều lần xuất. Bảng này bị xóa khievents_YYYYMMDD
hoàn tất.
Nếu bạn chọn tùy chọn hằng ngày khi thiết lập BigQuery Export, bảng sau đây cũng được tạo mỗi ngày.
events_YYYYMMDD
: Xuất hằng ngày toàn bộ các sự kiện.
Bạn nên truy vấn events_YYYYMMDD
thay vì events_intraday_YYYYMMDD
để truy vấn một tập dữ liệu ổn định cho ngày đó.
Hãy xem Giản đồ BigQuery Export để biết thêm thông tin về bảng events_YYYYMMDD
và events_intraday_YYYYMMDD
.
Chế độ xuất trực tuyến của BigQuery không bao gồm những dữ liệu phân bổ cho người dùng sau đây đối với người dùng mới:
- traffic_source.name (phương diện báo cáo: Chiến dịch đã thu nạp người dùng)
- traffic_source.source (phương diện báo cáo: Nguồn đã thu nạp người dùng)
- traffic_source.medium (thứ nguyên báo cáo: Phương tiện người dùng)
Dữ liệu phân bổ người dùng cho những người dùng hiện tại cũng được xuất, nhưng phải mất khoảng 24 giờ để xử lý hoàn toàn. Vì vậy, bạn không nên dựa vào dữ liệu đó trong bảng xuất trực tuyến, mà nên lấy dữ liệu phân bổ người dùng từ bảng xuất hằng ngày đầy đủ.
Bạn sẽ phải trả thêm phí sử dụng tính năng xuất trực tuyến của BigQuery với mức phí là 0,05 đô la Mỹ cho mỗi gigabyte dữ liệu. 1 gigabyte dữ liệu tương đương với khoảng 600.000 sự kiện Google Analytics, tuy nhiên, con số đó sẽ thay đổi tuỳ thuộc vào kích thước của sự kiện. Tìm hiểu thêm về giá của BigQuery.
Lịch cập nhật bảng
Những bảng được tạo trong BigQuery Export sẽ được cập nhật theo múi giờ của tài sản Analytics mà bạn xuất dữ liệu.
Bảng xuất trực tuyến (events_intraday_YYYYMMDD) được cập nhật liên tục suốt cả ngày (ví dụ: từ 12:00:00 sáng cho đến 11:59:59 tối theo múi giờ của tài sản). Khi ngày mới bắt đầu theo múi giờ của tài sản, các sự kiện được ghi vào một bảng mới trong ngày.
Bảng xuất hằng ngày (events_YYYYMMDD) được tạo sau khi Analytics thu thập tất cả sự kiện cho ngày hôm đó. Analytics sẽ cập nhật bảng hằng ngày trong vòng 72 giờ sau ngày tạo bảng bằng cách thêm những sự kiện có dấu thời gian khớp với ngày trong bảng (ví dụ: nhóm sự kiện mà Measurement Protocol hoặc Firebase SDK gửi muộn). Ví dụ: nếu ngày trong bảng là 20220101, thì Analytics sẽ cập nhật bảng này cho đến hết ngày 20220104 bằng cách thêm những sự kiện có dấu thời gian là 20220101.
Đôi khi, Analytics có thể cập nhật các bảng hằng ngày bất cứ lúc nào sau khoảng thời gian 72 giờ, trong trường hợp Analytics cần xử lý lại dữ liệu trong quá khứ (ví dụ: để sửa một lỗi gây ra lỗi xử lý).
Các ping không có cookie và dữ liệu do khách hàng cung cấp
Khi bạn triển khai chế độ đồng ý, những ping không có cookie mà Analytics thu thập sẽ xuất hiện trong BigQuery Export, cùng với dữ liệu do khách hàng cung cấp như user_id và các phương diện tuỳ chỉnh.
So sánh BigQuery Export trong Google Analytics 4 và Universal Analytics
Tài nguyên liên quan
Truy cập vào Hướng dẫn về công cụ BigQuery dành cho nhà phát triển để tìm hiểu thêm về:
Nguồn: https://support.google.com/analytics/answer/9358801