Các doanh nghiệp trên nhiều ngành công nghiệp chia sẻ dữ liệu, kết hợp dữ liệu bên thứ nhất với các nguồn bên ngoài để có được những hiểu biết mới và hợp tác với đối tác. Trên thực tế, hơn 6000 tổ chức chia sẻ hơn 275 PBs dữ liệu qua các ranh giới tổ chức mỗi tuần bằng cách sử dụng BigQuery. Năm ngoái, chúng tôi đã ra mắt Analytics Hub, trên thị trường, được xây dựng trên BigQuery, cho phép khách hàng chia sẻ và trao đổi dữ liệu một cách hiệu quả về chi phí, đồng thời giúp giảm thiểu các thách thức về di chuyển dữ liệu. Tuy nhiên, khách hàng chia sẻ nhiều loại dữ liệu, trong số đó có những loại có thể phải tuân thủ các yêu cầu về quy định và quyền riêng tư nghiêm ngặt hơn. Trong những trường hợp đó, khách hàng có thể cần các lớp bảo vệ bổ sung để phân tích dữ liệu marketing đa kênh và hợp tác an toàn với đối tác kinh doanh ở các ngành công nghiệp khác nhau.
Để hỗ trợ, chúng tôi giới thiệu BigQuery data clean rooms, sẽ ra mắt trong quý 3, để giúp các tổ chức tạo và quản lý môi trường an toàn cho việc chia sẻ, phân tích và hợp tác dữ liệu tập trung vào quyền riêng tư qua các tổ chức — tất cả mà không cần phải di chuyển hoặc sao chép dữ liệu.
Data clean rooms có thể giúp các doanh nghiệp lớn hiểu rõ khán giả mà vẫn tôn trọng quyền riêng tư và bảo mật dữ liệu của người dùng. Ví dụ, với BigQuery data clean rooms:
- Các nhà bán lẻ có thể tối ưu hóa hoạt động marketing và khuyến mãi bằng cách kết hợp dữ liệu POS từ các cửa hàng bán lẻ và dữ liệu marketing từ các công ty CPG.
- Các doanh nghiệp Dịch vụ Tài chính có thể cải thiện phát hiện gian lận bằng cách kết hợp dữ liệu nhạy cảm từ các cơ quan tài chính và chính phủ khác hoặc xây dựng điểm đánh giá rủi ro tín dụng bằng cách tổng hợp dữ liệu khách hàng từ nhiều ngân hàng.
- Trong ngành y tế, các bác sĩ và nhà nghiên cứu dược phẩm có thể chia sẻ dữ liệu trong clean room để tìm hiểu cách bệnh nhân phản ứng với liệu pháp.
Đây chỉ là một số trường hợp sử dụng mà BigQuery data clean rooms có thể cho phép. Hãy cùng xem cách nó hoạt động.
Triển khai data clean rooms
Data clean rooms sẽ được cung cấp trong tất cả các khu vực BigQuery thông qua Analytics Hub và có thể được tạo và triển khai trong vài phút. Khách hàng có thể sử dụng giao diện Google Cloud hoặc API để tạo môi trường phòng sạch an toàn và mời đối tác hoặc các bên tham gia khác để đóng góp dữ liệu.
Người đóng góp dữ liệu có thể xuất bảng hoặc các chế độ xem clean room và tổng hợp, ẩn danh và giúp bảo vệ thông tin nhạy cảm. Họ cũng có thể cấu hình các quy tắc phân tích để hạn chế các loại truy vấn có thể được thực hiện đối với dữ liệu. Quan trọng hơn, việc thêm dữ liệu vào clean room thông thường không yêu cầu tạo bản sao hoặc di chuyển dữ liệu; nó có thể được chia sẻ tại chỗ và vẫn nằm dưới sự kiểm soát của người đóng góp dữ liệu. Cuối cùng, khách hàng thuê bao dữ liệu sẽ có thể khám phá và đăng ký thuê clean rooms nơi họ có thể thực hiện các truy vấn tập trung vào quyền riêng tư trong dự án của họ.
Dữ liệu được chia sẻ trong clean room có thể là trực tiếp và được cập nhật – mọi thay đổi đối với bảng hoặc chế độ xem được chia sẻ sẽ ngay lập tức có sẵn cho các thuê bao. Người đóng góp dữ liệu cũng nhận được các nhật ký và số liệu tổng hợp để hiểu cách dữ liệu của họ được sử dụng trong clean room.
Không có chi phí bổ sung cho khách hàng BigQuery liên quan đến việc sử dụng BigQuery data clean rooms. Khi hợp tác với nhiều đối tác, người đóng góp dữ liệu chỉ phải trả chi phí lưu trữ dữ liệu và các thuê bao của các data clean rooms chỉ phải trả cho các truy vấn.
Các đối tác hỗ trợ data clean rooms trong BigQuery
Hiện nay, khả năng Data clean rooms capabilities trong BigQuery được kích hoạt bởi các đối tác của chúng tôi là Habu và LiveRamp. Với Habu, một nền tảng hợp tác dữ liệu cho việc sắp xếp dữ liệu tập trung vào quyền riêng tư, các khách hàng như L’Oréal đang làm việc cùng Google Cloud và Habu để giúp chia sẻ dữ liệu một cách an toàn. “Chúng tôi rất phấn khích khi được là một trong những người đầu tiên làm việc trong môi trường BigQuery và Habu. Khả năng truy cập và phân tích dữ liệu một cách an toàn và bảo mật hơn, mà không cần sử dụng tài nguyên khoa học dữ liệu, đã giúp chúng tôi hiểu rõ hơn về khách hàng của mình và đo lường ảnh hưởng thực sự của các hoạt động marketing của chúng tôi,” Shenan Reed, Phó Chủ tịch Cấp cao Quản lý Phương tiện tại L’Oréal.
“Đối tác của chúng tôi với Google Cloud là một minh chứng cho cam kết của chúng tôi trong việc cung cấp sự hợp tác mượt mà trên một hệ sinh thái công nghệ mở. Việc mở rộng quyền truy cập phòng sạch và cung cấp các công cụ tập trung vào quyền riêng tư mà các thương hiệu đòi hỏi đang mở ra những con đường mới cho sự phát triển của khách hàng chung của chúng tôi,” Matt Kilmartin, Cofounder và CEO của Habu nói.
LiveRamp trên Google Cloud có thể kích hoạt hợp tác dữ liệu tập trung vào quyền riêng tư và giải quyết danh tính trong BigQuery để thúc đẩy các đối tác dữ liệu hiệu quả hơn. Giải pháp của LiveRamp trong BigQuery mở khóa giá trị của dữ liệu bên thứ nhất của khách hàng và thiết lập một mô hình dữ liệu danh tính tập trung vào quyền riêng tư có thể chính xác:
- Cải thiện sự hợp nhất của cả các bản ghi ngoại tuyến và trực tuyến để có cái nhìn chính xác và toàn diện hơn về các hồ sơ khán giả của khách hàng
- Kích hoạt khán giả một cách an toàn với tỷ lệ phù hợp cải thiện để tăng cường khả năng tiếp cận và chất lượng đo lường
- Kết nối dữ liệu của khách hàng và tiềm năng với các báo cáo truyền thông trực tuyến và các yếu tố dữ liệu của đối tác để giúp cải thiện hành trình của khách hàng và nhận thông tin về quyền lợi sử dụng mô hình ML
“LiveRamp đã phát triển hỗ trợ sâu rộng cho việc kết nối dữ liệu chính xác và an toàn về quyền riêng tư trong toàn bộ hệ sinh thái Google. Là một trong những nhà cung cấp clean room đầu tiên trên Google Cloud với nền tảng Data Collaboration Platform của chúng tôi, chúng tôi rất phấn khích khi thấy sự tiến triển của Analytics Hub trở thành một giải pháp phòng sạch mạnh mẽ cho toàn bộ hệ sinh thái BigQuery. Công việc liên tục của chúng tôi với Google Cloud tập trung vào cho phép khách hàng toàn cầu kết nối và hợp tác với dữ liệu một cách dễ dàng hơn, thúc đẩy mô hình và kế hoạch đối tượng hiệu quả hơn và đảm bảo rằng họ có thể mở rộng tiện ích của dữ liệu một cách tự nhiên trên BigQuery một cách an toàn và bảo mật,” Max Parris
Cuối cùng, Lytics là một nền tảng dữ liệu khách hàng được xây dựng trên BigQuery. CDP có thể sử dụng dữ liệu để thay đổi cách họ kinh doanh và xây dựng mối quan hệ. Điều này bao gồm công cụ cho cơ sở hạ tầng dữ liệu khách hàng, vệ sinh dữ liệu, kích hoạt và báo cáo; tất cả để hỗ trợ các thương hiệu trong việc mở rộng và tận dụng dữ liệu khách hàng để khám phá những thông tin có ý nghĩa mà họ có thể thực hiện hành động. Lytics cũng cung cấp một giải pháp data clean room được xây dựng từ sự hợp tác với BigQuery và cung cấp các tính năng để quản lý và xử lý dữ liệu, tiếp nhận, hợp nhất, làm phong phú, nối và giải quyết thực thể. Giải pháp sử dụng quyền hạn mức đổi dữ liệu của Google Cloud và có thể thống nhất dữ liệu mà không tiết lộ thông tin cá nhân, từ đó cho phép khách hàng tận dụng dữ liệu trong toàn bộ tổ chức của họ, trong khi tránh sự trùng lặp dữ liệu và giảm thiểu rủi ro về quyền riêng tư.
Nguồn: https://cloud.google.com/blog/products/data-analytics/introducing-bigquery-data-clean-rooms