プライバシーサンドボックスの一部のテクノロジーは段階的に廃止されます。

プライバシーサンドボックステクノロジーに関する計画の最新情報をご覧ください。

プライバシーサンドボックスの機能のステータスでは、個々の API とプラットフォーム機能のステータスについて詳しく説明しています。

On-Device Personalization 連携コンピューティングサーバー

フェデレーションコンピューティング（FC）サーバーは、オンデバイスパーソナライズ（ODP）が提供するフェデレーションラーニングの一部です。このドキュメントの目的は、Federated Compute Server（FC Server）、そのコンポーネント、使用されているテクノロジーを紹介することです。このドキュメントでは、アーキテクチャの概要を説明してから、各コンポーネントについて詳しく説明します。また、コンポーネントが連携してフェデレーションラーニング環境を提供する仕組みについても説明し、ワークロードのスケーリングとシャーディングの戦略についても紹介します。

トレーニングフロー

トレーニングは、FC クライアントと FC サーバー間のデータフローで構成されます。FC クライアントは、デバイス上で ML モデルをトレーニングし、FC サーバーとやり取りするコア Android モジュールです。FC サーバーは、高信頼実行環境（TEE）で FC クライアントからの結果を安全に処理して集計します。

トレーニングは次の手順で構成されます。

Android 版プライバシーサンドボックスにおけるフェデレーションコンピューティングクライアントとサーバー間のトレーニングフローを示すフローチャート。

デバイス上の FC クライアントが、鍵サービスから公開暗号鍵をダウンロードします。
FC クライアントは FC サーバーにチェックインし、トレーニングタスクを取得します。
FC クライアントは、トレーニングプランとモデルの最新バージョン（バージョン N）をダウンロードします。
FC クライアントは、ローカルデータとプランを使用してトレーニングを行います。
FC クライアントは、ステップ 0 で取得した公開鍵を使用してこのデバイスの貢献度を暗号化し、FC サーバーにアップロードします。
FC クライアントは、トレーニングが完了したことを FC サーバーに通知します。
FC サーバーは、十分な数のクライアントが貢献を送信するまで待機します。
集計ラウンドがトリガーされます。
暗号化された投稿は、アグリゲータによって高信頼実行環境（TEE）に読み込まれます。
アグリゲータは、NIST の RFC 9334 Remote ATtestation procedureS（RATS）アーキテクチャに沿って、コーディネーターに対して自己証明を行います。構成証明に成功すると、Key Services は復号鍵を付与します。これらの鍵は、Shamir 秘密共有スキームで複数の鍵プロバイダに分割されることがあります。
アグリゲータは、クロスデバイス集計を行い、適切な差分プライバシー（DP）メカニズムに従ってクリップとノイズを追加し、ノイズが追加された結果を出力します。
アグリゲータがモデルアップデータをトリガーします。
モデルアップデータは、集計された貢献度を読み込み、モデルバージョン N に適用してモデルバージョン N + 1 を作成します。新しいモデルがモデルストレージに push されます。

FC サーバーは、TEE と関連するセキュリティ機能をサポートする任意のクラウドサービスにデプロイできます。現在、パブリッククラウドプロバイダと基盤となるテクノロジーを評価していますが、ここでは Confidential Space を使用した Google Cloud の実装例を紹介します。

アーキテクチャの概要

FC サーバーには、Google Cloud に次のコンポーネントがデプロイされています。

Android 版プライバシーサンドボックスのフェデレーションコンピューティングサーバーのアーキテクチャを示す図。

コンポーネント	説明
タスク管理サービス	トレーニングタスクを管理するためのウェブサービス。パートナーは、タスク管理 API を使用して、トレーニングタスクの作成、既存のすべてのトレーニングタスクの一覧表示、タスクのキャンセル、すべてのトレーニングステータスの取得を行う必要があります。
タスク割り当てサービス	クライアントデバイスが定期的にチェックインしてトレーニングタスクを取得し、トレーニングステータスをレポートする HTTPS ベースのウェブサービス。
アグリゲータ	Confidential Space で実行されているバックグラウンドサービス。ODP で作成されたワークロードを実行します。復号鍵へのアクセスをガードレールするコーディネーターに証明する必要があります。正常に証明されたアグリゲータのみが、クライアントデバイスから送信されたコントリビューションを復号し、クロスデバイス集計を実行できます。
モデルアップデータ	集計されたグラデーションをモデルに適用する Confidential Space で実行されるバックグラウンドサービス。

コンポーネントの詳細

以降のセクションでは、アーキテクチャの概要をさらに詳しく説明します。

Android 版プライバシーサンドボックスのフェデレーションコンピューティングサーバーのコンポーネントを示す図。

タスク管理サービス

タスク管理サービスには、タスク管理ウェブサービスとタスクスケジューラサービスの 2 つのサブコンポーネントが含まれています。どちらも GKE にデプロイされます。

タスク管理

これは、HTTPS リクエストを受け取り、タスクデータベースからタスクを作成または取得する一連のフロントエンドウェブサービスです。

タスクスケジューラ

タスクデータベースを継続的にスキャンするバックグラウンドサービス。トレーニングフロー（新しいトレーニングラウンドやイテレーションの作成など）を管理します。

タスクデータベース

タスク、イテレーション、割り当て情報を保存する ANSI SQL 準拠のデータベース。この実装では、基盤となるデータベースサービスとして Google Cloud Spanner が使用されます。

タスク割り当てサービス

タスク割り当てサービスは、GKE でホストされるフロントエンドウェブサービスです。FC クライアントからのリクエストを受け取り、該当する場合はトレーニングタスクを分散します。

ここでのタスクデータベースは、タスク管理サービスのタスクデータベースと同じデータベースインスタンスです。

アグリゲータサービス

アグリゲータとモデルアップデータ

アグリゲータとモデルアップデータは似ています。これらは、Confidential Space でデータを安全に処理するバックグラウンドサービスです。オフラインジョブ間の通信は PubSub を介して行われます。

勾配、集約された勾配、モデル、プラン

クライアントデバイスでアップロードされた（暗号化された）グラデーションのグラデーションストレージ。
集約、クリップ、ノイズが追加されたグラデーションの集約グラデーションストレージ。
トレーニングプラン、モデル、重みのモデルとプランのストレージ。

コレクタ

コレクタは、トレーニングラウンド中にクライアントデバイスの送信を定期的にカウントするバックグラウンドサービスです。十分な数の送信が利用可能になると、集計を開始するようアグリゲータに通知します。

サービスホスト

機密情報にアクセスできないすべてのサービスは GKE でホストされます。

機密情報にアクセスする可能性のあるすべてのサービスは、Confidential Space でホストされます。

すべての機密データは、複数のサードパーティが所有する Key Service によって管理される暗号鍵で暗号化されます。復号鍵にアクセスできるのは、正当な Confidential Computing 対応バージョンの Confidential Space で実行されている、ODP 作成のオープンソースコードのうち、正常に証明されたものだけです。

1 つのサービス単位では、コンピューティングリソースは次のようになります。

スケーラビリティ

前述のインフラストラクチャは、1 つのサービス単位に焦点を当てています。

1 つのサービス単位は 1 つの Cloud Spanner を使用します。主な制限事項については、Spanner の割り当てと上限をご覧ください。

このアーキテクチャの各コンポーネントは個別にスケーリングできます。これは、標準のスケーリングメカニズムを使用して、Confidential Space 内または GKE クラスタ内の容量をスケーリングすることで行われます。実際には、次のインスタンスを追加することで処理容量を増やすことができます。

タスク割り当てウェブサービス
タスク管理ウェブサービス
アグリゲータインスタンス
モデル更新ツールインスタンス

復元力

FC サーバーの復元性は、レプリケートされたストレージを使用した障害復旧によって処理されます。障害復旧に関心がある場合は、クロスリージョンデータレプリケーションを有効にする必要があります。これにより、災害（データセンターを中断させる気象イベントなど）が発生した場合でも、サービスは最後のトレーニングラウンドから再開されます。

Spanner

FC Server のデフォルトの実装では、トレーニングフローの制御に使用されるタスクステータスを保存するデータベースとして Google Cloud Spanner が使用されます。マルチリージョン構成を選択する前に、ビジネスニーズに応じて整合性と可用性のトレードオフを評価する必要があります。

Spanner インスタンスには、ユーザーデータまたはその派生データ（未加工または暗号化）は保存されません。Spanner が提供する障害復旧機能は、どれでも自由に使用できます。

Spanner は変更履歴を記録します。アグリゲータとモデルアップデータはトレーニングラウンドごとにデータを保存し、各ラウンドの結果は互いに上書きされることなく個別に保存されます。このため、障害が発生した場合でも、サービスは最後のトレーニングラウンドから再開できます。

Google Cloud Storage

FC サーバーのデフォルトの実装では、Google Cloud Storage を使用して、モデル、トレーニングプラン、暗号化されたデバイスの貢献度などの BLOB データを保存します。

設計には 3 つの GCS インスタンスがあります。

デバイスの投稿: デバイスからアップロードされた暗号化されたデバイスの投稿。
モデル: トレーニングプラン、モデルとその重み。
集約された勾配: アグリゲータによって生成された集約された勾配。

GCS に保存されるデータは次のいずれかです。

デベロッパーが提供したデータ（トレーニングプランなど）
デバイスからアップロードされたグラデーションや集計されたグラデーションなどのユーザーシグナル（複数のコーディネーターによるバックアップ暗号化で保護）から派生したデータであるため、プライベートなデータである可能性がある。
ユーザーシグナルから派生した非プライベートデータ（モデルの重みなど）。ただし、差分プライバシーの適用後に限ります。

整合性と可用性のトレードオフを評価し、適切な GCS データの可用性と耐久性の機能を選択する必要があります。独自のデータ保持ポリシーを指定する必要があります。

レプリケーションとバックアップ

Google Cloud が提供するデータレプリケーションメカニズムとは別に、Spanner と GCS のデータを定期的にバックアップすることもできます。たとえば、クロスクラウドレプリケーションサービスとオファリングを使用できます。これらの構成はビジネスニーズに大きく依存するため、ODP にはサンプルが用意されていません。現在の設計では、デベロッパーがこのようなレプリケーションとバックアップを必要とする可能性を考慮しています。そのため、サードパーティが提供するレプリケーションサービスやバックアップサービス、プロダクトと互換性があります。

On-Device Personalization 連携コンピューティング サーバー コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

トレーニング フロー