Диагностика и усиление; подтвердите свою инфраструктуру

Темы руководства:

Диагностика вашей инфраструктуры

На этой странице представлены инструкции по устранению неполадок и проверке инфраструктуры службы агрегации. Следуйте инструкциям, чтобы выявить и устранить проблемы.

Устранение неполадок Терраформа

Terraform, платформа «инфраструктура как код» (IaC), созданная HashiCorp, является основным драйвером для развертывания службы агрегации в выбранном вами общедоступном облаке. Если у вас не установлен terraform, ознакомьтесь с документацией HashiCorp о том, как получить локальный интерфейс cli .

Вы также можете рассмотреть возможность установки tfenv , если ваши потребности требуют переключения версий terraform.

Если вы не видите решения проблемы со службой агрегации, сообщите нам об этом, оставив заявку на GitHub или отправив форму технической поддержки .

Если вы предпочитаете переключать терраформ вручную:

rm -rf $(which terraform)
wget https://releases.hashicorp.com/terraform/1.2.3/terraform_1.2.3_linux_amd64.zip 
unzip terraform_1.2.3_linux_amd64.zip
mv terraform /usr/local/bin/terraform
terraform --version

Если ошибка Terraform не ясна, выходные данные можно просмотреть, включив ведение журнала Terraform на уровне TRACE .

Google Облако

Поставщик Terraform для Google Cloud разрабатывается совместно HashiCorp и Google. Если у вас есть дополнительные вопросы и советы по устранению неполадок, обратитесь в службу поддержки Cloud Terraform для получения дополнительной информации или зайдите в раздел Google на портале обсуждений Hashicorp .

Веб-сервисы Amazon

Документацию по отладке можно найти на сайте AWS . Мы также рекомендуем вам посетить раздел AWS на портале обсуждений HashiCorp .

Дополнительные вопросы о Terraform см. на портале сообщества HashiCorp . Советы по устранению неполадок для общего Terraform, прочитайте их документацию по отладке .

Будьте очень осторожны при изменении этих каталогов, потому что их удаление приведет к тому, что terraform больше не распознает состояние. Он попытается повторно предоставить все ресурсы и выдаст ошибку, если у вас есть ресурс с таким же именем. Если проблема не исчезнет, ​​свяжитесь с нами через форму технической поддержки .

Будьте очень осторожны при изменении этих каталогов, потому что их удаление приведет к тому, что terraform больше не распознает состояние. Он попытается повторно предоставить все ресурсы и выдаст ошибку, если у вас есть ресурс с таким же именем. Если проблема не исчезнет, ​​свяжитесь с нами через форму технической поддержки.

Проверьте настройку облака

Убедитесь, что ваша инфраструктура службы агрегации в выбранном вами общедоступном облаке развернута правильно. Для этого мы воспользуемся образцами отчетов об отладке и запустим задание в режиме отладки. Если служба агрегации может получить запрос API и ответить, мы знаем, что она запущена и работает. Если вы еще не настроили его, мы рекомендуем вам использовать Postman или cURL для настройки вызовов API к службе агрегации. Обратите внимание, что режимы отладки должны быть отключены и установлены в значение false во время обычных операций агрегирования.

В дополнение к следующим шагам для дальнейшей проверки инфраструктуры службы агрегации изучите все облачные компоненты, которые предоставляются в вашем общедоступном облаке.

Шаги

  1. Чтобы создать образцы отчетов об отладке и выходные файлы домена, выполните соответствующие шаги кодовых лабораторий:

  2. Запустите запрос createJob с этим телом, заменив выделенные заполнители:

    {
      "job_request_id": "<job_request_id>",
      "input_data_blob_prefix": "<report_folder>/<report_name>.avro",
      "input_data_bucket_name": "<input_bucket_name>",
      "output_data_blob_prefix": "<output_folder>/<summary_report_prefix>",
      "output_data_bucket_name": "<output_bucket_name>",
      "job_parameters": {
        "output_domain_blob_prefix": "<output_domain_folder>/<output_domain>.avro",
        "output_domain_bucket_name": "<output_domain_bucket_name>",
        "attribution_report_to": "<reporting_origin_domain>",
        "report_error_threshold_percentage": "10", // example value
        "debug_run": "true" // optional, but should be false by default
      }
    }
    
  3. Запустите запрос getJob , чтобы увидеть ответ. Если вы получаете следующий ответ, это означает, что ваша служба агрегации развернута правильно.

    {
        "job_status": "FINISHED",
        "request_received_at": <utc_timestamp>,
        "request_updated_at": <utc_timestamp>,
        "job_request_id": "<job_request_id>",
        "input_data_blob_prefix": "<report_folder>/<input_report_prefix>.avro",
        "input_data_bucket_name": "<input_bucket_name>",
        "output_data_blob_prefix": "<output_folder>/<summary_report_prefix>",
        "output_data_bucket_name": "<output_bucket_name>",
        "postback_url": "",
        "result_info": {
            "return_code": "<return_code_and_message>",
            "return_message": "Aggregation job successfully processed",
            "error_summary": {
                "error_counts": [],
                "error_messages": []
            },
            "finished_at": <utc_timestamp>
        },
        "job_parameters": {
            "debug_run": "true", // optional, but should be false by default
            "output_domain_bucket_name": "<output_domain_bucket_name>",
            "output_domain_blob_prefix": "<output_domain_folder>/<output_domain>.avro",
            "attribution_report_to": "<reporting_origin_domain>"
        },
        "request_processing_started_at": <utc_timestamp>
    }
    

Если вы не получили ответ с job_status: FINISHED , соберите дополнительную информацию, перейдя к вычислительному механизму или ресурсу EC2 выбранного вами общедоступного облака. Проверьте свой экземпляр службы агрегации, просмотрите журналы и запишите информацию, которую вы видите между TEE container launcher initiating и TEE container launcher exiting чтобы предоставить его нашей команде технической поддержки.

Google Облако

  1. Перейдите в Google Cloud: Compute Engine .
  2. Нажмите «Экземпляры виртуальных машин» и выберите экземпляр службы агрегации.
  3. Нажмите «Подробности» > «Журналы» > «Журналирование» (или найдите Обозреватель журналов).

Веб-сервисы Amazon

  1. Перейдите к Amazon Web Services: EC2 Enclave .
  2. Нажмите «Экземпляры EC2» и выберите экземпляр службы агрегации.
  3. Нажмите Действия > Мониторинг и устранение неполадок > Получить системный журнал .

Проверьте и посмотрите, найдете ли вы какие-либо совпадения с уведомлениями об ошибках в нашем общедоступном руководстве на GitHub .

Примечание. Если вы только что обновили текущую версию службы агрегации, полный процесс подготовки может занять до нескольких часов, прежде чем правильный образ экземпляра отобразится в окончательном экземпляре службы вычислений. Свяжитесь с нами, если это не ваш случай.

Следующие шаги

Если вы не видите решения проблемы со службой агрегации, сообщите нам об этом, оставив заявку на GitHub или отправив форму технической поддержки .