সমষ্টিগত প্রতিবেদনগুলি ব্যাচ করার সময়, গোপনীয়তার সীমা অতিক্রম না করার জন্য ব্যাচিং কৌশলগুলি অপ্টিমাইজ করা গুরুত্বপূর্ণ। সমষ্টিগত পরিষেবাতে প্রতিবেদনগুলির ব্যাচ পাঠানোর জন্য নিম্নলিখিত কয়েকটি প্রস্তাবিত কৌশল রয়েছে।
রিপোর্ট সংগ্রহ করুন
ব্যাচে অন্তর্ভুক্ত করার জন্য প্রতিবেদন সংগ্রহ করার সময়, নিম্নলিখিত বিষয়গুলি মনে রাখবেন:
আপলোড পুনঃচেষ্টা রিপোর্ট করুন
দ্রষ্টব্য: পুনরায় চেষ্টা করার মানদণ্ড পরিবর্তন সাপেক্ষে। এই বিভাগের তথ্য সেই ক্ষেত্রে আপডেট করা হবে।
ওয়েব এবং ওএস উভয় প্ল্যাটফর্মেই, একটি প্ল্যাটফর্ম তিনবার রিপোর্ট পাঠানোর চেষ্টা করবে, কিন্তু তৃতীয়বার চেষ্টা করার পরেও যদি রিপোর্ট পাঠানো না হয়, তাহলে তা পাঠানো হবে না। রিপোর্টটি কখন পাঠানো সম্ভব তা নির্বিশেষে মূল scheduled_report_time মান সংরক্ষিত থাকে। প্রতিটি প্ল্যাটফর্মের জন্য পুনরায় চেষ্টা করার সময়সীমা আলাদা:
- যখন ব্রাউজার অনলাইনে থাকবে তখন একটি ওয়েব ব্রাউজার রিপোর্ট পাঠাবে। যদি রিপোর্ট পাঠাতে ব্যর্থ হয়, তাহলে দ্বিতীয়বার পুনঃপ্রচেষ্টার জন্য পাঁচ মিনিট অপেক্ষা করবে এবং তৃতীয়বারের জন্য ১৫ মিনিট অপেক্ষা করবে। যদি ব্রাউজার অফলাইনে চলে যায়, তাহলে পরবর্তী পুনঃপ্রচেষ্টাটি অনলাইনে ফিরে আসার এক মিনিট পরে করা হবে। ওয়েবে রিপোর্ট পাঠানোর ক্ষেত্রে সর্বোচ্চ বিলম্ব নেই; এর অর্থ হল, যদি ব্রাউজার অফলাইনে চলে যায়, তাহলে রিপোর্টটি যতদিন আগে তৈরি করা হোক না কেন, ব্রাউজারটি অনলাইনে ফিরে আসার পরে, এটি পুনঃপ্রচেষ্টা নীতি অনুসারে রিপোর্ট পাঠানোর চেষ্টা করবে।
- একটি অ্যান্ড্রয়েড ফোনের নেটওয়ার্ক সংযোগ সুসংগত থাকে। ফলে, এটি প্রতি ঘন্টায় একবার রিপোর্ট পাঠানোর কাজটি চালাবে। এর অর্থ হল যদি কোনও রিপোর্ট পাঠানো ব্যর্থ হয়, তাহলে পরের ঘন্টায় আবার চেষ্টা করা হবে এবং তার এক ঘন্টা পরে আবার চেষ্টা করা হবে। যদি ডিভাইসটিতে সংযোগ না থাকে, তাহলে ডিভাইসটি নেটওয়ার্কের সাথে পুনরায় সংযোগ স্থাপনের পরে পরবর্তী রিপোর্টিং কাজের মাধ্যমে রিপোর্টটি পাঠানোর চেষ্টা করবে। সর্বাধিক বিলম্ব ২৮ দিন, যার অর্থ হল ডিভাইসটি ২৮ দিনের বেশি আগে তৈরি হওয়া কোনও রিপোর্ট পাঠাবে না।
রিপোর্টের জন্য অপেক্ষা করুন
ব্যাচিংয়ের জন্য রিপোর্ট সংগ্রহ করার সময় দেরিতে আসা রিপোর্টের জন্য অপেক্ষা করার পরামর্শ দেওয়া হচ্ছে। রিপোর্টটি কখন পাওয়া গেছে তার সাথে scheduled_report_time মান পরীক্ষা করে দেরিতে আসা রিপোর্ট নির্ধারণ করা যেতে পারে। এই রিপোর্টগুলির মধ্যে সময়ের পার্থক্য নির্ধারণ করতে সাহায্য করবে যে আপনি দেরিতে আসা রিপোর্টের জন্য কতক্ষণ অপেক্ষা করতে চাইতে পারেন। উদাহরণস্বরূপ, বিলম্বিত রিপোর্ট সংগ্রহ করার সময়, scheduled_report_time ক্ষেত্রটি পরীক্ষা করুন এবং ঘন্টাগুলিতে সময় বিলম্ব লক্ষ্য করুন কারণ 90%, 95% এবং 99% রিপোর্ট প্রাপ্ত হয়। দেরিতে আসা রিপোর্টের জন্য কতক্ষণ অপেক্ষা করতে হবে তা নির্ধারণ করতে সেই ডেটা ব্যবহার করা যেতে পারে। বিলম্বিত রিপোর্টের সম্ভাবনা কমাতে তাৎক্ষণিক সমষ্টিগত রিপোর্ট ব্যবহার করা যেতে পারে।
নিম্নলিখিত ভিজ্যুয়ালটিতে দেখানো হয়েছে যে দেরিতে আসা প্রতিবেদনগুলি নির্ধারিত রিপোর্ট সময় অনুসারে উপযুক্ত ব্যাচে সংরক্ষণ করা হচ্ছে। ব্যাচ T হল scheduled_report_time , এবং T+X হল বিলম্বিত প্রতিবেদনের জন্য অপেক্ষা করা সময়। এর ফলে একটি সারাংশ প্রতিবেদন তৈরি হয় যাতে ব্যাচে অন্তর্ভুক্ত বেশিরভাগ প্রতিবেদন অন্তর্ভুক্ত থাকে যা তাদের নির্ধারিত রিপোর্ট সময়ের সাথে সামঞ্জস্যপূর্ণ।

সমষ্টিগত প্রতিবেদন হিসাবরক্ষণ
সমষ্টি পরিষেবা "কোনও সদৃশ নয়" নিয়ম বজায় রাখে। এই নিয়মটি প্রয়োগ করে যে একই শেয়ার্ড আইডি সহ সমস্ত সমষ্টিগত প্রতিবেদন একই ব্যাচে অন্তর্ভুক্ত করতে হবে।
রিপোর্ট সংগ্রহের পর, সেগুলিকে এমনভাবে ব্যাচ করা উচিত যাতে একই শেয়ার করা আইডি সহ সমস্ত রিপোর্ট একই ব্যাচের অংশ হয়।
যদি একটি প্রতিবেদন ইতিমধ্যেই অন্য ব্যাচে প্রক্রিয়া করা হয়ে থাকে, তাহলে প্রক্রিয়াকরণের ফলে গোপনীয়তা বাজেটের অতিরিক্ত ত্রুটি দেখা দিতে পারে। রিপোর্টগুলি সঠিকভাবে ব্যাচ করা "কোনও সদৃশ নয়" নিয়মের কারণে ব্যাচগুলিকে প্রত্যাখ্যান করা থেকে রক্ষা করতে সাহায্য করে।
একটি শেয়ার্ড আইডি হল এমন একটি কী যা প্রতিটি রিপোর্টের জন্য তৈরি করা হয় যাতে সমষ্টিগত রিপোর্ট অ্যাকাউন্টিং ট্র্যাক করা যায়। শেয়ার্ড আইডি নিশ্চিত করে যে একই শেয়ার্ড আইডি সহ রিপোর্টগুলি শুধুমাত্র একটি সারাংশ রিপোর্টে অবদান রাখে। এর অর্থ হল যে রিপোর্টগুলি যেগুলি একটি শেয়ার্ড আইডিতে ম্যাপ করা হয় সেগুলিকে একসাথে একটি একক ব্যাচে অন্তর্ভুক্ত করতে হবে। উদাহরণস্বরূপ, যদি রিপোর্ট X এবং রিপোর্ট Y উভয়েরই একই শেয়ার্ড আইডি থাকে, তাহলে রিপোর্টগুলি ডুপ্লিকেশনের জন্য বাদ দেওয়া এড়াতে তাদের একই ব্যাচে অন্তর্ভুক্ত করতে হবে।
নিচের ছবিটি shared_info উপাদানগুলিকে দেখায় যেগুলিকে একসাথে হ্যাশ করে একটি শেয়ার্ড আইডি তৈরি করা হয়।

নিচের ছবিটি দেখায় যে কীভাবে দুটি ভিন্ন প্রতিবেদনের একই শেয়ার করা আইডি থাকতে পারে:

দ্রষ্টব্য: scheduled_report_time ঘন্টা দ্বারা ছোট করা হয়েছে এবং source_registration_time দিন দ্বারা ছোট করা হয়েছে। এছাড়াও, শেয়ার করা আইডি তৈরিতে report_id ব্যবহার করা হয় না। ভবিষ্যতে সময়ের গ্র্যানুলারিটি আপডেট করা হতে পারে।
ব্যাচের মধ্যে ডুপ্লিকেট রিপোর্ট
একটি সমষ্টিগত প্রতিবেদনের shared_info ফিল্ডে report_id ফিল্ডে একটি UUID থাকে, যা একটি ব্যাচের মধ্যে ডুপ্লিকেট রিপোর্ট সনাক্ত করতে ব্যবহৃত হয়। যদি একটি ব্যাচে একই report_id সহ একাধিক রিপোর্ট থাকে, তাহলে শুধুমাত্র প্রথম রিপোর্টটি একত্রিত করা হবে এবং অন্যগুলি ডুপ্লিকেট হিসাবে বিবেচিত হবে এবং নীরবে বাদ দেওয়া হবে; সমষ্টি স্বাভাবিকভাবে এগিয়ে যাবে এবং কোনও ত্রুটি পাঠানো হবে না। যদিও প্রয়োজন নেই, বিজ্ঞাপন প্রযুক্তিবিদরা সমষ্টিগতকরণের আগে একই প্রতিবেদন আইডি সহ ডুপ্লিকেট রিপোর্টগুলি ফিল্টার করে কিছু কর্মক্ষমতা লাভ দেখতে আশা করতে পারেন।
প্রতিটি রিপোর্টের জন্য report_id অনন্য।
ব্যাচ জুড়ে ডুপ্লিকেট রিপোর্ট
প্রতিটি প্রতিবেদনের জন্য একটি শেয়ার্ড আইডি বরাদ্দ করা হয়, যা রিপোর্টের shared_info ফিল্ড থেকে আসা সম্মিলিত ডেটা পয়েন্ট থেকে তৈরি একটি আইডি। একাধিক প্রতিবেদনে একই শেয়ার্ড আইডি থাকতে পারে এবং প্রতিটি ব্যাচে একাধিক শেয়ার্ড আইডি থাকতে পারে। একই শেয়ার্ড আইডি সহ সমস্ত প্রতিবেদন একই ব্যাচে যেতে হবে। যদি একই শেয়ার্ড আইডি সহ প্রতিবেদনগুলি একাধিক ব্যাচে শেষ হয়, তবে কেবল প্রথম ব্যাচটি গ্রহণ করা হবে এবং অন্যগুলি সদৃশ হিসাবে প্রত্যাখ্যান করা হবে। এটি প্রতিরোধ করার জন্য, ব্যাচগুলি যথাযথভাবে তৈরি করতে হবে ।
নিচের ছবিতে এমন একটি উদাহরণ দেখানো হয়েছে যেখানে একই শেয়ার্ড আইডি সহ রিপোর্টগুলি ব্যাচগুলিতে পরবর্তী ব্যাচগুলিকে ব্যর্থ করতে পারে। ছবিতে, আপনি দেখতে পাচ্ছেন যে একই শেয়ার্ড আইডি e679aa সহ দুটি বা ততোধিক রিপোর্ট বিভিন্ন ব্যাচ #1 এবং #2 এ ব্যাচ করা হয়েছে। যেহেতু শেয়ার্ড আইডি e679aa সহ সমস্ত রিপোর্টের বাজেট ব্যাচ #1 সারাংশ রিপোর্ট তৈরির সময় ব্যয় করা হয়, তাই ব্যাচ #2 অনুমোদিত নয় এবং একটি ত্রুটি সহ ব্যর্থ হয়।

ব্যাচ রিপোর্ট
ডুপ্লিকেট এড়াতে এবং সামগ্রিক প্রতিবেদনের হিসাব অপ্টিমাইজ করার জন্য ব্যাচ রিপোর্ট তৈরির জন্য নিম্নলিখিত সুপারিশকৃত উপায়গুলি দেওয়া হল।
বিজ্ঞাপনদাতা অনুসারে ব্যাচ
দ্রষ্টব্য: এই কৌশলটি শুধুমাত্র অ্যাট্রিবিউশন রিপোর্টিং একত্রিতকরণের জন্য সুপারিশ করা হয়।
প্রাইভেট অ্যাগ্রিগেশনের কোনও attribution_destination ফিল্ড নেই, যা বিজ্ঞাপনদাতা। প্রতিটি ব্যাচের জন্য সমষ্টিগত প্রতিবেদন অ্যাকাউন্টের সীমা অতিক্রম করা এড়াতে, বিজ্ঞাপনদাতা দ্বারা ব্যাচ করার পরামর্শ দেওয়া হয়, যার অর্থ একই ব্যাচে একজন বিজ্ঞাপনদাতার রিপোর্ট অন্তর্ভুক্ত করা। বিজ্ঞাপনদাতা হল শেয়ার্ড আইডি জেনারেশনের ক্ষেত্রে বিবেচিত একটি ক্ষেত্র, তাই একই বিজ্ঞাপনদাতার সাথে থাকা রিপোর্টগুলিরও একই শেয়ার্ড আইডি থাকতে পারে, যার ফলে ত্রুটি এড়াতে তাদের একই ব্যাচে থাকা প্রয়োজন।
সময় অনুসারে ব্যাচ
ব্যাচিং করার সময় রিপোর্টের নির্ধারিত রিপোর্ট সময় ( shared_info.scheduled_report_time ) বিবেচনা করার পরামর্শ দেওয়া হচ্ছে। শেয়ার্ড আইডি জেনারেশনে নির্ধারিত রিপোর্ট সময় ঘন্টার মধ্যে ছোট করা হয়, তাই কমপক্ষে রিপোর্টগুলি ঘন্টার ব্যবধানে ব্যাচ করা উচিত, অর্থাৎ একই ঘন্টার মধ্যে নির্ধারিত রিপোর্ট সময় সহ সমস্ত রিপোর্ট একই ব্যাচে পাঠানো উচিত যাতে একাধিক ব্যাচে একই শেয়ার্ড আইডি সহ রিপোর্ট না থাকে, যার ফলে কাজের ত্রুটি হতে পারে।
ব্যাচ ফ্রিকোয়েন্সি এবং শব্দ
সমষ্টিগত প্রতিবেদনগুলি কত ঘন ঘন প্রক্রিয়াজাত করা হয় তার উপর শব্দের প্রভাব বিবেচনা করার পরামর্শ দেওয়া হচ্ছে। যদি সমষ্টিগত প্রতিবেদনগুলি আরও ঘন ঘন ব্যাচ করা হয় - উদাহরণস্বরূপ, প্রতিবেদনগুলি এক ঘন্টা পরে প্রক্রিয়াজাত করা হয় - তাহলে কম রূপান্তর ইভেন্টগুলি অন্তর্ভুক্ত করা হবে এবং শব্দের আপেক্ষিক প্রভাব বেশি হবে। যদি ফ্রিকোয়েন্সি হ্রাস করা হয় এবং প্রতিবেদনগুলি সপ্তাহে একবার প্রক্রিয়াজাত করা হয়, তাহলে শব্দের আপেক্ষিক প্রভাব কম হবে। ব্যাচগুলিতে শব্দের প্রভাব আরও ভালভাবে বুঝতে, নয়েজ ল্যাব দিয়ে পরীক্ষা করুন।