সংক্ষিপ্ত প্রতিবেদনে গোলমাল বোঝা

গোলমালের অর্থ কী, কোথায় এটি যোগ করা হয় এবং এটি আপনার পরিমাপের প্রচেষ্টাকে কীভাবে প্রভাবিত করে তা জানুন।

সংক্ষিপ্ত প্রতিবেদনগুলি সমষ্টিগত প্রতিবেদনের সমষ্টির ফলাফল। যখন সমষ্টিগত প্রতিবেদনগুলি একটি সংগ্রাহক দ্বারা ব্যাচ করা হয় এবং একত্রীকরণ পরিষেবা দ্বারা প্রক্রিয়া করা হয়, তখন গোলমাল - একটি এলোমেলো পরিমাণ ডেটা - ফলাফলের সারাংশ প্রতিবেদনগুলিতে যোগ করা হয়। ব্যবহারকারীর গোপনীয়তা রক্ষা করতে নয়েজ যোগ করা হয়েছে। এই প্রক্রিয়াটির লক্ষ্য হল একটি কাঠামো যা পৃথকভাবে ব্যক্তিগত পরিমাপকে সমর্থন করতে পারে।

গোলমাল চূড়ান্ত সারাংশ রিপোর্ট যোগ করা হয়.
গোলমাল চূড়ান্ত সারাংশ রিপোর্ট যোগ করা হয়.

সংক্ষিপ্ত প্রতিবেদনে গোলমালের ভূমিকা

যদিও শব্দ যোগ করা সাধারণত বিজ্ঞাপন পরিমাপের একটি অংশ নয়, অনেক ক্ষেত্রে যোগ করা শব্দটি আপনার ফলাফলগুলিকে কীভাবে ব্যাখ্যা করবেন তা উল্লেখযোগ্যভাবে পরিবর্তন করবে না।

এটি নিম্নলিখিত উপায়ে এটি সম্পর্কে চিন্তা করতে সাহায্য করতে পারে: যদি সেই ডেটা গোলমাল না হয় তবে আপনি কি একটি নির্দিষ্ট ডেটার উপর ভিত্তি করে সিদ্ধান্ত নিতে আত্মবিশ্বাসী হবেন?

উদাহরণস্বরূপ, প্রচারাভিযান A-এর 15টি রূপান্তর এবং প্রচার B-এর 16টি ছিল?

যদি উত্তর না হয়, গোলমাল অপ্রাসঙ্গিক।

আপনি যা করতে চান তা হল আপনার API ব্যবহারকে এমনভাবে কনফিগার করুন যে:

  1. প্রশ্নের উত্তর হ্যাঁ।
  2. গোলমাল এমনভাবে পরিচালিত হয় যা নির্দিষ্ট ডেটার উপর ভিত্তি করে সিদ্ধান্ত নেওয়ার আপনার ক্ষমতাকে উল্লেখযোগ্যভাবে প্রভাবিত করে না। আপনি নিম্নরূপ এটির সাথে যোগাযোগ করতে পারেন: প্রত্যাশিত ন্যূনতম সংখ্যক রূপান্তরের জন্য, আপনি সংগৃহীত মেট্রিকে একটি নির্দিষ্ট % এর নিচে গোলমাল রাখতে চান।

এই বিভাগে এবং নিম্নলিখিত, আমরা 2 অর্জনের কৌশলগুলির রূপরেখা দেব।

মূল ধারণা

একত্রীকরণ পরিষেবা প্রতিটি সারাংশের মানের সাথে একবার শোরগোল যোগ করে—অর্থাৎ, প্রতি কী-প্রতিবার-প্রতিবারই একটি সারাংশ প্রতিবেদনের অনুরোধ করা হয়।

এই শব্দের মানগুলি এলোমেলোভাবে একটি নির্দিষ্ট সম্ভাব্যতা বন্টন থেকে আঁকা হয়, নিম্নরূপ।

শব্দ প্রভাবিত করে এমন সমস্ত উপাদান দুটি প্রাথমিক ধারণার উপর নির্ভর করে।

  1. শব্দ বিতরণ ( নীচে বিশদ ) সংক্ষিপ্ত মান নির্বিশেষে কম বা উচ্চ। অতএব, সারাংশের মান যত বেশি হবে, এই মানের তুলনায় শব্দের প্রভাব তত কম হবে।

    উদাহরণ স্বরূপ, ধরে নিন $20,000 এর মোট একত্রিত ক্রয় মূল্য এবং $200 এর মোট ক্রয় মূল্য উভয়ই একই বন্টন থেকে নির্বাচিত গোলমালের সাপেক্ষে।

    ধরা যাক এই বন্টন থেকে আওয়াজ মোটামুটিভাবে -100 এবং +100 এর মধ্যে পরিবর্তিত হয়।

    • $20,000 এর সারাংশ ক্রয় মূল্যের জন্য, শব্দ 0 এবং 100/20,000 = 0.5% এর মধ্যে পরিবর্তিত হয়।
    • $200 এর সংক্ষিপ্ত ক্রয় মূল্যের জন্য, গোলমাল 0 এবং 100/200 = 50% এর মধ্যে পরিবর্তিত হয়।

    অতএব, গোলমাল $200 মূল্যের তুলনায় $20,000 সমষ্টিগত ক্রয় মূল্যের উপর কম প্রভাব ফেলতে পারে। তুলনামূলকভাবে বলতে গেলে, $20,000 কম শোরগোল হওয়ার সম্ভাবনা, অর্থাৎ এটি উচ্চতর সংকেত-থেকে-শব্দ অনুপাতের সম্ভাবনা রয়েছে৷

    উচ্চ সমষ্টিগত মান তুলনামূলকভাবে কম শব্দ প্রভাব আছে.
    উচ্চতর একত্রিত মানগুলির তুলনামূলকভাবে কম শব্দের প্রভাব থাকে।

    এর কয়েকটি গুরুত্বপূর্ণ ব্যবহারিক প্রভাব রয়েছে যা পরবর্তী বিভাগে বর্ণিত হয়েছে। এই প্রক্রিয়াটি API ডিজাইনের অংশ, এবং ব্যবহারিক প্রভাব দীর্ঘমেয়াদী। বিজ্ঞাপন প্রযুক্তি যখন বিভিন্ন একত্রীকরণ কৌশল ডিজাইন এবং মূল্যায়ন করে তখন তারা একটি গুরুত্বপূর্ণ ভূমিকা পালন করতে থাকবে।

  2. যদিও সারাংশের মান নির্বিশেষে একই বন্টন থেকে গোলমাল টানা হয়, সেই বন্টনটি বিভিন্ন পরামিতির উপর নির্ভর করে। এই পরামিতিগুলির মধ্যে একটি, এপিসিলন , বিভিন্ন ইউটিলিটি/গোপনীয়তা সমন্বয়গুলি মূল্যায়ন করার জন্য সমাপ্ত অরিজিন ট্রায়ালের সময় বিজ্ঞাপন প্রযুক্তি দ্বারা পরিবর্তন করা যেতে পারে। যাইহোক, সাময়িক হিসাবে epsilon tweak করার ক্ষমতা বিবেচনা করুন. আমরা আপনার ব্যবহারের ক্ষেত্রে এবং এপিসিলনের মানগুলি সম্পর্কে আপনার প্রতিক্রিয়াকে স্বাগত জানাই যা ভাল কাজ করে।

যদিও একটি বিজ্ঞাপন প্রযুক্তি কোম্পানি শব্দ যোগ করার উপায়গুলির সরাসরি নিয়ন্ত্রণে নয়, এটি তার পরিমাপের ডেটাতে শব্দের প্রভাবকে প্রভাবিত করতে পারে। পরবর্তী বিভাগগুলিতে, আমরা কীভাবে শব্দকে অনুশীলনে প্রভাবিত করতে পারে তা নিয়ে আলোচনা করব।

আমরা করার আগে, আসুন শব্দ প্রয়োগ করার উপায়টি ঘনিষ্ঠভাবে দেখে নেওয়া যাক।

জুম ইন: কিভাবে শব্দ প্রয়োগ করা হয়

এক গোলমাল বিতরণ

নিম্নলিখিত পরামিতি সহ ল্যাপ্লেস ডিস্ট্রিবিউশন থেকে আওয়াজ টানা হয়:

  • 0 এর গড় ( μ )। এর মানে হল সবচেয়ে সম্ভাব্য শব্দের মান হল 0 (কোনও শব্দ যোগ করা হয়নি), এবং গোলমালের মানটি আসল থেকে ছোট হওয়ার সম্ভাবনা যতটা বড় হবে (এটিকে কখনও কখনও নিরপেক্ষ বলা হয়)।
  • b = CONTRIBUTION_BUDGET / epsilon একটি স্কেল প্যারামিটার
    • CONTRIBUTION_BUDGET ব্রাউজারে সংজ্ঞায়িত করা হয়েছে৷
    • epsilon অ্যাগ্রিগেশন সার্ভিসে ব্যবহৃত হয়।

নিম্নলিখিত চিত্রটি μ=0, b = 20 সহ একটি ল্যাপ্লেস ডিস্ট্রিবিউশনের জন্য সম্ভাব্যতা ঘনত্ব ফাংশন দেখায়:

μ=0, b = 20 সহ একটি ল্যাপ্লেস ডিস্ট্রিবিউশনের জন্য সম্ভাব্যতা ঘনত্ব ফাংশন
μ=0, b = 20 সহ একটি ল্যাপ্লেস ডিস্ট্রিবিউশনের জন্য সম্ভাব্যতা ঘনত্ব ফাংশন

এলোমেলো শব্দের মান, একটি শব্দ বিতরণ

ধরা যাক যে একটি বিজ্ঞাপন প্রযুক্তি দুটি সমষ্টি কী, key1 এবং key2-এর জন্য সারাংশ প্রতিবেদনের অনুরোধ করে।

অ্যাগ্রিগেশন সার্ভিস একই নয়েজ ডিস্ট্রিবিউশন অনুসরণ করে দুটি নয়েজ মান x1 এবং x2 নির্বাচন করে। key1-এর সারাংশের মানের সাথে x1 যোগ করা হয় এবং key2-এর সারাংশের মানের সাথে x2 যোগ করা হয়।

ডায়াগ্রামে, আমরা শব্দের মানগুলিকে অভিন্ন হিসাবে উপস্থাপন করব। এটি একটি সরলীকরণ; বাস্তবে, শব্দের মানগুলি পরিবর্তিত হবে, কারণ সেগুলি বিতরণ থেকে এলোমেলোভাবে আঁকা হয়েছে৷

এটি ব্যাখ্যা করে যে গোলমালের মানগুলি একই বন্টন থেকে আসে এবং তারা যে সারাংশের মান প্রয়োগ করা হয় তা থেকে স্বাধীন।

শব্দের অন্যান্য বৈশিষ্ট্য

গোলমাল প্রতিটি সারাংশ মান প্রয়োগ করা হয় - খালি (0) সহ।

এমনকি খালি সারাংশ মান গোলমাল সাপেক্ষে.
এমনকি খালি সারাংশ মান গোলমাল সাপেক্ষে.

উদাহরণস্বরূপ, একটি প্রদত্ত কী-এর প্রকৃত সারাংশের মান 0 হলেও, এই কীটির সারাংশ প্রতিবেদনে আপনি যে শোরগোলপূর্ণ সারাংশ মান দেখতে পাবেন তা (সম্ভবত) 0 হবে না।

শব্দটি হয় ইতিবাচক বা নেতিবাচক সংখ্যা হতে পারে।

ইতিবাচক এবং নেতিবাচক শব্দের উদাহরণ।
ইতিবাচক এবং নেতিবাচক শব্দের উদাহরণ।

উদাহরণস্বরূপ, 327,000-এর প্রাক-আওয়াজ ক্রয়ের পরিমাণের জন্য, নয়েজ +6,000 বা -6,000 হতে পারে (এগুলি নির্বিচারে উদাহরণ মান)।

গোলমাল মূল্যায়ন

গোলমালের মানক বিচ্যুতি গণনা করা

গোলমালের আদর্শ বিচ্যুতি হল:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
উদাহরণ

এপিসিলন = 10 এর সাথে, শব্দের মানক বিচ্যুতি হল:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267

যখন পরিমাপের পার্থক্য তাৎপর্যপূর্ণ হয় তখন মূল্যায়ন করা

যেহেতু আপনি সমষ্টি পরিষেবা দ্বারা প্রতিটি মান আউটপুটে যোগ করা গোলমালের মানক বিচ্যুতি জানতে পারবেন, আপনি গোলমালের কারণে পর্যবেক্ষণ করা পার্থক্যগুলি হতে পারে কিনা তা নির্ধারণ করতে তুলনা করার জন্য উপযুক্ত থ্রেশহোল্ড নির্ধারণ করতে পারেন।

উদাহরণস্বরূপ, যদি একটি মানের সাথে যোগ করা নয়েজটি প্রায় +/- 10 (স্কেলিংয়ের জন্য অ্যাকাউন্টিং) হয় এবং দুটি প্রচারাভিযানের মধ্যে মানের পার্থক্য 100-এর বেশি হয়, তাহলে এই সিদ্ধান্তে পৌঁছানো সম্ভব যে প্রতিটি প্রচারের মধ্যে পরিমাপ করা মানের পার্থক্য শুধুমাত্র গোলমালের কারণে নয়।

জড়িত এবং মতামত শেয়ার করুন

আপনি অংশগ্রহণ করতে পারেন এবং এই API এর সাথে পরীক্ষা করতে পারেন

পরবর্তী পদক্ষেপ