Binomial distribution in Bengali
পরিসংখ্যানের নতুন অধ্যায়: বাইনোমিয়াল ডিস্ট্রিবিউশন কী?
আগের পোস্টগুলিতে আমরা সম্ভাবনার কিছু মৌলিক ধারণা, যেমন— PMF এবং CDF নিয়ে আলোচনা করেছি। আজ আমরা একটি নির্দিষ্ট এবং বহুল ব্যবহৃত প্রব্যাবিলিটি ডিস্ট্রিবিউশন সম্পর্কে জানব, যার নাম বাইনোমিয়াল ডিস্ট্রিবিউশন (Binomial Distribution)।
ভাবুন তো, এমন অনেক পরিস্থিতি আমাদের চারপাশে ঘটে যেখানে ফলাফল মাত্র দুটি হতে পারে— হ্যাঁ বা না, সফল বা ব্যর্থ, জেতা বা হারা। যেমন:
- নির্বাচনে একজন ভোটার কোনো নির্দিষ্ট প্রার্থীকে ভোট দেবেন কি দেবেন না।
- একটি নতুন ঔষধ রোগীর উপর কাজ করবে কি করবে না।
- একটি ই-মেইল স্প্যাম ফোল্ডারে যাবে কি যাবে না।
এই ধরনের পরিস্থিতি, যেখানে প্রতিটি চেষ্টার (trial) দুটি মাত্র সম্ভাব্য ফলাফল থাকে, সেগুলোকে মডেল করার জন্য বাইনোমিয়াল ডিস্ট্রিবিউশন ব্যবহার করা হয়।
আমাদের আজকের উদাহরণ: কলকাতার নিউ মার্কেটে দর কষাকষি!
চলুন, একটি পরিচিত দৃশ্য দিয়ে বিষয়টি বোঝা যাক। আপনি কলকাতার নিউ মার্কেটে কেনাকাটা করতে গেছেন এবং সিদ্ধান্ত নিয়েছেন যে আপনি ৪ জন ভিন্ন দোকানদারের সাথে কোনো জিনিসের দাম নিয়ে দর কষাকষি (bargain) করবেন।
এখানে প্রতিটি দর কষাকষি একটি চেষ্টা (trial)। প্রতিটি চেষ্টার দুটি মাত্র ফলাফল হতে পারে:
- সফল (Success): আপনি সফলভাবে দাম কমাতে পারলেন।
- ব্যর্থ (Failure): আপনি দাম কমাতে পারলেন না।
বাইনোমিয়াল ডিস্ট্রিবিউশন আমাদের বলে দেবে যে, এই ৪টি চেষ্টার মধ্যে ঠিক ০ বার, ১ বার, ২ বার, ৩ বার বা ৪ বার সফল হওয়ার সম্ভাবনা কত।
বাইনোমিয়াল ডিস্ট্রিবিউশনের শর্তাবলী
যেকোনো পরিস্থিতিকে বাইনোমিয়াল ডিস্ট্রিবিউশন দিয়ে বর্ণনা করার জন্য ৪টি শর্ত পূরণ করতে হয়:
- নির্দিষ্ট সংখ্যক চেষ্টা (Fixed number of trials): চেষ্টার সংখ্যা নির্দিষ্ট থাকতে হবে। আমাদের উদাহরণে, চেষ্টার সংখ্যা হলো ৪ (n=4)।
- স্বাধীন চেষ্টা (Independent trials): প্রতিটি চেষ্টা স্বাধীন হতে হবে। অর্থাৎ, প্রথম দোকানে সফল হওয়া বা না হওয়া দ্বিতীয় দোকানের ফলাফলের উপর কোনো প্রভাব ফেলবে না।
- দুটি মাত্র ফলাফল (Only two outcomes): প্রতিটি চেষ্টার ফলাফল সফল অথবা ব্যর্থ— এই দুটির মধ্যেই সীমাবদ্ধ থাকতে হবে।
- সম্ভাবনা স্থির থাকা (Constant probability of success): প্রতিটি চেষ্টায় সফল হওয়ার সম্ভাবনা (`p`) একই থাকতে হবে। ধরা যাক, আপনার দর কষাকষির দক্ষতার কারণে যেকোনো দোকানে সফল হওয়ার সম্ভাবনা হলো 0.6 (বা 60%)।
বাইনোমিয়াল ডিস্ট্রিবিউশনের প্যারামিটার (Parameters)
বাইনোমিয়াল ডিস্ট্রিবিউশনকে দুটি জিনিস দিয়ে সংজ্ঞায়িত করা হয়, যেগুলোকে প্যারামিটার (parameter) বলা হয়:
- n (এন): মোট চেষ্টার সংখ্যা। (আমাদের উদাহরণে n = 4)
- p (পি): একটি চেষ্টায় সফল হওয়ার সম্ভাবনা। (আমাদের উদাহরণে p = 0.6)
আমরা এটিকে এভাবে লিখি: \( X \sim \text{Bin}(n, p) \), যার অর্থ হলো রেন্ডম ভেরিয়েবল X একটি বাইনোমিয়াল ডিস্ট্রিবিউশন অনুসরণ করে যার প্যারামিটার হলো n এবং p।
বাইনোমিয়াল প্রব্যাবিলিটি মাস ফাংশন (PMF) ফর্মুলা
`n` বার চেষ্টা করে ঠিক `k` বার সফল হওয়ার সম্ভাবনা বের করার সূত্রটি হলো:
আসুন, এই সূত্রের প্রতিটি অংশ বুঝি:
- \( \binom{n}{k} \): একে বলা হয় "n choose k"। এর মানে হলো, `n` টি চেষ্টার মধ্যে `k` টি সফল হওয়ার মোট কতগুলি ভিন্ন ক্রম (combination) সম্ভব।
- \( p^k \): এটি হলো `k` বার সফল হওয়ার মোট সম্ভাবনা।
- \( (1-p)^{n-k} \): এটি হলো `(n-k)` বার ব্যর্থ হওয়ার মোট সম্ভাবনা। (যেহেতু সফল হওয়ার সম্ভাবনা p, তাই ব্যর্থ হওয়ার সম্ভাবনা 1-p)।
আমাদের উদাহরণে প্রয়োগ
আমরা ৪ বার চেষ্টা করে (n=4) ঠিক ২ বার (k=2) সফল হওয়ার সম্ভাবনা বের করতে চাই, যেখানে সফলতার সম্ভাবনা p=0.6।
- প্রথম ধাপ: ক্রম সংখ্যা বের করা \( \binom{4}{2} \)
\( \binom{4}{2} = \frac{4!}{2!(4-2)!} = \frac{24}{2 \times 2} = 6 \)। অর্থাৎ, মোট ৬টি উপায়ে ২টি সফলতা পাওয়া সম্ভব। - দ্বিতীয় ধাপ: ফর্মুলায় মান বসানো
\( P(X=2) = \binom{4}{2} (0.6)^2 (1-0.6)^{4-2} \)
\( P(X=2) = 6 \times (0.6)^2 \times (0.4)^2 \)
\( P(X=2) = 6 \times 0.36 \times 0.16 \)
\( P(X=2) = 0.3456 \)
সুতরাং, ৪ জন দোকানদারের সাথে দর কষাকষি করলে ঠিক ২ জনের সাথে সফল হওয়ার সম্ভাবনা হলো 34.56%।
বাইনোমিয়ালের কিউমুলেটিভ ডিস্ট্রিবিউশন ফাংশন (CDF)
বাইনোমিয়াল ডিস্ট্রিবিউশনের CDF-এর জন্য কোনো সহজ ফর্মুলা নেই। যদি আমাদের জানতে হয় "সর্বাধিক ১ বার সফল হওয়ার সম্ভাবনা কত?" (অর্থাৎ, P(X ≤ 1)), তবে আমাদের P(X=0) এবং P(X=1)-এর মান আলাদাভাবে বের করে যোগ করতে হবে। বড় সংখ্যার ক্ষেত্রে এই কাজটি সফটওয়্যার বা ক্যালকুলেটরের মাধ্যমে করা হয়।
উপসংহার
বাইনোমিয়াল ডিস্ট্রিবিউশন পরিসংখ্যানের একটি শক্তিশালী টুল যা আমাদের দৈনন্দিন জীবনের অনেক binary ফলাফলযুক্ত পরিস্থিতি বিশ্লেষণ করতে সাহায্য করে। শুধু চেষ্টার সংখ্যা (`n`) এবং সফলতার সম্ভাবনা (`p`) জানলেই আমরা যেকোনো সংখ্যক সফলতার সম্ভাবনা গণনা করতে পারি।