Random Variables, PDF/PMF, CDF in Bengali

সম্ভাবনা ডিস্ট্রিবিউশন: PMF, CDF, এবং Tail Probabilities

সম্ভাবনা ডিস্ট্রিবিউশন: PMF, CDF, এবং Tail Probabilities

পরিসংখ্যানের অন্যতম গুরুত্বপূর্ণ ধারণা হলো প্রোবাবিলিটি ডিস্ট্রিবিউশন। কোনো একটি র‍্যান্ডম ভেরিয়েবলের বিভিন্ন মান ঘটার সম্ভাবনা কীভাবে বন্টিত থাকে, তা-ই হলো তার ডিস্ট্রিবিউশন। এই পোস্টে আমরা ডিস্ট্রিবিউশনকে বর্ণনা করার জন্য তিনটি অপরিহার্য টুল নিয়ে আলোচনা করব: PMF, CDF, এবং Tail Probabilities

র‍্যান্ডম ভেরিয়েবল (Random Variable) কী?

সহজ ভাষায়, একটি র‍্যান্ডম ভেরিয়েবল হলো এমন একটি চলক (variable), যার মান কোনো একটি দৈব (random) পরীক্ষার ফলাফলের উপর নির্ভর করে।

  • উদাহরণ: একটি ছক্কা নিক্ষেপের ফলাফল একটি র‍্যান্ডম ভেরিয়েবল, কারণ এর মান (১ থেকে ৬) দৈবভাবে নির্ধারিত হয়। একইভাবে, ১০ বার মুদ্রা নিক্ষেপে কতবার হেড আসবে, সেটাও একটি র‍্যান্ডম ভেরিয়েবল।

১. প্রোবাবিলিটি মাস ফাংশন (Probability Mass Function - PMF)

PMF শুধুমাত্র Discrete Random Variable-এর জন্য ব্যবহৃত হয়। এটি প্রতিটি নির্দিষ্ট মানের সম্ভাবনাকে সরাসরি দেখায়।

উদাহরণ: ছক্কা নিক্ষেপ

একটি সঠিক ছক্কার ক্ষেত্রে, র‍্যান্ডম ভেরিয়েবল X-এর মান (১, ২, ৩, ৪, ৫, ৬) হতে পারে। এর PMF হবে:

P(X = k) = ১/৬, যেখানে k = ১, ২, ৩, ৪, ৫, ৬

এর মানে, প্রতিটি নির্দিষ্ট সংখ্যা (যেমন, ৪) ওঠার সম্ভাবনা ১/৬। অন্য কোনো মান (যেমন, ৭) আসার সম্ভাবনা ০।

(Continuous Random Variable-এর ক্ষেত্রে, আমরা Probability Density Function বা PDF ব্যবহার করি, যা একটি নির্দিষ্ট মানের বদলে একটি পরিসরের সম্ভাবনা দেখায়।)

২. কিউমুলেটিভ ডিস্ট্রিবিউশন ফাংশন (Cumulative Distribution Function - CDF)

CDF আমাদের বলে, একটি র‍্যান্ডম ভেরিয়েবলের মান একটি নির্দিষ্ট সংখ্যা বা তার চেয়ে কম হওয়ার সম্ভাবনা কত। এটি একটি ক্রমযোজিত বা ক্রমবর্ধমান ফাংশন।

গাণিতিকভাবে, CDF হলো: F(k) = P(X ≤ k)

উদাহরণ: ছক্কা নিক্ষেপ

  • P(X ≤ ১) = ১/৬ (শুধু ১)
  • P(X ≤ ২) = ২/৬ (১ অথবা ২)
  • P(X ≤ ৩) = ৩/৬ (১, ২, অথবা ৩)
  • ...এবং P(X ≤ ৬) = ৬/৬ = ১

৩. টেইল প্রোবাবিলিটি (Tail Probabilities)

পরিসংখ্যানে প্রায়শই আমাদের জানতে হয় একটি নির্দিষ্ট মানের চেয়ে বেশি বা কম ফলাফল পাওয়ার সম্ভাবনা কত। এই ধরনের সম্ভাবনাকে টেইল প্রোবাবিলিটি বলা হয়।

আপার টেইল (Upper Tail): একটি মানের চেয়ে বেশি হওয়ার সম্ভাবনা। যেমন, P(X > k)।

আমরা CDF এবং Complement Rule ব্যবহার করে সহজেই এটি গণনা করতে পারি:

P(X > k) = 1 - P(X ≤ k)

উদাহরণ: ছক্কায় ২-এর চেয়ে বড় সংখ্যা আসার সম্ভাবনা কত?

P(X > 2) = 1 - P(X ≤ 2) = 1 - (২/৬) = ৪/৬ = ২/৩।

গুরুত্বপূর্ণ নোট: Discrete ভেরিয়েবলের ক্ষেত্রে, "greater than" (>) এবং "greater than or equal to" (≥) -এর মধ্যে পার্থক্য খেয়াল রাখা জরুরি। যেমন, P(X ≥ 2) = 1 - P(X < 2) = 1 - P(X ≤ 1) = 1 - (১/৬) = ৫/৬।

শেষ কথা

PMF, CDF, এবং টেইল প্রোবাবিলিটি হলো যেকোনো প্রোবাবিলিটি ডিস্ট্রিবিউশনকে বোঝার এবং বিশ্লেষণ করার মৌলিক হাতিয়ার। এই ধারণাগুলি ভালোভাবে আয়ত্ত করতে পারলে, বাইনোমিয়াল ডিস্ট্রিবিউশনের মতো আরও জটিল বিষয়গুলো বোঝা অনেক সহজ হয়ে যাবে।