The Standard Normal Distribution and the Empirical Rule in Bengali
পরিসংখ্যানের রাজা: নরমাল ডিস্ট্রিবিউশন ও 68-95-99.7 নিয়ম
পরিসংখ্যানের জগতে যদি কোনো একটি ডিস্ট্রিবিউশনকে "রাজা" বলা হয়, তবে সেটি হলো নরমাল ডিস্ট্রিবিউশন (Normal Distribution)। এর অপর নাম বেল কার্ভ (Bell Curve), কারণ এর গ্রাফটি দেখতে একটি ঘণ্টার মতো। মানুষের উচ্চতা, পরীক্ষার নম্বর, রক্তচাপ থেকে শুরু করে বিভিন্ন পরিমাপের ত্রুটি—আমাদের চারপাশের অসংখ্য ঘটনা এই ডিস্ট্রিবিউশন অনুসরণ করে।
আজ আমরা এই গুরুত্বপূর্ণ ডিস্ট্রিবিউশন এবং এর একটি বিখ্যাত নিয়ম—এম্পিরিকাল রুল—সম্পর্কে জানব।
নরমাল ডিস্ট্রিবিউশনের বৈশিষ্ট্য
যেকোনো নরমাল ডিস্ট্রিবিউশনের গ্রাফকে দুটি জিনিস দিয়ে বর্ণনা করা যায়:
- গড় বা Mean (μ): এটি হলো ডিস্ট্রিবিউশনের কেন্দ্রবিন্দু, যেখানে গ্রাফটি সবচেয়ে উঁচু থাকে। গ্রিক অক্ষর μ (মিউ) দিয়ে এটিকে প্রকাশ করা হয়।
- স্ট্যান্ডার্ড ডেভিয়েশন বা Standard Deviation (σ): এটি গ্রাফটির বিস্তার বা প্রসারণ (spread) পরিমাপ করে। অর্থাৎ, ডেটাগুলো গড় থেকে কতটা ছড়িয়ে আছে তা বোঝায়। গ্রিক অক্ষর σ (সিগমা) দিয়ে এটিকে প্রকাশ করা হয়। σ-এর মান যত বেশি হবে, গ্রাফটি তত চওড়া হবে।
একটি নরমাল ডিস্ট্রিবিউশনের সবচেয়ে বড় বৈশিষ্ট্য হলো এটি প্রতিসম (symmetric)। অর্থাৎ, এর কেন্দ্রবিন্দুর দুই পাশের আকৃতি হুবহু একই রকম।
স্ট্যান্ডার্ড নরমাল ডিস্ট্রিবিউশন (Standard Normal Distribution)
অসংখ্য নরমাল ডিস্ট্রিবিউশনের মধ্যে একটি বিশেষ প্রকার হলো স্ট্যান্ডার্ড নরমাল ডিস্ট্রিবিউশন। এর বৈশিষ্ট্য হলো:
- গড় (μ) = 0
- স্ট্যান্ডার্ড ডেভিয়েশন (σ) = 1
এই স্ট্যান্ডার্ড ডিস্ট্রিবিউশনটি খুবই গুরুত্বপূর্ণ, কারণ যেকোনো নরমাল ডিস্ট্রিবিউশনকে আমরা এর সাথে সম্পর্কিত করে বিশ্লেষণ করতে পারি।
আমাদের আজকের উদাহরণ: কলেজ স্ট্রিটের বই বাঁধাইয়ের ত্রুটি
চলুন, কলকাতার কলেজ স্ট্রিটের একজন দক্ষ বই বাঁধাইকারীর কথা ভাবি। তিনি যখন বইয়ের পৃষ্ঠা কাটেন, তখন তিনি গড়ে একেবারে সঠিক মাপে (গড় ত্রুটি = ০ মিমি) কাটার চেষ্টা করেন। কিন্তু মানুষ হিসেবে, তার কাজে সামান্য ত্রুটি থাকতেই পারে। ধরা যাক, তার এই ত্রুটির স্ট্যান্ডার্ড ডেভিয়েশন হলো ১ মিমি। অর্থাৎ, তার কাটা মাপ কখনো ১ মিমি বেশি, আবার কখনো ১ মিমি কম হতে পারে। এই পরিস্থিতিটি একটি স্ট্যান্ডার্ড নরমাল ডিস্ট্রিবিউশন (μ=0, σ=1) দিয়ে বর্ণনা করা যায়।
এম্পিরিকাল রুল (The Empirical Rule): 68-95-99.7 নিয়ম
এই নিয়মটি আমাদের বলে দেয় যে একটি নরমাল ডিস্ট্রিবিউশনের ডেটাগুলো তার গড় মানের চারপাশে কীভাবে ছড়িয়ে থাকে।
১. ৬৮% নিয়ম:
- প্রায় ৬৮% ডেটা গড়ের ±১ স্ট্যান্ডার্ড ডেভিয়েশনের মধ্যে থাকে।
- আমাদের উদাহরণে: এর মানে হলো, বই বাঁধাইকারীর ৬৮% কাটিং আসল মাপের চেয়ে -১ মিমি থেকে +১ মিমি-এর মধ্যে থাকবে। বাকি ৩২%-এর মধ্যে ১৬% থাকবে +১ মিমি-এর বেশি এবং ১৬% থাকবে -১ মিমি-এর কম।
২. ৯৫% নিয়ম:
- প্রায় ৯৫% ডেটা গড়ের ±২ স্ট্যান্ডার্ড ডেভিয়েশনের মধ্যে থাকে।
- আমাদের উদাহরণে: প্রায় ৯৫% কাটিং আসল মাপের চেয়ে -২ মিমি থেকে +২ মিমি-এর মধ্যে থাকবে। অর্থাৎ, তার ভুল খুব কমই ২ মিমি-এর বেশি হবে। বাকি ৫%-এর মধ্যে ২.৫% থাকবে +২ মিমি-এর বেশি এবং ২.৫% থাকবে -২ মিমি-এর কম।
৩. ৯৯.৭% নিয়ম:
- প্রায় ৯৯.৭% ডেটা গড়ের ±৩ স্ট্যান্ডার্ড ডেভিয়েশনের মধ্যে থাকে।
- আমাদের উদাহরণে: প্রায় সব ক্ষেত্রেই (৯৯.৭%) তার কাটিং আসল মাপের চেয়ে -৩ মিমি থেকে +৩ মিমি-এর মধ্যে থাকবে। ৩ মিমি-এর বেশি ভুল হওয়া একটি অত্যন্ত বিরল ঘটনা।
এই নিয়মটি আমাদের কোনো রকম জটিল গণনা ছাড়াই একটি নরমাল ডিস্ট্রিবিউশনের ডেটার বিস্তার সম্পর্কে একটি শক্তিশালী ধারণা দেয়।
উপসংহার
নরমাল ডিস্ট্রিবিউশন এবং এর 68-95-99.7 নিয়ম বোঝা পরিসংখ্যানের জগতে একটি বড় পদক্ষেপ। এটি আমাদের ডেটার বিন্যাস বুঝতে এবং বিভিন্ন ঘটনার সম্ভাবনা সম্পর্কে পূর্বাভাস দিতে সাহায্য করে। পরবর্তী আলোচনায় আমরা দেখব, কীভাবে এই নিয়ম ব্যবহার করে আরও নির্দিষ্ট পরিসরের সম্ভাবনা গণনা করা যায়।