Discrete and Continuous Variables, Dot Plots in Bengali: Statistics Tutorial 3

Discrete and Continuous Variables, Dot Plots in Bengali: Statistics Tutorial 3

কোয়ান্টিটেটিভ ডেটা পরিচিতি: ডিসক্রিট, কন্টিনিউয়াস এবং ডট প্লট

কোয়ান্টিটেটিভ ডেটা পরিচিতি: ডিসক্রিট, কন্টিনিউয়াস এবং ডট প্লট

আগের পোস্টে আমরা ক্যাটাগরিক্যাল ভেরিয়েবল এবং সেগুলোকে বর্ণনা করার জন্য ফ্রিকোয়েন্সি ও বার চার্ট নিয়ে আলোচনা করেছি। এখন আমরা কোয়ান্টিটেটিভ (Quantitative) বা সংখ্যাসূচক ডেটা বর্ণনা করার জন্য ব্যবহৃত কিছু নতুন ধারণা এবং গ্রাফ সম্পর্কে জানব।

কোয়ান্টিটেটিভ ভেরিয়েবলের প্রকারভেদ

কোয়ান্টিটেটিভ ভেরিয়েবলকে আরও দুটি ভাগে ভাগ করা যায়, যা ডেটার বৈশিষ্ট্য বুঝতে সাহায্য করে।

  1. ডিসক্রিট (Discrete) ভেরিয়েবল
  2. কন্টিনিউয়াস (Continuous) ভেরিয়েবল

পরিসংখ্যানের গভীরে গেলে এই পার্থক্যটি খুব গুরুত্বপূর্ণ হয়ে ওঠে, কারণ ডেটার ধরনের ওপর ভিত্তি করে বিশ্লেষণের পদ্ধতি বদলে যেতে পারে। তবে এই কোর্সের প্রাথমিক পর্যায়ে, এই পার্থক্যটি নিয়ে খুব বেশি চিন্তিত হওয়ার প্রয়োজন নেই।

১. ডিসক্রিট ভেরিয়েবল (Discrete Variable)

ডিসক্রিট ভেরিয়েবল হলো এমন এক ধরনের সংখ্যাসূচক ডেটা যার মানগুলোর মধ্যে ফাঁক (Gaps) থাকে। অর্থাৎ, এই ভেরিয়েবলের মান নির্দিষ্ট, পূর্ণ সংখ্যা হয় এবং দুটি মানের মাঝখানের কোনো দশমিক মান থাকা সম্ভব নয়। সাধারণত, যে জিনিসগুলো গণনা করা হয় (counting), সেগুলো ডিসক্রিট ভেরিয়েবল হয়।

নতুন উদাহরণ: ধরুন, আপনি দুর্গাপুর শহরের একটি বইয়ের দোকান থেকে সপ্তাহে কতগুলো বই কেনেন, তার ওপর সমীক্ষা করছেন। আপনার উত্তর হতে পারে ০, ১, ২, বা ৩টি বই। কিন্তু আপনার উত্তর কখনোই ১.৫ বা ২.৭ হতে পারে না। এখানে ০ এবং ১ বা ১ এবং ২-এর মধ্যে একটি স্পষ্ট ফাঁক রয়েছে।

২. কন্টিনিউয়াস ভেরিয়েবল (Continuous Variable)

কন্টিনিউয়াস ভেরিয়েবলের মানগুলোর মধ্যে কোনো ফাঁক থাকে না। অর্থাৎ, দুটি মানের মধ্যে যেকোনো দশমিক মান থাকা সম্ভব। সাধারণত, যে জিনিসগুলো পরিমাপ করা হয় (measuring), সেগুলো কন্টিনিউয়াস ভেরিয়েবল হয়।

নতুন উদাহরণ: ধরুন, আমরা বর্ষাকালে শিলিগুড়িতে দৈনিক বৃষ্টিপাতের পরিমাণ (মিলিমিটারে) পরিমাপ করছি। একদিন বৃষ্টিপাত হতে পারে ৫০ মিমি, পরের দিন হতে পারে ৫১ মিমি। কিন্তু এদের মধ্যে যেকোনো মান, যেমন ৫০.৫ মিমি বা ৫০.৫৭ মিমি, থাকাও সম্ভব। এখানে মানগুলোর মধ্যে কোনো ফাঁক নেই।

কোয়ান্টিটেটিভ ডেটার গ্রাফিক্যাল উপস্থাপন

ক্যাটাগরিক্যাল ডেটার মতো, কোয়ান্টিটেটিভ ডেটাকেও আমরা গ্রাফের মাধ্যমে সহজে উপস্থাপন করতে পারি।

হিস্টোগ্রাম (Histogram)
যখন আমরা ডিসক্রিট ডেটার জন্য বার চার্টের মতো একটি গ্রাফ তৈরি করি, তখন তাকে হিস্টোগ্রাম (Histogram) বলা হয়। দেখতে এটি বার চার্টের মতোই, কিন্তু এটি সংখ্যাসূচক ডেটার ফ্রিকোয়েন্সি দেখায়।

ডট প্লট (Dot Plot)
কন্টিনিউয়াস ডেটা উপস্থাপন করার একটি সহজ উপায় হলো ডট প্লট (Dot Plot)। এটি তৈরি করা খুব সহজ। প্রথমে একটি আনুভূমিক রেখা (X-অক্ষ) আঁকতে হবে, যেখানে আমাদের ডেটার সম্ভাব্য মানগুলো থাকবে। তারপর প্রতিটি ডেটা পয়েন্টের জন্য তার সঠিক মানের ওপরে একটি করে ডট বসাতে হবে। যদি কোনো মান একাধিকবার আসে, তাহলে ডটগুলো একটির ওপর আরেকটি বসাতে হবে।

ডট প্লটের উদাহরণ

ডট প্লটের সীমাবদ্ধতা

ডট প্লট একটি সহজ এবং কার্যকর গ্রাফ হলেও এর কিছু সীমাবদ্ধতা রয়েছে। যখন কন্টিনিউয়াস ডেটার মানগুলো খুব কাছাকাছি থাকে (যেমন ৫৯ এবং ৫৯.২), তখন ডটগুলো আলাদাভাবে থাকলেও তারা ঠিক কতটা ঘন বা সাধারণ, তা বোঝা কঠিন হয়ে যায়। কারণ সামান্য পার্থক্যের জন্য ডটগুলো পাশাপাশি বসে, কিন্তু একটির ওপর আরেকটি বসে না। ফলে, ডেটার আসল ঘনত্ব বোঝা যায় না।

এই সমস্যা সমাধানের জন্য আরও উন্নত কিছু গ্রাফিক্যাল টুল রয়েছে, যেমন স্টেম-অ্যান্ড-লিফ প্লট (Stem-and-Leaf Plot) এবং হিস্টোগ্রাম (Histogram), যা কন্টিনিউয়াস ডেটার জন্য বিশেষভাবে তৈরি। আমরা পরবর্তী পোস্টে এই বিষয়গুলো নিয়ে বিস্তারিত আলোচনা করব।