Statistics Tutorial 1:Introduction: Statistics, data, and variables in Bengali

পরিসংখ্যানের প্রথম পাঠ: ডেটা এবং ভেরিয়েবলস কী?

পরিসংখ্যানের প্রথম পাঠ: ডেটা এবং ভেরিয়েবলস কী?

পরিসংখ্যান বা স্ট্যাটিস্টিকসের জগতে আপনাকে স্বাগত! এই প্রথম ইউনিটে, আমরা পরিসংখ্যানের কিছু মৌলিক শব্দ এবং ধারণা নিয়ে আলোচনা করব। আমরা এই বিষয়গুলো দ্রুত শিখব, কিন্তু চিন্তা করবেন না। পুরো কোর্স জুড়ে আমরা এই ধারণাগুলো বারবার ব্যবহার করব, তাই সময়ের সাথে সাথে সবকিছু আরও পরিষ্কার হয়ে যাবে।

পরিসংখ্যান (Statistics) আসলে কী?

পরিসংখ্যান বিষয়টি অনেক বড়, কিন্তু আমরা যদি খুব সহজভাবে এটিকে সংজ্ঞায়িত করতে চাই, তাহলে বলতে পারি:
পরিসংখ্যান হলো ডেটা (Data) থেকে শেখার বিজ্ঞান।

অর্থাৎ, আমাদের কাছে কিছু তথ্য বা ডেটা থাকে এবং আমরা সেই ডেটা বিশ্লেষণ করে কোনো সিদ্ধান্তে পৌঁছাই।

তাহলে ডেটা (Data) কী?

সহজ কথায়, ডেটা (Data) হলো তথ্য (Information)। আজকের ডিজিটাল যুগে, ডেটা বিভিন্ন আকারে আসতে পারে। যেমন—ছবি, ভিডিও, টেক্সট, এমনকি আপনার ফিটবিটের সেন্সর থেকে পাওয়া তথ্যও ডেটা।

এই কোর্সে আমরা হয়তো ভিডিও বা টেক্সট ডেটা বিশ্লেষণ করা শিখব না, কিন্তু আমরা যে ভিত্তি তৈরি করব, তা আপনাকে ভবিষ্যতে আরও জটিল ডেটা নিয়ে কাজ করতে সাহায্য করবে।

ভেরিয়েবল (Variable) কী?

যখন আমরা ডেটা নিয়ে কথা বলি, তখন "ভেরিয়েবল" (Variable) শব্দটি প্রায়ই আসে। ভেরিয়েবল কী?

ভেরিয়েবল হলো এমন একটি বৈশিষ্ট্য (Characteristic) যা এক ব্যক্তি থেকে অন্য ব্যক্তিতে বা এক বস্তু থেকে অন্য বস্তুতে পরিবর্তিত হয়।

আসুন একটি নতুন উদাহরণ দিয়ে বিষয়টি বুঝি। ধরুন, আমরা দার্জিলিংয়ের বিভিন্ন চায়ের দোকানে এক কাপ চায়ের দাম জানতে চাই। এখানে, "চায়ের দাম" হলো একটি ভেরিয়েবল। কারণ, সব দোকানে চায়ের দাম একরকম নয়—এটি পরিবর্তনশীল। আমার উচ্চতা, আপনার উচ্চতা যেমন এক নয়, তেমনি এই দামও পরিবর্তনশীল।

ভেরিয়েবলের প্রধান প্রকারভেদ

এই কোর্সে, আমরা মূলত দুই ধরনের ভেরিয়েবল নিয়ে কাজ করব:

  1. ক্যাটাগরিক্যাল (Categorical)
  2. কোয়ান্টিটেটিভ (Quantitative)

কোন পরিস্থিতিতে কোন ধরনের ডেটা নিয়ে কাজ করছি, তা বোঝা খুব জরুরি, কারণ এর উপর ভিত্তি করেই আমাদের বিশ্লেষণের পদ্ধতি বদলে যায়।

১. ক্যাটাগরিক্যাল ভেরিয়েবল (Categorical Variable)

নাম শুনেই বোঝা যাচ্ছে, এই ধরনের ভেরিয়েবলের উত্তরগুলো বিভিন্ন ক্যাটাগরি বা গ্রুপে বিভক্ত থাকে। উত্তরগুলো হ্যাঁ/না হতে পারে, অথবা দুটি বা তার বেশি ক্যাটাগরির হতে পারে।

উদাহরণ:

ধরুন, আপনি হাওড়ার বইমেলায় আসা ১০০ জনকে জিজ্ঞাসা করলেন, "আপনি কোন ধরণের বই পড়তে সবচেয়ে বেশি ভালোবাসেন?"

সম্ভাব্য উত্তরগুলো হতে পারে:

  • কল্পবিজ্ঞান (Fiction)
  • প্রবন্ধ (Non-fiction)
  • কবিতা (Poetry)
  • ভ্রমণ কাহিনী (Travelogue)

এখানে উত্তরগুলো কোনো সংখ্যা নয়, বরং কয়েকটি নির্দিষ্ট ক্যাটাগরি। তাই, "বইয়ের ধরণ" একটি ক্যাটাগরিক্যাল ভেরিয়েবল।

২. কোয়ান্টিটেটিভ ভেরিয়েবল (Quantitative Variable)

কোয়ান্টিটেটিভ (Quantitative) শব্দটি এসেছে "কোয়ান্টিটি" (Quantity) বা পরিমাণ থেকে। এই ধরনের ভেরিয়েবলকে নিউমেরিক (Numeric) বা সংখ্যাসূচক ভেরিয়েবলও বলা হয়। যখন কোনো প্রশ্নের উত্তর একটি সংখ্যা হয়, তখন সেটি কোয়ান্টিটেটিভ ভেরিয়েবল।

উদাহরণ:

  • আসানসোলের আজকের তাপমাত্রা কত? (উত্তরটি একটি সংখ্যা, যেমন ৩৫°C)
  • শিয়ালদহ থেকে নৈহাটিগামী একটি লোকাল ট্রেনে মোট কতজন যাত্রী আছেন? (উত্তরটি একটি সংখ্যা, যেমন ১,২০০)
  • আপনি প্রতিদিন কত কাপ চা পান করেন? (উত্তরটি একটি সংখ্যা, যেমন ২ বা ৩)

এই সব প্রশ্নের উত্তরই হলো একটি সংখ্যা, তাই এগুলো কোয়ান্টিটেটিভ ভেরিয়েবল।

শেষ কথা

এই পোস্টে আমরা পরিসংখ্যানের কিছু প্রাথমিক ধারণা সম্পর্কে জানলাম—ডেটা কী, ভেরিয়েবল কী এবং এর প্রধান দুটি প্রকারভেদ: ক্যাটাগরিক্যালকোয়ান্টিটেটিভ। এই ধারণাগুলো আমাদের আগামী দিনের আলোচনার ভিত্তি স্থাপন করবে।

পরবর্তী পোস্টে, আমরা ক্যাটাগরিক্যাল ভেরিয়েবল নিয়ে আরও বিস্তারিত আলোচনা করব এবং দেখব কীভাবে সেগুলোকে বর্ণনা ও উপস্থাপন করা যায়।

Statistics Tutorial 1:Introduction: Statistics, data, and variables in Bengali