সম্ভাবনা বিতরণ

সম্ভাবনা বিতরণ

সম্ভাবনা বিতরণ

আমাদের শেষ নিবন্ধে আমরা সম্ভাবনার মূল বিষয়গুলি র ব্যাপারে আলোচনা করেছিলাম এবং দেখেছিলাম কীভাবে এটি অনুভূতিগতভাবে গণনা করা হয় । এই নিবন্ধে আমরা কীভাবে গাণিতিক ফাংশন থেকে সম্ভাবনাগুলি গণনা করা যায় তা বোঝার চেষ্টা করব। কিছু নির্দিষ্ট ফাংশন রয়েছে যা দিয়ে গণিতবিদদের দ্বারা প্রতিষ্ঠিত কিছু সূত্র ব্যবহার করে সম্ভাবনাগুলি গণনা করা যায়। বাস্তব জীবনে, বেশ কয়েকটি রান্ডম ভ্যারিয়েবল (যেমন পূর্ববর্তী নিবন্ধগুলির শিক্ষার্থীদের ওজন) এই ফাংশনগুলির একটি সম্ভাব্যতার নিদর্শন অনুসরণ করে বা অনুমান করা হয় যে করে। এই জাতীয় ক্ষেত্রে, সম্ভাবনাগুলি গণিত হিসাবে গণনা করা যেতে পারে। এই ফাংশনগুলি আমাদের সমস্ত সম্ভাব্য ফলাফল এবং তাদের সম্পর্কিত সম্ভাব্যতা সরবরাহ করে। এবং এটিকে সম্ভাব্যতা বন্টন বলা হয়।

সম্ভাব্যতা বিতরণ ফাংশন দুটি ধরণের হয়। একটি যেখানে ভেরিয়েবলগুলি পৃথক এবং অন্য যেখানে ভেরিয়েবলগুলি অবিচ্ছিন্ন। এই নিবন্ধে, আমরা সংক্ষেপে কিছু ব্যবহৃত ফাংশন নিয়ে আলোচনা করব।

পৃথক সম্ভাবনা বন্টন

দ্বিপদী সম্ভাব্য বন্টন

একটি রান্ডম ভেরিয়েবল দ্বিপদী বিতরণ অনুসরণ করে যদি

  1. রান্ডম ভেরিয়েবল টি বিযুক্ত (ডিসক্রিট ) ২. রান্ডম ভেরিয়েবল টি নির্দিষ্ট সংখ্যক বার পরিলক্ষিত হয় (একটি মুদ্রা টসিং এবং ফলাফল পর্যবেক্ষণের কল্পনা করুন) ৩. সম্ভাব্য দুটি ফলাফলই রয়েছে। তাদের কে 0 বা 1 হিসাবে, সাফল্য বা ব্যর্থতা বা সত্য বা মিথ্যা হিসাবে লেবেল করা যেতে পারে ৪. প্রতিটি ফলাফলের সাথে যুক্ত সম্ভাবনা রয়েছে যা যোগ যোগ করলে ১ হয় । সাফল্যের সম্ভাবনা যদি p হয় তবে ব্যর্থতার সম্ভাবনা (1-p ) হবে। ৫. প্রতিটি ফলাফল অপরটির থেকে স্বাধীন।

n টি রান্ডম নির্বাচন থেকে y সাফল্যের সম্ভাবনা হলো

\[ P(y)=_nC_yp^y(1-p)^{n-y} \]

যেখানে y হ’ল সাফল্যের সংখ্যা, p হ’ল সাফল্যের সম্ভাবনা এবং n হ’ল নমুনার সংখ্যা।

R এ , dbinom ফাংশন ব্যবহার করে এর সম্ভাব্যতা গণনা করতে পারে। মনে করুন যে আপনি জানেন যে মেসি পেনাল্টি শ্যুটআউটে 77% বার গোল করে। এবার , আপনি বুঝতে চান যে মেসি যদি 5 টি পেনাল্টি কিক নেন, তবে তাদের মধ্যে তিনটি গোল হওয়ার সম্ভাবনা কতটা।

dbinom(3,5,0.77)
## [1] 0.241506

যদি আমাদের ৩ টির বেশি গোল না হওয়ার সম্ভাবনার কথা জিজ্ঞেস করা হয়, তখন ? এটি করার দুটি উপায় আছে। প্রথম উপায়ে, আমরা 0,1,2 এবং 3 টি গোল এর সম্ভাবনার যোগ করি।

sum(dbinom(0:3,5,0.77))
## [1] 0.3250616

দ্বিতীয়টিতে, আমরা আরেকটি ফাংশন pbinom ব্যবহার করি।

pbinom(3,5,0.77)
## [1] 0.3250616

বিতরণের গড়টি সম্ভাব্যতা আর নমুনা আকারের (সংখ্যা ) গুণ। আমাদের উদাহরণস্বরূপ, আমরা 5 কিকের মধ্যে গড় 5 * 0.77 ( 3.85) গোল আশা করতে পারি। স্ট্যান্ডার্ড ডেভিয়েশন হলো \(\sqrt{np(1-p)}\).

পয়সন সম্ভাব্যতা বিতরণ

যখনই আমরা একটি বিরতিতে, ভ্যারিয়েবল এর এক নির্দিষ্ট ফলাফলের সংখ্যার ব্যাপারে কথা বলি, যার গড় আমাদের জানা, তখন আমরা পয়েশন ব্যবহার করি। উদাহরণস্বরূপ, প্রতিদিন কোনও দোকানে আগত গ্রাহকদের সংখ্যা বা এক মাসে মেসির দ্বারা গোল এর সংখ্যা। বিরতিটি সময়, স্থান বা ভলিউম হতে পারে। উদাহরণস্বরূপ, একটি পুকুর থেকে প্রতি লিটার পানিতে জীবের সংখ্যা।

একটি বিরতিতে y ইভেন্টগুলির বা কোনও নির্দিষ্ট ফলাফলের পর্যবেক্ষণের সম্ভাবনা দেওয়া হয়

\[ P(y)=\frac{e^{-a}a^y}{y!} \] যেখানে a হ’ল ব্যবধানে নির্দিষ্ট ফলাফলের গড় সংখ্যা।

দ্বিপদী ফাংশনের অনুরূপ, R এ পায়সনের জন্যও ফাংশন রয়েছে ।

ধরে নিই যে মেসি গড়ে প্রতি 1 ম্যাচে 2 টি স্কোর করে, আমরা গণনা করতে চাই যে পরের 1 ম্যাচে মেসির 2 টি গোল করার সম্ভাবনা কত।

dpois(1,2)
## [1] 0.2706706

আমরা যদি কমপক্ষে একটি গোল এর সম্ভাবনা জানতে চাই তবে দুটি উপায় আছে। আমরা 0 এবং 1 গোলের সম্ভাব্যতাগুলি যুক্ত করতে পারি বা ppois ফাংশন ব্যবহার করতে পারি।

sum(dpois(0:1,2))
## [1] 0.4060058
ppois(1,2)
## [1] 0.4060058

বিতরণের গড় হলো a যেটা আমাদের জানা । স্ট্যান্ডার্ড ডেভিয়েশন হ’ল \(\sqrt{a}\)

অবিচ্ছিন্ন সম্ভাবনা ফাংশন

অবিচ্ছিন্ন সম্ভাবনার ফাংশন অবিচ্ছিন্ন ভেরিয়েবলের সম্ভাব্যতা সরবরাহ করে। সর্বাধিক ব্যবহৃত অবিচ্ছন্ন সম্ভাব্যতা বিতরণ ফাংশন হ’ল সাধারণ/স্বাভাবিক (নরমাল) বিতরণ।

সাধারণ সম্ভাবনা বন্টন

সাধারণ সম্ভাবনা বিতরণ আছে

  1. বেল আকারের বক্ররেখা
  2. গড় (যা কেন্দ্রীয় মান) সম্পর্কে প্রতিসম
  3. লেজগুলি যা কখনও x অক্ষকে (এক্সিস) স্পর্শ করে না (অ্যাসিপটোটিক)
  4. বিতরণ দুটি পরামিতি, গড় এবং মান বিচ্যুতি (স্ট্যান্ডার্ড ডেভিয়েশন) দ্বারা বর্ণনা করা যেতে পারে
  5. বক্ররেখার নিচে মোট ক্ষেত্রফল 1 এবং
  6. একটি বিরতির সম্ভাবনা হ’ল অন্তরালের পরিধিটির বক্ররেখার ক্ষেত্রফল
library(ggplot2)
ggplot(data.frame(x = c(-3, 3)), aes(x)) +
  stat_function(fun = dnorm) + 
  stat_function(fun = dnorm, 
                xlim = c(-3,0),
                geom = "area",
                fill="blue") +
    stat_function(fun = dnorm, 
                xlim = c(1,2),
                geom = "area",
                fill="green")+
  labs(
    title = "(Standard)Normal Distribution",
    x="",
    y=""
  ) +
  geom_segment(x=0, xend=0, y=0, yend=0.4, linetype="dashed") +
  annotate("text", x=1, y=0.27, label=expression(x[1]))+
  annotate("text", x=2, y=0.07, label=expression(x[2]))+
  annotate("text", x=1.3, y=0.1, label="Prob")+
  annotate("text", x=0.2, y=0.1, label="mean=0")+
  annotate("text", x=-0.5, y=0.2, label="50 %")+
theme_classic() +
  theme(axis.text.x = element_blank(),
        axis.text.y = element_blank()
        ) 

স্ট্যান্ডার্ড স্বাভাবিক (Standard Normal) বিচ্যুতির সম্ভাবনাগুলি z-table নামে একটি সারণীতে পাওয়া যায়। যেহেতু টেবিলটি স্ট্যান্ডার্ড এর সম্ভাব্যতা সরবরাহ করে, তাই আমরা রান্ডম ভ্যারিয়েবল (x) কে z-value -তে রূপান্তর করি ।

\[ z=\frac{x-\mu}{\sigma} \] z-value মূলত x অক্ষে ভেরিয়েবলের নির্দিষ্ট মানের অবস্থান নির্দেশ করে (গড় থেকে কত দূরে)।

R -এ, z-table ব্যবহার করার দরকার নেই। binomial এবং Poisson এর ক্ষেত্রে যেমন ফাঙ্কশন রয়েছে, Normal Distribution এর জন্য ও ফাঙ্কশন রয়েছে ।

ধরা যাক একটি শ্রেণীর শিক্ষার্থীদের ওজনের গড় হার ৫০ এবং স্ট্যান্ডার্ড ডেভিয়েশন ৫ রয়েছে। আমরা ক্লাসের শীর্ষ 15% ওজনের নিম্ন সীমাটি জানতে চাই।

ggplot(data.frame(x = c(-3, 3)), aes(x)) +
  stat_function(fun = dnorm) + 
    stat_function(fun = dnorm, 
                xlim = c(2,3),
                geom = "area",
                fill="green")+
  labs(
    title = "Distribution of weights of students",
    x="",
    y=""
  ) +
  geom_segment(x=0, xend=0, y=0, yend=0.4, linetype="dashed") +
  annotate("text", x=2, y=0.07, label="lower limit")+
  annotate("text", x=0.2, y=0.1, label="mean=50")+
theme_classic() +
  theme(axis.text.x = element_blank(),
        axis.text.y = element_blank()
        ) 

আমরা নিম্ন সীমাটি সন্ধান করতে আগ্রহী, যা 85% (1- 15%)। সুতরাং, আমরা এই পয়েন্ট এ (৮৫%) মান সন্ধান করতে আগ্রহী। আমরা এটি করতে qnorm ফাংশনটি ব্যবহার করতে পারি।

qnorm(0.85, 50, 5)
## [1] 55.18217

দুটি সম্পর্কিত ভিডিও নিচে দেয়া হলো ।

Translations: