Квантитативне везе између појава су суштина статистичке науке, која пружа алате и технике за анализу и разумевање тих веза. Ови односи се изражавају путем бројева и формула, омогућавајући истраживачима да квантификују природу и јачину повезаности између различитих феномена.

Статистички приступ квантитативним везама подразумева коришћење различитих техника, као што су корелација, регресија и тестирање хипотеза, како би се разумела природа веза међу променљивима. На пример, користимо коефицијент корелације да бисмо проценили колико су две променљиве линеарно повезане, док регресија омогућава предвиђање вредности једне променљиве на основу вредности друге.

Осим тога, статистичке методе омогућавају и тестирање хипотеза о квантитативним везама. На пример, можемо тестирати да ли постоји статистички значајна разлика између група или да ли постоји линеарна веза између две променљиве.

Квантитативне везе су присутне у многим дисциплинама, као што су економија, психологија, медицина, социологија, и многе друге. На пример, у економији, квантитативне везе се користе за анализу односа између цена и потражње, док се у медицини користе за истраживање веза између фактора ризика и болести.

Квантитативна зависност међу појавама може бити:

  • функционалана (математичка, детерминистичка) и
  • стохастичка (статистичка).

Функционална подразумева да свакој вредности променљиве (X) тачно одговара одређена вредност друге променљиве (Y).

За разлику од математичких веза, стохастичке (статистичке везе) су слабије. Оне подразумевају да једној вредности променљиве (X) одговарају више различитиих вредности променљиве (Y).

Корелациона анализа

Корелациона анализа је статистичка техника која има за циљ да утврди да ли између варијација посматраних појава постоји квантитативно слагање, и ако постоји у ком степену.

Ако постоји веза између две појаве онда се ради о простој линеарној корелацији, а ако се анализирају више појава онда се ради о вишестукој корелацији.

Пошто ћемо се овде бавити само простом линеарном корелацијом, она може бити:

  • позитивна (директна) – када обе појаве иду у истом смеру,
  • негативна (инверзна) – када једна појава расте, а друга опада и обрнуто.

Коефицијент корелације

Коефицијент корелације је статистичка мера која се користи за процену јачине и правца везе између две променљиве. Ова мера варира између -1 и 1, где вредност од -1 указује на савршену негативну корелацију, вредност од 1 указује на савршену позитивну корелацију, док вредност од 0 указује на одсуство корелације.

Када говоримо о савршеној позитивној корелацији (вредност 1), то значи да како једна променљива расте, тако и друга расте пропорционално. Насупрот томе, савршена негативна корелација (вредност -1) означава да како једна променљива расте, друга опада пропорционално.

Коефицијент корелације се често користи у истраживањима и анализама, посебно у економији, медицини, психологији и многим другим научним дисциплинама. Ова мера омогућава истраживачима да идентификују везе између променљивих и да процене колико су те везе снажне.

Коефицијент просте линеарне корелације показује степен линеарног (праволинијског) квантитативног слагања варијација између две нумеричке појаве.

Важно је напоменути да корелација не имплицира узрочно-последичну везу између променљивих. Само зато што две променљиве показују корелацију, не значи нужно да једна променљива узрокује промене у другој. Стога, приликом тумачења коефицијента корелације, важно је разумети контекст и применити додатне анализе како би се утврдила узрочно-последична веза, ако постоји.

Коефицијент корелације (означен са 𝑟) се израчунава користећи формулу за Пеарсонов коефицијент корелације, која се често користи за мерење линеарних веза између две континуиране променљиве. Формула за Пеарсонов коефицијент корелације изгледа овако:

 r = \frac{n \sum_{i=1}^{n} (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{(n \sum_{i=1}^{n} (x_i - \bar{x})^2) (n \sum_{i=1}^{n} (y_i - \bar{y})^2)}} (1.1)

Где су:

  • n = број обележја,
  • X i Y = вредности првое и друге променљиве,
  • X i Y надвучено= просечне вредности прве и друге променљиве.

Корелација се може израчунати и коришћењем других формула. За то нам је потребна коваријанса и стандардна девијација за две појаве.

Форула за коваријансу:

 C_{XY} = \frac{\sum_{i=1}^{n}(X - \bar{X})(Y - \bar{Y})}{n} = \frac{\sum_{i=1}^{n} (XY)}{n} - \bar{X} \times \bar{Y} (1.2)

Формула за стандардну девијацију по x и y:

 \sigma_x =  \sqrt{\frac{\sum_{i=1}^n x_i^2}{\sum_{i=1}^n f_i} - \mu_x^2} (1.3)

 \sigma_y =  \sqrt{\frac{\sum_{i=1}^n y_i^2}{\sum_{i=1}^n f_i} - \mu_y^2} (1.4)

На основу претходних формула може се извести формула за коефицијент просте линеарне корелације (1.5):

 r = \frac{C_x_y}{\sigma_x \times\sigma_y} (1.5)

Ова формула рачуна просечно растојање сваке тачке од просека за обе променљиве, а затим дели то са производом стандардне девијације за обе променљиве.

Када се ова формула примени на одговарајуће податке, резултат ће бити вредност коефицијента корелације између две променљиве. Ова вредност ће бити негативна ако постоји негативна корелација, позитивна ако постоји позитивна корелација, и нула ако нема линеарног односа између променљивих.