Kvantitativne veze između pojava su suština statističke nauke, koja pruža alate i tehnike za analizu i razumevanje tih veza. Ovi odnosi se izražavaju putem brojeva i formula, omogućavajući istraživačima da kvantifikuju prirodu i jačinu povezanosti između različitih fenomena.

Statistički pristup kvantitativnim vezama podrazumeva korišćenje različitih tehnika, kao što su korelacija, regresija i testiranje hipoteza, kako bi se razumela priroda veza među promenljivima. Na primer, koristimo koeficijent korelacije da bismo procenili koliko su dve promenljive linearno povezane, dok regresija omogućava predviđanje vrednosti jedne promenljive na osnovu vrednosti druge.

Osim toga, statističke metode omogućavaju i testiranje hipoteza o kvantitativnim vezama. Na primer, možemo testirati da li postoji statistički značajna razlika između grupa ili da li postoji linearna veza između dve promenljive.

Kvantitativne veze su prisutne u mnogim disciplinama, kao što su ekonomija, psihologija, medicina, sociologija, i mnoge druge. Na primer, u ekonomiji, kvantitativne veze se koriste za analizu odnosa između cena i potražnje, dok se u medicini koriste za istraživanje veza između faktora rizika i bolesti.

Kvantitativna zavisnost među pojavama može biti:

  • funkcionalana (matematička, deterministička) i
  • stohastička (statistička).

Funkcionalna podrazumeva da svakoj vrednosti promenljive (X) tačno odgovara određena vrednost druge promenljive (Y).

Za razliku od matematičkih veza, stohastičke (statističke veze) su slabije. One podrazumevaju da jednoj vrednosti promenljive (X) odgovaraju više različitiih vrednosti promenljive (Y).

Korelaciona analiza

Korelaciona analiza je statistička tehnika koja ima za cilj da utvrdi da li između varijacija posmatranih pojava postoji kvantitativno slaganje, i ako postoji u kom stepenu.

Ako postoji veza između dve pojave onda se radi o prostoj linearnoj korelaciji, a ako se analiziraju više pojava onda se radi o višestukoj korelaciji.

Pošto ćemo se ovde baviti samo prostom linearnom korelacijom, ona može biti:

  • pozitivna (direktna) – kada obe pojave idu u istom smeru,
  • negativna (inverzna) – kada jedna pojava raste, a druga opada i obrnuto.

Koeficijent korelacije

Koeficijent korelacije je statistička mera koja se koristi za procenu jačine i pravca veze između dve promenljive. Ova mera varira između -1 i 1, gde vrednost od -1 ukazuje na savršenu negativnu korelaciju, vrednost od 1 ukazuje na savršenu pozitivnu korelaciju, dok vrednost od 0 ukazuje na odsustvo korelacije.

Kada govorimo o savršenoj pozitivnoj korelaciji (vrednost 1), to znači da kako jedna promenljiva raste, tako i druga raste proporcionalno. Nasuprot tome, savršena negativna korelacija (vrednost -1) označava da kako jedna promenljiva raste, druga opada proporcionalno.

Koeficijent korelacije se često koristi u istraživanjima i analizama, posebno u ekonomiji, medicini, psihologiji i mnogim drugim naučnim disciplinama. Ova mera omogućava istraživačima da identifikuju veze između promenljivih i da procene koliko su te veze snažne.

Koeficijent proste linearne korelacije pokazuje stepen linearnog (pravolinijskog) kvantitativnog slaganja varijacija između dve numeričke pojave.

Važno je napomenuti da korelacija ne implicira uzročno-posledičnu vezu između promenljivih. Samo zato što dve promenljive pokazuju korelaciju, ne znači nužno da jedna promenljiva uzrokuje promene u drugoj. Stoga, prilikom tumačenja koeficijenta korelacije, važno je razumeti kontekst i primeniti dodatne analize kako bi se utvrdila uzročno-posledična veza, ako postoji.

Koeficijent korelacije (označen sa 𝑟) se izračunava koristeći formulu za Pearsonov koeficijent korelacije, koja se često koristi za merenje linearnih veza između dve kontinuirane promenljive. Formula za Pearsonov koeficijent korelacije izgleda ovako:

 r = \frac{n \sum_{i=1}^{n} (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{(n \sum_{i=1}^{n} (x_i - \bar{x})^2) (n \sum_{i=1}^{n} (y_i - \bar{y})^2)}} (1.1)

Gde su:

  • n = broj obeležja,
  • X i Y​ = vrednosti prvoe i druge promenljive,
  • X i Y nadvučeno= prosečne vrednosti prve i druge promenljive.

Korelacija se može izračunati i korišćenjem drugih formula. Za to nam je potrebna kovarijansa i standardna devijacija za dve pojave.

Forula za kovarijansu:

 C_{XY} = \frac{\sum_{i=1}^{n}(X - \bar{X})(Y - \bar{Y})}{n} = \frac{\sum_{i=1}^{n} (XY)}{n} - \bar{X} \times \bar{Y} (1.2)

Formula za standardnu devijaciju po x i y:

 \sigma_x =  \sqrt{\frac{\sum_{i=1}^n x_i^2}{\sum_{i=1}^n f_i} - \mu_x^2} (1.3)

 \sigma_y =  \sqrt{\frac{\sum_{i=1}^n y_i^2}{\sum_{i=1}^n f_i} - \mu_y^2} (1.4)

Na osnovu prethodnih formula može se izvesti formula za koeficijent proste linearne korelacije (1.5):

 r = \frac{C_x_y}{\sigma_x \times\sigma_y} (1.5)

Ova formula računa prosečno rastojanje svake tačke od proseka za obe promenljive, a zatim deli to sa proizvodom standardne devijacije za obe promenljive.

Kada se ova formula primeni na odgovarajuće podatke, rezultat će biti vrednost koeficijenta korelacije između dve promenljive. Ova vrednost će biti negativna ako postoji negativna korelacija, pozitivna ako postoji pozitivna korelacija, i nula ako nema linearnog odnosa između promenljivih.