Dəstək
Pulsuz Yükləmə və Məlumat Platforması

p-dəyəri (ing. p-value və ya probability value) — statistik hipotez testində əldə edilən müşahidə nəticələrinin, sıfır hipotez doğru olduğu halda, nə qədər “nad

P-dəyəri

p-dəyəri (ing. p-value və ya probability value) — statistik hipotez testində əldə edilən müşahidə nəticələrinin, sıfır hipotez doğru olduğu halda, nə qədər “nadir” və ya “gözlənilməz” olduğunu ölçən ehtimal göstəricisidir. p-dəyəri sıfır hipotezin etibarlılığını yoxlamaq və statistik əhəmiyyətlilik dərəcəsini müəyyənləşdirmək üçün geniş istifadə olunur.

p-dəyəri elmdə faydalı göstəricilərdən biri olsa da, onun mütləq və tək qərar meyarı kimi qəbul edilməsi düzgün deyil. Elmi nəticələrin düzgün qiymətləndirilməsi üçün p-dəyəri digər statistik göstəricilərlə birlikdə kontekstə uyğun analiz edilməlidir.

Tarixi

Chest high painted portrait of man wearing a brown robe and head covering
Con Arbetnot
Pyer Simon Laplas
Man seated at his desk looking up at the camera
Karl Pirson
Sepia toned photo of young man wearing a suit, a medal, and wire-rimmed eyeglasses
Ronald Fişer

p-dəyərinin anlayışı statistikada XX əsrin əvvəllərində formalaşmağa başlamışdır. Onun kökləri İngiltərəli statistik Ronald A. Fişerin 1920-ci illərdə apardığı tədqiqatlara gedib çıxır. Fişer 1925-ci ildə nəşr etdiyi məşhur Statistical Methods for Research Workers (Tədqiqatçılar üçün Statistik Metodlar) adlı əsərində p-dəyərinin ilkin versiyasını təqdim edərək, onu elmi hipotezlərin qiymətləndirilməsində praktiki vasitə kimi təklif etmişdir. Fişer p-dəyərini təcrübi nəticələrin sıfır hipotezlə uyğunluğunu test etmək üçün ehtimal ölçüsü kimi təqdim etmiş və 0.05 sərhədini (yəni 5% ehtimalı) “statistik əhəmiyyətlilik” üçün konvensional meyar kimi irəli sürmüşdür.

Daha sonra 1930-cu illərdə Yeji Neyman və Eqon Pirson p-dəyəri anlayışını inkişaf etdirərək onu formal hipotez testləri çərçivəsində yenidən izah etdilər. Onlar səhv növləri (Tip I və Tip II) ilə bağlı nəzəriyyəni quraraq p-dəyərini qərarvermə mexanizminin bir hissəsinə çevirdilər. Neyman–Pirson yanaşması qərar əsaslı statistik testlərin əsasını qoydu və p-dəyəri bu çərçivədə sıfır hipotezin rədd edilib-edilməməsinə dair qərarın bir komponentinə çevrildi.

Zamanla p-dəyəri statistik analizlərin ayrılmaz hissəsinə çevrildi və xüsusilə təbabət, psixologiya, sosiologiya və iqtisadiyyat kimi empirik fənlərdə geniş yayılmağa başladı. XX əsrin ikinci yarısında praktiki tədqiqatlarda p < 0.05 dəyəri “əlamətdar nəticə” kimi standart normaya çevrildi. Lakin bu dövrdə p-dəyərinin geniş istifadəsi ilə yanaşı, onun yanlış təfsiri və sui-istifadəsi də artmağa başladı.

XXI əsrin əvvəllərində, xüsusilə metaelm və təkrarlanma böhranı çərçivəsində aparılan araşdırmalar p-dəyərinin qeyri-düzgün istifadəsinə qarşı ciddi tənqidlərə səbəb oldu. Beləliklə, p-dəyəri statistik analiz tarixində əvvəlcə səmərəli bir alət kimi təqdim olunsa da, zamanla onun rolu və interpretasiyası daha mürəkkəb və mübahisəli hala gəlmişdir. Müasir statistikada p-dəyəri hələ də geniş istifadə olunur, lakin artıq tək qərar kriteriyası deyil, digər göstəricilər və kontekstlə birlikdə şərh olunması tövsiyə olunur.

Tərifi

Rəsmi olaraq, p-dəyəri — sıfır hipotezin (H₀) doğru olduğu fərziyyəsi altında müşahidə edilən və ya daha ekstremal nəticələrin əldə edilmə ehtimalıdır. p-dəyəri nə qədər kiçik olarsa, əldə edilən nəticə sıfır hipotez ilə bir o qədər az uyğunlaşır. Əgər p-dəyəri müəyyən edilmiş əhəmiyyətlilik səviyyəsindən (məsələn, α = 0.05) kiçikdirsə, sıfır hipotez rədd olunur və nəticə “statistik əhəmiyyətli” hesab edilir.

İstifadəsi

P-dəyəri elmi tədqiqatlarda statistik testlərin nəticələrini şərh etmək üçün əsas alətlərdən biridir. O, fərqli qruplar arasında fərqin olub-olmadığını müəyyən etmək və bu fərqin təsadüfi olub-olmadığını qiymətləndirmək üçün istifadə olunur. Reqresiya analizləri, t-testlər, ANOVA və digər statistik metodlarda p-dəyəri nəticənin sıfır hipotezlə uyğunluğunu göstərmək məqsədilə tətbiq edilir. Məsələn, bir dərmanın effektivliyini test edən tədqiqatda p < 0.05 olduğu halda, bu, sıfır hipotezin rədd edilməsi və dərmanın “əlamətdar dərəcədə təsirli” olduğu nəticəsinə gəlmək üçün əsas kimi qəbul edilir.

Məhdudiyyətlər

Bununla belə, p-dəyərinin istifadəsi çox zaman yanlış anlaşılır və elmi nəticələrin şişirdilməsinə gətirib çıxarır. Bəzi yayılmış yanlış fikirlərdən biri, p-dəyərinin sıfır hipotezin doğru olma ehtimalını göstərməsi ilə bağlıdır. Halbuki, p-dəyəri sadəcə sıfır hipotezin doğru olduğu fərziyyəsi altında mövcud və ya daha ekstremal nəticələrin əldə edilmə ehtimalıdır. Bundan əlavə, p-dəyəri nəticələrin “böyüklüyünü” və ya “praktiki əhəmiyyətini” ifadə etmir. Kiçik p-dəyəri olsa belə, bu, hər zaman nəticənin mühüm və ya klinik baxımdan təsirli olduğu mənasına gəlmir. Digər bir problem isə böyük nümunə ölçülərində, əhəmiyyətsiz fərqlərin belə statistik əhəmiyyətli kimi görünə bilməsidir.

Tənqidi və metaelmdə rolu

Son illərdə p-dəyərinə həddən artıq güvənilmə elmi ictimaiyyətdə geniş tənqidlərə səbəb olmuşdur. Xüsusilə metaelmelmi metod sahəsində aparılan tədqiqatlar göstərmişdir ki, p-dəyərinə əsaslanan nəticələr çox vaxt təkrarlana bilmir və bu, “təkrarlanma böhranı”nın əsas səbəblərindən biridir. 2016-cı ildə American Statistical Association (ASA) p-dəyərlərin istifadəsinə dair rəsmi bəyanat verərək onun yanlış interpretasiyalarının qarşısını almağa çalışmışdır. Həmin bəyanatda p-dəyərinin nəyi göstərdiyi və göstərmədiyi aydın şəkildə izah olunmuş və tədqiqatçılara nəticələri yalnız bu göstəriciyə əsasən qiymətləndirməmək tövsiyə olunmuşdur.

Alternativ yanaşmalar

Alternativ yanaşmalar kimi “effekt ölçüləri” (ing. effect size), “etibarlılıq intervalları” (ing. confidence intervals), “Bayes ehtimal yanaşmaları” və “sübut miqdarları” (ing. evidence ratios) irəli sürülmüşdür. Bəzi hallarda qərəz düzəlişi ilə hesablanan p-dəyərlər və ya çoxsaylı hipotezlərin test edildiyi tədqiqatlarda korrektiv yanaşmalar da tətbiq olunur. Bu metodlar tədqiqat nəticələrinin daha dəqiq və kontekstual şəkildə şərh edilməsinə, elmi qərarların daha etibarlı əsaslara söykənməsinə imkan verir.

Həmçinin bax

  • Statistik əhəmiyyətlilik
  • Statistik hipotez testi
  • Metaelm
  • P-hacking
  • Etibarlılıq və validlik

Ədəbiyyat

  • Denworth L. "A Significant Problem: Standard scientific methods are under fire. Will anything change?". Scientific American. 321 (4). oktyabr 2019: 62–67 (63). The use of p values for nearly a century [since 1925] to determine statistical significance of experimental results has contributed to an illusion of certainty and [to] reproducibility crises in many scientific fields. There is growing determination to reform statistical analysis... Some [researchers] suggest changing statistical methods, whereas others would do away with a threshold for defining "significant" results.
  • Elderton WP. "Tables for Testing the Goodness of Fit of Theory to Observation". Biometrika. 1 (2). 1902: 155–163. doi:10.1093/biomet/1.2.155. 29 sentyabr 2023 tarixində . İstifadə tarixi: 27 iyun 2025.
  • Pearson, Karl. "On the probability that two independent distributions of frequency are really samples of the same population, with special reference to recent work on the identity of Trypanosome strains". Biometrika. 10. 1914: 85–154. doi:10.1093/biomet/10.1.85.
  • Fisher RA. Statistical Methods for Research Workers. Edinburgh, Scotland: Oliver & Boyd. 1925. ISBN 978-0-05-002170-5.
  • Fisher RA. The Design of Experiments (9th). Macmillan. 1971 [1935]. ISBN 978-0-02-844690-5.
  • Fisher RA, Yates F. Statistical tables for biological, agricultural and medical research. London, England. 1938.
  • Stigler SM. The history of statistics : the measurement of uncertainty before 1900. Cambridge, Mass: Belknap Press of Harvard University Press. 1986. ISBN 978-0-674-40340-6.
  • Hubbard R, Armstrong JS. "Why We Don't Really Know What Statistical Significance Means: Implications for Educators" (PDF). Journal of Marketing Education. 28 (2). 2006: 114–120. doi:10.1177/0273475306288399. hdl:2092/413. 18 may 2006 tarixində (PDF).
  • Hubbard R, Lindsay RM. (PDF). Theory & Psychology. 18 (1). 2008: 69–88. doi:10.1177/0959354307086923. 21 oktyabr 2016 tarixində orijinalından (PDF) arxivləşdirilib. İstifadə tarixi: 28 avqust 2015.
  • Stigler S. "Fisher and the 5% level". Chance. 21 (4). dekabr 2008: 12. doi:10.1007/s00144-008-0033-3.
  • Dallal GE. The Little Handbook of Statistical Practice. 2012. 8 mart 2016 tarixində . İstifadə tarixi: 27 iyun 2025.
  • Biau DJ, Jolles BM, Porcher R. "P value and the theory of hypothesis testing: an explanation for new researchers". Clinical Orthopaedics and Related Research. 468 (3). mart 2010: 885–892. doi:10.1007/s11999-009-1164-4. PMC 2816758. PMID 19921345.
  • Reinhart A. Statistics Done Wrong: The Woefully Complete Guide. No Starch Press. 2015. səh. 176. ISBN 978-1593276201. 2 oktyabr 2019 tarixində . İstifadə tarixi: 27 iyun 2025.
  • Benjamini, Yoav; De Veaux, Richard D.; Efron, Bradley; Evans, Scott; Glickman, Mark; Graubard, Barry I.; He, Xuming; Meng, Xiao-Li; Reid, Nancy; Stigler, Stephen M.; Vardeman, Stephen B.; Wikle, Christopher K.; Wright, Tommy; Young, Linda J.; Kafadar, Karen. "The ASA President's Task Force Statement on Statistical Significance and Replicability". Annals of Applied Statistics. 15 (3). 2021: 1084–1085. doi:10.1214/21-AOAS1501.
  • Benjamin, Daniel J.; Berger, James O.; Johannesson, Magnus; Nosek, Brian A.; Wagenmakers, E.-J.; Berk, Richard; Bollen, Kenneth A.; Brembs, Björn; Brown, Lawrence; Camerer, Colin; Cesarini, David; Chambers, Christopher D.; Clyde, Merlise; Cook, Thomas D.; De Boeck, Paul; Dienes, Zoltan; Dreber, Anna; Easwaran, Kenny; Efferson, Charles; Fehr, Ernst; Fidler, Fiona; Field, Andy P.; Forster, Malcolm; George, Edward I.; Gonzalez, Richard; Goodman, Steven; Green, Edwin; Green, Donald P.; Greenwald, Anthony G.; Hadfield, Jarrod D.; Hedges, Larry V.; Held, Leonhard; Hua Ho, Teck; Hoijtink, Herbert; Hruschka, Daniel J.; Imai, Kosuke; Imbens, Guido; Ioannidis, John P. A.; Jeon, Minjeong; Jones, James Holland; Kirchler, Michael; Laibson, David; List, John; Little, Roderick; Lupia, Arthur; Machery, Edouard; Maxwell, Scott E.; McCarthy, Michael; Moore, Don A.; Morgan, Stephen L.; Munafó, Marcus; Nakagawa, Shinichi; Nyhan, Brendan; Parker, Timothy H.; Pericchi, Luis; Perugini, Marco; Rouder, Jeff; Rousseau, Judith; Savalei, Victoria; Schönbrodt, Felix D.; Sellke, Thomas; Sinclair, Betsy; Tingley, Dustin; Van Zandt, Trisha; Vazire, Simine; Watts, Duncan J.; Winship, Christopher; Wolpert, Robert L.; Xie, Yu; Young, Cristobal; Zinman, Jonathan; Johnson, Valen E. "Redefine statistical significance". Nature Human Behaviour. 2 (1). 1 sentyabr 2017: 6–10. doi:10.1038/s41562-017-0189-z. eISSN 2397-3374. hdl:10281/184094. PMID 30980045.

vikipedia, viki, ensiklopediya, kitab, məqalə, oxumaq, pulsuz yüklə, p-dəyəri sözünün mənası, p-dəyəri haqqında məlumat. p-dəyəri nədir? p-dəyəri nə deməkdir?

Üst