• Ce poți găti din calmar: rapid și gustos

    INTERVALE DE ÎNCREDERE PENTRU FRECVENȚE ȘI FRACȚII

    © 2008

    Institutul Național de Sănătate Publică, Oslo, Norvegia

    Articolul descrie și discută calculul intervalelor de încredere pentru frecvențe și proporții folosind metodele Wald, Wilson, Clopper - Pearson, folosind transformarea unghiulară și metoda Wald cu corecția Agresti - Coull. Materialul prezentat dă Informații generale despre metode de calculare a intervalelor de încredere pentru frecvențe și proporții și are scopul de a trezi interesul cititorilor de reviste nu numai pentru utilizarea intervalelor de încredere în prezentarea rezultatelor propriilor cercetări, ci și pentru citirea literaturii de specialitate înainte de a începe lucrul la viitoarele publicații.

    Cuvinte cheie: interval de încredere, frecvență, proporție

    Una dintre publicațiile anterioare a menționat pe scurt descrierea datelor calitative și a raportat că estimarea intervalului acestora este preferabilă estimării punctuale pentru descrierea frecvenței de apariție a caracteristicii studiate în populație. Într-adevăr, întrucât cercetarea este efectuată folosind date eșantionate, proiecția rezultatelor asupra populației trebuie să conțină un element de imprecizie a eșantionării. Intervalul de încredere este o măsură a acurateței parametrului estimat. Este interesant că unele cărți despre statistici de bază pentru medici ignoră complet subiectul intervalelor de încredere pentru frecvențe. În acest articol vom analiza mai multe moduri de a calcula intervalele de încredere pentru frecvențe, implicând astfel de caracteristici ale eșantionului precum nerepetiția și reprezentativitatea, precum și independența observațiilor unele față de altele. În acest articol, frecvența este înțeleasă nu ca un număr absolut care arată de câte ori apare o anumită valoare în agregat, ci ca o valoare relativă care determină proporția de participanți la studiu la care apare caracteristica studiată.

    În cercetarea biomedicală, intervalele de încredere de 95% sunt cel mai frecvent utilizate. Acest interval de încredere este zona în care proporția reală se încadrează în 95% din timp. Cu alte cuvinte, putem spune cu o fiabilitate de 95% că adevărata valoare a frecvenței de apariție a unei trăsături în populație va fi în intervalul de încredere de 95%.

    Majoritatea manualelor de statistică pentru cercetătorii medicali raportează că eroarea de frecvență este calculată folosind formula

    unde p este frecvența de apariție a caracteristicii în eșantion (valoare de la 0 la 1). Majoritatea articolelor științifice interne indică valoarea frecvenței de apariție a unei trăsături într-un eșantion (p), precum și eroarea (e) acesteia sub forma p ± s. Este mai indicat, însă, să se prezinte un interval de încredere de 95% pentru frecvența de apariție a unei trăsături în populație, care va include valori de la

    la.

    Unele manuale recomandă ca, pentru eșantioane mici, să înlocuiți valoarea de 1,96 cu valoarea t pentru N – 1 grade de libertate, unde N este numărul de observații din eșantion. Valoarea t este găsită din tabelele pentru distribuția t, disponibile în aproape toate manualele de statistică. Utilizarea distribuției t pentru metoda Wald nu oferă avantaje vizibile în comparație cu alte metode discutate mai jos și, prin urmare, nu este recomandată de unii autori.

    Metoda prezentată mai sus pentru calcularea intervalelor de încredere pentru frecvențe sau proporții este numită Wald în onoarea lui Abraham Wald (1902–1950), deoarece utilizarea sa pe scară largă a început după publicarea lui Wald și Wolfowitz în 1939. Cu toate acestea, metoda în sine a fost propusă de Pierre Simon Laplace (1749–1827) încă din 1812.

    Metoda Wald este foarte populară, dar aplicarea ei este asociată cu probleme semnificative. Metoda nu este recomandată pentru eșantioane de dimensiuni mici, precum și în cazurile în care frecvența de apariție a unei caracteristici tinde spre 0 sau 1 (0% sau 100%) și este pur și simplu imposibilă pentru frecvențele de 0 și 1. În plus, aproximarea distribuției normale, care este utilizată la calcularea erorii, „nu funcționează” în cazurile în care n · p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более considerație detaliată Metoda lui Wald a arătat că intervalele de încredere obținute cu ajutorul ei sunt în majoritatea cazurilor prea înguste, adică utilizarea lor creează în mod eronat o imagine prea optimistă, mai ales când frecvența de apariție a caracteristicii este îndepărtată de la 0,5, sau 50%. În plus, pe măsură ce frecvența se apropie de 0 sau 1, intervalul de încredere poate lua valori negative sau poate depăși 1, ceea ce pare absurd pentru frecvențe. Mulți autori, pe bună dreptate, nu recomandă utilizarea acestei metode, nu numai în cazurile deja menționate, ci și atunci când frecvența de apariție a caracteristicii este mai mică de 25% sau mai mare de 75%. Astfel, în ciuda simplității calculelor, metoda Wald poate fi utilizată doar într-un număr foarte limitat de cazuri. Cercetătorii străini sunt mai categoric în concluziile lor și recomandă clar să nu se folosească această metodă pentru eșantioane mici, iar cercetătorii medicali trebuie adesea să se ocupe de astfel de eșantioane.

    Deoarece noua variabilă este distribuită în mod normal, limitele inferioare și superioare ale intervalului de încredere de 95% pentru variabila φ vor fi φ-1,96 și φ+1,96 stânga">

    În loc de 1,96 pentru probele mici, se recomandă înlocuirea valorii t cu N – 1 grade de libertate. Această metodă nu produce valori negative și permite estimări mai precise ale intervalelor de încredere pentru frecvențe decât metoda Wald. În plus, este descris în multe cărți interne de referință privind statistica medicală, ceea ce, totuși, nu a condus la utilizarea sa pe scară largă în cercetarea medicală. Calcularea intervalelor de încredere folosind transformarea unghiulară nu este recomandată pentru frecvențele care se apropie de 0 sau 1.

    Aici se termină de obicei descrierea metodelor de estimare a intervalelor de încredere în majoritatea cărților despre bazele statisticii pentru cercetătorii medicali, iar această problemă este tipică nu numai pentru literatura națională, ci și pentru literatura străină. Ambele metode se bazează pe teorema limită centrală, care implică un eșantion mare.

    Ținând cont de neajunsurile estimării intervalelor de încredere folosind metodele de mai sus, Clopper și Pearson au propus în 1934 o metodă de calcul a așa-numitului interval de încredere exact, având în vedere distribuția binomială a trăsăturii studiate. Această metodă este disponibilă în multe calculatoare online, dar intervalele de încredere obținute astfel sunt în majoritatea cazurilor prea largi. În același timp, această metodă este recomandată pentru utilizare în cazurile în care este necesară o evaluare conservatoare. Gradul de conservativitate al metodei crește pe măsură ce dimensiunea eșantionului scade, mai ales când N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

    Potrivit multor statisticieni, cea mai optimă evaluare a intervalelor de încredere pentru frecvențe este realizată prin metoda Wilson, propusă încă din 1927, dar practic neutilizată în cercetarea biomedicală internă. Această metodă nu numai că permite estimarea intervalelor de încredere atât pentru frecvențe foarte mici, cât și pentru frecvențe foarte mari, dar este și aplicabilă pentru un număr mic de observații. ÎN vedere generală Intervalul de încredere conform formulei lui Wilson are forma



    unde ia valoarea 1,96 la calcularea intervalului de încredere de 95%, N este numărul de observații, iar p este frecvența de apariție a caracteristicii în eșantion. Această metodă este disponibilă în calculatoarele online, astfel încât utilizarea sa nu este problematică. și nu recomandăm utilizarea acestei metode pentru n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

    Pe lângă metoda Wilson, se crede că metoda Wald cu corecție Agresti-Coll oferă o estimare optimă a intervalului de încredere pentru frecvențe. Corecția Agresti-Coll este o înlocuire în formula Wald a frecvenței de apariție a unei caracteristici într-un eșantion (p) cu p`, la calculul care 2 se adaugă la numărător și 4 se adaugă la numitor, adică p` = (X + 2) / (N + 4), unde X este numărul de participanți la studiu care au caracteristica studiată și N este dimensiunea eșantionului. Această modificare produce rezultate foarte asemănătoare cu formula lui Wilson, cu excepția cazului în care frecvența evenimentelor se apropie de 0% sau 100% și eșantionul este mic. Pe lângă metodele de mai sus pentru calcularea intervalelor de încredere pentru frecvențe, au fost propuse corecții de continuitate atât pentru metodele Wald, cât și pentru cele Wilson pentru eșantioane mici, dar studiile au arătat că utilizarea lor este inadecvată.

    Să luăm în considerare aplicarea metodelor de mai sus pentru calcularea intervalelor de încredere folosind două exemple. În primul caz, studiem un eșantion mare de 1.000 de participanți la studiu selectați aleatoriu, dintre care 450 au trăsătura studiată (aceasta ar putea fi un factor de risc, un rezultat sau orice altă trăsătură), reprezentând o frecvență de 0,45 sau 45. %. În al doilea caz, studiul se desfășoară folosind un eșantion mic, să zicem, doar 20 de persoane și doar 1 participant la studiu (5%) are trăsătura studiată. Intervalele de încredere conform metodei Wald, conform metodei Wald cu corectie Agresti-Coll, conform metodei Wilson au fost calculate folosind un calculator online dezvoltat de Jeff Sauro (http://www. /wald. htm). Intervalele de încredere corectate ale lui Wilson au fost calculate utilizând calculatorul furnizat de Wassar Stats: Web Site for Statistical Computation (http://faculty.vassar.edu/lowry/prop1.html). Calculele de transformare Angular Fisher au fost efectuate manual folosind valoarea critică t pentru 19 și, respectiv, 999 de grade de libertate. Rezultatele calculului sunt prezentate în tabel pentru ambele exemple.

    Intervale de încredere calculate cu șase în moduri diferite pentru cele două exemple descrise în text

    Metoda de calcul a intervalului de încredere

    P=0,0500 sau 5%

    95% CI pentru X=450, N=1000, P=0,4500 sau 45%

    –0,0455–0,2541

    Wald cu corectie Agresti–Coll

    <,0001–0,2541

    Wilson cu corecție de continuitate

    „metoda exactă” Clopper-Pearson

    Transformare unghiulară

    <0,0001–0,1967

    După cum se poate observa din tabel, pentru primul exemplu intervalul de încredere calculat folosind metoda Wald „general acceptată” intră în regiunea negativă, ceea ce nu poate fi cazul frecvențelor. Din păcate, astfel de incidente nu sunt neobișnuite în literatura rusă. Modul tradițional de prezentare a datelor în termeni de frecvență și eroarea acesteia maschează parțial această problemă. De exemplu, dacă frecvența de apariție a unei trăsături (în procente) este prezentată ca 2,1 ± 1,4, atunci aceasta nu este la fel de „ofensivă pentru ochi” ca 2,1% (IC 95%: -0,7; 4,9), deși și înseamnă acelasi lucru. Metoda Wald cu corecția Agresti–Coll și calculul folosind transformarea unghiulară oferă o limită inferioară care tinde spre zero. Metoda lui Wilson corectată în funcție de continuitate și „metoda exactă” produc intervale de încredere mai largi decât metoda lui Wilson. Pentru al doilea exemplu, toate metodele dau aproximativ aceleași intervale de încredere (diferențele apar numai în miimi), ceea ce nu este surprinzător, deoarece frecvența de apariție a evenimentului din acest exemplu nu este mult diferită de 50%, iar dimensiunea eșantionului este destul de mare.

    Pentru cititorii interesați de această problemă, le putem recomanda lucrările lui R. G. Newcombe și Brown, Cai și Dasgupta, care oferă avantajele și dezavantajele utilizării a 7 și, respectiv, 10 metode diferite pentru calcularea intervalelor de încredere. Dintre manualele interne, recomandăm cartea și, care, pe lângă o descriere detaliată a teoriei, prezintă metodele lui Wald și Wilson, precum și o metodă de calcul a intervalelor de încredere ținând cont de distribuția binomială a frecvenței. Pe lângă calculatoarele online gratuite (http://www. /wald. htm și http://faculty. vassar. edu/lowry/prop1.html), intervalele de încredere pentru frecvențe (și nu numai!) pot fi calculate folosind Programul CIA (Confidence Intervals Analysis), care poate fi descărcat de pe http://www. şcoala de medicină. soton. ac. uk/cia/ .

    Următorul articol va analiza modalități univariate de a compara datele calitative.

    Referințe

    Statistica medicală în limbaj clar: un curs introductiv / A. Banerjee. – M.: Medicină practică, 2007. – 287 p. Statistici medicale / . – M.: Agenția de Informații Medicale, 2007. – 475 p. Statistică medicală şi biologică / S. Glanz. – M.: Praktika, 1998. Tipuri de date, testare de distribuție și statistică descriptivă // Ecologie umană – 2008. – Nr. 1. – P. 52–58. CU. Statistici medicale: manual / . – Rostov n/d: Phoenix, 2007. – 160 p. Statistici medicale aplicate / , . – Sankt Petersburg. : Foliot, 2003. – 428 p. F. Biometrie / . – M.: Şcoala superioară, 1990. – 350 p. O. Statistica matematică în medicină / , . – M.: Finanțe și Statistică, 2007. – 798 p. Statistica matematică în cercetarea clinică / , . – M.: GEOTAR-MED, 2001. – 256 p. Junkerov V. ŞI. Prelucrarea medicala si statistica a datelor de cercetare medicala / , . – Sankt Petersburg. : VmedA, 2002. – 266 p. Agresti A. Aproximat este mai bine decât exact pentru estimarea pe intervale a proporțiilor binomiale / A. Agresti, B. Coull // Statistician american. – 1998. – N 52. – P. 119–126. Altman D. Statistici cu încredere // D. Altman, D. Machin, T. Bryant, M. J. Gardner. – Londra: BMJ Books, 2000. – 240 p. Brown L.D. Estimarea intervalului pentru o proporție binomială / L. D. Brown, T. T. Cai, A. Dasgupta // Statistical science. – 2001. – N 2. – P. 101–133. Clopper C.J. Utilizarea limitelor de încredere sau fiduciale ilustrate în cazul binomului / C. J. Clopper, E. S. Pearson // Biometrika. – 1934. – N 26. – P. 404–413. Garcia-Perez M.A. Despre intervalul de încredere pentru parametrul binom / M. A. Garcia-Perez // Calitate și cantitate. – 2005. – N 39. – P. 467–481. Motulsky H. Biostatistică intuitivă // H. Motulsky. – Oxford: Oxford University Press, 1995. – 386 p. Newcombe R. G. Intervale de încredere pe două părți pentru o singură proporție: comparație a șapte metode / R. G. Newcombe // Statistics in Medicine. – 1998. – N. 17. – P. 857–872. Sauro J. Estimarea ratelor de finalizare din eșantioane mici folosind intervale de încredere binomiale: comparații și recomandări / J. Sauro, J. R. Lewis // Proceedings of the human factors and ergonomics society annual meeting. – Orlando, FL, 2005. Wald A. Limite de încredere pentru funcțiile de distribuție continuă // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. – 1939. – N 10. – P. 105–118. Wilson E.B. Inferență probabilă, legea succesiunii și inferență statistică / E. B. Wilson // Journal of American Statistical Association. – 1927. – N 22. – P. 209–212.

    INTERVALE DE ÎNCREDERE PENTRU PROPORȚII

    O. M. Grjibovski

    Institutul Național de Sănătate Publică, Oslo, Norvegia

    Articolul prezintă mai multe metode de calcul a intervalelor de încredere pentru proporții binomiale, și anume, metodele Wald, Wilson, arcsinus, Agresti-Coull și exacte Clopper-Pearson. Lucrarea oferă doar o introducere generală a problemei estimării intervalului de încredere a unei proporții binomiale și scopul său este nu numai de a stimula cititorii să folosească intervalele de încredere atunci când prezintă rezultatele propriilor cercetări empirice, ci și de a-i încuraja să consulte cărți de statistică. înainte de a analiza propriile date și de a pregăti manuscrise.

    Cuvinte cheie: interval de încredere, proporție

    Informații de contact:

    Consilier principal, Institutul Național de Sănătate Publică, Oslo, Norvegia

    Astăzi este într-adevăr prea ușor: poți merge până la un computer și, cu puține sau deloc cunoștințe despre ceea ce faci, poți crea inteligență și prostii cu o viteză cu adevărat uluitoare. (J. Box)

    Intervalele de încredere

    Prezentare generală

    Luând un eșantion din populație, obținem o estimare punctuală a parametrului de interes și calculăm eroarea standard pentru a indica precizia estimării.

    Cu toate acestea, pentru majoritatea cazurilor, eroarea standard ca atare nu este acceptabilă. Este mult mai util să combinați această măsură de precizie cu o estimare a intervalului pentru parametrul populației.

    Acest lucru se poate face prin utilizarea cunoștințelor distribuției teoretice de probabilitate a statisticii (parametrului) eșantionului pentru a calcula un interval de încredere (CI - Intervalul de încredere, CI - Intervalul de încredere) pentru parametru.

    În general, un interval de încredere extinde estimările în ambele direcții cu un anumit multiplu al erorii standard (a unui parametru dat); cele două valori (limitele de încredere) care definesc intervalul sunt de obicei separate prin virgulă și cuprinse între paranteze.

    Interval de încredere pentru medie

    Folosind distribuția normală

    Media eșantionului este distribuită în mod normal dacă dimensiunea eșantionului este mare, astfel încât să puteți aplica cunoștințele despre distribuția normală atunci când luați în considerare media eșantionului.

    Mai exact, 95% din distribuția mediilor eșantionului se află în 1,96 deviații standard (SD) față de media populației.

    Când avem un singur eșantion, îl numim eroarea standard a mediei (SEM) și calculăm intervalul de încredere de 95% pentru medie după cum urmează:

    Dacă repetăm ​​acest experiment de mai multe ori, intervalul va conține media reală a populației în 95% din timp.

    De obicei, acesta este un interval de încredere, cum ar fi intervalul de valori în care se află media reală a populației (media generală) cu un nivel de încredere de 95%.

    Deși nu este în întregime riguros (media populației este o valoare fixă ​​și, prin urmare, nu poate avea o probabilitate atașată) să interpretăm un interval de încredere în acest fel, este conceptual mai ușor de înțeles.

    Utilizare t- distributie

    Puteți folosi distribuția normală dacă cunoașteți valoarea varianței în populație. De asemenea, atunci când dimensiunea eșantionului este mică, media eșantionului urmează o distribuție normală dacă datele populației subiacente sunt distribuite în mod normal.

    Dacă datele care stau la baza populației nu sunt distribuite în mod normal și/sau varianța generală (varianța în populație) este necunoscută, media eșantionului se supune Distribuția t a studentului.

    Calculăm intervalul de încredere de 95% pentru media populației generale după cum urmează:

    Unde este punctul procentual (percentila) t- Distribuția t a lui Student cu (n-1) grade de libertate, care dă o probabilitate cu două fețe de 0,05.

    În general, oferă o gamă mai largă decât utilizarea distribuției normale deoarece ia în considerare incertitudinea suplimentară introdusă prin estimarea abaterii standard a populației și/sau datorită dimensiunii reduse a eșantionului.

    Când dimensiunea eșantionului este mare (de ordinul a 100 sau mai mult), diferența dintre cele două distribuții ( t-Studentși normal) este nesemnificativă. Cu toate acestea, ele folosesc întotdeauna t- distribuția la calcularea intervalelor de încredere, chiar dacă dimensiunea eșantionului este mare.

    De obicei este raportat IC de 95%. Alte intervale de încredere pot fi calculate, cum ar fi IC 99% pentru medie.

    În loc de produsul erorii standard și valoarea tabelului t- distribuție, care corespunde unei probabilități cu două fețe de 0,05, înmulțiți-o (eroarea standard) cu valoarea care corespunde unei probabilități cu două fețe de 0,01. Acesta este un interval de încredere mai larg decât intervalul de încredere de 95%, deoarece reflectă o încredere crescută că intervalul include de fapt media populației.

    Interval de încredere pentru proporție

    Distribuția de eșantionare a proporțiilor are o distribuție binomială. Cu toate acestea, dacă dimensiunea eșantionului n este rezonabil de mare, atunci distribuția de eșantionare a proporției este aproximativ normală cu media .

    Evaluăm prin raport selectiv p=r/n(Unde r- numărul de indivizi din eșantion cu trăsăturile caracteristice care ne interesează), iar eroarea standard este estimată:

    Intervalul de încredere de 95% pentru proporție este estimat:

    Dacă dimensiunea eșantionului este mică (de obicei când n.p. sau n(1-p) Mai puțin 5 ), atunci este necesar să se utilizeze distribuția binomială pentru a calcula intervalele de încredere precise.

    Rețineți că dacă p exprimat ca procent, atunci (1-p)înlocuit cu (100-p).

    Interpretarea intervalelor de încredere

    Când interpretăm un interval de încredere, ne interesează următoarele întrebări:

    Cât de larg este intervalul de încredere?

    Un interval larg de încredere indică faptul că estimarea este imprecisă; îngust indică o estimare precisă.

    Lățimea intervalului de încredere depinde de mărimea erorii standard, care, la rândul său, depinde de dimensiunea eșantionului și, atunci când se ia în considerare o variabilă numerică, variabilitatea datelor produce intervale de încredere mai largi decât studiile unui set mare de date cu puține variabile. .

    CI include valori de interes deosebit?

    Puteți verifica dacă valoarea probabilă pentru un parametru de populație se încadrează în intervalul de încredere. Dacă da, rezultatele sunt în concordanță cu această valoare probabilă. Dacă nu, atunci este puțin probabil (pentru un interval de încredere de 95% șansa este de aproape 5%) ca parametrul să aibă acea valoare.

    Luând un eșantion din populație, obținem o estimare punctuală a parametrului de interes și calculăm eroarea standard pentru a indica precizia estimării.

    Cu toate acestea, pentru majoritatea cazurilor, eroarea standard ca atare nu este acceptabilă. Este mult mai util să combinați această măsură de precizie cu o estimare a intervalului pentru parametrul populației.

    Acest lucru se poate realiza prin utilizarea cunoștințelor distribuției teoretice de probabilitate a statisticii (parametrului) eșantionului pentru a calcula intervalul de încredere (CI - Interval de încredere, DI – Interval de încredere) pentru parametru.

    Deloc, interval de încredere extinde estimările în ambele direcții cu o anumită valoare care este un multiplu al erorii standard (a unui parametru dat); cele două valori (limitele de încredere) care definesc intervalul sunt de obicei separate prin virgulă și cuprinse între paranteze.

    În statistică, a interval de încredere(CI) este un tip de estimare pe intervale a unui parametru de populație. Este un interval observat (adică este calculat din observații), în principiu diferit de la probă la probă, care include frecvent valoarea unui parametru de interes neobservabil dacă experimentul este repetat. Cât de frecvent intervalul observat conține parametrul este determinată de nivelul de încredere sau coeficientul de încredere. Mai precis, sensul termenului „nivel de încredere” este că, dacă CI sunt construite pe baza multor analize separate de date ale experimentelor replicate (și posibil diferite), proporția acestor intervale care conțin valoarea adevărată a parametrului se va potrivi cu cea dată. nivelul de încredere În timp ce limitele de încredere cu două laturi formează un interval de încredere, omologii lor unilaterali sunt denumite limite inferioare/superioare de încredere (sau limite).


    Intervalul de încredere arată în ce interval vor fi situate rezultatele observațiilor eșantionului (sondajelor). Dacă efectuăm 100 de anchete identice în eșantioane identice dintr-o singură populație (de exemplu, 100 de eșantioane a câte 1000 de persoane fiecare într-un oraș cu o populație de 5 milioane de locuitori), atunci la un nivel de încredere de 95%, 95 din 100 de rezultate se vor încadra în intervalul de încredere (de exemplu, de la 28% la 32% cu o valoare reală de 30%). De exemplu, numărul real al locuitorilor orașului care fumează este de 30%. Dacă eșantionăm 1000 de persoane de 100 de ori la rând și punem întrebarea „Fumați în aceste mostre, în 95 din aceste 100 de eșantioane, cu un interval de încredere de 2%, valoarea va fi de la 28% la 32%.

    Formule pentru construirea intervalelor de încredere cu exemple practice pot fi găsite, de exemplu,.

    Interpretarea intervalelor de încredere

    Când interpretăm un interval de încredere, ne interesează următoarele întrebări:

    Cât de larg este intervalul de încredere?

    Un interval larg de încredere indică faptul că estimarea este imprecisă; îngust indică o estimare precisă.
    Lățimea intervalului de încredere depinde de mărimea erorii standard, care, la rândul său, depinde de dimensiunea eșantionului și, atunci când se ia în considerare o variabilă numerică, variabilitatea datelor produce intervale de încredere mai largi decât studiile unui set mare de date cu puține variabile. .

    CI include valori de interes deosebit?

    Puteți verifica dacă valoarea probabilă pentru un parametru de populație se încadrează în intervalul de încredere. Dacă da, rezultatele sunt în concordanță cu această valoare probabilă. Dacă nu, atunci este puțin probabil (pentru un interval de încredere de 95% șansa este de aproape 5%) ca parametrul să aibă acea valoare. ()

    Una dintre metodele de rezolvare a problemelor statistice este calcularea intervalului de încredere. Este utilizat ca o alternativă preferată la estimarea punctuală atunci când dimensiunea eșantionului este mică. Trebuie remarcat faptul că procesul de calcul al intervalului de încredere în sine este destul de complex. Dar instrumentele programului Excel vă permit să o simplificați oarecum. Să aflăm cum se face acest lucru în practică.

    Această metodă este utilizată pentru estimarea pe intervale a diferitelor mărimi statistice. Sarcina principală a acestui calcul este de a scăpa de incertitudinile estimării punctuale.

    În Excel, există două opțiuni principale pentru efectuarea calculelor folosind această metodă: când varianța este cunoscută și când este necunoscută. În primul caz, funcția este utilizată pentru calcule ÎNCREDERE.NORMĂ, iar în al doilea - ADMINISTRATOR.STUDENT.

    Metoda 1: Funcția NORM DE ÎNCREDERE

    Operator ÎNCREDERE.NORMĂ, care aparține grupului statistic de funcții, a apărut pentru prima dată în Excel 2010. Versiunile anterioare ale acestui program folosesc analogul său ÎNCREDERE. Scopul acestui operator este de a calcula un interval de încredere distribuit normal pentru media populației.

    Sintaxa sa este următoarea:

    CONFIDENCE.NORM(alpha;standard_off;size)

    "Alfa"— un argument care indică nivelul de semnificație care este utilizat pentru a calcula nivelul de încredere. Nivelul de încredere este egal cu următoarea expresie:

    (1-"Alfa")*100

    „Abaterea standard”- Acesta este un argument, a cărui esență este clară din nume. Aceasta este abaterea standard a eșantionului propus.

    "Dimensiune"— argument care definește dimensiunea eșantionului.

    Toate argumentele aduse acestui operator sunt necesare.

    Funcţie ÎNCREDERE are exact aceleași argumente și posibilități ca și precedentul. Sintaxa sa este:

    TRUST(alpha, standard_off, dimensiune)

    După cum puteți vedea, diferențele sunt doar în numele operatorului. Din motive de compatibilitate, această funcție este lăsată în Excel 2010 și versiunile mai noi într-o categorie specială "Compatibilitate". În versiunile Excel 2007 și anterioare, acesta este prezent în grupul principal de operatori statistici.

    Limita intervalului de încredere este determinată folosind următoarea formulă:

    X+(-)INCREDEREA NORM

    Unde X este valoarea medie a eșantionului, care se află la mijlocul intervalului selectat.

    Acum să ne uităm la cum să calculăm un interval de încredere folosind un exemplu specific. Au fost efectuate 12 teste, rezultând rezultate diferite, enumerate în tabel. Aceasta este totalitatea noastră. Abaterea standard este 8. Trebuie să calculăm intervalul de încredere la nivelul de încredere de 97%.

    1. Selectați celula în care va fi afișat rezultatul prelucrării datelor. Faceți clic pe butonul „Inserare funcție”.
    2. Apare Expertul de funcții. Mergi la categorie "Statistic"și evidențiați numele „TRUST.NORM”. După aceea, faceți clic pe butonul "BINE".
    3. Se deschide fereastra de argumente. Câmpurile sale corespund în mod firesc cu numele argumentelor.
      Plasați cursorul în primul câmp - "Alfa". Aici ar trebui să indicăm nivelul de semnificație. După cum ne amintim, nivelul nostru de încredere este de 97%. În același timp, am spus că se calculează astfel:

      (1-nivel de încredere)/100

      Adică, înlocuind valoarea, obținem:

      Prin calcule simple aflăm că argumentul "Alfa" egală 0,03 . Introduceți această valoare în câmp.

      După cum se știe, prin condiție abaterea standard este egală cu 8 . Prin urmare, pe teren „Abaterea standard” doar notează acest număr.

      În câmp "Dimensiune" trebuie să introduceți numărul de elemente de testare efectuate. După cum ne amintim, lor 12 . Dar pentru a automatiza formula și a nu o edita de fiecare dată când efectuăm un nou test, să setăm această valoare nu cu un număr obișnuit, ci folosind operatorul VERIFICA. Deci, să plasăm cursorul în câmp "Dimensiune", apoi faceți clic pe triunghi, care se află în stânga barei de formule.

      Apare o listă cu funcțiile utilizate recent. Dacă operatorul VERIFICA a fost folosit recent de dvs., ar trebui să fie pe această listă. În acest caz, trebuie doar să faceți clic pe numele acestuia. În caz contrar, dacă nu îl găsești, mergi la subiect „Alte funcții...”.

    4. Apare unul deja familiar Expertul de funcții. Să ne întoarcem din nou la grup "Statistic". Evidențiem numele acolo "VERIFICA". Faceți clic pe butonul "BINE".
    5. Apare fereastra de argument pentru afirmația de mai sus. Această funcție este concepută pentru a calcula numărul de celule dintr-un interval specificat care conțin valori numerice. Sintaxa sa este următoarea:

      COUNT(valoare1,valoare2,...)

      Grupul de argumentare "Valori" este o referință la intervalul în care doriți să calculați numărul de celule umplute cu date numerice. Pot exista până la 255 de astfel de argumente în total, dar în cazul nostru avem nevoie doar de unul.

      Plasați cursorul în câmp „Valoare 1”și, ținând apăsat butonul stâng al mouse-ului, selectați pe foaie gama care conține colecția noastră. Apoi adresa lui va fi afișată în câmp. Faceți clic pe butonul "BINE".

    6. După aceasta, aplicația va efectua calculul și va afișa rezultatul în celula în care se află. În cazul nostru particular, formula arăta astfel:

      NORMĂ DE ÎNCREDERE(0,03,8,NUMĂRĂ(B2:B13))

      Rezultatul general al calculelor a fost 5,011609 .

    7. Dar asta nu este tot. După cum ne amintim, limita intervalului de încredere este calculată prin adăugarea și scăderea rezultatului calculului din media eșantionului ÎNCREDERE.NORMĂ. În acest fel, se calculează limitele din dreapta și respectiv din stânga intervalului de încredere. Media eșantionului în sine poate fi calculată folosind operatorul MEDIE.

      Acest operator este conceput pentru a calcula media aritmetică a unui interval selectat de numere. Are următoarea sintaxă destul de simplă:

      MEDIE(numărul1,numărul2,...)

      Argument "Număr" poate fi fie o singură valoare numerică, fie o referință la celule sau chiar intervale întregi care le conțin.

      Deci, selectați celula în care va fi afișat calculul valorii medii și faceți clic pe butonul „Inserare funcție”.

    8. Se deschide Expertul de funcții. Revenind la categorie "Statistic"și selectați un nume din listă "MEDIE". Ca întotdeauna, faceți clic pe butonul "BINE".
    9. Se deschide fereastra de argumente. Plasați cursorul în câmp „Numărul 1”și ținând apăsat butonul stâng al mouse-ului, selectați întregul interval de valori. După ce coordonatele sunt afișate în câmp, faceți clic pe butonul "BINE".
    10. După care MEDIE afișează rezultatul calculului într-un element de foaie.
    11. Calculăm limita dreaptă a intervalului de încredere. Pentru a face acest lucru, selectați o celulă separată și puneți semnul «=» și se adună conținutul elementelor foii în care se află rezultatele calculelor de funcție MEDIEŞi ÎNCREDERE.NORMĂ. Pentru a efectua calculul, apăsați butonul Intră. În cazul nostru, avem următoarea formulă:

      Rezultatul calculului: 6,953276

    12. La fel se calculează limita din stânga a intervalului de încredere, doar de data aceasta din rezultatul calculului MEDIE scade rezultatul calculului operatorului ÎNCREDERE.NORMĂ. Formula rezultată pentru exemplul nostru este de următorul tip:

      Rezultatul calculului: -3,06994

    13. Am încercat să descriem în detaliu toți pașii pentru calcularea intervalului de încredere, așa că am descris fiecare formulă în detaliu. Dar puteți combina toate acțiunile într-o singură formulă. Calculul limitei drepte a intervalului de încredere poate fi scris după cum urmează:

      MEDIE(B2:B13)+INCREDERE.NORMĂ(0,03,8,NUMĂRĂ(B2:B13))

    14. Un calcul similar pentru marginea din stânga ar arăta astfel:

      MEDIE(B2:B13)-CONFIDENCE.NORM(0,03,8,NUMĂR (B2:B13))

    Metoda 2: Funcția STUDENT DE ÎNCREDERE

    În plus, Excel are o altă funcție care este asociată cu calcularea intervalului de încredere - ADMINISTRATOR.STUDENT. A apărut doar în Excel 2010. Acest operator calculează intervalul de încredere al populației folosind distribuția Student. Este foarte convenabil de utilizat atunci când varianța și, în consecință, abaterea standard sunt necunoscute. Sintaxa operatorului este:

    CONFIDENCE.STUDENT(alpha,standard_off,size)

    După cum puteți vedea, numele operatorilor au rămas neschimbate în acest caz.

    Să vedem cum să calculăm limitele unui interval de încredere cu o abatere standard necunoscută folosind exemplul aceleiași populații pe care am considerat-o în metoda anterioară. Să luăm nivelul de încredere ca ultima dată la 97%.

    1. Selectați celula în care va fi efectuat calculul. Faceți clic pe butonul „Inserare funcție”.
    2. În deschis Expertul de funcții mergi la categorie "Statistic". Selectați un nume „ELEV DE ÎNCREDERE”. Faceți clic pe butonul "BINE".
    3. Se lansează fereastra de argumente pentru operatorul specificat.

      În câmp "Alfa", având în vedere că nivelul de încredere este de 97%, notăm numărul 0,03 . Pentru a doua oară nu ne vom opri asupra principiilor calculării acestui parametru.

      După aceasta, plasați cursorul în câmp „Abaterea standard”. De data aceasta, acest indicator ne este necunoscut și trebuie calculat. Acest lucru se face folosind o funcție specială - STDEV.V. Pentru a deschide fereastra acestui operator, faceți clic pe triunghiul din stânga barei de formule. Dacă nu găsim numele dorit în lista care se deschide, atunci mergeți la articol „Alte funcții...”.

    4. Începe Expertul de funcții. Trecerea la categorie "Statistic"și marcați numele în el „STDEV.B”. Apoi faceți clic pe butonul "BINE".
    5. Se deschide fereastra de argumente. Sarcina operatorului STDEV.V este de a determina abaterea standard a unei probe. Sintaxa sa arată astfel:

      DEVIARE STANDARD.B(număr1;număr2;…)

      Nu este greu de ghicit că argumentul "Număr" este adresa elementului de selecție. Dacă selecția este plasată într-o singură matrice, atunci puteți utiliza un singur argument pentru a furniza o legătură către acest interval.

      Plasați cursorul în câmp „Numărul 1”și, ca întotdeauna, ținând apăsat butonul stâng al mouse-ului, selectați colecția. După ce coordonatele sunt în câmp, nu vă grăbiți să apăsați butonul "BINE", deoarece rezultatul va fi incorect. Mai întâi trebuie să revenim la fereastra de argumente operator ADMINISTRATOR.STUDENT pentru a adăuga argumentul final. Pentru a face acest lucru, faceți clic pe numele corespunzător din bara de formule.

    6. Fereastra de argumente pentru funcția deja familiară se deschide din nou. Plasați cursorul în câmp "Dimensiune". Din nou, faceți clic pe triunghiul cu care suntem deja familiarizați pentru a merge la selecția operatorilor. După cum înțelegeți, avem nevoie de un nume "VERIFICA". Deoarece am folosit această funcție în calculele din metoda anterioară, este prezentă în această listă, așa că faceți clic pe ea. Dacă nu îl găsiți, atunci urmați algoritmul descris în prima metodă.
    7. Odată ajuns în fereastra de argumente VERIFICA, plasați cursorul în câmp „Numărul 1”și cu butonul mouse-ului ținut apăsat, selectați colecția. Apoi faceți clic pe butonul "BINE".
    8. După aceasta, programul efectuează un calcul și afișează valoarea intervalului de încredere.
    9. Pentru a determina limitele, va trebui din nou să calculăm media eșantionului. Dar, având în vedere că algoritmul de calcul folosind formula MEDIE la fel ca în metoda anterioară și chiar și rezultatul nu s-a schimbat, nu ne vom opri asupra acestui lucru în detaliu a doua oară.
    10. Însumarea rezultatelor calculului MEDIEŞi ADMINISTRATOR.STUDENT, obținem limita dreaptă a intervalului de încredere.
    11. Scăzând din rezultatele de calcul ale operatorului MEDIE rezultatul calculului ADMINISTRATOR.STUDENT, avem limita din stânga a intervalului de încredere.
    12. Dacă calculul este scris într-o singură formulă, atunci calculul limitei drepte în cazul nostru va arăta astfel:

      MEDIE(B2:B13)+ÎNCREDERE.STUDENT(0,03,STDEV.B(B2:B13),NUMĂR(B2:B13))

    13. În consecință, formula pentru calcularea marginii din stânga va arăta astfel:

      MEDIE(B2:B13)-INCREDERE.STUDENT(0,03,STDEV.B(B2:B13),NUMĂR(B2:B13))

    După cum puteți vedea, instrumentele Excel facilitează calcularea intervalului de încredere și a limitelor acestuia. În aceste scopuri, se folosesc operatori separați pentru eșantioanele a căror varianță este cunoscută și necunoscută.

    Calculul intervalului de încredere se bazează pe eroarea medie a parametrului corespunzător. Interval de încredere arată în ce limite cu probabilitate (1-a) se află adevărata valoare a parametrului estimat. Aici a este nivelul de semnificație, (1-a) se mai numește și probabilitate de încredere.

    În primul capitol am arătat că, de exemplu, pentru media aritmetică, media reală a populației în aproximativ 95% din cazuri se află în 2 erori standard ale mediei. Astfel, limitele intervalului de încredere de 95% pentru medie vor fi separate de media eșantionului de două ori eroarea medie a mediei, i.e. înmulțim eroarea medie a mediei cu un anumit coeficient în funcție de nivelul de încredere. Pentru medie și diferența de medii se ia coeficientul Student (valoarea critică a testului Student), pentru ponderea și diferența de cote, valoarea critică a testului z. Produsul dintre coeficient și eroarea medie poate fi numit eroarea maximă a unui parametru dat, adică maximul pe care îl putem obţine la evaluarea acestuia.

    Interval de încredere pentru medie aritmetică : .

    Iată media eșantionului;

    Eroarea medie a mediei aritmetice;

    s – abaterea standard a probei;

    n

    f = n-1 (Coeficientul elevului).

    Interval de încredere pentru diferențe de medii aritmetice :

    Iată diferența dintre mediile eșantionului;

    - eroarea medie a diferenţei dintre mediile aritmetice;

    s 1 , s 2 – abateri standard ale probei;

    n1,n2

    Valoarea critică a testului Student pentru un anumit nivel de semnificație a și numărul de grade de libertate f=n 1 + n 2-2 (Coeficientul elevului).

    Interval de încredere pentru acțiuni :

    .

    Aici d este fracția eșantionului;

    – eroare medie de fracție;

    n– dimensiunea eșantionului (mărimea grupului);

    Interval de încredere pentru diferenta de actiuni :

    Iată diferența dintre acțiunile eșantionului;

    – eroarea medie a diferenței dintre mediile aritmetice;

    n1,n2– volume de probe (număr de grupuri);

    Valoarea critică a criteriului z la un nivel de semnificație dat a ( , , ).

    Prin calcularea intervalelor de încredere pentru diferența dintre indicatori, în primul rând, vedem direct valorile posibile ale efectului, și nu doar estimarea punctuală a acestuia. În al doilea rând, putem trage o concluzie despre acceptarea sau respingerea ipotezei nule și, în al treilea rând, putem trage o concluzie despre puterea testului.

    Când testați ipoteze folosind intervale de încredere, trebuie să respectați următoarea regulă:

    Dacă intervalul de încredere de 100(1-a) procente al diferenței de medii nu conține zero, atunci diferențele sunt semnificative statistic la nivelul de semnificație a; dimpotrivă, dacă acest interval conține zero, atunci diferențele nu sunt semnificative statistic.

    Într-adevăr, dacă acest interval conține zero, atunci indicatorul comparat poate fi fie mai mare, fie mai mic într-unul dintre grupuri comparativ cu celălalt, adică. diferenţele observate se datorează întâmplării.

    Puterea testului poate fi judecată după locația lui zero în intervalul de încredere. Dacă zero este aproape de limita inferioară sau superioară a intervalului, atunci poate cu un număr mai mare de grupuri comparate, diferențele ar ajunge la semnificație statistică. Dacă zero este aproape de mijlocul intervalului, înseamnă că atât o creștere, cât și o scădere a indicatorului în grupul experimental sunt la fel de probabile și, probabil, chiar nu există diferențe.

    Exemple:

    Pentru a compara mortalitatea chirurgicală la utilizarea a două tipuri diferite de anestezie: 61 de persoane au fost operate cu primul tip de anestezie, 8 au murit, cu al doilea tip – 67 de persoane, 10 au murit.

    d 1 = 8/61 = 0,131; d2 = 10/67 = 0,149; d1-d2 = - 0,018.

    Diferența de letalitate a metodelor comparate va fi în intervalul (-0,018 - 0,122; -0,018 + 0,122) sau (-0,14; 0,104) cu o probabilitate de 100(1-a) = 95%. Intervalul conține zero, adică. ipoteza mortalităţii egale cu două tipuri diferite de anestezie nu poate fi respinsă.

    Astfel, rata mortalității poate și va scădea la 14% și crește la 10,4% cu o probabilitate de 95%, adică. zero este aproximativ la mijlocul intervalului, deci se poate argumenta că, cel mai probabil, aceste două metode nu diferă într-adevăr în ceea ce privește letalitatea.

    În exemplul discutat mai devreme, timpul mediu de apăsare în timpul testului de atingere a fost comparat în patru grupuri de studenți care au fost diferite în ceea ce privește scorurile la examen. Să calculăm intervalele de încredere pentru timpul mediu de presare pentru studenții care au promovat examenul cu 2 și 5 note și intervalul de încredere pentru diferența dintre aceste medii.

    Coeficienții lui Student se găsesc folosind tabelele de distribuție a lui Student (vezi anexa): pentru prima grupă: = t(0,05;48) = 2,011; pentru a doua grupă: = t(0,05;61) = 2,000. Astfel, intervale de încredere pentru primul grup: = (162,19-2,011*2,18; 162,19+2,011*2,18) = (157,8; 166,6), pentru al doilea grup (156,55- 2.000*1,88 ; 156,805*1,88 ; =+1,805*1,805) ; 160,3). Deci, pentru cei care au promovat examenul cu 2, timpul mediu de apăsare variază de la 157,8 ms la 166,6 ms cu o probabilitate de 95%, pentru cei care au promovat examenul cu 5 – de la 152,8 ms la 160,3 ms cu o probabilitate de 95% .

    De asemenea, puteți testa ipoteza nulă folosind intervale de încredere pentru medii și nu doar pentru diferența de medii. De exemplu, ca și în cazul nostru, dacă intervalele de încredere pentru medii se suprapun, atunci ipoteza nulă nu poate fi respinsă. Pentru a respinge o ipoteză la un nivel de semnificație ales, intervalele de încredere corespunzătoare nu trebuie să se suprapună.

    Să aflăm intervalul de încredere pentru diferența în timpul mediu de presare la loturile care au promovat examenul cu note 2 și 5. Diferența de medii: 162,19 – 156,55 = 5,64. Coeficientul studentului: = t(0,05;49+62-2) = t(0,05;109) = 1,982. Abaterile standard de grup vor fi egale cu: ; . Se calculează eroarea medie a diferenței dintre medii: . Interval de încredere: =(5,64-1,982*2,87; 5,64+1,982*2,87) = (-0,044; 11,33).

    Așadar, diferența de timp mediu de presare în grupele care au promovat examenul cu 2 și 5 va fi în intervalul de la -0,044 ms la 11,33 ms. Acest interval include zero, adică Timpul mediu de presare pentru cei care au promovat bine examenul poate fie să crească, fie să scadă în comparație cu cei care au promovat examenul nesatisfăcător, adică. ipoteza nulă nu poate fi respinsă. Dar zero este foarte aproape de limita inferioară, iar timpul de presare este mult mai probabil să scadă pentru cei care au trecut bine. Astfel, putem concluziona că există încă diferențe în timpul mediu de presare între cei care au trecut de 2 și 5, pur și simplu nu le-am putut detecta având în vedere modificarea timpului mediu, răspândirea timpului mediu și dimensiunile eșantionului.

    Puterea unui test este probabilitatea de a respinge o ipoteză nulă incorectă, i.e. găsiți diferențele acolo unde acestea există de fapt.

    Puterea testului este determinată pe baza nivelului de semnificație, a mărimii diferențelor dintre grupuri, a răspândirii valorilor în grupuri și a mărimii eșantioanelor.

    Pentru testul t Student și analiza varianței, pot fi utilizate diagrame de sensibilitate.

    Puterea criteriului poate fi utilizată pentru a determina preliminar numărul necesar de grupuri.

    Intervalul de încredere arată în ce limite se află valoarea adevărată a parametrului estimat cu o probabilitate dată.

    Folosind intervale de încredere, puteți testa ipoteze statistice și puteți trage concluzii despre sensibilitatea criteriilor.

    LITERATURĂ.

    Glanz S. – Capitolul 6,7.

    Rebrova O.Yu. – p.112-114, p.171-173, p.234-238.

    Sidorenko E.V – p.32-33.

    Întrebări pentru autotestarea elevilor.

    1. Care este puterea criteriului?

    2. În ce cazuri este necesară evaluarea puterii criteriilor?

    3. Metode de calcul al puterii.

    6. Cum se testează o ipoteză statistică folosind un interval de încredere?

    7. Ce se poate spune despre puterea criteriului la calcularea intervalului de încredere?

    Sarcini.