Статистика за студентски t-тест

Студентски t-тест, в статистиката, метод за тестване на хипотези за средната стойност на малка извадка, получена от нормално разпределена популация, когато стандартното отклонение на популацията е неизвестно.

През 1908 г. Уилям Сили Госет, англичанин, издател под псевдонима Student, разработва t-test и t разпространението. Разпределението t е семейство от криви, в което броят на степените на свобода (броят на независимите наблюдения в извадката минус една) определя конкретна крива. Тъй като размерът на извадката (и по този начин степента на свобода) се увеличава, разпределението на t се приближава до формата на звънеца на стандартното нормално разпределение. На практика за тестове, включващи средната стойност на проба с размер по-голям от 30, обикновено се прилага нормалното разпределение.

Обикновено първо се формулира нулева хипотеза, която гласи, че няма ефективна разлика между наблюдаваната средна проба и средната хипотеза или заявена популация - т.е., че всяка измерена разлика се дължи само на случайността. Например в селскостопанско проучване, нулевата хипотеза би могла да бъде, че прилагането на тор не оказва влияние върху добива на културите и ще се извърши експеримент, за да се провери дали той е увеличил реколтата. Като цяло, t-тестът може да бъде или двустранен (също наричан двукрачен), като просто заявява, че средствата не са еквивалентни, или едностранчиви, като се уточнява дали наблюдаваната средна стойност е по-голяма или по-малка от средната хипотеза. След това се изчислява тестовата статистика t. Ако наблюдаваната t-статистика е по-крайна от критичната стойност, определена от подходящото референтно разпределение, нулевата хипотеза се отхвърля. Подходящото референтно разпределение за t-статистиката е t разпределението. Критичната стойност зависи от нивото на значимост на теста (вероятността за погрешно отхвърляне на нулевата хипотеза).

Да предположим, например, че изследовател желае да тества хипотезата, че извадка с размер n = 25 със средно x = 79 и стандартно отклонение s = 10 е изтеглена произволно от популация със средна μ = 75 и неизвестно стандартно отклонение. Използвайки формулата за t-статистиката, изчисленото t е равно на 2. За двустранен тест с общо ниво на значимост α = 0,05, критичните стойности от t разпределението на 24 градуса на свобода са −2.064 и 2.064. Изчисленото t не надвишава тези стойности, следователно нулевата хипотеза не може да бъде отхвърлена с 95-процентова увереност. (Нивото на доверие е 1 - α.)

Второ приложение на t разпределението тества хипотезата, че две независими случайни проби имат еднаква средна стойност. Разпределението t може също да се използва за изграждане на интервали на доверие за истинската средна стойност на съвкупност (първото приложение) или за разликата между две примерни средства (второто приложение). Вижте също интервална оценка.