Проводя статистическое исследование, необходимо учитывать, что никакой закономерности может и не быть.
Проводя научный эксперимент, мы анализируем полученную информацию, чтобы иметь возможность выбирать между гипотезами. К примеру, если вы полагаете, что природа должна вести себя в данной ситуации таким-то образом, и проводите эксперимент, чтобы это доказать или опровергнуть, вы ведь хотите иметь возможность заявить, что экспериментальные данные подтверждают вашу гипотезу, а не чью-либо еще. Иными словами, мы ожидаем, что данные докажут ту, а не иную зависимость результатов эксперимента от переменных. В большинстве случаев не существует единственного «чистого» эксперимента, так что нам приходится многократно повторять измерения, чтобы получить гарантию достоверности результата. Поэтому мы часто нуждаемся в статистическом анализе полученной информации. Часто оказывается, что результат зависит от множества факторов. В этом случае нам необходимо отделить главные из них от второстепенных — зерно от шелухи.
Например, когда ученый хочет найти связь между курением и раком легких, ему не достаточно найти одного курильщика, получившего (или не получившего) рак легких. Должен быть собран и проанализирован значительный объем данных, прежде чем этот ученый сможет утверждать, что между курением и раком легких существует зависимость. В исследованиях такого рода нулевая гипотеза играет ключевую роль. Нулевая гипотеза — это, по сути, предположение, что результата — конечной цели любого исследования — не существует. И как бы далеко ни зашли ваши поиски взаимосвязи между курением и раком легких, нулевая гипотеза будет утверждать, что никакой такой взаимосвязи не существует. Встает вопрос, в какой момент собранных данных станет достаточно, чтобы отвергнуть это утверждение.
Если говорить о курении и раке легких, то нулевая гипотеза была исключена уже давно: ни один уважающий себя ученый не прибегнет к ней сейчас. Но было время, когда просто-напросто не хватало данных, чтобы ее исключить; и исследователи не могли доказать, что заболеваемость раком легких среди курящих и некурящих людей не была лишь делом случая. Только имея большой массив данных и тем самым сводя возможность случайного результата к минимуму, можно исключить нулевую гипотезу.
В нашем примере приходилось накапливать большое количество данных — ученые скажут «большую выборку», — чтобы исключить нулевую гипотезу. Но может быть и по-другому. Например, Тихо Браге, чья многолетняя работа привела к созданию законов Кеплера о планетарном движении, просто проводил наиболее точные измерения, которых оказалось достаточно, чтобы отвергнуть нулевую гипотезу и убедиться в верности результата.
Итак, когда вы в следующий раз будете читать работу, в которой утверждается о наличие корреляции между заболеванием и его предполагаемой причиной, спросите себя, действительно ли исследователи рассмотрели достаточное количество случаев, прежде чем исключить нулевую гипотезу.