Ф. Давидофф
Как поставить биостатистику с головы на ноги?

Translated, with permission of the ACP—ASIM, from: Davidoff F. Standing statistic right side up. Ann Intern Med 1999;130:1019—21.


В течение многих лет преподавания я обучаю студентов основам диагностики. В начале лекции я объясняю, что чувствительность диагностического метода при заболевании Х равна доле положительных результатов в популяции людей, у которых, согласно результатам другого, надежного и не зависящего от данных иных методов обследования теста (диагностического, или "золотого", стандарта), имеется заболевание Х. Иными словами, чувствительность теста равна доле истиннопо ложительных результатов в популяции больных: например, при выявлении 95 из 100 заведомо больных она составляет 0,95. Затем я перехожу к понятию специфичности теста, отражающей вероятность того, что у людей, которые по данным диагностического стандарта не имеют заболевания Х, результат теста не будет положительным. При 10 ложноположительных результатах теста на 100 здоровых людей его специфичность составит 0,90.

Наконец, я предлагаю студентам решить следующую задачу: какова вероятность наличия болезни Х, если при обследовании тест с упомянутыми выше чувствительностью и специфичностью дал положительный результат? В ответ я почти всегда слышу: "95%". Такой вывод кажется совершенно логичным, поскольку тест выявляет 95% людей с заболеванием Х, но в действительности он не только неправильный, но извращает сам процесс логического мышления.

Оценка чувствительности и специфичности диагностического метода представляет собой пример дедукции : исследователь движется от общего (гипотезы о наличии либо отсутствии того или иного заболевания) к частному (вероятности того, что результат теста будет положительным). В приведенном примере студенты ставят логику с ног на голову, поскольку перед врачом (и больным) стоит диаметрально противоположная задача: с помощью индукции двигаться от частного (результата теста) к общему (гипотезе о наличии заболевания).

Другими словами, врачам (и больным) нужен метод расчета вероятности того, что любой результат теста, будь он положительным или отрицательным, отражает истинное положение дел. Для этого можно воспользоваться методом индукции, но тогда нам понадобится комбинированный показатель чувствительности и специфичности теста, который называется отношением правдоподобия . Этот обобщенный показатель отражает степень достоверности как положительных, так и отрицательных результатов теста. С помощью отношения правдоподобия и претестовой (априорной) вероятности наличия болезни вычисляют более близкую к действительности послетестовую (апостериорную) вероятность , а точнее вероятность того, что болезнь имеется. Этот показатель называют прогностической ценностью теста. Прогностическая ценность положительного результата теста отражает послетестовую вероятность наличия болезни при положительном результате теста, а прогностическая ценность отрицательного результата теста — послетестовую вероятность отсутствия болезни при отрицательном результате теста.

Хотя дедуктивный подход к оценке чувствительности и специфичности коренным образом отличается от индуктивного подхода к расчету прогностической ценности, отличие это нелегко заметить, что и происходило в биостатистике до середины 70-х годов [1]. В своей статье, состоящей из двух частей [2, 3]*, S.N. Goodman продемонстрировал, что стандартные статистические методы (иногда называемые частотными), которые с давних пор используются для анализа результатов биомедицинских исследований и многими воспринимаются как уникальный способ выявления истины, в действительности ставят логическое мышление с ног на голову наподобие того, как это делали студенты при решении упомянутой в начале статьи диагностической задачи.

Чтение статьи S.N. Goodman — далеко не легкое занятие. Вместе с тем ее автор — талантливый герменевтик, умело интерпретирующий самую сложную информацию. Читатель, который попробует понять его, будет вознагражден целым рядом важных, а возможно и обескураживающих открытий. Задача врача — оценить вероятность наличия заболевания у конкретного человека при определенном результате теста, а задача исследователя (и тех, кто прочитает отчет о его исследовании) — оценить истинность изучаемой гипотезы на основании данных, полученных в ходе определенного эксперимента или испытания. Оба процесса подразумевают использование метода индукции. Но, как справедливо отметил S.N. Goodman, исследователи куда более охотно прибегают к противоположно направленным рассуждениям (метод дедукции). При этом рассчитывается вероятность того, что наблюдаемый эффект будет именно таким, какой получен в данном испытании (в пределах некоторых отклонений), при условии истинности определенной гипотезы (обычно это нулевая гипотеза, т.е. предположение об отсутствии различий между сравниваемыми группами). Этот подход отражает знакомая всем величина p.

Применение величины p часто подвергалось критике, так как для того, чтобы отличить истинный эффект вмешательства от отсутствия эффекта многие бездумно используют величину p=0,05. Хотя S.N. Goodman соглашается с этой критикой, его больше беспокоят более глубокие и сложные проблемы, связанные с неправильным толкованием таких понятий, как доказательства, ошибки и проверка гипотез. Эти проблемы особенно важны, поскольку неправильное толкование не позволяет разграничить суждения об истинности отдельной гипотезы, выдвинутой в ходе конкретного исследования, и суждения о данных целого ряда исследований.

Адрес для корреспонденции: F. Davidoff, MD, Editor, 190 N. Independence Mall West Philadelphia, PA, 19106-1572, USA. FAX 215-351-2644.

*Вторая часть статьи S.N. Goodman, посвященная байесовскому критерию, будет опубликована в следующем номере МЖМП (Примеч. ред.).

Перейдем к теореме Байеса. К несчастью, для большинства врачей, исследователей и редакторов медицинских журналов это зловещее словосочетание ассоциируется с туманными претестовыми вероятностями и пугающей абракадаброй математических формул. Но когда мы наконец понимаем, что метод Байеса представляет собой не что иное, как эквивалент расчета прогностической ценности — показателя, хорошо знакомого врачам по его использованию при построении диагноза, этот метод перестает казаться таким запутанным. Кроме того, будет полезным, оставив в стороне математические тонкости, осознать тот факт, что формула Байеса позволяет количественно описать процесс, которым мы занимаемся каждый день: индуктивную проверку новой информацией истинности наших прежних предположений. Другими словами, чтобы повысить степень достоверности наших предположений (получить послетестовую вероятность), лучше всего комбинировать исходную степень достоверности, основанную на внешней, полученной из иных — не связанных с рассматриваемым тестом или исследованием — информации (претестовая вероятность), с доказательствами, полученными в ходе данного исследования (байесовский фактор).

Важность той роли, которую играет исходная (внешняя) информация, становится ясна, если рассмотреть использование одного и того же диагностического теста в разных клинических ситуациях. При скрининговом обследовании, когда вероятность наличия заболевания у данного больного низкая, прогностическая ценность положительного результата теста (послетестовая вероятность) может составить всего 0,1 или 0,2, даже если чувствительность и специфичность метода довольно высоки. В этом случае, комбинируя доказательства, полученные в ходе исследования (отношение правдоподобия положительного результата теста), с внешней информацией (очень низкая претестовая вероятность наличия заболевания) , получают сравнительно низкую послетестовую вероятность (если, конечно, специфичность теста не приближается к 1,0). Напротив, при использовании теста для подтверждения диагноза, предполагаемого на основании данных других методов обследования, прогностическая ценность положительного результата теста может составить 0,90—0,95 или даже выше. В этом случае сравнительно высокая претестовая вероятность наличия болезни в сочетании с положительным результатом теста (даже если его специфичность относительно невелика) обеспечит еще более высокую послетестовую вероятность. В режиме первичной диагностики, при средних величинах претестовой вероятности наличия заболевания, тот же самый тест будет характеризоваться промежуточной прогностической ценностью положительного результата.

Точно так же исходная (внешняя) информация необходима для интерпретации результатов биомедицинских исследований. Неспособность или нежелание учитывать эту информацию часто приводит к неправильной оценке доказательности данных. Так, авторы недавно опубликованного мета-анализа утверждали, что отношение шансов, равное 1,66, свидетельствует в пользу эффективности гомеопатического средства. Взятый в отрыве от другой информации 95% доверительный интервал от 1,33 до 2,08 был истолкован как доказательство, свидетельствующее против гипотезы о том, что "эффект препарата объясняется эффектом плацебо" [4]. Если бы при оценке доказательности этого результата учли крайне низкую претестовую вероятность того, что чистая вода в малых дозах, пусть даже после особого встряхивания, может оказывать какое-либо биологическое действие, уверенность в эффективности такого средства (послетестовая вероятность) также была бы низкой. Скорее всего наблюдаемый эффект объясняется не биологическим, а психологическим либо каким-то другим действием препарата [5]. И наоборот, с учетом имеющихся данных о снижении частоты развития ишемической болезни сердца на фоне приема витамина Е опубликованные [6] доказательства отсутствия профилактического эффекта витамина Е в отношении ишемического инсульта, не исключают, а лишь незначительно снижают вероятность наличия такого эффекта.

Разработка оптимального способа совместного анализа результатов клинического испытания и внешней (независимой от данного испытания) информации — важная задача, которую трудно решить, поскольку мы часто судим о внешней информации субъективно. Поэтому S.N. Goodman концентрирует наше внимание на менее противоречивом и более объективном ключевом элементе формулы Байеса — инструменте для оценки доказательности результатов исследования. В качестве такого инструмента используется байесовский фактор — показатель, который знаком многим читателям медицинских журналов как отношение правдоподобия и сам по себе служит источником логически законченной и статистически достоверной информации [3]. Важный вывод, который можно сделать из этой части статьи, состоит в том, что при байесовском анализе доказательности данных, свидетельствующих против нулевой гипотезы, сила этого доказательства оказывается ниже, чем при интерпретации тех же данных с помощью показателя р.

Убедившись, что индуктивный метод удобен и полезен при анализе результатов исследований, редакция журнала "Annals of Internal Medicine" предложила в 1997 г. включать в статьи обработку и представление информации в соответствии с байесовским подходом [7]. Немногие авторы вняли этому совету, возможно, потому, что с вероятностными методами все знакомы, для этих методов существует программное обеспечение, их использования требуют редакторы других биомедицинских журналов, а альтернативными статистическими методами большинство исследователей не владеют. Именно ученых должна в первую очередь заинтересовать статья S.N. Goodman, так как использование байесовских принципов позволит усовершенствовать структуру биомедицинских исследований. Эти принципы включают исчерпывающий поиск имеющейся внешней информации, который в настоящее время часто вообще не проводится [8], и расчет минимального байесовского фактора на основании данных исследования. Использование байесовского подхода может оказаться полезным и у постели больного, когда врач должен интерпретировать и оценивать результаты отдельных исследований, чтобы принять то или иное решение, и при составлении доклада, когда его автор останав ливается только на результатах новейшего испытания без учета всех накопленных знаний (что вводит в заблуждение как самого ученого, так и тех, кто будет его слушать).

Частотный подход годится для решения определенных задач, но имеет много серьезных ограничений. Вот почему многие специалисты по биостатистике прилагали и прилагают значительные усилия для того, чтобы при планировании исследований и интерпретации полученных данных производители и потребители информации пользовались методом Байеса. Статья S.N. Goodman может служить ярким примером результатов этих усилий, поскольку в ней автор разъясняет как теоретическую основу метода, так и его практическое применение. По мнению редакции, данная статья должна помочь всем нам поставить биостатистику с головы на ноги. Мы рекомендуем нашим читателям обратить на нее самое пристальное внимание.


Литература

1. Galen R.S., Gambino S.R. Beyond Normality: The Predictive Value and Efficiency of Medical Diagnoses. New York: Wiley; 1975.

2. Goodman S.N. Toward evidence-based medical statistics. 1: The P value fallacy. Ann Intern Med 1999;130:995—1004.

3. Goodman S.N. Toward evidence-based medical statistics. 2: The Bayes factor. Ann Intern Med 1999;130:1005—13.

4. Linde K., Clausius N., Ramirez G., Melchart D., Eitel F., Hedges L.V., et al. Are the clinical effects of homeopathy placebo effects? A meta-analysis of placebo-controlled trials. Lancet 1997;350:834—43.

5. Vandenbroucke J.P. 175th anniversary lecture. Medical journals and the shaping of medical knowledge. Lancet 1998;352:2001—6.

6. Ascherio A., Rimm E.B., Hernбn M.A., Giovannucci E., Kawachi I., Stampfer M.J., et al. Relation of consumption of vitamin E, vitamin C, and carotenoids to risk for stroke among men in the United States. Ann Intern Med 1999;130:963—70.

7. Information for authors. Ann Intern Med 1997;127:1—15.

8. Clarke M., Chalmers I. Discussion sections in reports of controlled trials published in general medical journals: islands in search of continents? JAMA 1998;280:280—2.


Возврат к содержанию| Возврат на home page "Международного журнала медицинской практики"| Возврат на home page издательства "МедиаСфера"