Д.Г. Альтман, К.Ф. Шульц, Д. Мохер, М. Эггер, Ф.
Давидофф, Д. Элбурн, П.К. Гёче, Т. Ланг
Пересмотренный вариант единых стандартов
представления результатов рандомизированных
контролируемых испытаний (CONSORT): разъяснения и
перспективы дальнейшего усовершенствования
Translated, with permission of the ACP—ASIM, from: Altman D.G., Shultz K.F., Moher D., Egger M., Davidoff F., Elbourne D., Gotzsche P.C., and Lang T., for the CONSORT Group. "The revised CONSORT statement for reporting randomized trials: explanation and elaboration" Ann Intern Med 2001;134:663—94.
В настоящее время имеется большое количество данных о том, что качество представления материалов рандомизированных контролируемых испытаний (РКИ) оставляет желать лучшего. В ходе недавно проведенных анализов методологического качества РКИ было показано, что неправильный выбор структуры исследования и недостатки в составлении отчета существенно повышают вероятность наличия систематической ошибки при оценке эффекта лечения. Это может неблагоприятно сказаться на самой идее проведения РКИ, поскольку изначально предполагалось, что в таких исследованиях должны предусматриваться все меры, обеспечивающие отсутствие систематических ошибок. Наличие подобной ошибки в РКИ отражает несовершенство научного подхода, а это в свою очередь ставит под сомнение строгость соблюдения соответствующих этических норм.
Группа, состоящая из исследователей и редакторов медицинских журналов, разработала Единые стандарты представления результатов рандомизированных контролируемых испытаний (CONSORT — CONsolidated Standards Of Reporting Trials), которые должны помочь авторам повысить качество отчетов путем использования специального контрольного списка и схемы проведения РКИ. Эти стандарты были признаны редакционными коллективами многих медицинских журналов и крупными международными сообществами редакторов. Применение материалов CONSORT помогает авторам улучшить качество отчетов об РКИ, тем самым облегчая критическую оценку и интерпретацию полученных результатов.
Данная статья должна способствовать широкому применению CONSORT, их более глубокому пониманию и распространению. В ней объяснен и обоснован каждый пункт контрольного списка. Для большинства пунктов приводятся примеры правильного представления материалов РКИ и по возможности ссылки на соответствующие исследования. Представлены также несколько примеров составления схемы проведения РКИ.
Базовые материалы CONSORT, данная статья и соответствующий сайт в Интернете (http:/www.consort-statement.org) должны помочь в работе всем, кто составляет или читает отчеты об РКИ.
"Методы рандомизированных контролируемых испытаний изящны и могут быть использованы при проведении многих исследований, однако, как почти все творения человека, не лишены недостатков. Наличие субъективного фактора при проведении наблюдений и измерений всегда сопряжено с вероятностью возникновения систематической ошибки" [1].
Хорошо спланированное и правильно проведенное рандомизированное контролируемое испытание (РКИ) позволяет получить самую достоверную информацию об идеальной эффективности медицинских вмешательств *, но при низком методологическом качестве РКИ оценка эффекта лечения обычно завышена [2—5]. Неправильный выбор структуры исследования и недостатки в составлении отчета повышают вероятность наличия систематической ошибки* в результатах РКИ, что может стать причиной принятия неправильных решений на всех уровнях оказания медицинской помощи — от лечения отдельных больных до процесса формирования национальной политики здравоохранения.
Критическая оценка качества клинического испытания возможна только при условии подробного и точного описания его структуры, методов проведения и анализа данных в представляемом отчете. На деле в таких отчетах часто отсутствует необходимая информация [6—9], что усугубляет проблемы, связанные с низким методологическим качеством исследований [10—15].
Неполное и неточное представление данных в отчетах о рандомизированных контролируемых испытаниях
Недостатки представляемых отчетов об РКИ отмечали многие составители обзорных статей. Так, об использовании слепого метода при оценке клинических исходов * (или об отказе от него) сообщалось лишь в 30% отчетов о 67 РКИ, опубликованных в 4 ведущих медицинских журналах в 1979 и 1980 г. [16]. Только в 27% из 45 отчетов об РКИ, опубликованных в 1985 г., приводилась информация об основном критерии оценки*, и всего в 43% из 37 отчетов об РКИ с отрицательными результатами, опубликованных в 1990 г., были приведены расчеты, на основании которых определялся размер выборки * [17]. Иногда в отчетах встречаются и неточности. В 119 отчетах авторы утверждали, что данные обо всех участниках * были включены в окончательный анализ, проводимый исходя из допущения, что все больные получили предписанное вмешательство (ITT-анализ *), однако в 15 (13%) из этих исследований это на самом деле не было сделано [18]. Авторы многих других обзоров обнаружили, что некачественные отчеты часто публикуются в специализированных медицинских журналах [19—29] и журналах, издающихся не на английском языке [30, 31].
Правильно проведенная рандомизация * исключает вероятность возникновения систематической ошибки, связанной с отбором участников *, и относится к важнейшим составляющим высококачественного РКИ [32]. Чтобы рандомизация была эффективной, она должна включать в себя 2 этапа: генерацию непредсказуемой последовательности включения участников в группы* и сокрытие данной последовательности от лиц, осуществляющих это включение (табл. 1) [2, 21]. К сожалению, представление информации о методах, применявшихся при отнесении участников к той или иной группе, в целом также оставляет желать лучшего. Например, при анализе 206 статей, опубликованных в журналах по акушерству и гинекологии как отчеты об РКИ, было установлено, что по крайней мере в 5% из них описывались исследования, которые в действительности нельзя было считать РКИ [21]. Но даже эта оценка слишком оптимистична, поскольку в большинстве оригинальных статей не приводится необходимая информация о методах распределения больных по группам [19, 21, 23, 25, 30, 39].
Адрес для корреспонденции: Professor Altman: ICRF Medical Statistics Group, Centre for Statistics in Medicine, Institute of Health Sciences, Old Road, Headington, Oxford OX3 7LF, United Kingdom.
*Все помеченные звездочкой термины разъясняются в "Словаре терминов" в конце статьи.

Улучшение качества отчетов о рандомизированных контролируемых испытаниях: Единые стандарты представления результатов рандомизированных контролируемых испытаний (CONSORT)
R. DerSimomian et al. [16] предположили, что "качество представления результатов клинических испытаний значительно улучшится, если редакторы медицинских журналов составят список разделов, которые должны быть обязательно отражены в отчете об исследовании". В начале 90-х годов две группы, в которые вошли редакторы медицинских журналов, исследователи и специалисты по методологии проведения исследований, независимо друг от друга опубликовали рекомендации по составлению отчетов об РКИ [40, 41]. Позднее появилась редакционная статья D. Rennie [42], в которой он призвал представителей двух групп объединить свои усилия и разработать общие материалы по этой проблеме; в конечном счете были созданы Единые стандарты представления результатов рандомизированных контролируемых испытаний (CONSORT — CONsolidated Standards Of Reporting Trials) [43].
Материалы CONSORT (для простоты в дальнейшем они будут обозначаться общим термином CONSORT) включают в себя контрольный список разделов и подразделов, которые необходимо включить в отчет о РКИ, и схему, отражающую процесс его проведения. Их использование в первую очередь должно улучшить качество отчетов о простых РКИ с 2 группами сравнения, хотя в целом CONSORT применимы и к исследованиям с другой структурой (например, к РКИ факторного типа, кластерным, перекрестным и т.д.) В настоящее время готовятся к выходу специальные варианты CONSORT для представления результатов таких РКИ.
Цель CONSORT заключается в том, чтобы облегчить критическую оценку и интерпретацию результатов РКИ за счет повышения качества публикаций. Помимо авторов, получивших четкие инструкции по представлению отчетов о РКИ, CONSORT могут использовать рецензенты и редакторы медицинских журналов для выявления тех исследований, результаты которых трудно интерпретировать или в которых высока вероятность наличия систематической ошибки. Вместе с тем CONSORT нельзя рассматривать в качестве инструмента для оценки методологического качества исследований, этот документ скорее направлен на повышение достоверности * и обобщаемости (применимости) * их результатов. В высшей степени желательно наличие в отчете разделов, которые не отнесены в CONSORT к обязательным (например, об одобрении исследования этическим комитетом лечебно-профилактического учреждения, получении информированного согласия от участников, наличии в учреждении комитета по мониторингу и защите получаемых данных, а также об источниках финансирования). Кроме того, следует точно и подробно изложить данные, необходимые для анализа эффективности затрат [44—46] и оценки качества жизни [47].
Пересмотренный вариант (CONSORT): разъяснения и перспективы усовершенствования
Первоначальный вариант CONSORT был опубликован в 1996 г., после чего эти стандарты были признаны редакционными коллективами многих медицинских журналов [48—51] и крупными международными сообществами редакторов, включая Международный комитет редакторов медицинских журналов, известный также как Ванкуверская группа [52]. Предварительные данные указывают на то, что использование CONSORT способствовало повышению качества отчетов об РКИ [53, 54]. Однако эти материалы нельзя считать окончательными, они периодически пересматриваются и совершенствуются [3]. Первый вариант CONSORT [43] вызвал множество замечаний, в том числе и критических. Так, C.L. Meinert заявил о том, что в документе используются не вполне понятные термины, а в схеме проведения РКИ не представлена важная информация о числе участников на каждой его стадии [55]. Работа по пересмотру CONSORT началась в 1999 г. Новый вариант контрольного списка представлен в табл. 2, а схемы проведения РКИ — на рис. 1 [56—58].
Во время работы над новым вариантом стало ясно, что опубликование статьи с разъяснением основных принципов CONSORT помогло бы авторам оригинальных медицинских статей правильно составлять отчеты об РКИ, а читателям критически оценить представленные в них результаты. В данной статье приводится научное обоснование каждого из пунктов контрольного списка (см. табл. 2) с примерами правильного представления соответствующей информации (более подробно они изложены на сайте www.consort-statement.org). В этих примерах для простоты были удалены ссылки на другие публикации, хотя на практике всегда нужно цитировать источни ки новой информации (например, о методологических подходах, которые еще не получили должного распространения). По возможности приводились результаты эмпирических исследований по соответствующей тематике. Более подробное обсуждение методологических аспектов можно найти в обширной и качественной литературе по проведению клинических испытаний [59—61].
Для простоты в тексте порой применяются термины "лечение" и "больной", хотя не все вмешательства, эффективность которых изучается в ходе РКИ, относятся к именно к лечению, и не всех участников можно назвать больными.
Контрольный список
Название и реферат
Пункт 1. Способ отнесения участников к группе того или иного вмешательства ("в случайном порядке", или "рандомизированно").
Примеры
Название: "Частота отказа от курения на фоне ингаляционной заместительной никотинотерапии: двойное слепое рандомизированное клиническое испытание с оценкой эффективности и безопасности метода" [62].
Реферат: "Структура исследования: рандомизированное двойное слепое плацебо-контролируемое испытание" [63].
Разъяснение
Возможность найти исследование по нужной теме в значительной степени зависит от того, как оно было индексировано. Исследование не будет внесено в базу данных MEDLINE Национальной медицинской библиотеки США как РКИ, если авторами не будет представлена вся необходимая для этого информация. Чтобы этого не случилось, в реферате следует четко и ясно указать, что "участников исследования распределяли по группам сравнения в случайном порядке" или "лечение назначали рандомизированно". Для быстрого выявления статьи в высшей степени желательно включить в ее название определения, имеющие общий корень со словом "рандомизация" или производные от него.
В середине 90-х годов электронный поиск в базе данных MEDLINE позволял найти материалы лишь о половине РКИ по определенной тематике [64]. Этот недостаток отчасти был преодолен усилиями членов Кокрановского сотрудничества, которые выявили почти 100 000 РКИ, не зарегистрированные в базе данных MEDLINE как таковые. Впоследствии эти исследования были реиндексированы и в MEDLINE [65]. Выполнение данной рекомендации должно привести к более точному индексированию медицинских публикаций.
Сжато изложить содержание работы можно в виде структурированного реферата, который позволит читателю быстро ознакомиться с разделами статьи, касающимися структуры исследования, методов его проведения и анализа данных [66]. Исследования показали, что структурированные рефераты отличаются более высоким качеством, чем традиционные описательные [67], и облегчают поиск информации [68].

Рис. 1. Схема проведения рандомизированного испытания, отражающая данные о числе участников на всех его стадиях: включения участников, рандомизированного назначения того или иного вмешательства, наблюдения и анализа данных (приводится по [56—58]).


Введение
Пункт 2. История проблемы и обоснование целесообразности исследования.
Пример
"Синдром запястного канала вызывается сдавлением срединного нерва в области кисти и часто приводит к возникновению боли в руке, особенно у женщин. Местное введение кортикостероидных препаратов относится к числу рекомендуемых способов лечения этого синдрома.
Одна из методик подразумевает введение препаратов проксимальнее запястного канала (но не в сам канал). Обоснованием подобного подхода служит тот факт, что на ладонной поверхности кисти в непосредственной близости от канала часто отмечается отек, который может сдавливать срединный нерв. Кроме того, при введении кортикостероидных препаратов в этом месте риск повреждения нерва ниже, чем при инъекции в узкий запястный канал. Данные препараты целесообразно вводить вместе с лигнокаином (лидокаин), поскольку это делает процедуру безболезненной, а снижение чувствительности после инъекции подтверждает правильное положение иглы.
В ходе двойного слепого рандомизированного испытания мы попытались ответить на следующие вопросы: 1) исчезают ли типичные симптомы после введения кортикостероидных препаратов проксимальнее запястного канала и 2) какова доля больных, у которых рецидив не развивается в течение всего периода наблюдения" [69].
Разъяснение
Обычно в неструктурированной вводной части авторы произвольно излагают историю проблемы, научное обоснование целесообразности проведения данного исследования и его цели. При этом исследование может быть посвящено изучению какого-либо научного медицинского вопроса (например, сравнение биодоступности 2 лекарственных форм препарата или оценка возможного влияния препарата на функцию почек) или различных аспектов медицинской практики (например, сравнение эффективности двух альтернативных методов лечения с последующей разработкой клинических рекомендаций). Авторы должны привести все имеющиеся данные о положительных эффектах любого изучаемого вмешательства. Кроме того, в вводной части следует попытаться объяснить механизм действия вмешательства, особенно если ранее оно применялось редко или не применялось вообще [70].
В Хельсинской декларации говорится, что любые биомедицинские исследования на человеке должны проводится только после тщательного изучения соответствующей научной литературы [71]. Иными словами, неэтично подвергать людей необоснованному риску, связанному с проведением таких исследований. Установлено, что некоторые клинические испытания были не нужны, поскольку в них изучались вопросы, ответы на которые уже были получены (или могли быть получены) в систематических обзорах [72]. Таким образом, во введении авторы статьи должны доказать необходимость выполнения исследования. В идеале следует привести ссылки на систематический обзор уже проведенных РКИ по данной тематике или заявить об отсутствии таковых [73].
В первой части введения необходимо описать проблему, требующую проведения данного исследования. Ее характер, масштабы и серьезность должны служить вескими основаниями для исследования. К сожалению, именно эта информация нередко отсутствует в отчетах о РКИ. Затем следует кратко изложить подход к изучению данной проблемы и сформулировать основные цели исследования (см. пункт 5).
Методы
Пункт 3а. Критерии включения.
Пример
"…... кандидатами для включения в исследование были все женщины 20—44 лет с регулярным менструальным циклом, обратившиеся в течение указанного периода в Центр благосостояния семьи Национального госпиталя Кениатта для установки внутриматочного контрацептивного средства. Критерии исключения: 1) наличие внематочной беременности в анамнезе; 2) роды или прерывание беременности в предшествующие 42 дня; 3) лейомиома матки; 4) активный воспалительный процесс в малом тазе; 5) рак шейки матки или эндометрия; 6) аллергия на тетрациклины; 7) применение любых антибиотиков в предшествующие 14 дней или пенициллина длительного действия в инъекциях; 8) снижение иммунитета; 9) проживание за пределами г. Найроби, невозможность дальнейшего наблюдения из-за отсутствия точного адреса или нежелание являться на повторный осмотр" [74].
Разъяснение
Каждое РКИ посвящено изучению проблемы, актуальной для определенной категории лиц с определенным заболеванием, состоянием или воздействием того или иного фактора. Авторы обычно ограничивают исследуемую популяцию, применяя критерии включения * и проводя испытание на базе одного или нескольких медицинских центров. Обычно к критериям включения относятся пол, возраст, клинический диагноз и наличие сопутствующих заболеваний; критерии исключения часто применяются в целях обеспечения безопасности вмешательства. Критерии включения должны быть четко сформулированы. При необходимости следует обсудить все известные случаи, когда диагноз был сомнительным, ибо такие случаи могут отрицательно повлиять на статистическую чувствительность (мощность ) исследования* [75]. Нет необходимости в четком разграничении критериев включения и исключения [76].
Чтобы читатель мог судить об обобщаемости (применимости, см. пункт 21) результатов РКИ, необходимо подробно описать характеристики участников и условия, в которых проводилось исследование. Особое значение имеет метод набора участников * (например, по направлению другого врача или лечебно-профилактического учреждения либо по желанию самих больных, прочитавших объявление об исследовании в газете, и т.д.). Поскольку набор участников происходит до рандомизации, критерии включения не влияют на достоверность результатов РКИ, но могут сказаться на их обобщаемости.
Несмотря на важность критериев включения, информация о них часто представлена неправильно. Так, при анализе отчетов о 364 РКИ было показано, что в 25% из них вообще отсутствовал соответствующий подраздел [77]. В каждом из 8 РКИ, результаты которых легли в основу клинических рекомендаций и предупреждений, разработанных Национальными институтами здоровья США, в среднем применялся 31 критерий включения, однако в журнальных статьях были перечислены лишь 63% из этих критериев, а в соответствующих предупреждениях — только 19% [78]. В период с 1970 по 1990 г. значительно возросло число критериев включения, используемых в РКИ по онкологии [76].
Пункт 3б. Клиническая база (с указанием географического региона).
Пример
"Набор добровольцев проводился в Лондоне на участках, обслуживаемых 4 врачами общей практики, и в оториноларингологическом амбулаторном отделении госпиталя Нортвик Парк. Врачи, назначавшие лечение, были знакомы с принципами гомеопатии, но не являлись специалистами по гомеопатической иммунотерапии" [79].
Разъяснение
Клиническая база и ее местонахождение сказываются на обобщаемости результатов РКИ. Лечебно-профилактические учреждения существенно различаются по принципам организации медицинской помощи, материальной базе, квалификации персонала и исходному влиянию факторов риска развития определенных заболеваний в конкретной местности. Кроме того, на обобщаемость результатов РКИ могут влиять климат и другие факторы окружающей среды, экономические, географические, социальные и культурные особенности.
Чтобы читатель мог судить об обобщаемости результатов РКИ, авторы должны сообщить, сколько и каких медицинских центров участвовали в его проведении, где они расположены (страна, город, принципы оказания медицинской помощи, например участковый, амбулаторный, стационарный, на базе отделения больницы). В первую очередь следует указать, что исследование проводилось в одном или нескольких центрах (многоцентровое). На основании этой информации читатель сможет определить, применимы ли результаты РКИ в условиях его практики. Авторы обязаны предоставить дополнительную информацию обо всех особенностях клинической базы РКИ, которые могли повлиять на его результаты (например, проблемы с транспортом, ограничивающие отбор участников).
Пункт 4. Точное описание вмешательств в группах сравнения.
Пример
"Больные с псориатическим артритом в течение 12 нед рандомизированно получали либо плацебо, либо этанерцепт (энбрел; по 25 мг подкожно 2 раза в неделю).… Этанерцепт доставлялся в виде стерильного лиофилизированного порошка, расфасованного в стеклянные ампулы, каждая из которых содержала 25 мг этанерцепта, 40 мг маннитола, 10 мг сахарозы и 1—2 мг трометамина. Состав порошка в ампулах с плацебо был таким же, за исключением этанерцепта. Перед введением содержимое ампул растворяли в 1 мл стерильной воды для инъекций" [80].
Разъяснение
Следует подробно описать все применявшиеся в исследовании вмешательства, включая контрольное. Нужно также перечислить характеристики плацебо и приемы, с помощью которых производилась имитация лечения. Следует детально описать применяемую в контрольной группе "стандартную терапию" или иное вмешательство, которое на деле включает в себя несколько различных вмешательств.
В некоторых случаях бывает необходимым сообщить, кто осуществлял предписанное вмешательство (поскольку это может существенно повлиять на результаты РКИ). Так, при описании хирургического вмешательства следует сообщать не только об особенностях самой операции, но и о количестве хирургов, которые принимали участие в РКИ, уровне их теоретической подготовки и практическом опыте [81].
При необходимости авторы должны указать сроки начала вмешательства и его продолжительность, особенно в тех случаях, когда вмешательства были многокомпонентными.
Пункт 5. Конкретные цели исследования и проверяемые гипотезы.
Пример
"В ходе данного исследования проверялась гипотеза о том, что активное ведение первых родов: 1) снижает частоту выполнения кесарева сечения; 2) снижает частоту случаев затяжных родов; 3) не влияет на степень удовлетворенности роженицы ведением родов" [82].
Разъяснение
К целям исследования относят вопросы, на которые должно ответить РКИ. Часто они связаны с оценкой эффективности конкретного лечебного или профилактического вмешательства. Гипотезой * называют предположение, которое предстоит проверить для того, чтобы достичь намеченной цели.
Гипотезы сформулированы конкретнее, чем простые вопросы, и при их проверке могут быть использованы точные статистические методы. На практике бывает непросто разделить гипотезы и цели исследования, как видно из вышеприведенного примера.
В большинстве отчетов об РКИ представлена достаточная информация о целях исследования и проверяемых гипотезах [24].
Пункт 6а. Четко сформулированные основные и дополнительные клинические исходы, а также критерии их оценки.
Пример
"В качестве основного критерия оценки эффективности лечения псориаза использо валась доля больных, у которых исходная активность заболевания, оцениваемая по шкале PASI (Psoriasis Area and Severity Index), через 12 нед снизилась на 75%. В ходе дополнительных анализов рассчитывалось процентное изменение суммарного показателя по шкале PASI и улучшения состояния псориатических очагов" [80].
Разъяснение
Во всех РКИ проводится оценка изучаемых показателей или клинических исходов в группах сравнения. В большинстве РКИ используются сразу несколько клинических исходов (или критериев оценки), которые интересуют исследователей в большей или меньшей степени. Основным клиническим исходом (критерием оценки) называют выбранный перед началом исследования клинический исход, который имеет наибольшее значение и обычно используется при расчете размера выборки (см. пункт 7). В некоторых РКИ может быть указано несколько основных клинических исходов, однако использование трех клинических исходов и более влечет за собой необходимость проведения множественных сравнений * (см. пункты 18 и 20), что затрудняет интерпретацию данных и потому не рекомендуется. Основные клинические исходы должны быть перечислены в отчете об РКИ. Кроме того, оцениваются и дополнительные клинические исходы, которых часто бывает несколько. Как правило, в их число включают побочные эффекты изучаемых вмешательств (см. пункт 19).
Как и основные, все дополнительные клинические исходы должны быть перечислены и описаны. Если частоту развития клинического исхода планируется регистрировать неоднократно, следует указать время соответствующих измерений. В ряде случаев имеет смысл сообщить, сколько исследователей участвуют в оценке клинических исходов и кто они (например, если для оценки требуются специальные навыки).
При многих заболеваниях существуют десятки возможных клинических исходов, для оценки которых используют специальные шкалы и другие способы измерения. Когда это возможно и целесообразно, следует выбирать те из них, обоснованность применения которых уже была доказана [83, 84]; это позволит повысить точность измерений и сравнивать результаты различных исследований. Так, применение прошедших проверку способов оценки качества жизни может улучшить представление результатов соответствующих испытаний [85]. Авторы должны указать источники информации, в которых описана та или иная шкала, и коротко изложить принципы ее использования.
В 196 РКИ, посвященных оценке эффективности нестероидных противовоспалительных препаратов при ревматоидном артрите, изучались более 70 клинических исходов [28], а в 2000 РКИ, посвященных проблемам шизофрении, использовались 640 различных шкал и других критериев оценки (из них 369 применялись впервые) [39]. При анализе 149 из этих 2000 РКИ было показано, что использование шкал, ранее не описанных в литературе, привело к возникновению систематической ошибки. В РКИ, посвященных оценке эффективности нелекарственной терапии, около 1/3 заключений о преимуществах того или иного метода, которые были сделаны при использовании непроверенных шкал, не выдерживали критики и не появились бы, если бы авторы работали с общепризнанными шкалами [86]. И эти примеры далеко не единичные [87, 88].
Пункт 6б. Методы, применявшиеся для повышения точности измерений (многократные измерения; обучение исследователей, оценивающих клинические исходы).
Примеры
"Специальный комитет…, применяя слепой метод, рассмотрел все возможные варианты течения заболевания и единогласно утвердил список клинических исходов, подлежащих оценке" [89].
"У больных с фибрилляцией предсердий специально обученная медицинская сестра измеряла диастолическое артериальное давление в положении сидя после 5-минутного отдыха, используя для этого электронный аппарат Copal UA-251 или Takeda UA-751 (Andrew Stephens, Brighouse, West Yorkshire) либо сфигмоманометр Hawksley (Hawksley, Lancing, Sussex). Результаты 1-го измерения не учитывали. После регистрации результатов 2, 3 и 4-го измерений определяли их среднее значение (если коэффициент вариации между ними не превышал 15%), при необходимости проводили дополнительные измерения" [90].
Разъяснение
Авторы должны подробно описать процесс оценки основных и дополнительных клинических исходов, а также указать, принимались ли при этом меры, направленные на повышение достоверности результатов.
Некоторые клинические исходы оценить легко, другие — гораздо сложнее. В отличие от констатации смерти (обусловленной любыми причинами) оценка изменений артериального давления, выраженности симптомов депрессии или качества жизни может быть сопряжена с определенными трудностями. Существуют специальные приемы для повышения точности измерений, например неоднократная регистрация артериального давления и использование более точного сфигмоманометра с функцией автоматической калибровки. Вероятность возникновения систематической ошибки, связанной с измерения ми, уменьшается при использовании слепого метода, когда участник и исследователь, оценивающий клинические исходы, не знают о назначенном вмешательстве (пункт 11а). Если в ходе РКИ необходимо использовать сложные или редкие способы измерений, рекомендуется предварительно провести стандартизованную подготовку лиц, которые будут проводить такие измерения.
Пункт 7а. Принципы расчета размеров выборки.
Примеры
"Мы исходили из предположения, что… комбинированный показатель смертности, частоты развития тромбоза глубоких вен нижней конечности с характерными симптомами и тромбоэмболии легочной артерии может составить 4% в группе плацебо и 1,5% в группе ардепарина натрия. Для выявления статистически значимых различий (р<0,05 при использовании двухстороннего теста) статистическая чувствительность исследования должна быть равна 0,9; в таком случае в каждую группу следует включить по 976 больных. С учетом возможного выбывания участников было запланировано довести размер каждой группы до 1000 больных" [91].
"Чтобы с 85% вероятностью выявить как статистически значимую (р=0,05 при использовании двухстороннего теста) разницу в 5 баллов между 2 группами сравнения при оценке общего состояния по шкале SF-36 (Short Form-36) и допущении, что стандар тное отклонение составит 20%, а доля выбывающих из исследования участниц — 20%, в каждую группу необходимо включить по 360 женщин (всего 720)" [92].
Разъяснение
Исходя из научных и этических соображений, необходимо тщательно рассчитать размер выборки. В идеале она должна быть достаточно большой, чтобы обеспечить такой уровень статистической чувствительности исследования, когда с высокой вероятностью будут выявляться статистически значимые различия в клинически важных эффектах (если таковые существуют). Размер эффекта, который считается клинически важным, обратно пропорционален размеру выборки, необходимой для его выявления. Иными словами, чем меньше ожидаемый эффект, тем больше должна быть выборка. При расчете ее размера следует учитывать: 1) предполагаемую частоту развития клинических исходов в каждой группе (клинически значимые ожидаемые различия между группами сравнения); 2) ошибку первого рода (a-ошибка); 3) статистическую чувствительность исследования (ошибка второго рода, или b-ошибка); 4) стандартное отклонение при регистрации непрерывных данных [93].
Авторы должны пояснить, каким образом рассчитывался размер выборки. Если расчет статистической чувствительности проводился по общепринятым правилам, следует назвать основной критерий оценки (см. пункт 6а), все использованные для этого количественные параметры и расчетный размер каждой группы. Предпочтительнее привести ожидаемые результаты для каждой группы, а не только размер ожидаемых различий между ними. Нужно детализировать все поправки на частоту выбывания участников и исключение некоторых данных из анализа.
Иногда в РКИ используются промежуточные анализы; это помогает решить, следует ли продолжать набор больных (пункт 7б). Если реальный размер выборки отличается от расчетного, необходимо указать причину (например, низкая распространенность заболевания, невозможность набрать большее число участников или принятие решения об изменении желаемого размера выборки).
При слишком маленьком размере выборки исследователи часто приходят к ошибочному выводу об отсутствии различий между группами [94]. Составители обзоров отмечают, что во многих РКИ статистическая чувствительность недостаточна для выявления клинически значимого эффекта лечения [17, 95]. Высока вероятность того, что на самом деле такой эффект имеется (хоть и невелик) и может быть подтвержден в ходе более крупных РКИ [96]. В 196 РКИ, посвященных лечению артрита, средний размер выборки составил 54 больных [28]; в 73 РКИ, посвященных лечению кожных заболеваний, — 46 больных [8], в 2000 РКИ, посвященных лечению шизофрении, — 65 больных [39]. Не имеет смысла рассчитывать статистическую чувствительность после получения результатов исследования, на этом этапе ее точно отражают доверительные интервалы * (см. пункт 17) [97].
Пункт 7б. Обоснование любых промежуточных анализов и правил прекращения исследования (если они применялись).
Примеры
"Анализ результатов… проводили каждые 6 мес для того, чтобы иметь возможность прекратить исследование ранее намеченного срока (что и произошло в действительности), как только станет очевидным преимущество одного из применяемых способов профилактики" [98].
"За время испытания были проведены два промежуточных анализа. Статистическая значимость получаемых данных в целом удерживалась на уровне, соответствующем р=0,05, и рассчитывалась в соответствии с правилом прекращения исследований (правило O'Brien—Fleming). При окончательном анализе использовали Z-критерий, равный 1,985, и значение р, равное 0,0471" [99].
Разъяснение
Во многих РКИ включение участников продолжается в течение длительного времени. Если эффективность, неэффективность или вред какого-либо из сравниваемых вмешательств очевидны, исследование может быть прекращено досрочно по этическим соображениям. Решение о досрочном завершении РКИ может быть принято на основании результатов промежуточных анализов *, данных по мере накопления последних. Однако многократное проведение промежуточных анализов без должной коррекции может привести к получению ошибочных результатов и неправильной их интерпретации [100]. Так, при проведении единственного анализа в конце РКИ общая частота ложноположительных результатов составляет около 5%, а при проведении 5 промежуточных анализов — почти 19%.
Для коррекции результатов промежуточных анализов применяют несколько методов последовательной статистической обработки данных [101—103]; решение об использовании таких методов должно быть принято до начала РКИ и обосновано в его протоколе. В ходе каждого промежуточного анализа проводится сравнение данных в группах, и очень низкая величина р свидетельствует о статистической значимости выявленных различий. Некоторые исследователи используют величину р, полученную в ходе промежуточных анализов, для принятия решений [104], другие рассматривают ее в качестве одного из вариантов правил прекращения исследований * (при этом исходят из допущения, что исследование должно быть прекращено, если значение р меньше некоей критической величины).
Авторы обязаны сообщить о проведении промежуточных анализов данных, их количестве, применявшихся статистических методах (включая любые правила прекращения исследований) и времени, когда было решено проводить промежуточный анализ (до или после начала исследования). В отчетах об РКИ эта информация часто отсутствует [14].
Пункт 8а. Метод генерации последовательности при отнесении участников к той или иной группе.
Пример
"Сотрудники аптек, не находящиеся в подчинении координационному центру исследования, отпускали ингаляторы с активным препаратом или плацебо согласно порядку рандомизации, который был генерирован компьютером" [62].
Разъяснение
В идеале результаты процесса отнесения участников к той или иной группе сравнения должны быть случайными и непредсказуемыми (см. табл. 1). Авторы отчета должны представить информацию, необходимую читателю для оценки методов, которые использовались при генерации случайного порядка отнесения участников к той или иной группе*, и вероятности возникновения систематической ошибки на этом этапе исследования.
Как правило, в РКИ используют достаточно эффективные методы генерации случайной последовательности. Однако о них невозможно судить по голословным утверждениям о "рандомизации" или "случайном отнесении участников к той или иной группе". Авторы должны указать, какой метод был использован: компьютерный генератор, таблица случайных чисел или что-нибудь другое, например процесс минимизации *, который относится к дополнительным методам, применяемым при проведении ограниченной рандомизации (см. пункт 8б и табл. 3).
В некоторых РКИ сознательно составляются группы неодинаковых размеров, например для того, чтобы более наглядно продемонстрировать преимущество одного из вмешательств либо ограничить расходы на проведение исследования. В таких случаях авторы должны сообщить о соотношении размера групп после рандомизации (например, 2:1).
Термин "случайность"# имеет строгий математический смысл. При случайном отнесении участников к той или иной группе заранее известна вероятность включения каждого больного в конкретную группу сравнения, но с точностью предсказать, в какую именно группу он попадет, невозможно. Однако нередко этим термином произвольно характе ризуют исследования, не относящиеся к рандомизированным, в которых при составлении групп применяются детерминистские методы отнесения участников к той или иной группе* (на основе очередности поступления больного в стационар, номера истории болезни или даты рождения больного). Если использовались подобные методы, нужно подробно описать их, не пытаясь вставить в текст производные от слова "случайность" на каком бы то ни было языке. Исследования перечисленных видов вряд ли даже можно назвать псевдорандомизированными. Эмпирические данные свидетельствуют о наличии в таких исследованиях систематических ошибок [2—5]. Считается, что последние связаны с невозможностью сохранить в тайне принцип отнесения участников к той или иной группе (см. пункт 9).
Только в 32% отчетов об РКИ, опубликованных в специализированных журналах [21], и в 48% отчетов, опубликованных в общемедицинских журналах [25], сообщается о применении правильного метода генерации случайной последовательности включения участников в группы. Почти во всех этих случаях использовались либо компьютерный генератор, либо таблица случайных чисел. При анализе статей, опубликованных в одном из журналов по дерматологии за 22 года, было установлено, что о применении правильного метода генерации случайной последовательности сообщалось лишь в 1 из 68 отчетов об РКИ [8].
Пункт 8б. Подробное описание любых особенно стей рандомизации (блоковая, стратификационная).
Пример
"Вероятность отнесения к той или иной группе была одинаковой для всех участниц. Случайный порядок формирования блоков с внутренней рандомизацией был выработан с помощью компьютерного генератора. Размер блоков составлял 4, 8 и 10 больных; он также определялся в случайном порядке…" [74].
Разъяснение
В крупных испытаниях проведение простой рандомизации * обеспечивает формирование двух групп одного размера, с приблизительно одинаковыми известными (и неизвестными) прогностическими факторами *. Дополнительные методы, применяемые при ограниченной рандомизации *, позволяют в большей степени уравновесить группы по размеру или характеристикам больных (см. табл. 3).
Если эти методы не использовались, желательно подчеркнуть, что проводилась простая рандомизация. В остальных случаях нужно назвать их вместе с методом генерации случайной последовательности (см. пункт 8а). При использовании блоковой рандомизации авторы должны детально описать принципы формирования блоков (например, выбор соотношения участников, которым назначалось то или иное вмешательство, внутри определенного блока*) и выбора их размера (например, в случайном порядке) или указать фиксированный размер. Если проводилась стратификационная рандомизация, следует перечислить принципы составления подгрупп и блоков. Стратификационная рандомизация может оказаться весьма эффективным методом, однако при учете большого числа признаков ее проведение затруднительно. В случае использования процесса минимизации (см. табл. 3) авторы должны сообщить об этом (и об элементе случайности, если таковой присутствовал), а также перечислить уравновешиваемые параметры.
Показано, что проведение стратификационной рандомизации повышает статистическую чувствительность небольших РКИ почти на 12%, особенно при выраженном эффекте вмешательства или наличии важных прогностических факторов [109]. Применение минимизации не обеспечивает подобных преимуществ [110].
#Random (англ.) — случайный, произвольный, выбранный наугад.

Лишь в 9% из 206 отчетов об РКИ, опубликованных в специализированных журналах [21], и в 39% из 80 отчетов об РКИ, опубликованных в общемедицинских журналах [25], сообщается об использо вании стратификации; только в половине отчетов упоминается о проведении ограниченной рандомизации. K.F. Schults et al. [21], D.G. Altman и C.J. Dore [25], K. Adetugbo и H. Williams [8] установили, что во многих РКИ размер групп почти одинаков; это может быть обусловлено только применением блоковой или стратификационной рандомизации, хотя авторы отчетов и не сообщали об этом.
Пункт 9. Метод сокрытия процесса рандомизации (получение указаний в пронумерованных контейнерах, конвертах или по телефону) с обязательным представлением данных о том, был ли этот процесс скрытым.
Пример
"Участницам назначался прием либо витаминов Е и С, либо двойного плацебо; предписанное вмешательство применялось до конца беременности у всех женщин, продолжавших принимать участие в испытании. Выработку порядка рандомизации с помощью компьютерного генератора проводил статистик…, затем он сообщал об этом порядке фармацевтам. Последовательное включение в испытание беременных, пришедших на ультразвуковое исследование или на прием в женскую консультацию и отвечавших критериям включения, осуществляли исследователи, которые затем наблюдали за участницами; соответствующий набор таблеток на весь срок беременности участницы получали непосредственно в аптеке. Сами исследователи узнавали о порядке рандомизации только после завершения набора участниц и сбора данных, включая результаты лабораторных исследований" [111].
Разъяснение
В пункте 8 обсуждается процесс генерации случайной (непредсказуемой) последовательности отнесения участников к той или иной группе. Очень важен способ передачи этой информации на этапе включения участников; в идеале эта информация должна быть сохранена в тайне от исполнителей [21], что не позволит последним так или иначе влиять на результаты исследования. Обследование больных для оценки соответствия целям РКИ и получение у них информированного согласия не требует знания о том, в какую группу будет отнесен следующий участник [112].
Сокрытие порядка отнесения участников к той или иной группе не следует путать с применением слепого метода*, или маскированием вмешательства * (см. пункт 11). Первое предназначено для предотвращения систематической ошибки, связанной с отбором участников, сохранения в тайне последовательности их отнесения к той или иной группе вплоть до момента отнесения; такое сокрытие может успешно применяться при любых обстоятельствах [2]. Второе предназначено для предотвращения систематических ошибок, связанных с ходом исследования * или с выявлением и подтверждением определенного клинического исхода*, и для сохранения в тайне назначенного вмешательств после формирования групп; слепой метод может применяться далеко не всегда [21]. Следует помнить, что даже безукоризненно проведенная генерация случайной (непредсказуемой) последовательности без ее последующего сокрытия не принесет желаемого результата [2, 113].
Особенно рекомендуется применение децентрализованного подхода (привлечение к этому процессу "третьей стороны"). Чаще всего с этой целью используется централизованная рандомизация по телефону или через аптеку. Все большую популярность завоевывают автоматизированные системы рандомизации [114]. В отсутствие условий для привлечения независимых посторонних лиц указания о последовательности отнесения участников к той или иной группе могут доставляться в пронумерованных контейнерах. Указания о предписанном вмешательстве (или непосредственно препараты) помещаются в одинаковые контейнеры, пронумерованные согласно порядку рандомизации. Можно запечатывать эти указания в непрозрачные конверты, пронумерованные таким же образом, если этот процесс правильно организован и тщательного контролируется. В противном случае метод может оказаться неэффективным. Необходимо, чтобы конверты вскрывали в нужной последовательности (в соответствии с их номерами) и только после того, как исследователь запишет на них имя участника и прочие необходимые данные [106].
В недавних исследованиях были проанализированы причины возникновения систематических ошибок при проведении РКИ. В отчетах о 250 РКИ, включенных в 33 мета-анализа по проблемам акушерства, оценивалась полнота изложения информации о методах рандомизации, после чего анализировалась взаимосвязь между качеством этих данных и размером выявленного эффекта [2]. В РКИ, где сокрытие отнесения участников к той или иной группе было недостаточным или не было описано должным образом, размер выявленного эффекта был гораздо больше (величина отношения шансов была выше на 30—40%), чем в РКИ с эффективным сокрытием порядка рандомизации. Три других исследования подтвердили эти выводы [3—5]. Имеющиеся данные убедительно свидетельствуют о том, что недостаточное сокрытие порядка рандомизации приводит к завышению эффекта вмешательства.
Несмотря на то что методы, применявшиеся при отнесении участников к той или иной группе, имеют очень большое значение, во многих отчетах о РКИ они не описаны. Такие сведения отсутствуют в 89% отчетов о РКИ, посвященных лечению ревматоидного артрита [28], в 48% отчетов, опубликованных в журналах по акушерству и гинекологии [21], и в 44% отчетов, опубликованных в общемедицинских журналах [25]. Только в 5 из 73 отчетов о РКИ, опубликованных в одном из журналов по дерматологии за период с 1976 по 1997 г., сообщалось о методах, которые применялись при формировании групп сравнения [8].
Пункт 10. Лица, которые осуществляли процесс генерации последовательности, включения участников в исследование и распределения их в группы сравнения.
Пример
"При определении того, каким больным будут назначены терапия стрептомицином и постельный режим (группа стрептомицина) или только постельный режим (контрольная группа), применялся порядок рандомизации, основанный на результатах процесса генерации случайных чисел, который профессор Бредфорд Хилл проводил отдельно для мужчин и женщин в каждом медицинском центре. Исследователи и координатор не знали заранее о порядке рандомизации, они получали запечатанные конверты, на которых были указаны только название медицинского центра и номер. После того, как включение участника было одобрено специальным комитетом, но еще до назначения терапии, в центральном офисе вскрывали соответствующий конверт и передавали информацию главному врачу означенного медицинского центра" [33].
Разъяснение
Как уже было отмечено ранее (см. пункт 9), на этапе включения участников в РКИ чрезвычайно важно сохранить в тайне отнесение участников к той или иной группе. Для успешного выполнения этой задачи большое значение имеют не только применяемые методы, но и исполнители, которые осуществляют или контролируют генерацию случайной последовательности, отбор участников и их распределение по группам.
Этап включения в РКИ состоит из двух различных процессов: генерации случайной последовательности и ее применения (табл. 4). В рамках каждого из этих процессов одно лицо может выполнять несколько задач, но следует стремиться к тому, чтобы исследователи не совмещали функций, характерных для разных процессов.
Независимо от методологического качества процесса рандомизации, неспособность разделить два вышеуказанных процесса может привести к возникновению систематической ошибки. Так, если лицо, принимавшее участие в процессе генерации последовательности отнесения участников к той или иной группе, воспользуется копией соответствующего списка при беседе с кандидатами, это может способствовать возникновению систематической ошибки, связанной с отбором участников *, хотя сама последовательность была случайной (непредсказуемой). Иногда один и тот же человек задействован в разработке последовательности отнесения участников к той или иной группе и непосредственном формировании групп. В таких случаях старший исследователь, который отвечает за проведение РКИ в конкретном медицинском центре, должен не только обеспечить непредсказуемость последовательности, но и хранить соответствующий список в надежном месте, недоступном для исполнителей. В отчете об исследовании следует указать, где хранился этот документ.

Пункт 11а. Применялся ли слепой метод, или маскирование вмешательств, в отношении участников, медицинского персонала и исследователей, оценивающих клинические исходы.
Пример
"На протяжении всего исследования в отношении всех лиц, проводивших его, и всех участников применялся метод маскирования вмешательств. Доступ к полной информации был предоставлен только статистикам и членам комитета по мониторингу данных, которые не контактировали с участниками исследования" [115].
Разъяснение
Применительно к РКИ термином "слепой метод" (маскирование вмешательств )* обозначают сохранение в тайне информации о назначенном вмешательстве от участников, медицинского персонала, а в ряде случаев от исследователей, которые собирают и анализируют данные; такая информация могла бы повлиять на их действия и решения. Применение слепого метода позволяет предотвратить возникновение систематических ошибок на разных этапах РКИ, хотя этот метод может быть использован не всегда.
Маскирование вмешательств от больных очень важно, поскольку в ряде случаев открытость информации приводит к изменению ответной реакции на применяемое вмешательство. В группе лечения больные могут питать неоправданные надежды либо, напротив, переживать по поводу применения новых, непроверенных методов. В контрольной группе больные могут чувствовать себя обделенными (если верят в "прогресс" медицинской науки) или быть удовлетворены распределением именно в эту группу (если придерживаются консервативных взглядов). Использование плацебо в контрольной группе совместно с маскированием вмешательства от участников предназначено для исключения систематической ошибки, связанной с неспецифическим эффектом самого процесса лечения (эффект плацебо).
Маскирование вмешательств от больных и медицинского персонала направлено также на предотвращение систематической ошибки, связанной с проведением РКИ. Такая разновидность систематической ошибки может возникать, когда дополнительные вмешательства ("сопутствующее лечение") применяются или пользуются особым спросом лишь в одной из групп сравнения. В этих случаях на решение об исключении больного из исследования или об изменении доз препаратов часто влияет информированность о его принадлежности к той или иной группе.
Маскирование вмешательств от больных, врачей и других медицинских работников, которые принимают участие в оценке клинических исходов (например, рентгенологов), призвано свести к минимуму риск возникновения систематической ошибки, связанной с выявлением, подтверждением или оценкой определенного клинического исхода. Такая разновидность систематической ошибки возникает в тех случаях, когда знание о принадлежности больного к той или иной группе может повлиять на процесс оценки клинического исхода. Так, в ходе плацебо-контролируемого испытания, посвященного лечению рассеянного склероза, эта информация не скрывалась от невропатологов, что привело к завышенной оценке эффективности проводимой терапии [116].
И наконец, маскирование вмешательств от лиц, проводящих статистический анализ данных, также может снизить вероятность возникновения систематической ошибки, связанной с предвзятым, неоптимальным выбором тактики и методов анализа [117].
РКИ, в которых слепой метод не применялся, называют открытыми *. Такой подход типичен для ранней стадии оценки эффективности лекарствен ных препаратов (II фаза испытаний).
В отличие от сокрытия отнесения участников к той или иной группе (см. пункт 10) применение слепого метода не всегда уместно, а иногда и невозможно. В качестве примера можно привести сравнение интенсивности болевых ощущений при диагностическом взятии крови из мочки уха или из пальца [118]. Слепой метод особенно важен, когда критерий оценки содержит элемент субъективности (например, выявление изменений выраженности боли или уровня смертности от конкретной причины), но играет меньшую роль при использовании объективных критериев оценки (например, определение уровня общей смертности), когда вероятность возникновения систематической ошибки мала. Однако и в этих случаях отказ от применения слепого метода чреват появлением других проблем, например связанных с отсевом данных [Shultz K.F., Chalmers I., Altman D.G. The landscape and lexicon of blinding. Принято в печать]. В некоторых РКИ, особенно посвященных хирургическим вмешательствам, затруднено или невозможно применение двойного слепого метода. Но даже в открытых исследованиях, как правило, допустимо и желательно маскирование вмешательств от лиц, оценивающих клинические исходы. Так, снимки различных поражений до и после вмешательства может оценивать специалист, не принимавший непосредственного участия в проведении РКИ [119]. Побочные эффекты некоторых методов лечения, о которых исследователи даже не предполагали во время планирования РКИ, могут быть настолько специфичными, что при их развитии ни у больных, ни у медицинского персонала не возникает сомнений в том, какое вмешательство применялось. В таких случаях настоятельно рекомендуется замаскировать вмешательство от лиц, оценивающих клинические исходы.
В отчетах о РКИ часто сообщается об использовании двойного слепого метода. Сам этот термин подразумевает маскирование вмешательств от больных и медицинского персонала, но не разъясняет, применялся ли этот метод по отношению к другим лицам (в том числе и к тем, кто оценивал клинические исходы) [120]. Авторы статьи должны перечислить все категории лиц, не располагающих информацией о характере применяемого вмешательства (включая больных, медицинских работников и лиц, оценивающих клинические исходы, наблюдающих за сбором данных и осуществляющих их анализ); способы маскирования вмешательств (например, использование капсул или таблеток); описать схожесть характеристик вмешательств в группах сравнения (например, внешний вид, вкус и путь введения лекарственных препаратов и плацебо) [40, 121]. Кроме того, следует объяснить, почему в отношении кого-либо из вышеуказанных лиц не был применен режим маскирования.
Часто в отчетах об РКИ вообще не сообщается, использовался ли слепой метод [16], а если эта информация приводится, то отсутствуют необходимые детали. Так, о применении слепого метода не упоминалось в 51% отчетов из 506 РКИ, посвященных лечению муковисцидоза [122], в 33% из 196 РКИ, посвященных лечению ревматоидного артрита [28], и в 38% из 68 РКИ, посвященных лечению кожных болезней [8]. В 31 отчете об РКИ, проводившихся в области гинекологии, сообщалось о применении двойного слепого метода, однако при их анализе оказалось, что лишь в 14 (45%) из них говорилось о внешнем сходстве основного и контрольного вмешательства, только в 5 (16%) — об успешности применения данного метода [12].
Вместо терминов "слепой метод" или "ослепление" лучше использовать термин "маскирование вмешательства", это позволяет избежать ассоциаций с истинной слепотой, хотя все эти термины давно используются в медицинской литературе и должны быть понятны читателям отчетов об РКИ [119, 123].
Пункт 11б. Если метод маскирования вмешательств применялся, то как оценивалась его эффективность.
Пример
"Для оценки эффективности применения слепого метода участникам раздавали анкеты, в которых содержались три варианта ответов на вопрос о том, какое из вмешательств ("акупунктура", "ее имитация", "не знаю"), по их мнению, применялось в различные периоды испытания... Если участники выбирали один из двух первых ответов, их просили объяснить, почему они пришли к такому выводу…" [124].
Разъяснение
Ранее уже указывалось, что для подтверждения случайного характера отнесения участников к той или иной группе необходимо убедиться в эффективности сокрытия порядка рандомизации; точно так же следует убедиться в успешности применения слепого метода. Хотя уже из описания процедуры маскирования вмешательства может быть ясно, что его удалось замаскировать от заинтересованных лиц, иногда для оценки успешности такого подхода участникам, медицинскому персоналу или исследователям, оценивающим клинические исходы, предлагают угадать, какое вмешательство применялось.
A.S. Prasad et al. не только сравнивали длительность симптомов простуды на фоне приема пастилок с цинком или плацебо, но провели также отдельное исследование, в которое включали здоровых добровольцев, чтобы выяснить, насколько отличается вкус этих двух препаратов [63]. Кроме того, участники основного РКИ должны были ответить на вопрос о применявшемся вмешательстве. В конце испытания 56% больных в группе лечения и 26% больных в контрольной группе правильно ответили на этот вопрос (р=0,09).
Теоретически при условии успешного маскирования вмешательства больной может лишь по чистой случайности угадать, к какой группе он относится. В действительности же превышение расчетной доли больных, имеющих представление о проводимой терапии, еще не означает неэффективности маскирования вмешательств. Хотя истина чаще всего раскрывается при развитии характерных побочных эффектов (особенно при испытании лекарственных препаратов), клинический исход также наводит на определенные мысли. Так, врачи могут предполагать (в ряде случаев ошибочно), что больной, у которого наблюдался более благоприятный клинический исход, скорее всего получал активное вмешательство. Если вмешательство на самом деле эффективнее плацебо (или новый метод эффективнее традиционного), медицинский персонал будет чаще угадывать принадлежность больного к той или иной группе, чем это можно было бы ожидать на основании математических расчетов [125].
Авторы статьи должны сообщить обо всех недочетах, допущенных при маскировании вмешательства (например, о разном внешнем виде препаратов, которые применялись в группах сравнения).
Пункт 12а. Статистические методы, применявшиеся при сравнении групп по основным критериям оценки.
Пример
"Анализ всех данных осуществляли по заранее разработанному плану. Различные соотношения сравнивали с помощью критерия хи-квадрат, при необходимости применяя метод непрерывной коррекции или точный критерий Фишера. При проведении многофакторного анализа использовали логистическую регрессию, при сравнении длительности заболевания и выраженности его симптомов — регрессионную модель пропорционального риска, при сравнении средних концентраций ретинола в сыворотке крови — критерий t (критерий Стьюдента) и анализ ковариаций… При всех сравнениях применялись двусторонние тесты оценки статистической значимости" [126].
Разъяснение
Существует множество методов статистического анализа данных, некоторые из них могут оказаться неприменимыми к конкретной ситуации. Очень важно перечислить все методы, использованные при каждом анализе, а затем подробно описать их в разделе "Результаты".
Почти все методы статистического анализа направлены на расчет размера эффекта вмешательства, т.е. на выявление различий в частоте развития определенных клинических исходов. Помимо размера эффекта авторы должны привести его доверительный интервал, по которому можно судить о степени неясности при оценке истинного эффекта вмешательства. Доверительный интервал можно также интерпретировать как диапазон значений размера эффекта, сходных с полученными в исследовании данными. В настоящее время принято приводить значения 95% доверительного интервала, который означает, что подобный размер эффекта будет получен в 95 из 100 РКИ по соответствующей тематике.
Результаты исследований можно также оценивать по их статистической значимости. Значение р отражает вероятность того, что при одинаковой реальной эффективности сравниваемых вмешательств выявленные различия носят случайный характер. Рекомендуется представлять значения р в виде точных, а не пороговых величин (например, р=0,003, а не p<0,05) [46, 127].
При использовании стандартных методов анализа данных предполагается, что эти данные "независимы". Применительно к РКИ под этим обычно подразумевают регистрацию одного измерения у одного участника. Ошибочно считать независимыми друг от друга данные, полученные в процессе множественных однотипных измерений или наблюдений, выполненных одновременно, но в разных участках у одного и того же больного (что обычно имеет место в стоматологии и ревматологии). Упоминающиеся в этой статье способы статистической обработки данных подразумевают исключительно традиционный подход к сбору информации [128, 129], в противном случае необходимо применять более сложные математические расчеты [130]. Неправильный подход к анализу множественных измерений или наблюдений отмечен в 123 (63%) из 196 РКИ, посвященных лечению ревматоидного артрита [28].
Пункт 12б. Статистические методы, применявшиеся при дополнительном анализе данных (например, при анализе в подгруппах или стандартизованном анализе).
Пример
"При сравнении в группах доли больных с ответной реакцией на лечение применялся критерий хи-квадрат Mantel—Haenszel с внесением поправок на такой стратификационный параметр, как применение метотрексата" [80].
"…Для оценки сравнительной эффективности новой схемы лучевой терапии (CHART) перед началом исследования был запланирован анализ в подгруппах, сформированных в зависимости от возраста и пола больных, их функционального статуса, стадии заболевания, локализации и гистологического строения опухоли. При анализе данных использовался критерий хи-квадрат для выявления взаимодействия, а при необходимости критерий хи-квадрат для выявления тенденций" [131].
Разъяснение
Как и в случае с первичным анализом данных, авторы должны представить точную информацию о методах дополнительного анализа в подгруппах *. Самыми надежными методами такого анализа считаются те, которые основаны на выявлении различий в размере эффекта между подгруппами, сформированными по одному признаку (например, между больными разного возраста); такое сравнение называют тестом для выявления взаимодействия * [132, 133]. Часто используемым, но менее действенным подходом считается сравнение значений р, полученных при оценке размера эффекта в каждой группе с помощью раздельного анализа данных. Такой подход может привести к ошибочному выводу о более выраженном эффекте лечения (взаимодействии) в подгруппе со статистически значимыми различиями по сравнению с подгруппой, где различия были статистически незначимыми [134]. В этих случаях высока частота ложноположительных результатов.
Из-за высокой вероятности ошибочных выводов многие эксперты рекомендуют вообще отказаться от анализа в подгруппах [14, 135], особенно вторичного, проводимого после первоначальной обработки данных; результаты такого вторичного анализа очень часто не подтверждаются в ходе дальнейших исследований и потому считаются ненадежными.
В некоторых исследованиях при неоднородности групп по характеристикам больных (прогностическим факторам) проводится стандартизация (см. стандартизованный анализ*) полученных данных с помощью одной из разновидностей множественного регрессионного анализа. Хотя при проведении РКИ такая необходимость возникает гораздо реже, чем при эпидемиологических исследованиях, стандартизованный анализ может быть вполне оправдан, особенно в случаях, когда одному или нескольким прогностическим факторам придают большее значение, чем остальным [136]. В идеале планируемые методы стандартизованного анализа должны быть перечислены в протоколе исследования. Применение таких методов в высшей степени желательно при использовании стратификации (см. пункт 8б). Следует обосновать проведение стандартизованного анализа и использованных при этом статистических методов. Такое решение нельзя объяснять исключительно статистически значимыми различиями в исходных характеристиках участников разных групп (см. пункт 16) [133, 137].
Авторы отчета обязаны обосновать выбор показателей, которые учитывались при стандартизации полученных данных; указать, как обрабатывались непрерывные данные, и был ли такой анализ запланированным * или решение о нем принималось после получения данных [Muller M., Matthews H., Altman D.G. Reporting on statistical methods to adjust for confounding: a cross-sectional survey. Принято в печать]. Обзоры опубликованных отчетов показали, что представление результатов стандартизованного анализа в подавляющем большинстве случаев не отвечает всем этим требованиям [138—140].
Результаты
Пункт 13а. Число участников на каждой стадии исследования (рекомендуется представить и в виде схемы проведения исследования). Обязательно следует сообщить о числе участников, которые были распределены в каждую группу, получали запланированное лечение, завершили исследование согласно протоколу и были включены в окончательный анализ по основному критерию оценки.
Примеры
См. рис. 2, 3 и 4.
Разъяснение
Структура и особенности проведения некоторых РКИ настолько просты, что для описания числа участников на каждой стадии РКИ достаточно нескольких предложений. В отчетах о более сложных исследованиях требуется пояснить, почему некоторые участники не получили назначенное вмешательство, не наблюдались до конца РКИ или данные о них были исключены из анализа [54]. Эта информация очень важна по целому ряду причин. Больные, исключенные из исследования после рандомизации, скорее всего имеют особенности, не характерные для других участников. Например, в ходе исследования у них резко обострилось заболевание или отмечалось развитие тяжелых побочных эффектов * [32, 141].

Рис. 2. Детальная схема проведения многоцентрового испытания, в ходе которого сравнивалась эффективность первичного коронарного стентирования с использованием стентов, покрытых гепарином (КС-Г), и чрескожной коронарной ангиопластики (КАП).
КА — коронарная артерия; КШ — коронарное шунтирование. Приводится по [144].

Рис. 3. Схема проведения испытания, в ходе которого оценивалась эффективность мануальных манипуляций (ММ) на шейном отделе позвоночника при периодических головных болях напряжения.
Приведена информация о числе больных, которые наблюдались на разных этапах испытания. ИЛТ — имитация лазерной терапии в области шейного отдела позвоночника (плацебо). Приводится по [145].
Отсев больных, который обусловлен потерей (зачастую неизбежной) контакта с ними, не следует путать с произвольным исключением больных из исследования в связи с несоответствием его целям, отменой лечения или отказом больного продолжать прием препарата, несоблюдением предписанной схемы лечения. В ряде случаев исключение данных из анализа приводит к неправильным выводам, и разный подход к этому процессу в основной и контрольной группах может свидетельствовать о высокой вероятности наличия систематической ошибки [141—143]. Вот почему в статье всегда нужно указывать, все ли данные об участниках, рандомизированно отнесенных в группы сравнения, были включены в ITT-анализ (см. пункт 16). Зная, сколько участников вообще не получили назначенную терапию или не прошли полный курс лечения, читатель может оценить разницу в размере эффекта в реальных и идеальных условиях. По возможности следует сообщить о числе больных, которые были обследованы для оценки соответствия целям испытания. Хотя этот показатель отражает только обобщаемость результатов исследования и, возможно, не так важен, как другие [55], по нему можно судить о репрезентативности выборки.
Недавний обзор отчетов об РКИ, которые были опубликованы в 5 ведущих общемедицинских журналах и журналах по внутренним болезням в 1998 г., показал, что представление информации о числе больных на разных этапах исследования часто не соответствует перечисленным требованиям. В первую очередь это касается числа участников, которые не получили назначенное вмешательство или не наблюдались до конца исследования. Доля статей, в которых отсутствовали совершенно необходимые данные о числе больных, прошедших рандомизацию, и числе больных, данные о которых не были включены в анализ, достигала 20% [54]. Качество представления материалов было существенно выше в тех отчетах, где приводилась рекомендуемая CONSORT схема проведения испытания. На основании цитируемого обзора и был разработан новый вариант схемы проведения РКИ для последний версии CONSORT [56—58] (см. рис. 1; табл. 5).
Некоторые данные (например, о числе больных, обследованных для оценки соответствия целям испытания) не всегда известны [14], и в зависимости от характера исследования актуальность одних показателей может быть выше, чем других. Поэтому в ряде случаев целесообразно или даже необходимо изменять структуру представленного образца схемы в соответствии с целями и задачами конкретного РКИ. В качестве примера можно привести многоцентровое РКИ, в ходе которого сравнивалась эффективность коронарного стентирования (с использованием стентов, покрытых гепарином) и стандартной чрескожной коронарной ангиопластики [144]. Из-за особенностей этих способов реваскуляризации миокарда число больных, не получивших назначенное вмешательство, оказалось сравнительно высоким. В схеме проведения данного РКИ (см. рис. 2) пришлось расширить соответствующую ячейку, чтобы перечислить причины отклонения от намеченного плана.
Таблица 5. Информация, необходимая для составления схемы проведения рандомизированного контролируемого испытания (РКИ) и отражающая данные о числе участников на всех его стадиях

Иногда в схему целесообразно включить дополнительную информацию. Здесь примером может служить РКИ, в ходе которого оценивалась эффективность мануальных вмешательств на шейном отделе позвоночника при периодических головных болях напряжения [145]. В схеме проведения данного РКИ (см. рис. 3) представлена детальная информация о числе больных, которые наблюдались на разных этапах испытания. Иногда в схеме проведения РКИ можно отобразить и его результаты (например, частоту развития основного клинического исхода). Так, авторы испытания ингибитора топоизомеразы I иринотекана при метастазирующем раке толстой кишки и неэффективности химиотерапии фторурацилом [146] привели в схеме данные о числе больных, умерших за время наблюдения (см. рис. 4).
Из этих примеров видно, что форма и содержание схемы проведения РКИ могут меняться в зависимости от особенностей конкретного исследования. Так, во многих РКИ, посвященных оценке эффективности хирургических вмешательств или вакцинации, не предусмотрена возможность досрочного прекращения испытания. Хотя группа CONSORT настоятельно рекомендует включать в отчет схему проведения РКИ, ее структуру должны выбрать сами авторы. Более того, при проведении простых РКИ, в которых все участники наблюдались до конца исследования, приводить такую схему в отчете не обязательно.

Рис. 4. Схема проведения испытания ингибитора топоизомеразы I иринотекана при метастазирующем раке толстой кишки и неэффективности химиотерапии фторурацилом.
Приведена информация об основном критерии оценки (общая выживаемость). По данным [146].
Пункт 13б. Описание любых отклонений от протокола с указанием их причин.
Примеры
"Было допущено единственное отклонение от протокола исследования в основной группе. Роженице с анатомически узким тазом было запланировано проведение кесарева сечения, но акушер счел допустимыми естественные роды; операция была выполнена лишь после регистрации слабости родовых сил в первом периоде родов" [147].
"В процессе контроля за ходом испытания из него были исключены 9 медицинских центров, в которых обнаружились приписки и другие серьезные нарушения принципов добросовестной практики научных исследований" [148].
Разъяснение
Авторы должны сообщать обо всех отклонениях от протокола, включая незапланированные изменения вмешательств, методов обследования участников, сбора данных и их анализа. Некоторые из этих отклонений могут быть отражены в схеме проведения РКИ (см. пункт 13а); например, в ней может быть указано число больных, не получивших предписанное вмешательство. Если больных, не соответствующих критериям включения (см. пункт 16), исключали из исследования уже после рандомизации (что не позволяет применять ITT-анализ), информацию о них также можно представить в схеме проведения РКИ. При наличии любых отклонений от протокола в отчете об РКИ нельзя ограничиваться беглым упоминанием о них. Необходимо перечислить все отклонения и указать их причины.
Пункт 14. Даты, отражающие начало и конец периода включения и периода наблюдения.
Пример
"Включение участников соответствующего возраста проводилось… в период с февраля 1993 г. по сентябрь 1994 г.… Участники посещали клинику во время рандомизации (исходное состояние), а затем каждые 6 мес в течение 3 лет" [115].
Разъяснение
Методы лечения постоянно совершенствуются и пополняются новыми, поэтому для того, чтобы представить себе, о какой "стандартной" терапии идет речь, читатель оригинальной статьи должен знать календарные даты начала и конца исследования. Информация о скорости включения участников также может представлять интерес, особенно для других исследователей.
Продолжительность наблюдения после рандомизации участников не всегда одинакова. Во многих РКИ используется такой критерий оценки, как время до развития определенного клинического исхода; в этих случаях наблюдение за отдельными участниками заканчивается после регистрации данного исхода. В отчетах о подобных исследованиях необходимо указать, когда это происходило, и по возможности привести значение медианы продолжительности наблюдения [149, 150].
Если РКИ было прекращено досрочно на основании результатов промежуточного анализа данных (пункт 7б), следует обязательно сообщить об этом. Досрочное завершение РКИ может привести к несоответствию между запланированным и реальным размером выборки. Кроме того, в таких РКИ часто завышен размер эффекта [102].
D.G. Altman et al. [150] изучили отчеты об исследованиях, которые были опубликованы в журналах по онкологии и в которых использовался анализ выживаемости; большинство этих исследований не являлись РКИ. Почти в 80% (104 из 132) отчетов были указаны начало и конец периода включения, но лишь в 24% (32 из 132) отчетов — время окончания периода наблюдения.
Пункт 15. Исходные демографические и клинические характеристики участников в каждой группе.
Пример
См. табл. 6.
Разъяснение
Хотя описание критериев включения (см. пункт 3) уже позволяет представить себе особенности выборки, важно знать исходные характеристики участников исследования.
При проведении РКИ группы сравнения должны отличаться друг от друга только применяемыми вмешательствами. Рандомизация предотвращает возникновение систематической ошибки, связанной с отбором участников, но не гарантирует исходной однородности групп. Однако при этом любые различия в характеристиках участников отражают влияние случая, а не систематической ошибки [25]. Чтобы составить представление о сопоставимости групп, нужно знать исходные демографические и клинические характеристики их участников. Эти параметры особенно важны в тех случаях, когда критерии оценки применяют с самого начала исследования.

Демографические и клинические характеристики участников можно наглядно представить в виде таблицы (см. табл. 6). Для непрерывных данных, таких как масса тела или уровень артериального давления, значение средней следует приводить вместе со значением стандартного (или среднеквадратичного) отклонения, которое отражает вариабельность показателя в группе. При несимметричном распределении непрерывных данных предпочтительнее привести значения медианы и диапазона в перцентилях (например, с 25-го по 75-й перцентиль) [127]. Стандартная ошибка средней и доверительный интервал неприменимы для описания вариабельности данных; эти показатели относятся к проверке гипотез, а не к описательной статистике. Нельзя рассматривать стадии и классы в качестве непрерывных данных (например, больные с I—IV стадиями заболевания); необходимо указать (в абсолютных и относительных величинах), сколько участников было в каждой из таких подгрупп [46, 127].
Несмотря на многократные заявления о неуместности определения статистической значимости различий в исходных количественных характеристиках участников [21, 25, 151], соответствующие анализы проводят до сих пор; в ходе недавнего анализа 50 РКИ подобные погрешности выявлены в половине исследований [133]. В идеале протокол испытания должен содержать информацию о том, учитывались ли конкретные исходные данные при коррекции результатов с помощью ковариационного анализа [137]. Если исходные данные существенно различались, проведение подобной стандартизации повышает вероятность неправильной оценки размера эффекта [137].
Пункт 16. Число участников (в знаменателе) в каждой группе, данные о которых были включены в анализ любого вида, и информация о том, проводился ли ITT-анализ. По возможности следует представлять абсолютное число участников, у которых был выявлен тот или иной эффект, а не их долю (т.е. 10 из 20 больных, а не 50% больных).
Примеры
"Первичный анализ данных проводили исходя из допущения, что все больные получили предписанное лечение; в этот анализ были включены данные обо всех больных, прошедших рандомизацию" [91].
"В группе алендроната 1 больной наблюдался не до конца исследования, поэтому в анализ, проводимый исходя из допущения, что все больные получили назначенное лечение, можно было включить данные о 31 больном. Однако было установлено, что в 5 случаях был нарушен протокол исследования…; таким образом, в окончательный анализ были включены данные о 26 больных" [152].
Разъяснение
В схеме проведения РКИ представлены данные о числе участников, у которых наступил тот или иной клинический исход. Для расчета различных соотношений используется число участников (в знаменателе) в каждой группе, данные о которых были включены в анализ любого вида. Эта информация составляет неотъемлемую часть результатов исследования и особенно важна при оценке клинических исходов, представленных в виде дихотомических данных, поскольку такие показатели, как отношение и разность рисков, должны рассчитываться с учетом частоты наступления этих исходов. Кроме того, представление результатов в относительных величинах помогает сделать вывод о том, все ли больные, прошедшие рандомизацию, были включены в окончательный анализ; если нет, то сколько больных были исключены из него. Таким образом, результаты РКИ не следует представлять только в виде обобщенных показателей (например, в виде значений относительного риска).
Включение в анализ данных не обо всех участниках может привести к возникновению систематической ошибки и неправильной оценке результатов. Однако не все данные, полученные в ходе РКИ, могут быть включены в окончательный анализ. Это связано с нарушениями протокола, например с получением назначенного вмешательства не в полном объеме, назначением неправильного вмешательства или ошибочной рандомизацией участников, не соответствующих критериям включения. Широко рекомендуется всегда проводить анализ данных в зависимости от первоначального отнесения участников к той или иной группе, но это не во всех случаях применимо на практике. Некоторые участники выбывают из РКИ досрочно, некоторым по тем или иным причинам приходится отменять назначенное вмешательство; в итоге не все участники обследуются в конце исследования. В таких случаях невозможно применить ITT-анализ, хотя в соответствующих публикациях часто фигурирует именно это определение. Упомянутый термин способен ввести в заблуждение и в тех случаях, когда до конца исследования наблюдались все участники, но данные о некоторых из них не были включены в анализ, например из-за того, что в действительности лечение не было получено в связи с несоблюдением назначений врача. Анализ, в который включили данные только об участниках, соответствующих целям исследования, в полном объеме получавших предписанное вмешательство и успешно прошедших оценку клинических исходов, называют анализом в зависимости от реально полученного вмешательства. В некоторых РКИ приведены результаты анализов обоих типов.
Исключение из анализа данных об участниках может привести к неправильным выводам. Так, в РКИ, посвященном сравнительной оценке эффективности консервативного и хирургического лечения стеноза сонных артерий, анализ данных о больных, которые наблюдались до конца исследования, показал, что хирургическое лечение снижает риск смерти, развития преходящего нарушения мозгового кровообращения или инсульта, но анализ в зависимости от первоначального отнесения участников к той или иной группе не подтвердил ее преимуществ [153]. В большинстве случаев предпочтительнее проводить ITT-анализ, поскольку он предотвращает появление систематической ошибки, связанной с неслучайным выбыванием участников из исследования [154—156]. Вне зависимости от того, как назвали проведенные анализы авторы статьи, они должны пояснить, данные о каких участниках были при этом использованы (см. пункт 13). ITT-анализ неприменим при изучении побочных эффектов вмешательств.
При несоблюдении некоторыми участниками назначений врача такой анализ приведет к недооценке эффективности вмешательства. В подобных случаях могут потребоваться дополнительные анализы [157, 158].
При анализе отчетов об РКИ, опубликованных в 1997 г. в ведущих общемедицинских журналах, было показано, что почти в половине отчетов (119 из 249) упоминался ITT-анализ; однако лишь в 5 из этих отчетов была приведена точная информация, подтверждающая это [18]. Кроме того, в 89 (75%) из этих отчетов отсутствовали некоторые данные об основном критерии оценки. K.F. Schulz et al. обнаружили, что методологическое качество отчетов, в которых указаны все случаи исключения данных из анализа, в целом гораздо выше [121]; это наглядно свидетельствует о сокрытии некоторыми авторами важной информации об исключении данных из анализа. В свою очередь M. Ruiz-Canela et al. пришли к выводу, что отчеты, в которых сообщается о проведении ITT-анализа, имеют и другие признаки соответствия добросовестной практике научных исследований и публикаций, в частности в них описывается процедура расчета размера выборки [159].
Пункт 17. Суммарный результат для каждого из основных и дополнительных критериев оценки клинических исходов в каждой группе, а также рассчитанный размер эффекта и точность его оценки (например, доверительный интервал).
Пример
См. табл. 7.
Разъяснение
Для каждого из основных и дополнительных критериев оценки в каждой группе следует сообщить суммарный результат (например, доля случаев эффективного и неэффективного лечения или среднее и стандартное отклонение), а также размер эффекта * (различие в результатах между группой лечения и контроля). Для дихотомических клинических исходов размер эффекта выражают в виде отношения риска (относительного риска), отношения шансов или разницы рисков; для данных о выживаемости — в виде отношения шансов выживания, отношения риска смерти или различия в медиане продолжительности жизни; для непрерывных данных — обычно в виде различия средних. Значения перечисленных показателей приводят вместе с доверительным интервалом. К распространенным ошибкам относится представление доверительного интервала для результатов в каждой группе, а не для их разницы [160]. Зачастую представление результатов в виде таблицы может быть более наглядным, чем в виде текста (см. табл. 7).

Авторы должны привести диапазон доверительного интервала для всех критериев оценки, чтобы можно было судить о точности расчета их значений [46, 161]. Обычно используют 95% доверительный интервал, хотя в ряде случаев имеет смысл применить другие его пределы. Редакции многих медицинских журналов требуют или настоятельно рекомендуют использовать доверительные интервалы [162]. Наибольший диапазон доверительного интервала отмечается при статистически незначимых различиях (которые, однако, не равнозначны отсутствию важных клинически значимых различий). В последние годы доверительные интервалы стали применяться чаще, но не во всех медицинских специальностях [160]. В отчете кроме диапазона доверительных интервалов могут приводиться и значения р, однако не следует использовать только последний показатель [163, 164].
Необходимо представить результаты анализа для всех основных и дополнительных критериев оценки, а не только для тех сравнений, в ходе которых были выявлены статистически значимые различия. В настоящий момент еще недостаточно эмпирических доказательств того, что избирательное представление результатов промежуточных анализов [28] отрицательно сказывается на методологическом качестве отчетов о РКИ, хотя это скорее всего именно так [165, 166]. В тех случаях, когда проводился промежуточный анализ, интерпретировать следует данные, полученные в конце исследования, а не результаты промежуточного анализа [167].
При анализе исходов, представленных в виде дихотомических данных, и выживаемости результаты можно представить также в виде таких двух показателей, как ЧБНЛ (число больных, которых необходимо лечить определенным методом в течение определенного времени, чтобы достичь определенного благоприятного исхода или предотвратить определенный неблагоприятный исход у 1 больного) или ИПВ (индекс потенциального вреда — число больных, которые должны получить лечение, чтобы у 1 больного развился неблагоприятный исход; см. пункт 21) [168, 169].
Пункт 18. Другие (кроме основного) применявшиеся виды анализа данных (включая анализ в подгруппах и стандартизованный анализ) с указанием, какие из них были исходно запланированы, а какие было решено провести уже в ходе исследования.
Пример
"Интересно также отметить некоторую взаимосвязь между применением витамина А и тяжестью заболевания при амбулаторном или стационарном лечении больных. При стационарном лечении его результаты в группе витамина А были несколько лучше, чем в контрольной группе, а при амбулаторном лечении — наоборот. Хотя эти данные были получены в ходе запланированного заранее анализа в подгруппах, ни в одном из сравнений выявленные различия не достигли уровня статистической значимости (5%)" [126].
Разъяснение
Использование одних и тех же данных в разных видах анализа существенно повышает риск получения ложноположительных результатов [170]. Особенно авторы должны избегать многочисленных анализов в подгруппах [133, 135, 171]. Результаты заранее запланированных анализов, указанных в протоколе РКИ, значительно надежнее результатов, полученных в ходе анализа, решение о проведении которого было "продиктовано" полученными данными. Всегда нужно указывать, был ли тот или иной анализ запланирован. Если проводились анализы данных в подгруппах, необходимо описать эти подгруппы и обосновать их выбор, хотя приводить подробные разъяснения не всегда обязательно. Избирательное представление результатов этих анализов может способствовать возникновению систематической ошибки [172]. При формальной оценке взаимодействия (см. пункт 12б) данные следует представлять в виде различия в эффекте вмешательства между каждой из подгрупп (вместе с диапазоном доверительного интервала), не ограничиваясь только значением р.
По данным S.F. Assmann et al., анализ в подгруппах применялся в 35 из 50 РКИ, а тест для оценки взаимодействия — только в 15 из этих 35 РКИ. Авторы обзора отметили, что из-за низкого качества многих отчетов часто не было возможности определить, какой из анализов был запланирован.
Эти рекомендации применимы и к анализам, в ходе которых вносятся коррективы на исходные показатели. Следует сообщать обо всех анализах независимо от того, были они стандартизованными или нет. В первом случае нужно указать, планировалось ли проведение такого анализа, и какие показатели были выбраны для этого.
Пункт 19. Все неблагоприятные и побочные эффекты, зарегистрированные в каждой группе и имеющие клиническое значение.
Пример
"Доля больных, у которых отмечалось развитие любых неблагоприятных эффектов, была одинаковой в группах rBPI21 (рекомбинантный бактерицидный белок, повышающий проницаемость мембран) и плацебо — 168 (88,4%) из 190 и 180 (88,7%) из 203 больных соотв.; при оценке по 11 из 12 систем и органов этот показатель был несколько ниже в группе rBPI21.… Доля больных, у которых развились тяжелые неблагоприятные эффекты, в группе rBPI21 была ниже, чем в группе плацебо: 53 (27,9%) из 190 и 74 (36,5%) из 203 больных соотв. Только 3 случая возникновения тяжелых побочных эффектов были связаны с применявшимся вмешательством; все они отмечались в группе плацебо" [173].
Разъяснение
Кроме предполагаемых положительных эффектов для большинства лечебных вмешательств характерны также побочные, часто нежелательные эффекты, которые иногда угрожают здоровью и жизни больных. Чтобы принимать обоснованные взвешенные решения, читатель должен иметь информацию как о преимуществах, так и о недостатках различных вмешательств. От частоты развития и характера побочных эффектов конкретного метода лечения во многом зависит, будет ли он признан эффективным, безопасным и приемлемым. Не все отмеченные в ходе РКИ побочные эффекты * являются следствием тех или иных лечебных вмешательств; некоторые из них обусловлены самим заболеванием. Только в ходе РКИ можно наиболее полно оценить идеальные показатели эффективности и безопасности вмешательства, хотя такая структура исследования не позволяет выявить редкие побочные эффекты.
Авторы должны сообщить о частоте развития по крайней мере основных тяжелых побочных эффектов и о причинах досрочной отмены лечения в каждой из групп сравнения. Если в ходе РКИ побочный эффект отмечался неоднократно, следует указать, у какого числа больных и с какой частотой он возникал. Кроме того, необходимо указать, каким образом оценивалась тяжесть неблагоприятных эффектов [174].
Во многих отчетах информация о неблагоприятных реакциях отсутствует или недостаточна. Только в 39% из 192 отчетов об испытаниях лекарственных препаратов данные о клинических проявлениях неблагоприятных эффектов были представлены должным образом, лишь в 29% отчетов оценка токсичности препаратов основывалась на результатах лабораторных исследований [174]. Более того, при анализе 52 отчетов об исследованиях (преимущественно РКИ), опубликованных в одном томе ведущего общемедицинского журнала в 1998 г., оказалось, что в 30 (58%) отчетах никаких деталей о неблагоприятных эффектах вмешательств не было приведено [J. Hasford, личное сообщение ].
Обсуждение
Пункт 20. Интерпретация полученных данных с учетом первоначальной гипотезы, источников возможных систематических ошибок или погрешностей, возможного влияния вторичного и прочих видов вспомогательного анализа.
Разъяснение
Существует мнение, что в отчетах о научных исследованиях раздел "Обсуждение" переполнен риторикой, с помощью которой авторы пытаются оправдать полученные результаты [175], и практически не содержит обоснованных аргументов "за" и "против" полученных данных и самого исследования. Редакции некоторых журналов борются с этой проблемой, всячески поощряя структурирование соответствующего раздела в отчетах об РКИ [176, 177]. Так, журнал "Annals of Internal Medicine" [176] предлагает авторам следующую структуру этого раздела: 1) краткое резюме основных результатов; 2) перечень и обоснование предполагаемых механизмов действия вмешательства; 3) сравнение результатов данного и предыдущих исследований (по возможности включая реферат систематического обзора, обобщающего эти результаты); 4) описание ограничений данного исследования (и методов, использованных для того, чтобы уменьшить влияние этих ограничений или преодолеть их); 5) краткая характеристика исследования с точки зрения его практической и научной ценности. Редакционный коллектив журнала рекомендует авторам придерживаться этой структуры, при необходимости используя в разделе "Обсуждение" дополнительные подзаголовки.
Хотя в отчетах редко упоминается об ограничениях и недостатках оригинальных клинических исследований [178], эта информация имеет особое значение. Например, недавно группа хирургов сообщила, что при выполнении технически сложной лапароскопической холецистэктомии частота развития осложнений (основной критерий оценки) была ниже, чем при широко применяемой открытой холецистэктомии [179]. В своем сообщении авторы даже не обсуждали вероятность наличия систематической ошибки, хотя все эндоскопические процедуры целиком выполняли квалифицированные врачи-исследователи, а традиционную открытую холецистэктомию в 80% случаев завершали стажеры. Выявленные преимущества лапароскопической холецистэктомии могут целиком зависеть от опыта хирурга, что повышает вероятность наличия систематической ошибки. Для читателя было бы лучше, если бы результаты этого исследования оценивались с учетом данного методологического недостатка.
Возможно, именно при обсуждении недостатков исследования следует представить данные о любых погрешностях * результатов. Эти погрешности могут быть связаны с различными аспектами исследования, например недостаточно четкой формулировкой критериев включения (см. пункт 3а) или основного критерия оценки (см. пункт 6). Проверка обоснованности шкалы, применявшейся у детей, могла проводиться в популяции взрослых больных, или, например, один из исследователей, оценивающих клинические исходы, мог не пройти необходимую подготовку.
Никогда не следует ставить знак равенства между статистической и клинической значимостью результатов; выявление статистически незначимых различий вовсе не свидетельствует об одинаковой эффективности вмешательств. Каким бы ни было значение р, только диапазон доверительного интервала (см. пункт 17) позволяет определить наличие клинически значимого эффекта лечения [94].
Необходимо очень осторожно трактовать результаты РКИ, в которых проводились множественные сравнения *. Такие сравнения неизбежны при использовании нескольких вмешательств или критериев оценки, при неоднократных измерениях, проведении анализов в подгруппах и т.д. В этих обстоятельствах статистически значимые различия будут обусловлены только влиянием случайных факторов.
Пункт 21. Обобщаемость (применимость) результатов испытания.
Пример
"Данное испытание было достаточно крупным и продолжительным, но популяция больных с остеоартритом и ревматоидным артритом намного разнообразнее использованной выборки, а болезнь длится значительно дольше 6 мес. Кроме того, у больных с остеоартритом и ревматоидным артритом часто встречаются сопутствующие заболевания (например, желудочно-кишечного тракта), которые в данном исследовании относились к критериям исключения. Поэтому полученные результаты не отражают частоты развития редких неблагоприятных реакций и не могут распространяться на все случаи названных заболеваний, с которыми приходится сталкиваться в клинической практике" [180].
Разъяснение
Обобщаемостью (применимостью) результатов испытания называют ту степень, в которой они могут быть применимы при других обстоятельствах, в иных клинических условиях [181]. Обобщаемость результатов прежде всего определяется их достоверностью: результаты некачественного РКИ недостоверны, поэтому вопрос об их обобщаемости отпадает автоматически. Не существует абсолютной обобщаемости как таковой; это понятие обретает смысл только в тех случаях, когда речь идет о конкретных условиях, которые не изучались в ходе конкретного испытания. Правомерны, например, следующие вопросы: "Применимы ли результаты данного РКИ к данному больному или к группам больных определенного возраста, пола, с определенной стадией заболевания или с сопутствующими заболеваниями?"; "Применимы ли результаты данного РКИ при использовании других препаратов того же фармакологического класса (группы), других дозировок, схем и путей введения, а также сопутствующей терапии?"; "Будут ли результаты одинаковыми при использовании вмешательства в системах первичной, квалифицированной и специализированной медицинской помощи?"; "Как влияет вмешательство на другие клинические исходы, которые не оценивались в данном РКИ, и как повлияло бы на результаты изменение продолжительности лечения и наблюдения?"
Оценка обобщаемости результатов РКИ во многом субъективна, она зависит от характеристик участников, клинической базы, применявшихся схем лечения и оцениваемых клинических исходов [182]. Поэтому так важно, чтобы в отчете была представлена полная информация о критериях включения участников, клинической базе исследования и ее местонахождении (см. пункт 3), вмешательствах и схемах их применения (см. пункт 4), основных и дополнительных клинических исходах (см. пункт 6), начале и конце периодов включения и наблюдения (см. пункт 14). Важно также сообщать о доле больных в контрольной группе, у которых развился тот или иной клинический исход (что позволяет оценить степень риска его возникновения в контрольной группе).
Пытаясь применить результаты РКИ к конкретному клиническому случаю, нужно учитывать ряд обстоятельств [183—185]. Эффективность лечения может быть разной у отдельных больных, участников одного РКИ или нескольких исследований, включенных в систематический обзор, однако такие различия, как правило, количественные, а не качественные. За редким исключением [185], применимость вмешательств, оказавшихся полезными для узкого круга больных, в действительности гораздо шире. При оценке возможных достоинств и недостатков определенного вмешательства у отдельного больного или группы больных с характеристиками, отличающимися от характеристик участников РКИ, полезно ориентироваться на рассчитанные авторами отчета показатели, учитывающие исходный риск и размер эффекта, например ЧБНЛ и ИПВ [185—187]. Убедившись, что в конкретном случае вмешательство приемлемо по соображениям эффективности и безопасности, врач обязан учесть мнение и пожелания больного. Такой же логики рассуждений врач должен придерживаться при оценке применимости результатов РКИ в других условиях оказания медицинской помощи и при использовании других вмешательств.
Пункт 22. Общая оценка полученных результатов в свете имеющихся доказательств.
Пример
"Результаты исследований, проведенных до 1990 г., указывали на то, что профилактическая иммунотерапия снижает частоту больничных инфекций у младенцев с очень низкой массой тела при рождении. Однако эти исследования были небольшими и имели различную структуру, в них применялись разные препараты и дозы препаратов у несхожих категорий участников. В данном крупном многоцентровом РКИ повторное внутривенное введение иммуноглобулина не сопровождалось статистически значимым снижением частоты больничных инфекций у недоношенных детей с массой тела при рождении от 501 до 1500 г" [188].
Разъяснение
Результаты любого РКИ важны не только для выяснения того, какое вмешательство лучше, каков размер эффекта и насколько точны полученные результаты. В отчете об РКИ должно быть указано, как полученные данные соотносятся с результатами предыдущих исследований по соответствующей тематике. В идеале такая цель может быть достигнута путем использования в разделе "Результаты" или "Обсуждение" элементов формального систематического обзора (мета-анализа) [82, 189, 190]. Но подобный подход реален только при наличии опубликованных результатов предыдущих РКИ (например, в базе данных Cochrane Controlled Trials Register [191]) и в ряде случаев невозможен.
Включение в раздел "Обсуждение" систематического обзора позволяет читателю статьи оценить результаты РКИ в свете всех доказательств, имеющихся на тот момент в мировой медицинской литературе. Такая информация помогает понять, насколько данные, полученные в ходе этого РКИ, схожи с результатами других исследований, а также насколько различаются характеристики участвовавших в них больных. Недавно были получены доказательства того, что качество представления этой информации в отчетах об РКИ неудовлетворительно [192]. Для обобщения результатов данного РКИ и предшествующих исследований можно использовать методы Байеса [193].
Редакция журнала "Annals of Internal Medicine" рекомендует авторам при обсуждении результатов своих РКИ по крайней мере упоминать имеющиеся доказательства. При этом соответствующий раздел не должен быть бессистемным и ограничиваться цитированием работ, подтверждающих результаты представляемого РКИ [194]. Желательно включить в этот раздел систематический обзор или указать на недостаток информации, если полноценное обсуждение по каким-то причинам невозможно.
Заключение
Оценка эффективности медицинских вмешательств будет правильной только в том случае, если исследователи постараются свести к минимуму вероятность возникновения систематических ошибок. Рандомизированное отнесение участников к той или иной группе остается единственным методом, позволяющим избежать систематических ошибок, связанных с отбором и влиянием сопутствующих факторов. Действительно, во многих методологических обзорах [195—197] (хотя и не во всех [198, 199]) были выявлены стойкие различия в качестве рандомизированных и нерандомизированных исследований.
Однако систематические ошибки могут возникать и в РКИ, если они проводятся неправильно [200]. Результаты недавних анализов свидетельствуют о наличии в некоторых РКИ систематических ошибок, которые приводят к неверным выводам. Четыре группы авторов независимо друг от друга показали, что в исследованиях с неправильно организованным или недостаточным сокрытием порядка отнесения участников к той или иной группе размер эффекта был завышен в среднем на 30—40% по сравнению с теми исследованиями, где этот процесс был правильным [2, 4, 5, 201]. В целом для РКИ, проведенных на низком методологическом уровне, характерна тенденция к завышению размера эффекта и наличию значимых систематических ошибок.
Только в высококачественных исследованиях с правильно выбранной структурой вероятность возникновения систематических ошибок сведена к минимуму. При выборе структуры и проведении РКИ очень важны методологический и клинический опыт, внимание к малейшим деталям [22, 106], постоянная готовность к столкновению с непредвиденными трудностями, незамеченными вовремя проблемами и методологическими недостатками. При написании отчета об РКИ также следует в первую очередь помнить о возможных систематических ошибках и стремиться к предельной ясности изложения материала. Читатели не должны теряться в догадках относительно применявшихся методов исследования, пытаясь разграничить сомнительные и достоверные результаты. Этика проведения клинических испытаний базируется на принципах добросовестной практики научных исследований, а результаты любых научных исследований следует представлять в соответствии с принципами добросовестной практики научных публикаций [202].
Данная статья была написана для того, чтобы облегчить авторам использование CONSORT при написании отчетов об РКИ и донести до широкой медицинской общественности важность правильного представления их результатов. Материалы CONSORT могут помочь исследователям, планирующим РКИ, а также рецензентам и редакторам, которые оценивают методологическое качество статей. Эти материалы находятся в непрерывном развитии, периодически подвергаясь оценке, усовершенствованию, а при необходимости и изменению. Таким образом, изложенные в статье принципы и контрольный список [56—58] могут изменяться по мере накопления новых данных и критических замечаний.
Использование первого варианта CONSORT, несмотря на его несовершенство, привело к улучшению качества отчетов об РКИ, публикуемых в тех журналах, которые признали CONSORT [54, 56—58]. Другие группы исследователей и редакторов используют CONSORT для повышения качества исследований иных типов, например испытаний диагностических методов [J. Lijmer, личное сообщение], мета-анализов РКИ [203] и обсервационных исследований [204]. Есть надежда, что этот дух сотрудничества сохранится и впредь.
Для пользователей Интернета создан сайт группы CONSORT (http://www.consort-statement.org) с обучающими материалами и базой данных, в которой хранятся материалы, необходимые при подготовке отчета об РКИ. На сайте можно найти примеры из реальных исследований, в том числе и включенные в эту статью. База данных будет пополняться новыми образцами правильного и неправильного представления результатов РКИ; приветствуются любые замечания и предложения, которые можно посылать координатору группы (Leah Lepage; llepage@uottawa.ca). Будут приложены все усилия к тому, чтобы упомянутые примеры были всегда доступны всем желающим для изучения и распространения среди ученых и практикующих врачей, занимающихся биомедицинскими исследованиями.
Материалы CONSORT будут периодически оцениваться до тех пор, пока не появятся прямые доказательства важности каждого пункта контрольного списка и схемы проведения РКИ. Члены группы CONSORT будут продолжать поиск статей, посвященных различным аспектам улучшения качества отчетов об РКИ, и призывают авторов этих статей сообщать о них координатору группы. Вся информация будет размещаться на сайте группы в Интернете и регулярно обновляться.
Усилия группы CONSORT были замечены медицинской общественностью. Редакционные коллективы многих журналов, включая Lancet, BMJ, JAMA и Annals of Internal Medicine, различные объединения редакторов биомедицинских периодических изданий, в том числе Международный комитет редакторов медицинских журналов (Ванкуверская группа) и Совет редакторов научных журналов официально поддержали CONSORT. Издания, которые пока еще не присоединились к их числу, могут сделать это, зарегистрировавшись на сайте группы. В конечном счете эти совместные усилия должны способствовать улучшению качества всех без исключения видов медицинской помощи.
Словарь терминов
Анализ в подгруппах — анализ, при котором эффект вмешательства оценивается в определенных подгруппах участников с одинаковыми клиническими или демографическими характеристиками. Размер выборки при таком анализе обычно очень мал, поэтому его статистическая чувствительность низка. При проведении анализа в подгруппах исследователи сталкиваются с проблемами, характерными для множественных сравнений. См. также Множественные сравнения .
Анализ, проводимый из допущения, что все больные получили назначенное вмешательство (анализ в зависимости от назначенного вмешательства, или ITT-анализ — от англ. intention-to-treet analysis), — подход, при котором данные обо всех участниках анализируются в соответствии с тем, к какой группе вмешательства они были отнесены первоначально (вне зависимости от того, применялось ли в действительности это вмешательство). Такой анализ предотвращает систематическую ошибку, связанную с выбыванием или исключением участников, которая возникает при несоблюдении предписанных назначений и может нарушить однородность групп сравнения, даже если таковая была достигнута при рандомизации.
Блок — см. Рандомизация внутри блоков.
Блоковая рандомизация — см. Рандомизация внутри блоков.
Взаимодействие — изменение силы воздействия одного переменного фактора на клинический исход, которое происходит под влиянием другого переменного фактора. В ходе РКИ проведение теста на взаимодействие позволяет выявить различие в размере эффекта между подгруппами. См. также Анализ в подгруппах .
Включение — процесс, осуществляемый после обследования потенциальных кандидатов для оценки соответствия целям РКИ, но перед рандомизацией.
Влияние сопутствующих факторов — искаженная оценка эффекта вмешательства в тех случаях, когда группы сравнения различаются не только по применяемым вмешательствам, но и по другим факторам (например, исходные характеристики участников, прогностические факторы или сопутствующая терапия), которые также могут повлиять на изучаемый исход. См. также Стандартизованный анализ.
Вмешательство — метод изучаемого медицинского воздействия. Эффекты вмешательств количественно выражают с помощью критериев оценки.
Генерация последовательности отнесения участников к той или иной группе — процесс выработки случайной последовательности отнесения участников к той или иной группе с помощью таблицы случайных чисел или специальной компьютерной программы. Применяется при простой, блоковой или стратификационной рандомизации.
Гипотеза — предположение о том, что сравниваемые вмешательства по-разному влияют на клинический исход. Нулевая гипотеза об отсутствии этого различия требует проверки с помощью специальных статистических тестов, в ходе которых рассчитывают значение р.
Группы сравнения — группы, в которых сравнивается эффективность различных вмешательств; кроме того, применяются термины "группа лечения", или "основная группа" и "контрольная группа", могут также использоваться названия вмешательств (например, "группа аспирина" и "группа плацебо").
Детерминистский метод формирования групп — отнесение участников к той или иной группе в заранее определенном порядке, не содержащем элемент случайности (например, поочередно, в зависимости от дня недели, номера больницы или даты рождения больного). О порядке отнесения известно заранее, что позволяет заинтересованным лицам вмешиваться в процесс формирования групп. Такой подход приводит к возникновению систематической ошибки, связанной с отбором участников. См. также Систематическая ошибка, связанная с отбором участников и Сокрытие порядка отнесения участников к той или иной группе.
Доверительный интервал — мера точности оценки показателя. Отражает область, в пределах которой "истинная" величина этого показателя находится с определенной степенью вероятности (обычно 95%). Доверительный интервал измеряется в тех же единицах, что и сам показатель. Чем шире диапазон доверительного интервала, тем меньше точность оценки, и наоборот.
Достоверность (внутренняя обоснованность) — степень, в которой результат отражает истину и свободен от систематических ошибок; максимальная степень достоверности достигается при правильном выборе структуры и проведении РКИ.
Запланированные анализы — виды статистического анализа данных, указанные в протоколе испытания (т.е. запланированные до сбора данных). Иногда их также называют априорными (или первичными) и противопоставляют незапланированным анализам (вторичным, исследовательским, "продиктованным" полученными данными). См. также Анализ в подгруппах .
Исходные характеристики — демографические, клинические и иные особенности, отмечаемые у участников в начале исследования, т.е. до вмешательства. См. также Прогностический признак .
Клинический исход — см. Критерий оценки.
Критерий оценки — показатель, позволяющий оценить изучаемый клинический исход. Предполагается, что различия в этих показателях между группами сравнения обусловлены применением разных вмешательств. Основной клинический исход представляет наибольший интерес для исследователей, а данные о дополнительных клинических исходах позволяют оценить дополнительные эффекты изучаемого вмешательства.
Критерии включения — клинические и демографические характеристики, которые должны присутствовать у участников РКИ
Критерии соответствия целям РКИ — клинические и демографические характеристики, которые должны присутствовать у потенциальных кандидатов на включение в РКИ.
Маскирование вмешательства — см. Слепой метод.
Минимизация — метод формирования групп сравнения, который преследует те же цели, что и стратификация (уравновесить действие некоторых факторов). Рандомизированно относят к той или иной группе лишь первого больного, а всех последующих распределяют таким образом, чтобы свести к минимуму имеющуюся на тот момент неоднородность. Минимизация представляется единственной приемлемой альтернативой рандомизации.
Множественность результатов — проведение в ходе РКИ большого числа сравнений, обычно в связи с использованием множества критериев оценки или групп, многократной оценкой клинических исходов уже после окончания вмешательства или применением анализа в подгруппах.
Множественные сравнения — использование одних и тех же данных в различных видах статистического анализа. Множественные статистические сравнения повышают вероятность возникновения ошибки первого типа (выявляемое различие приписывается действию вмешательства, хотя на самом деле оно обусловлено влиянием случайных факторов).
Наблюдение — периодические контакты исследователей с участниками для выполнения назначенных вмешательств, их изменения, регистрации эффекта вмешательств и сбора данных. См. также Наблюдение не до конца исследования .
Наблюдение не до конца исследования — утрата контакта с участником, типичная для длительных исследований; при этом полный сбор всех запланированных данных становится невозможным. См. также Наблюдение .
Набор участников — процесс, с которого начинается обследование потенциальных участников РКИ для оценки соответствия его целям. См. также Включение .
Нарушение протокола — несоблюдение заранее указанных в протоколе РКИ условий (как в целом, так и в отношении отдельных больных). Примерами таких нарушений могут быть ошибочное включение в РКИ участников, не отвечающих критериям включения, или применение вмешательств, отличающихся от указанных в протоколе.
Неблагоприятный эффект — нежелательный эффект, выявляемый у участников РКИ; он может и не быть связан с изучаемым вмешательством. См. также Побочный эффект.
Обобщаемость (применимость, внешняя обоснованность) — степень, в которой результаты данного РКИ применимы при других обстоятельствах.
Ограниченная рандомизация — применение любого дополнительного метода рандомизации, позволяющего уравновесить группы по размеру или исходным характеристикам участников. Первую задачу позволяет решить блоковая рандомизация, а вторую — стратификационная рандомизация, которую проводят независимо в пределах каждой подгруппы (например, среди лиц с определенной тяжестью состояния, а в многоцентровых РКИ — в каждом медицинском центре).
Открытое испытание — РКИ, в котором слепой метод не применялся.
Отнесение — см. Рандомизация.
Побочный эффект — неожиданный или нежелательный эффект вмешательства. См. также Неблагоприятный эффект.
Погрешность — количественное выражение (обычно в виде 95% доверительного интервала) неопределенности при оценке таких показателей, как размер эффекта. В более общем виде означает все источники неопределенности, например ошибку измерения.
Порядок (последовательность) рандомизации — список вмешательств, составленный с использованием методов генерации случайной последовательности и применяемый для отнесения последовательно включаемых участников к той или иной группе.
Правило прекращения исследования — статистический критерий, используемый в некоторых РКИ в ходе запланированного и указанного в протоколе промежуточного анализа данных для того, чтобы определить момент, когда исследование может или должно быть прекращено в связи с явными преимуществами или недостатками одного из вмешательств. См. также Промежуточный анализ.
Прогностический показатель — исходный показатель, который определяет клинический исход в отсутствие вмешательства. Простая (неограниченная) рандомизация может привести к неоднородности групп сравнения по прогностическим показателям, что искажает результаты и снижает достоверность исследования. Избежать этого позволяет применение методов стратификации и минимизации. См. также Стандартизованный анализ.
Промежуточный анализ — сравнение эффекта вмешательства в разных группах до формального завершения РКИ, обычно до окончания периода включения. Такой анализ часто применяется вместе с правилами прекращения исследований; это позволяет принять решение о досрочном прекращении РКИ, чтобы не подвергать больных ненужному риску в тех случаях, когда преимущества одного из вмешательств очевидны. Частота и предполагаемые сроки проведения промежуточных анализов должны быть указаны в протоколе РКИ.
Простая рандомизация — рандомизация, при проведении которой не использовались никакие дополнительные методы или приемы. В РКИ с 2 группами сравнения такой порядок случайного отнесения участников к той или иной группе можно сравнить с подбрасыванием монетки. См. также Ограниченная рандомизация .
Размер выборки — число участников РКИ. Предполагаемый размер выборки рассчитывают заранее с учетом статистической чувствительности, которой должно обладать исследование. Размер выборки должен быть достаточен для того, чтобы с высокой долей вероятности выявить статистически значимый эффект заданного размера (если таковой существует на самом деле). Реальным размером выборки называют число участников испытания, прошедших рандомизацию, получивших предписанное вмешательство или включенных в анализ.
Размер эффекта — см. Эффект вмешательства .
Рандомизация (случайный порядок отнесения участников испытания к той или иной группе) — процесс, в ходе которого каждый участник имеет одинаковый шанс получить любое из возможных вмешательств. Этот метод предназначен для того, чтобы невозможно было предвидеть заранее, в какую группу будет отнесен конкретный участник.
Рандомизация внутри блоков — способ рандомизации, который гарантирует постоянное соотношение (например, 1:1 или 2:1) между числом участников, отнесенных в группы сравнения в любой момент испытания. Пополнение групп осуществляется после того, как будет составлен блок заранее оговоренного размера. Так, в блоке из 12 участников соотношение рандомизации может составлять 1:1 (6 участникам будет назначено вмешательство А, другим 6 участникам — вмешательство В) или 2:1 (в этом случае 8 участникам будет назначено вмешательство А, 4 участникам — вмешательство В). Генерация порядка отнесения участников к той или иной группе включает в себя случайный выбор из числа всех перестановок при условии, что будет соблюдено заданное соотношение рандомизации.
Систематическая ошибка — систематическое завышение или занижение "истинного" эффекта вмешательства, связанное с неправильным выбором структуры РКИ, его проведением или анализом данных.
Систематическая ошибка, связанная с отбором участников, — явное и скрытое несоответствие исходных характеристик участников вследствие неправильного отбора и отнесения участников к той или иной группе, приводящее к различиям в прогнозе между группами сравнения. См. также Сокрытие отнесения участников к той или иной группе и Обобщаемость .
Систематическая ошибка, связанная с ходом исследования, — систематические различия в лечении, которое проводится в группах сравнения помимо изучаемого вмешательства.
Систематическая ошибка, связанная с выявлением и подтверждением определенного клинического исхода, — искажение результатов РКИ при оценке клинических исходов исследователем или самим участником, знающим о применяемом вмешательстве.
Слепой метод (маскирование вмешательства) — сохранение в тайне назначенного вмешательства от участников, медицинского персонала и лиц, осуществляющих сбор данных или оценку клинических исходов. При маскировании вмешательства от всех перечисленных лиц метод называют двойным слепым (самый распространенный вариант). Слепой метод предотвращает возникновение систематических ошибок, связанных с ходом исследования, а также с выявлением и подтверждением определенного клинического исхода.
Сокрытие порядка отнесения участников РКИ к той или иной группе — способ предотвращения систематической ошибки, связанной с отбором участников, за счет сохранения в тайне порядка (последовательности) рандомизации от лиц, осуществляющих включение участников в РКИ, непосредственно до момента их отнесения к той или иной группе.
Соотношение рандомизации — предполагаемое соотношение размеров групп сравнения. В простых РКИ с 2 группами это соотношение обычно равно 1:1, но в ряде случаев используется неравная рандомизация с соотношением 1:2.
Стандартизованный анализ — обычно применяется для устранения исходной неоднородности в важных характеристиках участников; иногда используется для коррекции значения р при множественных измерениях. См. Множественные сравнения .
Статистическая чувствительность (мощность) исследования — вероятность (обычно рассчитываемая перед началом РКИ) того, что в ходе исследования будет выявлен статистически значимый эффект вмешательства оговоренного размера. Размер выборки часто рассчитывают на основании желаемой статистической чувствительности исследования. См. также Размер выборки .
Стратификационная рандомизация — подход к формированию групп сравнения, при котором рандомизацию проводят в пределах определенных подгрупп, или страт (например, среди больных определенного возраста или с определенной тяжестью заболевания), что позволяет уравновесить группы по исходным характеристикам участников. См. также Ограниченная рандомизация .
Точность — см. Погрешность .
Участник — обычно объект исследования, по своим характеристикам отвечающий критериям соответствия целям РКИ и критериям включения. См. также Включение и Набор потенциальных участников .
Цели исследования — общие вопросы, на которые должно ответить исследование. Могут быть связаны с проверкой одной или нескольких гипотез, которые помогают ответить на поставленные вопросы. См. также Гипотеза .
Эффект вмешательства — показатель, отражающий различия в определенных клинических исходах между группами сравнения. Для дихотомических клинических исходов его обычно выражают в виде отношения риска (относительного риска), отношения шансов или разницы рисков; для непрерывных данных — в виде различия средних. Часто обозначается как "размер эффекта".
Литература
1. Cochrane A.L. Effectiveness and Efficiency: Random Reflections on Health Services. Abingdon, UK: The Nuffield Provincial Hospitals Trust; 1972:2.
2. Schulz K.F., Chalmers I., Hayes R.J., Altman D.G. Empirical evidence of bias. Dimensions of methodological quality associated with estimates of treatment effects in controlled trials. JAMA 1995;273:408—12. [PMID: 0007823387]
3. Moher D. CONSORT: an evolving tool to help improve the quality of reports of randomized controlled trials. Consolidated Standards of Reporting Trials. JAMA 1998;279:1489—91. [PMID: 0009600488]
4. Kjaergеrd L., Villumsen J., Gluud C. Quality of randomised clinical trials affects estimates of intervention efficacy [Abstract]. In: Abstracts for Workshops and Scientific Sessions, 7th International Cochrane Colloquium, Rome, Italy, 1999.
5. Jьni P., Altman D.G., Egger M. Assessing the quality of controlled clinical trials. BMJ [In press].
6. Veldhuyzen van Zanten S.J., Cleary C., Talley N.J., Peterson T.C., Nyren O., Bradley L.A., et al. Drug treatment of functional dyspepsia: a systematic analysis of trial methodology with recommendations for design of future trials. Am J Gastroenterol 1996;91:660—73. [PMID: 0008677926]
7. Talley N.J., Owen B.K., Boyce P., Paterson K. Psychological treatments for irritable bowel syndrome: a critique of controlled treatment trials. Am J Gastroenterol 1996;91:277—83. [PMID: 0008607493]
8. Adetugbo K., Williams H. How well are randomized controlled trials reported in the dermatology literature? Arch Dermatol 2000;136:381—5. [PMID: 0010724201]
9. Kjaergеrd L.L., Nikolova D., Gluud C. Randomized clinical trials in HEPATOLOGY: predictors of quality. Hepatology 1999;30:1134—8. [PMID: 0010534332]
10. Schor S., Karten I. Statistical evaluation of medical journal manuscripts. JAMA 1966;195:1123—8. [PMID: 0005952081]
11. Gore S.M., Jones I.G., Rytter E.C. Misuse of statistical methods: critical assessment of articles in BMJ from January to March 1976. Br Med J 1977;1:85—7. [PMID: 0000832023]
12. Hall J.C., Hill D., Watts J.M. Misuse of statistical methods in the Australasian surgical literature. Aust N Z J Surg 1982;52:541—3. [PMID: 0006959608]
13. Altman D.G. Statistics in medical journals. Stat Med 1982;1:59—71. [PMID: 0007187083]
14. Pocock S.J., Hughes M.D., Lee R.J. Statistical problems in the reporting of clinical trials. A survey of three medical journals. N Engl J Med 1987;317:426—32. [PMID: 0003614286]
15. Altman D.G. The scandal of poor medical research [Editorial]. BMJ 1994;308:283—4. [PMID: 0008124111]
16. DerSimonian R., Charette L.J., McPeek B., Mosteller F. Reporting on methods in clinical trials. N Engl J Med 1982;306:1332—7. [PMID: 0007070458]
17. Moher D., Dulberg C.S., Wells G.A. Statistical power, sample size, and their reporting in randomized controlled trials. JAMA 1994;272:122—4. [PMID: 0008015121]
18. Hollis S., Campbell F. What is meant by intention to treat analysis? Survey of published randomised controlled trials. BMJ 1999;319:670—4. [PMID: 0010480822]
19. Nicolucci A., Grilli R., Alexanian A.A., Apolone G., Torri V., Liberati A. Quality, evolution, and clinical implications of randomized, controlled trials on the treatment of lung cancer. A lost opportunity for meta-analysis. JAMA 1989;262:2101—7. [PMID: 0002677423]
20. Sonis J., Joines J. The quality of clinical trials published in The Journal of Family Practice, 1974—1991. J Fam Pract 1994;39:225—35. [PMID: 0008077901]
21. Schulz K.F., Chalmers I., Grimes D.A., Altman D.G. Assessing the quality of randomization from reports of controlled trials published in obstetrics and gynecology journals. JAMA 1994;272:125—8. [PMID: 0008015122]
22. Schulz K.F. Randomised trials, human nature, and reporting guidelines. Lancet 1996;348:596—8. [PMID: 0008774577]
23. Ah-See K.W., Molony N.C. A qualitative assessment of randomized controlled trials in otolaryngology. J Laryngol Otol 1998;112:460—3. [PMID: 0009747475]
24. Bath F.J., Owen V.E., Bath P.M. Quality of full and final publications reporting acute stroke trials: a systematic review. Stroke 1998;29:2203—10. [PMID: 0009756604]
25. Altman D.G., Dore C.J. Randomisation and baseline comparisons in clinical trials. Lancet 1990;335:149—53. [PMID: 0001967441]
26. Williams D.H., Davis C.E. Reporting of assignment methods in clinical trials. Control Clin Trials 1994;15:294—8. [PMID: 0007956269]
27. Mosteller F., Gilbert J.P., McPeek B. Reporting standards and research strategies for controlled trials. Agenda for the editor. Control Clin Trials 1980;1:37—58.
28. Gшtzsche P.C. Methodology and overt and hidden bias in reports of 196 double-blind trials of nonsteroidal antiinflammatory drugs in rheumatoid arthritis. Control Clin Trials 1989;10:31—56. [PMID: 0002702836]
29. Tyson J.E., Furzan J.A., Reisch J.S., Mize S.G. An evaluation of the quality of therapeutic studies in perinatal medicine. J Pediatr 1983;102:10—3. [PMID: 0006848706]
30. Moher D., Fortin P., Jadad A.R., Juni P., Klassen T., Le Lorier J., et al. Completeness of reporting of trials published in languages other than English: implications for conduct and reporting of systematic reviews. Lancet 1996;347:363—6. [PMID: 0008598702]
31. Junker C.A. Adherence to published standards of reporting: a comparison of placebo-controlled trials published in English or German. JAMA 1998;280:247—9. [PMID: 0009676671]
32. Altman D.G. Randomisation [Editorial]. BMJ 1991;302:1481—2. [PMID: 0001855013]
33. Streptomycin treatment of pulmonary tuberculosis: a Medical Research Council investigation. BMJ 1948;2:769—82.
34. Schulz K.F. Randomized controlled trials. Clin Obstet Gynecol 1998;41:245—56. [PMID: 0009646957]
35. Armitage P. The role of randomization in clinical trials. Stat Med 1982;1:345—52. [PMID: 0007187102]
36. Greenland S. Randomization, statistics, and causal inference. Epidemiology 1990;1:421—9. [PMID: 0002090279]
37. Kleijnen J., Gшtzsche P., Kunz R.A., Oxman A.D., Chalmers I. So what's so special about randomisation. In: Maynard A., Chalmers I., eds. Non-Random Reflections on Health Services Research: On the 25th Anniversary of Archie Cochrane's Effectiveness and Efficiency. London: BMJ; 1997.
38. Chalmers I. Assembling comparison groups to assess the effects of health care. J R Soc Med 1997;90:379—86. [PMID: 0009290419]
39. Thornley B., Adams C. Content and quality of 2000 controlled trials in schizophrenia over 50 years. BMJ 1998;317:1181—4. [PMID: 0009794850]
40. A proposal for structured reporting of randomized controlled trials. The Standards of Reporting Trials Group. JAMA 1994;272:1926—31. [PMID: 0007990245]
41. Call for comments on a proposal to improve reporting of clinical trials in the biomedical literature. Working Group on Recommendations for Reporting of Clinical Trials in the Biomedical Literature. Ann Intern Med 1994;121:894—5. [PMID: 0007978706]
42. Rennie D. Reporting randomized controlled trials. An experiment and a call for responses from readers [Editorial]. JAMA 1995;273:1054—5. [PMID: 0007897791]
43. Begg C., Cho M., Eastwood S., Horton R., Moher D., Olkin I., et al. Improving the quality of reporting of randomized controlled trials. The CONSORT statement. JAMA 1996;276:637—9. [PMID: 0008773637]
44. Siegel J.E., Weinstein M.C., Russell L.B., Gold M.R. Recommendations for reporting cost-effectiveness analyses. Panel on Cost-Effectiveness in Health and Medicine. JAMA 1996;276:1339—41. [PMID: 0008861994]
45. Drummond M.F., Jefferson T.O. Guidelines for authors and peer reviewers of economic submissions to the BMJ. The BMJ Economic Evaluation Working Party. BMJ 1996;313:275—83. [PMID: 0008704542]
46. Lang T.A., Secic M. How to Report Statistics in Medicine: Annotated Guidelines for Authors, Editors, and Reviewers. Philadelphia: American Coll of Physicians; 1997.
47. Staquet M., Berzon R., Osoba D., Machin D. Guidelines for reporting results of quality of life assessments in clinical trials. Qual Life Res 1996;5:496—502. [PMID: 0008973129]
48. Altman D.G. Better reporting of randomised controlled trials: the CONSORT statement [Editorial]. BMJ 1996;313:570—1. [PMID: 0008806240]
49. [A standard method for reporting randomized medical scientific research; the "Consolidation of the standards of reporting trials"]. Ned Tijdschr Geneeskd 1998;142:1089—91. [PMID: 0009623225]
50. Huston P., Hoey J. CMAJ endorses the CONSORT statement. CONsolidation of Standards for Reporting Trials. CMAJ 1996;155:1277—82. [PMID: 0008911294]
51. Ausejo M., Saenz A., Moher D. [CONSORT: an attempt to improve the quality of publication of clinical trials] [Editorial]. Aten Primaria 1998;21:351—2. [PMID: 0009633133]
52. Davidoff F. News from the International Committee of Medical Journal Editors [Editorial]. Ann Intern Med 2000;133:229—31. [PMID: 0010906840]
53. Moher D., Jones A., Lepage L. Use of the CONSORT statement and quality of reports of randomized trials: a comparative before-and-after evaluation. The CONSORT Group. JAMA 2001;285:1992—5.
54. Egger M., Jьni P., Bartlett C. Value of flow diagrams in reports of randomized controlled trials. The CONSORT Group. JAMA 2001;285:1996—9.
55. Meinert C.L. Beyond CONSORT: need for improved reporting standards for clinical trials. Consolidated Standards of Reporting Trials. JAMA 1998;279:1487—9. [PMID: 0009600487]
56. Moher D., Schulz K.F., Altman D.G. The CONSORT statement: revised recommendations for improving the quality of reports of parallel group randomized trials. The CONSORT Group. Ann Intern Med 2001;134:657—62.
57. Moher D., Schulz K.F., Altman D.G. The CONSORT statement: revised recommendations for improving the quality of reports of parallel group randomized trials. The CONSORT Group. JAMA 2001;285:1987—91.
58. Moher D., Schulz K.F., Altman D.G. The CONSORT statement: revised recommendations for improving the quality of reports of parallel group randomised trials. The CONSORT Group. Lancet [In Press].
59. Pocock S.J. Clinical Trials: A Practical Approach. Chichester, UK: John Wiley; 1983.
60. Meinert C.L. Clinical Trials: Design, Conduct, and Analysis. New York: Oxford Univ Pr; 1986.
61. Friedman L.M., Furberg C.D., DeMets D.L. Fundamentals of Clinical Trials. 3rd ed. New York: Springer; 1998.
62. Bolliger C.T., Zellweger J.P., Danielsson T., van Biljon X., Robidou A., Westin A., et al. Smoking reduction with oral nicotine inhalers: double blind, randomised clinical trial of efficacy and safety. BMJ 2000;321:329—33. [PMID: 0010926587]
63. Prasad A.S., Fitzgerald J.T., Bao B., Beck F.W., Chandrasekar P.H. Duration of symptoms and plasma cytokine levels in patients with the common cold treated with zinc acetate. A randomized, double-blind, placebo-controlled trial. Ann Intern Med 2000;133:245—52. [PMID: 0010929163]
64. Dickersin K., Scherer R., Lefebvre C. Identifying relevant studies for systematic reviews. BMJ 1994;309:1286—91. [PMID: 0007718048]
65. Lefebvre C., Clarke M. Identifying randomised trials. In: Egger M, Davey Smith G, Altman DG, eds. Systematic Reviews in Health Care: Meta-Analysis in Context. London: BMJ Books; 2001:69—86.
66. Haynes R.B., Mulrow C.D., Huth E.J., Altman D.G., Gardner M.J. More informative abstracts revisited. Ann Intern Med 1990;113:69—76. [PMID: 0002190518]
67. Taddio A., Pain T., Fassos F.F., Boon H., Ilersich A.L., Einarson T.R. Quality of nonstructured and structured abstracts of original research articles in the British Medical Journal, the Canadian Medical Association Journal and the Journal of the American Medical Association. CMAJ 1994;150:1611—5. [PMID: 0008174031]
68. Hartley J., Sydes M., Blurton A. Obtaining information accurately and quickly: Are structured abstracts more efficient? Journal of Information Science 1996;22:349—56.
69. Dammers J.W., Veering M.M., Vermeulen M. Injection with methylprednisolone proximal to the carpal tunnel: randomised double blind trial. BMJ 1999;319:884—6. [PMID: 0010506042]
70. Sandler A.D., Sutton K.A., DeWeese J., Girardi M.A., Sheppard V., Bodfish J.W. Lack of benefit of a single dose of synthetic human secretin in the treatment of autism and pervasive developmental disorder. N Engl J Med 1999;341:1801—6. [PMID: 0010588965]
71. World Medical Association declaration of Helsinki. Recommendations guiding physicians in biomedical research involving human subjects. JAMA 1997;277:925—6. [PMID: 0009062334]
72. Lau J., Antman E.M., Jimenez-Silva J., Kupelnick B., Mosteller F., Chalmers T.C. Cumulative meta-analysis of therapeutic trials for myocardial infarction. N Engl J Med 1992;327:248—54. [PMID: 0001614465]
73. Savulescu J., Chalmers I., Blunt J. Are research ethics committees behaving unethically? Some suggestions for improving performance and accountability. BMJ 1996;313:1390—3. [PMID: 0008956711]
74. Sinei S.K., Schulz K.F., Lamptey P.R., Grimes D.A., Mati J.K., Rosenthal S.M., et al. Preventing IUCD-related pelvic infection: the efficacy of prophylactic doxycycline at insertion. Br J Obstet Gynaecol 1990;97:412—9. [PMID: 0002196934]
75. Rodgers A., MacMahon S. Systematic underestimation of treatment effects as a result of diagnostic test inaccuracy: implications for the interpretation and design of thromboprophylaxis trials. Thromb Haemost 1995;73:167—71. [PMID: 0007792725]
76. Fuks A., Weijer C., Freedman B., Shapiro S., Skrutkowska M., Riaz A. A study in contrasts: eligibility criteria in a twenty-year sample of NSABP and POG clinical trials. National Surgical Adjuvant Breast and Bowel Program. Pediatric Oncology Group. J Clin Epidemiol 1998;51:69—79. [PMID: 0009474067]
77. Hall J.C., Mills B., Nguyen H., Hall J.L. Methodologic standards in surgical trials. Surgery 1996;119:466—72. [PMID: 0008644014]
78. Shapiro S.H., Weijer C., Freedman B. Reporting the study populations of clinical trials. Clear transmission or static on the line? J Clin Epidemiol 2000;53:973—9. [PMID: 0011027928]
79. Taylor M.A., Reilly D., Llewellyn-Jones R.H., McSharry C., Aitchison T.C. Randomised controlled trial of homoeopathy versus placebo in perennial allergic rhinitis with overview of four trial series. BMJ 2000;321:471—6. [PMID: 0010948025]
80. Mease P.J., Goffe B.S., Metz J., VanderStoep A., Finck B., Burge D.J. Etanercept in the treatment of psoriatic arthritis and psoriasis: a randomised trial. Lancet 2000;356:385—90. [PMID: 0010972371]
81. Roberts C. The implications of variation in outcome between health professionals for the design and analysis of randomized controlled trials. Stat Med 1999;18:2605—15. [PMID: 0010495459]
82. Sadler L.C., Davison T., McCowan L.M. A randomised controlled trial and meta-analysis of active management of labour. BJOG 2000;107:909—15. [PMID: 0010901564]
83. McDowell I., Newell C. Measuring Health: A Guide to Rating Scales and Questionnaires. 2nd ed. New York: Oxford Univ Pr; 1996.
84. Streiner D., Normand C. Health Measurement Scales: A Practical Guide to Their Development and Use. 2nd ed. Oxford: Oxford Univ Pr; 1995.
85. Sanders C., Egger M., Donovan J., Tallon D., Frankel S. Reporting on quality of life in randomised controlled trials: bibliographic study. BMJ 1998;317:1191—4. [PMID: 0009794853]
86. Marshall M., Lockwood A., Bradley C., Adams C., Joy C., Fenton M. Unpublished rating scales: a major source of bias in randomised controlled trials of treatments for schizophrenia. Br J Psychiat 2000;176:249—52. [PMID: 0010755072]
87. Jadad A.R., Boyle M., Cunningham C., Kim M., Schachar R. Treatment of Attention-Deficit/Hyperactivity Disorder. Evidence Report/Technology Assessment No. 11. Rockville, MD: U.S. Department of Health and Human Services, Public Health Service, Agency for Healthcare Research and Quality; 1999. AHRQ publication no.00-E005.
88. Schachter H.M., Pham B., King J., Langford S., Moher D. The Efficacy and Safety of Methylphenidate in Attention Deficit Disorder: A Systematic Review and Meta-Analysis. Prepared for the Therapeutics Initiative, Vancouver, B.C., and the British Columbia Ministry for Children and Families. 2000.
89. Kahn J.O., Cherng D.W., Mayer K., Murray H., Lagakos S. Evaluation of HIV-1 immunogen, an immunologic modifier, administered to patients infected with HIV having 300 to 549 ґ 106/L CD4 cell counts: a randomized controlled trial. JAMA 2000;284:2193—202. [PMID: 0011056590]
90. Tight blood pressure control and risk of macrovascular and microvascular complications in type 2 diabetes: UKPDS 38. UK Prospective Diabetes Study Group. BMJ 1998;317:703—13. [PMID: 0009732337]
91. Heit J.A., Elliott C.G., Trowbridge A.A., Morrey B.F., Gent M., Hirsh J. Ardeparin sodium for extended out-of-hospital prophylaxis against venous thromboembolism after total hip or knee replacement. A randomized, double-blind, placebo-controlled trial. Ann Intern Med 2000;132:853—61. [PMID: 0010836911]
92. Morrell C.J., Spiby H., Stewart P., Walters S., Morgan A. Costs and effectiveness of community postnatal support workers: randomised controlled trial. BMJ 2000;321:593—8. [PMID: 0010977833]
93. Campbell M.J., Julious S.A., Altman D.G. Estimating sample sizes for binary, ordered categorical, and continuous outcomes in two group comparisons. BMJ 1995;311:1145—8. [PMID: 0007580713]
94. Altman D.G., Bland J.M. Absence of evidence is not evidence of absence. BMJ 1995;311:485. [PMID: 0007647644]
95. Freiman J.A., Chalmers T.C., Smith H. Jr., Kuebler R.R. The importance of beta, the type II error and sample size in the design and interpretation of the randomized control trial. Survey of 71 “negative” trials. N Engl J Med 1978;299:690—4. [PMID: 0000355881]
96. Yusuf S., Collins R., Peto R. Why do we need some large, simple randomized trials? Stat Med 1984;3:409—22. [PMID: 0006528136]
97. Goodman S.N., Berlin J.A. The use of predicted confidence intervals when planning experiments and the misuse of power when interpreting results. Ann Intern Med 1994;121:200—6. [PMID: 0008017747]
98. Prevention of neural tube defects: results of the Medical Research Council Vitamin Study. MRC Vitamin Study Research Group. Lancet 1991;338:131—7. [PMID: 0001677062]
99. Galgiani J.N., Catanzaro A., Cloud G.A., Johnson R.H., Williams P.L., Mirels L.F., et al. Comparison of oral fluconazole and itraconazole for progressive, nonmeningeal coccidioidomycosis. a randomized, double-blind trial. Ann Intern Med 2000;133:676—86. [PMID: 0011074900]
100. Geller N.L., Pocock S.J. Interim analyses in randomized clinical trials: ramifications and guidelines for practitioners. Biometrics 1987;43:213—23. [PMID: 0003567306]
101. Berry D.A. Interim analyses in clinical trials: classical vs. Bayesian approaches. Stat Med 1985;4:521—6. [PMID: 0004089353]
102. Pocock S.J. When to stop a clinical trial. BMJ 1992;305:235—40. [PMID: 0001392832]
103. DeMets D.L., Pocock S.J., Julian D.G. The agonising negative trend in monitoring of clinical trials. Lancet 1999;354:1983—8. [PMID: 0010622312]
104. Buyse M. Interim analyses, stopping rules and data monitoring in clinical trials in Europe. Stat Med 1993;12:509—20. [PMID: 0008493429]
105. Altman D.G., Bland J.M. How to randomise. BMJ 1999;319:703—4. [PMID: 0010480833]
106. Schulz K.F. Subverting randomization in controlled trials. JAMA 1995;274:1456—8. [PMID: 0007474192]
107. Enas G.G., Enas N.H., Spradlin C.T., Wilson M.G., Wiltse C.G. Baseline comparability in clinical trials. Drug Information Journal 1990;24:541—8.
108. Treasure T., MacRae K.D. Minimisation: the platinum standard for trials? Randomisation doesn't guarantee similarity of groups; minimisation does [Editorial]. BMJ 1998;317:362—3. [PMID: 0009694748]
109. Kernan W.N., Viscoli C.M., Makuch R.W., Brass L.M., Horwitz R.I. Stratified randomization for clinical trials. J Clin Epidemiol 1999;52:19—26. [PMID: 0009973070]
110. Tu D., Shalay K., Pater J. Adjustment of treatment effect for covariates in clinical trials: statistical and regulatory issues. Drug Information Journal 2000;34:511—23.
111. Chappell L.C., Seed P.T., Briley A.L., Kelly F.J., Lee R., Hunt B.J., et al. Effect of antioxidants on the occurrence of pre-eclampsia in women at increased risk: a randomised trial. Lancet 1999;354:810—6. [PMID: 0010485722]
112. Chalmers T.C., Levin H., Sacks H.S., Reitman D., Berrier J., Nagalingam R. Meta-analysis of clinical trials as a scientific discipline. I: Control of bias and comparison with large cooperative trials. Stat Med 1987;6:315—28. [PMID: 0002887023]
113. Pocock S.J. Statistical aspects of clinical trial design. Statistician 1982;31:1—18.
114. Haag U. Technologies for automating randomized treatment assignment in clinical trials. Drug Information Journal 1998;32:11
115. LaCroix A.Z., Ott S.M., Ichikawa L. Scholes D., Barlow W.E. Low-dose hydrochlorothiazide and preservation of bone mineral density in older adults. A randomized, double-blind, placebo-controlled trial. Ann Intern Med 2000;133:516—26. [PMID: 0011015164]
116. Noseworthy J.H., Ebers G.C., Vandervoort M.K., Farquhar R.E., Yetisir E., Roberts R. The impact of blinding on the results of a randomized, placebo-controlled multiple sclerosis clinical trial. Neurology 1994;44:16—20. [PMID: 0008290055]
117. Gшtzsche P.C. Blinding during data analysis and writing of manuscripts. Control Clin Trials. 1996;17:285—90; discussion 290-3. [PMID: 0008889343]
118. Carley S.D., Libetta C., Flavin B., Butler J., Tong N., Sammy I. An open prospective randomised trial to reduce the pain of blood glucose testing: ear versus thumb. BMJ 2000;321:20. [PMID: 0010875827]
119. Day S.J., Altman D.G. Statistics notes: blinding in clinical trials and other studies. BMJ 2000;321:504. [PMID: 0010948038]
120. Devereaux P.J., Manns B.J., Ghali W.A., Quan H., Lacchetti C., Guyatt G.H. Physician interpretations and textbook definitions of blinding terminology in randomized controlled trials. JAMA 2001;285:2000—3.
121. Schulz K.F., Grimes D.A., Altman D.G., Hayes R.J. Blinding and exclusions after allocation in randomised controlled trials: survey of published parallel group trials in obstetrics and gynaecology. BMJ 1996;312:742—4. [PMID: 0008605459]
122. Cheng K., Smyth R.L., Motley J., O'Hea U., Ashby D. Randomized controlled trials in cystic fibrosis (1966—1997) categorized by time, design, and intervention. Pediatr Pulmonol 2000;29:1—7. [PMID: 0010613779]
123. Lang T. Masking or blinding? An unscientific survey of mostly medical journal editors on the great debate. Med Gen Med 2000:E25. [PMID: 0011104471]
124. Lao L., Bergman S., Hamilton G.R., Langenberg P., Berman B. Evaluation of acupuncture for pain control after oral surgery: a placebo-controlled trial. Arch Otolaryngol Head Neck Surg 1999;125:567—72. [PMID: 0010326816]
125. Quitkin F.M., Rabkin J.G., Gerald J., Davis J.M., Klein D.F. Validity of clinical trials of antidepressants. Am J Psychiat 2000;157:327—37. [PMID: 0010698806]
126. Nacul L.C., Kirkwood B.R., Arthur P., Morris S.S., Magalhaes M., Fink M.C. Randomised, double blind, placebo controlled clinical trial of efficacy of vitamin A treatment in non-measles childhood pneumonia. BMJ 1997;315:505—10. [PMID: 0009329303]
127. Altman D.G., Gore S.M., Gardner M.J., Pocock S.J. Statistical guidelines for contributors to medical journals. In: Altman D.G., Machin D., Bryant T.N., Gardner M.J., eds. Statistics with Confidence: Confidence Intervals and Statistical Guidelines. 2nd ed. London: BMJ Books; 2000:171—90.
128. Altman D.G., Bland J.M. Statistics notes. Units of analysis. BMJ 1997;314:1874. [PMID: 0009224131]
129. Bolton S. Independence and statistical inference in clinical trial designs: a tutorial review. J Clin Pharmacol 1998;38:408—12. [PMID: 0009602951]
130. Greenland S. Principles of multilevel modelling. Int J Epidemiol 2000;29:158—67. [PMID: 0010750618]
131. Saunders M., Dische S., Barrett A., Harvey A., Gibson D., Parmar M. Continuous hyperfractionated accelerated radiotherapy (CHART) versus conventional radiotherapy in non-small-cell lung cancer: a randomised multicentre trial. CHART Steering Committee. Lancet 1997;350:161—5. [PMID: 0009250182]
132. Matthews J.N., Altman D.G. Interaction 3: How to examine heterogeneity. BMJ 1996;313:862. [PMID: 0008870577]
133. Assmann S.F., Pocock S.J., Enos L.E., Kasten L.E. Subgroup analysis and other (mis)uses of baseline data in clinical trials. Lancet 2000;355:1064—9. [PMID: 0010744093]
134. Matthews J.N., Altman D.G. Statistics notes. Interaction 2: Compare effect sizes not P values. BMJ 1996;313:808. [PMID: 0008842080]
135. Oxman A.D., Guyatt G.H. A consumer's guide to subgroup analyses. Ann Intern Med 1992;116:78—84. [PMID: 0001530753]
136. Steyerberg E.W., Bossuyt P.M., Lee K.L. Clinical trials in acute myocardial infarction: should we adjust for baseline characteristics? Am Heart J 2000;139:745—51. [PMID: 0010783203]
137. Altman D.G. Adjustment for covariate imbalance. In: Armitage P, Colton T, eds. Encyclopedia of Biostatistics. Chichester, UK: John Wiley; 1998:1000—5.
138. Concato J., Feinstein A.R., Holford T.R. The risk of determining risk with multivariable models. Ann Intern Med 1993;118:201—10. [PMID: 0008417638]
139. Bender R., Grouven U. Logistic regression models used in medical research are poorly presented [Letter]. BMJ 1996;313:628. [PMID: 0008806274]
140. Khan K.S., Chien P.F., Dwarakanath L.S. Logistic regression models in obstetrics and gynecology literature. Obstet Gynecol 1999;93:1014—20. [PMID: 0010362173]
141. Sackett D.L., Gent M. Controversy in counting and attributing events in clinical trials. N Engl J Med 1979;301:1410—2. [PMID: 0000514321]
142. May G.S., DeMets D.L., Friedman L.M., Furberg C., Passamani E. The randomized clinical trial: bias in analysis. Circulation 1981;64:669—73. [PMID: 0007023743]
143. Altman D.G., Cuzick J., Peto J. More on zidovudine in asymptomatic HIV infection [Letter]. N Engl J Med 1994;330:1758—9. [PMID: 0008190146]
144. Serruys P.W., van Hout B., Bonnier H., Legrand V., Garcia E., Macaya C., et al. Randomised comparison of implantation of heparin-coated stents with balloon angioplasty in selected patients with coronary artery disease (Benestent II). Lancet 1998;352:673—81. [PMID: 0009728982]
145. Bove G., Nilsson N. Spinal manipulation in the treatment of episodic tension-type headache: a randomized controlled trial. JAMA 1998;280:1576—9. [PMID: 0009820258]
146. Cunningham D., Pyrhцnen S., James R.D., Punt C.J., Hickish T.F., Heikkila R., et al. Randomised trial of irinotecan plus supportive care versus supportive care alone after fluorouracil failure for patients with metastatic colorectal cancer. Lancet 1998;352:1413—8. [PMID: 0009807987]
147. van Loon A.J., Mantingh A., Serlier E.K., Kroon G., Mooyaart E.L., Huisjes H.J. Randomised controlled trial of magnetic-resonance pelvimetry in breech presentation at term. Lancet 1997;350:1799—804. [PMID: 0009428250]
148. Brown M.J., Palmer C.R., Castaigne A., de Leeuw P.W., Mancia G., Rosenthal T., et al. Morbidity and mortality in patients randomised to double-blind treatment with a long-acting calcium-channel blocker or diuretic in the International Nifedipine GITS study: Intervention as a Goal in Hypertension Treatment (INSIGHT). Lancet 2000;356:366—72. [PMID: 0010972368]
149. Shuster J.J. Median follow-up in clinical trials [Letter]. J Clin Oncol 1991;9:191—2. [PMID: 0001985169]
150. Altman D.G., De Stavola B.L., Love S.B., Stepniewska K.A. Review of survival analyses published in cancer journals. Br J Cancer 1995;72:511—8. [PMID: 0007640241]
151. Senn S. Base logic: tests of baseline balance in randomized clinical trials. Clinical Research and Regulatory Affairs 1995;12:171—82.
152. Haderslev K.V., Tjellesen L., Sorensen H.A., Staun M. Alendronate increases lumbar spine bone mineral density in patients with Crohn's disease. Gastroenterology 2000;119:639—46. [PMID: 0010982756]
153. Fields W.S., Maslenikov V., Meyer J.S., Hass W.K., Remington R.D., Macdonald M. Joint study of extracranial arterial occlusion. V. Progress report of prognosis following surgery or nonsurgical treatment for transient cerebral ischemic attacks and cervical carotid artery lesions. JAMA 1970;211:1993—2003. [PMID: 0005467158]
154. Lee Y.J., Ellenberg J.H., Hirtz D.G., Nelson K.B. Analysis of clinical trials by treatment actually received: is it really an option? Stat Med 1991;10:1595—605. [PMID: 0001947515]
155. Lewis J.A., Machin D. Intention to treat—who should use ITT? [Editorial] Br J Cancer 1993;68:647—50. [PMID: 0008398686]
156. Lachin J.L. Statistical considerations in the intent-to-treat principle. Control Clin Trials 2000;21:526. [PMID: 0011018568]
157. Sheiner L.B., Rubin D.B. Intention-to-treat analysis and the goals of clinical trials. Clin Pharmacol Ther 1995;57:6—15. [PMID: 0007828382]
158. Nagelkerke N., Fidler V., Bernsen R., Borgdorff M. Estimating treatment effects in randomized clinical trials in the presence of non-compliance. Stat Med 2000;19:1849—64. [PMID: 0010867675]
159. Ruiz-Canela M., Martнnez-Gonzбlez M.A., de Irala-Estйvez J. Intention to treat analysis is related to methodological quality [Letter]. BMJ 2000;320:1007—8. [PMID: 0010753165]
160. Altman D.G. Confidence intervals in practice. In: Altman D.G., Machin D., Bryant T.N., Gardner M.J., eds. Statistics with Confidence: Confidence Intervals and Statistical Guidelines. 2nd ed. London: BMJ Books; 2000:6—14.
161. Altman D.G. Clinical trials and meta-analyses. In: Altman D.G., Machin D., Bryant T.N., Gardner M.J., eds. Statistics with Confidence: Confidence Intervals and Statistical Guidelines. 2nd ed. London: BMJ Books; 2000:120—38.
162. Uniform requirements for manuscripts submitted to biomedical journals. International Committee of Medical Journal Editors. Ann Intern Med 1997;126:36—47. [PMID: 0008992922]
163. Gardner M.J., Altman D.G. Confidence intervals rather than P values: estimation rather than hypothesis testing. Br Med J (Clin Res Ed) 1986;292:746—50. [PMID: 0003082422]
164. Bailar J.C. 3rd, Mosteller F. Guidelines for statistical reporting in articles for medical journals. Amplifications and explanations. Ann Intern Med 1988;108:266—73. [PMID: 0003341656]
165. Hutton J.L., Williamson P.R. Bias in meta-analysis due to outcome variable selection within studies. Applied Statistics 2000;49:359—70.
166. Egger M., Dickersin K., Davey Smith G. Problems and limitations in conducting systematic reviews. In: Egger M., Davey Smith G., Altman D.G., eds. Systematic Reviews in Health Care: Meta-Analysis in Context. London: BMJ Books; 2001:43—68.
167. Bland J.M. Quoting intermediate analyses can only mislead [Letter]. BMJ 1997;314:1907—8. [PMID: 0009224157]
168. Cook R.J., Sackett D.L. The number needed to treat: a clinically useful measure of treatment effect. BMJ 1995;310:452—4. [PMID: 0007873954]
169. Altman D.G., Andersen P.K. Calculating the number needed to treat for trials where the outcome is time to an event. BMJ 1999;319:1492—5. [PMID: 0010582940]
170. Tukey J.W. Some thoughts on clinical trials, especially problems of multiplicity. Science 1977;198:679—84. [PMID: 0000333584]
171. Yusuf S., Wittes J., Probstfield J., Tyroler H.A. Analysis and interpretation of treatment effects in subgroups of patients in randomized clinical trials. JAMA 1991;266:93—8. [PMID: 0002046134]
172. Hahn S., Williamson P.R., Hutton J.L., Garner P., Flynn E.V. Assessing the potential for bias in meta-analysis due to selective reporting of subgroup analyses within studies. Stat Med 2000;19:3325—3336. [PMID: 0011122498]
173. Levin M., Quint P.A., Goldstein B., Barton P., Bradley J.S., Shemie S.D., et al. Recombinant bactericidal/permeability-increasing protein (rBPI21) as adjunctive treatment for children with severe meningococcal sepsis: a randomised trial. rBPI21 Meningococcal Sepsis Study Group. Lancet 2000;356:961—7. [PMID: 0011041396]
174. Ioannidis J.P., Lan J. Completeness of safety reporting in randomized trials. An evaluation of 7 medical areas. JAMA 2001;285:437—43. [PMID: 0011242428]
175. Horton R. The rhetoric of research. BMJ 1995;310:985—7. [PMID: 0007728037]
176. Annals of Internal Medicine. Information for authors. Available at http://www.annals.org. Accessed 10 January 2001.
177. Docherty M., Smith R. The case for structuring the discussion of scientific papers [Editorial]. BMJ 1999;318:1224—5. [PMID: 0010231230]
178. Purcell G.P., Donovan S.L., Davidoff F. Changes to manuscripts during the editorial process: characterizing the evolution of a clinical paper. JAMA 1998;280:227—8. [PMID: 0009676663]
179. Kiviluoto T., Sirйn J., Luukkonen P., Kivilaakso E. Randomised trial of laparoscopic versus open cholecystectomy for acute and gangrenous cholecystitis. Lancet 1998;351:321—5. [PMID: 0009652612]
180. Silverstein F.E., Faich G., Goldstein J.L., Simon L.S., Pincus T., Whel-ton A., et al. Gastrointestinal toxicity with celecoxib vs nonsteroidal anti-inflammatory drugs for osteoarthritis and rheumatoid arthritis: the CLASS study: A randomized controlled trial. Celecoxib Long-term Arthritis Safety Study. JAMA 2000;284:1247—55. [PMID: 0010979111]
181. Campbell D.T. Factors relevant to the validity of experiments in social settings. Psychol Bull 1957;54:297—312.
182. Jьni P., Altman D.G., Egger M. Assessing the quality of controlled clinical trials. In: Egger M., Davey Smith G., Altman D.G., eds. Systematic Reviews in Health Care: Meta-Analysis in Context. London: BMJ Books; 2001.
183. Dans A.L., Dans L.F., Guyatt G.H., Richardson S. Users' guides to the medical literature: XIV. How to decide on the applicability of clinical trial results to your patient. Evidence-Based Medicine Working Group. JAMA 1998;279:545—9. [PMID: 0009480367]
184. Davey Smith G., Egger M. Who benefits from medical interventions? [Editorial] BMJ 1994;308:72—4. [PMID: 0008298415]
185. McAlister F.A. Applying the results of systematic reviews at the bedside. In: Egger M., Davey Smith G., Altman D.G., eds. Systematic Reviews in Health Care: Meta-Analysis in Context. London: BMJ Books; 2001.
186. Laupacis A., Sackett D.L., Roberts R.S. An assessment of clinically useful measures of the consequences of treatment. N Engl J Med 1988;318:1728—33. [PMID: 0003374545]
187. Altman D.G. Confidence intervals for the number needed to treat. BMJ 1998;317:1309—12. [PMID: 0009804726]
188. Fanaroff A.A., Korones S.B., Wright L.L., Wright E.C., Poland R.L., Bauer C.B., et al. A controlled trial of intravenous immune globulin to reduce nosocomial infections in very-low-birth-weight infants. National Institute of Child Health and Human Development Neonatal Research Network. N Engl J Med 1994;330:1107—13. [PMID: 0008133853]
189. Randomised trial of intravenous atenolol among 16 027 cases of suspected acute myocardial infarction: ISIS-1. First International Study of Infarct Survival Collaborative Group. Lancet 1986;2:57—66. [PMID: 0002873379]
190. Gшtzsche P.C., Gjшrup I., Bonnйn H., Brahe N.E., Becker U., Burcharth F. Somatostatin v placebo in bleeding oesophageal varices: randomised trial and meta-analysis. BMJ 1995;310:1495—8. [PMID: 0007787594]
191. Cochrane Collaboration. The Cochrane Library. Issue 1. Oxford: Update Software; 2000.
192. Clarke M., Chalmers I. Discussion sections in reports of controlled trials published in general medical journals: islands in search of continents? JAMA 1998;280:280—2. [PMID: 0009676682]
193. Goodman S.N. Toward evidence-based medical statistics. 1: The P value fallacy. Ann Intern Med 1999;130:995—1004. [PMID: 0010383371]
194. Gшtzsche P.C. Reference bias in reports of drug trials. Br Med J (Clin Res Ed) 1987;295:654—6. [PMID: 0003117277]
195. Berlin J.A., Begg C., Louis T.A. An assessment of publication bias using a sample of published clinical trials. Journal of the American Statistical Association 1989;84:381—92.
196. Guyatt G.H., DiCenso A., Farewell V., Willan A., Griffith L. Randomized trials versus observational studies in adolescent pregnancy prevention. J Clin Epidemiol 2000;53:167—74. [PMID: 0010729689]
197. Kunz R., Oxman A.D. The unpredictability paradox: review of empirical comparisons of randomised and non-randomised clinical trials. BMJ 1998;317:1185—90. [PMID: 0009794851]
198. Benson K., Hartz A.J. A comparison of observational studies and randomized, controlled trials. N Engl J Med 2000;342:1878—86. [PMID: 0010861324]
199. Concato J., Shah N., Horwitz R.I. Randomized, controlled trials, observational studies, and the hierarchy of research designs. N Engl J Med 2000;342:1887—92. [PMID: 0010861325]
200. Collins R., MacMahon S. Reliable assessment of the effects of treatment on mortality and major morbidity, I: clinical trials. Lancet 2001;357:373—80. [PMID: 0011211013]
201. Moher D., Pham B., Jones A., Cook D.J., Jadad A.R., Moher M., et al. Does quality of reports of randomised trials affect estimates of intervention efficacy reported in meta-analyses? Lancet 1998;352:609—13. [PMID: 0009746022]
202. Murray G.D. Promoting good research practice. Stat Methods Med Res 2000;9:17—24. [PMID: 0010826155]
203. Moher D., Cook D.J., Eastwood S., Olkin I., Rennie D., Stroup D.F. Improving the quality of reports of meta-analyses of randomised controlled trials: the QUOROM statement. Quality of Reporting of Meta-analyses. Lancet 1999;354:1896—900. [PMID: 0010584742]
204. Stroup D.F., Berlin J.A., Morton S.C., Olkin I., Williamson G.D.,Rennie D., et al. Meta-analysis of observational studies in epidemiology: a proposal for reporting. Meta-analysis Of Observational Studies in Epidemiology (MOOSE) group. JAMA 2000;283:2008—12. [PMID: 0010789670]
Возврат к содержанию| Возврат на home page "Международного журнала медицинской практики"| Возврат на home page издательства "МедиаСфера"