Методи математичної статистики

Методиматематичної статистики
Теоріяймовірностей і математична статистика виникли в середині XVII століття врезультаті розвитку суспільства і товарно-грошових відносин.
Своюроль у цьому процесі відіграли й азартні ігри, вони послужили простими моделямидля виявлення закономірностей у появі випадкових подій. Крім того, розвитокматематичної статистики був обумовлений необхідністю обробляти дані, якізібралися до того часу в області керування державою: демографії, охороніздоров’я, торгівлі й інших галузях господарської діяльності.
Можнаперелічити досить довгий список імен великих учених, які додали свого внеску урозвиток математичної статистики: П. Ферма (1601–1665) і Б. Паскаль(1623–1662), Я. Бернуллі (1654–1705) і П. Лаплас (1749–1827), К. Гаусс(1777–1855) і С. Пуассон (1781–1840), Т. Байєс (1701–1761) та ін.Ці імена мають бути вже відомі читачам з назв часто застосовуваних статистичнихпроцедур, тестів і розподілів.
Першим, хто вдало об’єднав методи антропології і соціальноїстатистики з досягненнями в області теорії ймовірностей і математичноїстатистики, був бельгійський статистик Л. Кетле (1796–1874).
З його робіт випливало, що задача статистики полягає не лише узбиранні і класифікації даних, а й у їхньому аналізі з метою відкриттязакономірностей. Л. Кетле одним з перших показав, що випадковості, якіспостерігаються в живій природі, внаслідок їхньої повторюваності виявляютьпевну тенденцію, яку можна описати мовою математики. Л. Кетле заклав іоснови біометрії.
Створення ж математичного апарата цієї науки належить англійськійшколі статистиків XIX століття, на чолі якої стояли Ф. Гальтон і К.Пірсон. Розроблені Ф. Гальтоном (1822–1911) і К. Пірсоном (1857–1936)біометричні методи увійшли в золотий фонд математичної статистики.
Пірсон запровадив у біометрії такі поняття, як середнє квадратичневідхилення і варіацію, йому належить розробка методу моментів, критерію згоди />2, він увівтермін «нормальний розподіл», який зараз загальноприйнятий у багатьох країнах.(Відомо ще багато варіантів назви цього розподілу, наприклад, лапласіврозподіл, гауссів розподіл, розподіл Гаусса-Лапласа, розподіл Лапласа-Гаусса.
Як апроксимація до біноміального розподілу він розглядався Муавромще в 1733 р., однак Муавр не вивчав його властивостей.) К. Пірсонудосконалив запропоновані Гальтоном методи кореляції і регресії. Термін«регресія» був введений Ф. Гальтоном у 1886 р. Гальтон встановив, щов середньому сини високих батьків мають не такий великий зріст, а сини батьківз невеликим зростом вище за своїх батьків. Це було інтерпретовано ним як «регресіядо посередності». Помилки в міркуваннях Гальтона були роз’яснені пізніше,приміром, Браунлі.
Однак біологи не відразу оцінили переваги, які давало використанняматематичної статистики в природознавстві. Положення дещо змінилося на краще,коли була обґрунтована теорія малих виборок.
Піонером у цій області був учень Пірсона В. Госсет, якийопублікував у журналі «Біометрика» свою статтю під псевдонімом Стьюдент (звідси– критерій Стьюдента). Вважається, що цінність роботи Стьюдента полягала не узначних числових змінах під час розрахунку тестової статистики. Багато вченихзадовго до Стьюдента використовували співвідношення, яке тепер має його ім’я,але без урахування обсягу вибірок (числа ступенів свободи) і співвідносилиотриманий результат з таблицями стандартного нормального розподілу (аналогкритерію Стьюдента для нескінченного числа ступенів свободи), користуючись прицьому різними застереженнями під час інтерпретації результатів.
Цінність роботи Стьюдента полягає в усвідомленні того, що требабрати до уваги «капризи» малих вибірок, причому не тільки в тій задачі, з якоїпочинав Стьюдент, але й у всіх подібних. Крім того, він розробив таблиці, якіможна використовувати для визначення довірчих інтервалів і перевірки критеріївзначимості навіть на основі дуже малих вибірок, що дає можливість вирішеннябагатьох статистичних задач в області клінічних досліджень.
Подальший розвиток теорія малих вибірок одержала у працях Р.Фішера (1890–1962), основне місце в його роботі займали питання плануванняексперименту. Фішер запропонував у біометрії цілий ряд нових термінів і понять,розглянув фундаментальні принципи статистичних висновків, показав, щопланування експериментів і обробка їхніх результатів – дві нерозривно пов’язанізадачі статистики.
Не можна не відзначити той величезний внесок, що зробили врозвиток теорії ймовірностей і математичної статистики російські вчені: О.Я.Хінчін (1894–1959), О.І. Хотимський (1892–1939), Б.С. Ястремський (1877–1962),В.І.Романовський (1879–1954), А.А. Ляпунов (1911–1973), А.Н. Колмогоров та його школа ібагато інших.
У сучасній статистичній науці існує розподіл на дві основні школи:найбільш численна класична школа – послідовники Фішера і його учнів, а такожсуб’єктивістська, чи байєсівська школа.
І хоча на рівні прикладної статистики результати, одержані врамках цих різних наукових шкіл, досить добре погоджуються, з широкого колатеоретичних і філософських питань ці два напрямки часто розходяться, пропонуючирізні підходи до вирішення задач, у тому числі в області біометрії.
Стисло основну розбіжність у підходах можна було бохарактеризувати в такий спосіб: прихильники класичного підходу єдино можливоювважають частотну інтерпретацію імовірності (тому такий підхід називають ще«frequentist school»), суть їхнього підходу полягає в тому, що вони починаютьвирішення задачі з вибору моделі і перевіряють, чи може дана модель «пояснити»отримані (чи ще більш «екстремальні») дані. Відмінність байєсівського підходуполягає в тому, що до того, як будуть отримані дані, статистик розглядаєступінь своєї довіри до різних можливих моделей і представляє їх у вигляді ймовірностей(апріорні імовірності). Як тільки дані отримані, теорема Байєса дозволяєрозрахувати нову множину ймовірностей, що являють собою переглянуті ступнідовіри до можливих моделей на основі отриманих даних (апостеріорніімовірності). Оцінка апріорних ймовірностей є суб’єктивною, тому даний підхід іназивається суб’єктивістським.
Зараз основні статистичні процедури і тести в області клінічнихдосліджень засновані на класичних підходах, хоча за необхідності допускаєтьсязастосування байєсівських процедур. Байєсівський підхід стає все більшпопулярним в області фармакокінетики.
Можна сказати, що клінічні дослідження мають ще тривалішу історію,ніж математична статистика. Клінічні дослідження в тому розумінні, що ми звикливкладати в це поняття, в основному одержали розвиток після другої світовоївійни, хоча відомі і більш ранні приклади. Вважається, що вже у працяхсередньовічного вченого, лікаря і філософа Ібн Сіни (Авіценна) (980–1037), чиїтрактати в області теоретичної і клінічної медицини були надзвичайно популярніпротягом багатьох століть і були обов’язковим керівництвом, містилися згадкипро технологію проведення «клінічних досліджень».
А в книзі видатного вірменського лікаря і натураліста АмірдовлатаАмасіаці (помер у 1496 р.) «Непотрібне для неуків» (переклад з вірменськоїі коментар канд. мед. наук С.А. Варданян, серія «Научное наследие», 1990),що є узагальненням тривалого історичного шляху розвитку вірменської медицини іприродничих наук у XV столітті, містяться 7 основних умов, яких авторрекомендує дотримуватися під час проведення іспитів лік, що перегукуються зпринципами, які лежать в основі сучасних клінічних досліджень. «І говорять, щоприрода лік пізнається дослідним шляхом. Перша умова полягає в тому, щозастосовують випробувані ліки в чистому вигляді, без сторонніх домішок.
Друга умова полягає в тому, що коли випробовують одні ліки, требадавати їх людині з помірною натурою так, щоб видно було її дію на природу(поняття «помірна натура», відповідно до середньовічної теорії, сучасноюмедичною мовою означало б групу норми).
Третя умова полягає в тому, що одні ліки слід випробовувати приодній хворобі, а не при двох і більше захворюваннях. Оскільки вони корисні приодному захворюванні, а на друге не діють, людина не може зрозуміти, куди жподілася їхня корисна дія.
Четверта умова полягає в тому, що коли ліки виявляються кориснимпри декількох хворобах, то слід перевірити, чи є ця дія чимось, властивим тількиїм, чи вона залежить від інших сторонніх обставин.
П’ята умова полягає в тому, щоб сила ліків відповідала силіхвороби.
Шоста умова – щоб враховувати пору року, оскільки існує така пора,коли ліки діють, і така, коли вони не діють або виявляють слабку дію. Сьомаумова полягає в тому, щоб при введенні цих лік дія їх була б постійною,оскільки якщо вони то діють, то не діють, то це залежить не від ліків, а відсторонніх причин».
Можна сказати, що автор цих правил розумів необхідність правильноїпостановки і дотримання умов експерименту, а також важливість грамотноїінтерпретації отриманих у дослідженні результатів.
Сьогодні вже неможливо уявити собі клінічні дослідження безстатистичної обробки отриманих результатів. Вперше рандомізовані клінічнідослідження в сучасному розумінні були проведені в Англії, а одним з основнихвиконавців був відомий статистик Остін Б. Хілл (1897–1991).
Нині статистична наука продовжує розвиватися. Так, у 90-і роки XXстоліття була зроблена величезна методологічна робота, яка має безпосереднєвідношення до статистичного аналізу клінічних досліджень. Цікаві роботивчених-статистиків у цій області стосувалися питань метааналізу, перехресногодизайну, досліджень біоеквівалентності, послідовного дизайну вимірювань, щоповторюються, тощо.
Досить важко дати вичерпне визначення статистики як дисципліни.Найбільш вдалим можна вважати таке визначення: «наука, що вивчає методизбирання й інтерпретації числових даних».
Таким чином, головна мета статистики – одержання осмисленихвисновків з неузгоджених (що підлягають розкиду) даних. Оскільки індивідуумамвластива уроджена мінливість ознак (наприклад, ріст, маса тіла тощо) і, крімтого, біологічні ознаки можуть випадково змінюватися в часі, природа клінічнихданих, що характеризуються розкидом чи варіацією, диктує необхідність їхньогостатистичного оцінювання.
Ще одна причина, з якої застосування статистичних методів до данихклінічних досліджень стає необхідним, – випадкові помилки вимірювання клінічнихпоказників. Мовою математики, величина будь-якої ознаки, що варіює, є змінноювипадковою величиною, а її конкретні значення прийнято називати варіантами.
Важливою задачею під час проведення статистичного аналізуклінічних даних, є визначення одного чи декількох ознак, що у даному клінічномудослідженні адекватно оцінюватимуть порівнюваний ефект.
Взагалі словом «ефект» незалежно від його медичного змісту миназиватимемо будь-які прояви дії досліджуваного препарату (чи методулікування), які обрані дослідником для демонстрації його ефективності, безпекитощо. Показники визначеного в такий спосіб ефекту мають міжіндивідуальнуваріабельність.
Статистику ще часто називають наукою прийняття розумних рішень вумовах невизначеності. При цьому двом категоріям задач статистики приділяютьособливу увагу: статистичне оцінювання і перевірка статистичних гіпотез. Першазадача поділяється на точкове та інтервальне оцінювання параметрів розподілу.
Взагалі статистичні задачі з’являються тоді, коли необхідно датинайкращі, у певному розумінні відповіді за обмеженою кількістю спостережень.Якби кількість спостережень не була обмеженою, можна було б точно визначитипараметри розподілів і порівняти їх, при цьому ніякої статистичної задачі небуло б. Якщо в ході досліджень ми могли б вивчити всі об’єкти сукупності, які насцікавлять (наприклад, усіх хворих з визначеним захворюванням), то можна було бсказати, що ми маємо справу із суцільним вивченням генеральної сукупності.
Насправді обстежувати всі об’єкти сукупності вдається рідко,зазвичай доводиться вивчати лише вибірку, сподіваючись, що ця вибірка доситьдобре показує властивості досліджуваної сукупності.
При цьому також виникають важливі статистичні задачі: випадковийвідбір варіантів з генеральної сукупності і репрезентативності вибірки, а такожвизначення необхідного обсягу вибірки для формування статистично значимоговисновку за результатами проведених досліджень.
Усістатистичні методи виходять з припущення, що дані вилучені із сукупностівипадково. А це означає, що імовірність виявитися обраним для всіх членів сукупностімає бути однакова.
Випадковиммає бути і віднесення пацієнта до тієї чи іншої порівнювальної групи, тобтокожен пацієнт повинен мати рівний шанс потрапити в будь-яку групу вдослідженні. Призначені для вирішення цієї статистичної задачі методи називаютьсяметодами рандомізації.
Найбільшвідомі методи рандомізації: проста рандомізація, блокова рандомізація, пошароварандомізація, адаптивна рандомізація чи рандомізація за принципом несиметричноїмонети, «гра на лідера» та ін. Рандомізація не тільки порівнює імовірністьодержання пацієнтом різних порівнювальних впливів, але й дозволяє формуватигрупи, подібні з погляду прогностичних факторів.
Отже,рандомізація забезпечує підбір хворих так, щоб контрольна група нічим невідрізнялась від експериментальної, крім досліджуваного методу лікування. Але іцього виявляється недостатньо. Тісно пов’язана з проблемою рандомізації і такзвана проблема сліпоти дослідження.
Длятого, щоб ані лікар, ані дослідник, ані пацієнт не могли як-небудь впливати наодержані результати, використовується таке поняття, як сліпота дослідження.Наприклад, якщо дозволяють клінічні особливості даного дослідження, частозастосовується так званий подвійний сліпий метод, коли ні лікар, ні пацієнт незнають, який з методів лікування був застосований.
Важливим питанням є і питання репрезентативності вибірки щодовсієї популяції, з якої вона відбиралася. Звичайно, якщо вибірка взята ізсукупності випадково і має досить великий обсяг, середні характеристикипацієнтів у вибірці практично такі самі, як у відповідній популяції. Напрактиці більшість груп пацієнтів, включених у різні клінічні дослідження,являють собою зміщені вибірки.
Це пов’язано з особливостями включення пацієнтів у дослідження:часто пацієнти включаються тому, що знаходяться на лікуванні в центрі, якийпроводить дослідження, чи тому, що, з погляду дослідника, являють собою цікавийклінічний випадок.
Загалом така відсутність репрезентативності не приводить доякихось неправильних висновків. Однак дослідник має чітко розуміти, на якупопуляцію реально можуть бути поширені результати, отримані в такомудослідженні.
Наступна важлива математична задача – визначення необхідногообсягу вибірки. Під «необхідним» розуміють мінімально можливу кількістьпацієнтів, включених у дослідження, що при обраному дизайні дозволяє установитинаявність статистично значимих розбіжностей між порівнюваними методами.
На жаль, про важливість вирішення цієї задачі згадують, якправило, коли дослідження вже закінчені і починається процес статистичноїобробки отриманих результатів. Ця проблема дуже важлива.
Мета клінічних досліджень – виявлення методів, що дозволяютьполіпшити існуючі результати лікування, діагностику, попередження захворювань.Якщо новий метод дозволяє одержати високий відсоток лікування хворих, щостраждають раніше не виліковним захворюванням, довести його ефективність можнашляхом оцінки результатів лише в одній групі, без порівняння з контролем.
Такі дослідження називаються неконтрольованими. Контрольованіклінічні дослідження – це дослідження, у яких групи, що порівнюються, отримуютьрізні види лікування.
Зазвичай контрольовані дослідження є перспективними, тобто даніодержують після початку дослідження. На відміну від перспективних досліджень,відомі випадки, коли як контроль може використовуватися ретроспективно зібранаінформація: дані літератури чи результати інших досліджень.
При плануванні досліджень дуже важливо сформулювати його мету.Якщо метою проведеного дослідження є встановлення розбіжностей (чи переваг)методів лікування, математично дане питання вирішується зазвичай за допомогоюперевірки статистичного критерію (чи тесту). Застосовані для цього процедурипов’язані з формулюванням статистичних гіпотез. Іноді для вирішення цієї задачізастосовують і метод довірчих інтервалів.
Статистична гіпотеза – це твердження, помилкове заперечення якогохотілося б уникнути. Як правило, в області клінічних досліджень прийнятоформулювати так звану нульову гіпотезу (Но) таким чином, щоб це твердженнябажано було б відкинути (наприклад, немає розбіжностей в ефекті впорівнювальних методах).
Не можна забувати, що нульовій гіпотезі відповідає альтернативнагіпотеза (ЯА) – це висновок, до якого хотілося б прийти в результатідослідження (наприклад, ефекти порівнювальних методів різні). З процедурами перевіркигіпотез тісно пов’язані поняття помилки I і II роду.
Так, помилка I роду – можливість помилково відхилити нульовугіпотезу, тобто знайти розходження там, де їх немає. Прийнятна для даногоексперименту імовірність помилки I роду називається рівнем значимості а.Помилка II роду виникає тоді, коли ми приймаємо нульову гіпотезу, а вонаневірна, іншими словами, не знаходимо існуючу розбіжність. Імовірність помилкиII роду позначається літерою р. Імовірність знайти наявні розходження, тобточутливість, чи потужність критерію, дорівнює 1 (за інших рівних умов цейкритерій має перевагу, у якого імовірність помилки II роду менше, відповідночутливість більше).
Крім того, для оцінки справедливості Но важливий показник, щозазвичай позначається літерою р і називається р-значенням. Він оцінюєімовірність того, що значення критерію виявиться не менше критичного значенняза умови справедливості нульової гіпотези (тобто за відсутності розбіжностейміж порівнювальними групами).
Під час планування клінічних досліджень в залежності відконкретних умов і мети може бути обраний різний порядок їхнього проведення, чидизайн.
Говорячи про дизайн дослідження, зазвичай мають на увазі йогоосновні компоненти: встановлення порядку проведення дослідження чи плану,визначення обраних методів рандомізації і ступеня сліпоти, оцінку необхідноїкількості пацієнтів, що включаються.
Найбільш часто зустрічаються такі варіанти планів дослідження:перехресний план, план латинських квадратів, мультиперехресний план, планпаралельних груп, блокові плани, план «гра на лідера», послідовний план.