Вероять их мать направо и налево...
Mar. 19th, 2020 11:58 am
Эксперимент на медиках in vivo
Тут давеча среди срача о нравах начался вторичный диспут о том, какой "статистике" (и вообще математике) имеет смысл учить врачей. Врачам сейчас не до нас, но почему бы не обсудить сюжет, пока они перебивать не будут? Чему не надо учить, я уже вскользь писал. А чему надо?Сначала надо шокировать
Первую лекцию врачам я бы начал с неожиданного тезиса. Забудьте, что на свете есть числа. Чисел нет, их придумали злодеи-профессора, чтоб пудрить вам мозги и заставлять заучивать бессмысленные заклинания типа латыни.Это прозвучит несколько неожиданно, но это в самом деле так. Вы когда-нибудь пытались взвешиваться на электронных весах, борясь с лишними килограммами? Тогда вы точно знаете, что ваш вес - это нонсенс. Кроме очевидных изменений (выпил стакан воды, опорожнился, вспотел после прогулки), даже попытки в течение одной минуты встать на весы и слезть приведут к разным результатам (да чего там: просто поднимите руки, не слезая с весов). И это, заметим, я ни словом не намекнул, что вашим весам уже 10 лет и батарейка там почти села.
Про то, какое у вас кровяное давление, вы и сами знаете. Конечно, есть инструкции (померить три раза, взять наилучшее), но даже не задавая еретических вопросов, почему три раза и почему наилучшее, - если вы проделаете те же манипуляции с тем же прибором, ответ будет другой. А померить двумя приборами по-македонски, на двух руках одновременно, я думаю, никто не пробовал.
Не расстраивайтесь, это не только проблема медиков. Если взять шарик от подшипника (самое совершенное, что создало человечество за 20 веков цивилизации), то и его радиус при разных измерениях окажется разным. Можно подвести под это дело физически-философское обоснование, связанное с квантовыми измерениями и эффектом неопределённости, но не надо ходить настолько далеко. Если вы подумаете, то окажется, что вокруг вас нет ни одного числа, есть что-то мерцающее, постоянно меняющееся, совершенно невыразимое.
Философски/компьютерно грамотные среди вас скажут, что это потому, что мы говорим о числах с "плавающей запятой", приближённых, и если нет "точного значения", то по крайней мере всегда можно указать интервал, внутри которого лежит данное "число". А если мы говорим о целых, скажем, числах, - то там пресловутый кот Шредингера (если кто слышал) может принимать только значения 0 (дохлый) и 1 (живой), а значит, целые числа точно существуют.
Вы уверены? Вот у вас есть кот Шредингера, которого вы лечите от какой-то болезни. По окончании всех процедур котик либо 0, либо 1. И что? Конечно, дохлого котика от живого в большинстве случаев легко отличить. Но если сдох, то отчего? А если живой, то вылечился ли он? А если он-таки сдох через два дня после выписки? А это всё означает, что в отчёте вашего ветеринара каждая строчка сомнительна, поэтому если по итогам месяца сдохли 7 котиков и поправились 14, ни одному из этих чисел нельзя верить, невзирая на радость счастливых семей и горе несчастных.
Где ещё могут прятаться числа? Ну да, там, где их печатают. На кассе, в банковских распечатках, в бюджетных и бухгалтерских отчётах. Про последнюю категорию я умолчу, чтоб не обижать никого. Но вот ваш банковский счёт, скажем? Уж это-то - настоящее число с точностью до копеек? Авотхрен. Вы же не едите и не носите рубли/шекели. А когда вы пойдёте в магазин (где тоже вам на кассовом чеке напечатают какие-то совершенно точные числа), то вы обнаружите, что из разных магазинов в разных местах вы выйдете с совершенно разными практическими результатами. И не надо мне в доллары переводить, мне евро ближе ;-)
Промежуточный вывод
ОК, если нет чисел, то что есть? И почему нас обманывают?❝Врачу! Не подводи статистики! Веди как можно точнее и детальнее историю болезни!❞
Картинки, столбики, диаграммы
Самый простой (хотя и сильно обманчивый) ответ - чисел нет, есть распределения. В первом приближении это такие нарисованные рядом друг с другом столбики с подписью, что где, самым мелким шрифтом. Чем пытаться дать "определение", лучше привести примеры.- Возрастная пирамида: для каждой страны Х рисуется сто колонок, 37-я колонка показывает, сколько в стране жителей, которым исполнилось ровно 37 полных лет. Сто колонок - перебор, поэтому обычно их группируют: 0-5 лет, 5-10лет, ... , 95-100 лет. Имеет смысл рисовать отдельно колонки для мужчин и для женщин.
- То же, но с медицинской спецификой: вместо всего населения вы регистрируете только больных с диагнозом Y. Или больных, умерших (официально) от этой болезни.
- То же, но с санитарной спецификой. Каждые полчаса вы подходите к градуснику и меряете температуру в палате, которая (теоретически) должна поддерживаться постоянной, скажем, 25С. За сутки у вас наберётся 24 измерения, и можно посчитать, сколько из них попадают в интервал 22-23, 23-24, 24-25, ..., 27-28 градусов.
- То же, но с климатической спецификой: градусник висит за окном, вы не отвечаете ни за что, но каждые сутки получаете новое распределение.
- Вы выписываете в строчку названия болезней, от которых мрут, и на основании данных Минздрава рисуете колонки, показывающие число умерших от разных болезней. В отличие от предыдущих примеров, колонки можно переставлять местами, важно помнить, где какая. Этим обычно пользуются для того, чтобы их упорядочить по убыванию.
Но эти распределения - всё же не самое интересное, что может быть. В некотором смысле, это всё "мёртвые", архивные данные, которые существенно иметь для сравнений и пр. Гораздо существеннее для нас распределения, которые мы сами "меряем" в поисках чисел. Типичный врачебный пример - эффективность лекарства. Берём группу больных с примерно одинаковыми внешними данными (возраст, вес, анамнез, ... ) - ну, насколько люди вообще могут быть одинаковы. Даём им всем одинаковое лекарство по одной и той же схеме, и через определённое время смотрим, что с ними произошло. Тут число колонок может быть различным ("поправился полностью", "состояние улучшилось", "нет видимых изменений", "состояние ухудшилось (как конкретно)", и т.д.). Ни у кого нет сомнений, что подобное тестирование, проведённое в двух разных госпиталях, даст разные результаты-"распределения". Вопрос - насколько они будут выглядеть по-разному?
Медицина любит "контрольные группы". Это тот же самый эксперимент, только вместо лекарства дают что-нибудь заведомо нейтральное плацебо типа глюкозы. Для чего? для того, чтобы сравнить, разумеется. Состояние больного будет меняться так или иначе в любом случае, и есть надежда оценить, оказало ли лекарство какой-нибудь эффект, или нет. Тут нельзя не восхититься изобретательностью медиков. Поскольку человек бесконечно сложнее каждого отдельного биохимического цикла, чтобы выделить эффект лекарства, надо максимально выравнять остальные условия. В частности, психосоматику, способность человека усилием воли влиять на своё состояние. Поэтому больные не знают, получают ли они лекарство или плацебо. Более того, врач тоже способен добросовестно заблуждаться, решая в конце эксперимента, было ли улучшение, ухудшение или эффекта не произошло. Поэтому врач тоже не знает, что он даёт конкретному больному (это называется double blind trial).
Почему у нас не получаются всякий раз одинаковые результаты? Отчасти ответ очевиден: в мире нет двух одинаковых людей, и даже у близнецов с возрастом накапливаются различия в реакции на медицинские воздействия, связанные с разным анамнезом. Мы не знаем всех причин, поэтому не можем предугадать последствия.
Но есть и более фундаментальная причина: случайность, которая присутствует в нашем мире неизбежно. Когда-то казалось, что случайность и неопределённость связана с нашим незнанием: Лаплас искренне верил, что, зная начальные положения и скорости всех тел во Вселенной, он теоретически смог бы предсказать её поведение в будущем со сколь угодно высокой точностью.
Философия Лапласа накрылась медным тазом, и даже двумя, в 20-м веке. Сначала физики, разобравшись с квантовой механикой, поняли, что на микроуровне никакой "механистической" предопределённости нет, есть детерминизм уравнения Шредингера, но даже абсолютно точное знание (что бы это ни значило) его решения не позволяет делать детерминистские макро-предсказания (привет котику Ш.). Второй таз прилетел от математиков: вычисление "в принципе" и "теоретически" оказывается невозможным в количественном отношении. Очень многие процессы в нашем мире экспоненциально неустойчивы: малое различие в начальных условиях, грубо говоря, удваивается каждый час (день, секунду). Даже если бы нам понадобилось покрыть всю Землю метеостанциями и запустив все суперкомпьютеры одновременно, мы смогли бы предсказать погоду на шесть дней, чтобы продлить прогноз на шаббат, нам пришлось бы удвоить число метеостанций и мощности компьютеров. Такой разорительной экспоненты ни одна "теория" себе не может позволить.
Но задолго до Лапласа умные люди (Паскаль) поняли, что со случайностью надо учиться жить. В те времена случайность подстерегала людей гораздо чаще, чем сегодня (и болезни, и путешествия, и дурные нравы современников), но самой общеизвестной формой были азартные игры - в карты, кости и т.д. И вот Паскаль начал размышлять на тему того, можно ли "вычислить" случайность и как-то загнать её в рамки той науки, которую почти одновременно создавал Ньютон. Ньютону было проще, - планеты и яблоки были видны всем желающим, а чего исчислял Паскаль? Я не знаю, был ли он первым, кто додумался до понятия "вероятность", но точно был одним из тех, кто стал с ним работать.
Что было, если вдуматься, интеллектуальным подвигом. Ньютон не задумывался над тем, что такое "число", - оно было "интуитивно ясно" до времён Дирихле и Вейерштрасса, а Паскаль свои вероятности никак не мог ни пощупать, ни померить. И тем не менее!
Математический ликбез: как выглядит идеальная модель сферического коня в вакууме?
Надо сказать, что ответа на вопрос "что такое вероятность" и сегодня нет. Было несколько попыток аккуратно определить это понятие, но они оказались не слишком удачными. Сегодня математики пользуются аксиоматикой Колмогорова (1933), которая, по сути, аксиоматизирует вероятности при помощи абстрактных "вероятностных пространств с сигма-алгеброй", но это всего лишь способ поставить ширму и сказать, что за неё мы не будем заходить.Конечно, врачам совершенно не нужно влезать в эти теологические дебри. Нужно понимать, что есть такие звери - "случайные величины": их значения зависят от невидимого нам "случайного генератора", и предсказать их значения невозможно. Самая популярная случайная величина - "честная монетка". С ней связано "распределение" (в описанном выше смысле) всего из двух столбиков: орел - 0.5 и решка - 0.5. Поскольку мы уже незаметно перешли в мир математических идеализаций, у нас вновь появились "настоящие числа" и 0.5 - это в самом деле ровно 1/2, половина, сколько значащих цифр не выписывай. Соответствующая случайная величина ξ принимает всего два значения 0 и 1 с равной вероятностью.
Что будет, если мы "бросим монетку два раза"? ответ общеизвестен, но повод немного задуматься остаётся. В самом деле: вы бросаете с приятелем монетку, она падает орлом, вы выходите покурить, возвращаетесь, - а приятель говорит, что она и второй раз опять выпала орлом. Он, конечно, мухлюет, - хотя к монетке не прикасался, но у него есть аргумент. "А чё её бросать-то снова? та же монетка, те же начальные условия, ясно же, что выпадет снова орлом". Не требуете же вы на кассе в супере пересчитать сумму только потому, что она вам не нравитсь? Что на такую наглость ответишь?
Ответ - второе ключевое понятие теории вероятности, независимость случайных величин. Два раза бросить монетку - это на самом деле вычислить две случайные величины, ξ1 и ξ2, которые независимы друг от друга. Общее число орлов - это сумма двух величин, которая может принимать значения 0,1 и 2, но уже вовсе не с равной вероятностью. Ответ общеизвестен, - 1/4, 1/2 и 1/4. Почему? аксиома в аксиоматике Колмогорова, если угодно: вероятности независимых событий перемножаются.
В реальной жизни, в отличие от честной монетки, независимость иногда бывает очень трудно "проверить". Общеизвестен исторический анекдот, что
вероятность умереть от инфаркта у случайного американца в 50-е и вероятность, что у него есть дома цветной телевизор, не были независимы. И не потому, что цветной телевизор плохо влиял на седце, а потому, что есть третья и четвёртая случайные величины - "уровень дохода в семье" и "количество жиров в ежедневной диете", которые каузально (причинно) не являются не зависимыми между собой и с первыми двумя величинами.
Но вернёмся к монетке. Что будет, если бросить её не 2 раза, а 100? Сумма случайных величин ξ1 + ... + ξ100 будет принимать значения от 0 до 100, и чтобы сравнивать такие суммы друг с другом, надо как-то приводить их к общему знаменателю. Например, поделить на число слагаемых (усреднить). Будет ли наблюдаться какая-то закономерность, если мы будем увеличивать число бросаний? Оказывается, что наивное желание усреднить не очень помогает, а вот если мы рассмотрим сдвинутую нормированную сумму,
ζn=[(ξ1 + ... + ξn)-0.5 n]/√ n
то получим неожиданный (очень неожиданный!) ответ - да! В отличие от очень многих математических теорем, которые доказываются "рассуждениями", этот ответ доказывается довольно длинным и непростым вычислением. Если мы построим распределение, столбики которого будут вероятности попадания в интервалы длиной 1, вместе покрывающие отрезок [-50,50], то мы увидим очень характерную колоколообразную кривую, симметричную относительно точки 0.5, в которой кривая достигает своего максимума. Заменив 100 на 10,000, мы всего лишь "сгладим" картину: отдельные столбики станут очень тонкими, а их верхушки лягут на колоколообразную кривую с восхитительной точностью.
Это называется "Центральная предельная теорема", и он сам по себе достоин удивления: случайные величины, никем не направляемые и не контролируемые, в сумме ведут себя гораздо дисциплинированнее, чем можно было бы себе представить. Более того, честная монетка здесь - не самый главный участник. Колоколообразная кривая (Гауссово распределение) возникает везде, где мы суммируем независимые одинаково распределённые случайные величины, если их надлежащим образом подправить сдвигом и нормировать на число слагаемых. Эта универсальность, к сожалению, приводит к иллюзии, что все вообще случайные величины распределены "по Гауссу": это не так, и даже если распределение имеет "один горб", всё равно без понимания того, что там внутри суммируется, никакого Гаусса ожидать не стоит.
И снова к нашим баранам
Предыдущие экзерциции со случайными величинами - математические упражнения. А жить надо здесь и сейчас. Вот у вас есть часок свободного времени и самая честная монетка. Вы начинаете её бросать и записываете, сколько раз выпало 0 орлов, 1 орёл, ..., 100 орлов. Нарисовали столбики, порадовались - но шероховатости остаются. Скорее всего, самый высокий столбик придётся не ровно на 50, а где-то рядом. Во-вторых, монотонность наверняка нарушится где-то либо ближе к середине, либо на концах распределения. Это что? монетка неправильная? бросали потной рукой?Вы повторяете эксперимент. И снова те же шероховатости, но в других местах. А после десятой серии бросков вы замечаете, что максимум заметно чаще попадает на числа орлов, меньшие 50, чем на числа, большие 50. Означает ли это, что монетка неправильная?
Усугубим ситуацию. Вы провели десять серий по сто бросков, и во всех десяти сериях максимум приходился на интервал 30-35 орлов. Можно ли с этим идти в суд, обвиняя чеканщиков, что монетка фальшивая?
Формальный ответ - нет. Даже если ваша монетка все сто раз выпала решкой, это не является "юридическим" доказательством того, что она фальшивая. Даже самая честная монетка иногда (невероятно редко) может выпасть таким образом. Вероятность такого варианта астрономически мала, но не нулевая. Формально судья имеет право отказать в иске.
Фактически, конечно, подобный исход СКОРЕЕ ВСЕГО означает, что монетка фальшивая. Но ответ "скорее всего" - тоже вероятностный! Запомни, врачу: никакая вероятностная модель никогда, какие бы замысловатые статистические пакеты не крутить, не даст определённый (детерминированный) ответ в виде "да/нет". В лучшем случае ваш статпакет напечатает ответ "с вероятностью 80% ответ - да, с вероятностью 20% - нет". А как жить с этим знанием - ваше дело.
На этом, пожалуй, сделаю паузу. Надо ж и делом заняться. Критика, как всегда, приветствуется.
no subject
Date: 2020-03-19 12:39 pm (UTC)no subject
Date: 2020-03-19 12:45 pm (UTC)no subject
Date: 2020-03-19 01:02 pm (UTC)no subject
Date: 2020-03-19 02:18 pm (UTC)no subject
Date: 2020-03-19 04:57 pm (UTC)когда студенту объясняешь эту разницу - он/а и мед статистику начинает понимать лучшее
сейчас кстати до пипла начинает доходить что страховая модель в медицине несостоятельна
но медленно
но вирус это понимание подтолкнул
no subject
Date: 2020-03-19 05:45 pm (UTC)no subject
Date: 2020-03-19 06:14 pm (UTC)или по мылу
но мне это очень интересно
no subject
Date: 2020-03-21 01:40 am (UTC)