ϾѠϿ

Apr. 3rd, 2020 03:37 pm
xaxam: (Default)
[personal profile] xaxam

Что такое геометрическая прогрессия

Вот уж не думал, что после рассказов о резонансах придётся вспоминать заветы дедушки Перельмана и рассказывать, что такое обычная геометрическая прогрессия (в задаче о распространении болезни). Но ϾѠϿ, деваться некуда (хотя лучше бы, если бы вы начали в самом деле с классической книжки).

Привет Перельману. Начнём с фразы, которая сегодня слетает с микрокаплями слюны с уст любого "эпидемиолога" ("вирусолога", ...) без участия головного мозга.
❝За единицу времени каждый больной заражает одно и то же постоянное количество людей. Это описывается уравнением X(t+1)=A⋅X(t), t=0,1,2,..., где А - число, описывающее интенсивность распространения болезни. 

Решение этого уравнения даётся геометрической прогрессией X(t)=At ⋅X(0). ❞
Эта фраза бессмысленна, пока мы не договорились о том, ху из ху. Прежде всего, что такое t? Естественный ответ для любого человека, - номер дня (скажем, с начала эпидемии). Однако же есть и альтернативная точка зрения, более естественная с точки зрения эпидемиологии, - t меряется не в днях, а в "тактах" длительности заболевания, промежутках времени от заражения и до... до чего? Тут тоже возможны варианты: в "свободно летящей" эпидемии - до выздоровления или смерти (и в том, и в другом случае распространитель инфекции выходит из игры). В эпидемии с "точечной изоляцией" - до появления симптомов, позволяющих выявить больного носителя и изъять его из игры, посадив в карантин. В "одношаговой" модели все подходы равноправны, но существенно пользоваться одним и тем же вариантом, а не подменять дюймы сантиметрами в ходе вычислений.

Второй вопрос, - что такое Х(t). Это (число людей) тоже можно понимать по-разному. Каждый человек может быть в "активной фазе" (распространять заразу) и в "неактивной" (ещё не заболел или уже не заразен, напр., на кладбище). Написанное уравнение проще всего интерпретировать, если Х(t) - число "активных больных", а t меряется в тактах, а не в днях. Но тогда оно становится неверным: все больные, которые были активны в такте t, становятся (так или иначе) неактивными в такте t+1, a активными будут только свежезаражённые. Иными словами, если А - число людей, которых заражает один "активный" больной за время "такта" (всей протяжённости болезни), то уравнение должно иметь вид X(t+1)=A⋅X(t). Именно такое (выделенное выше жирным шрифтом) определение принимается для пресловутой "константы R0". Если мы хотим перейти от "тактов" к дням, это всего лишь замена масштаба "независимой переменной". Но и здесь есть небольшая засада. Предположим, длительность "такта" - n дней. Сколько человек должен заражать один активный больной в день, чтобы за полные n дней от него заразилось А = R0 человек? Наивный ответ - R0/n, считая, что процесс равномерный по дням. Идеологически правильный ответ, - R01/n, корень степени n из А. К счастью, для значений R0 близких к единице и не слишком больших n это почти одно и то же, как следует из биномиальной формулы.

Однако если Х(t) - число активных больных, то что же мы наблюдаем? В сводках с полей сражений нам сообщают про общее количество заразившихся, с начала эпидемии. Это - интегральная сумма Y(t)=X(0)+X(1)+...+X(t). Если мы считаем, что X(t)=Аt⋅X(0), А= R01/n, то то эта сумма равна Y(t)=(Аt+1-1)/(A-1)⋅X(0)=(C0 Аt+C1)⋅X(0), где С0, С1 - некоторые константы, зависящие от А. Иными словами, мы имеем рост в виде геометрической прогрессии с тем же самым знаменателем, если А > 1, и насышение на уровне C1 в пределе, если A < 1.

Я надеюсь, что вся эта мешанина нормировок, интерпретаций, масштабов по времени, отнимания единицы и пр., относящаяся всего лишь к простейшей геометрической прогрессии, отвадит желающих ловить меня на том, что я (возможно, небрежно) писал об одном, а читательницы с половниками прочли жопой не так.

Уравнение с запаздыванием. Часть этого геморроя самоупростится, если мы рассмотрим уравенение эпидемии так, как оно того заслуживает, - а именно, как уравнение с запаздыванием. В этом случае каждый "активный" больной характеризуется ещё и своим "стажем", числом дней с момента инфицирования до выбытия из игры (выздоровление, погост, карантин, депортация). Вместо одной переменной X(t) у нас появляется ожидаемым образом набор x0(t), x0(t), ... xn(t), - количество активных больных со стажем 0,1,...n в каждый момент времени t. Поскольку мы явно ввели "такт" в модель, с этого момента мы считаем t только в днях.

Уравнения динамики приобретают теперь несколько иную форму: вместо одного уравнения мы теперь имеем систему, первые n из которых предельно просты,

xk(t+1)=xk-1(t),           k=1,2, ... n.

Это попросту означает, что за сутки у каждого уже больного стаж увеличивается на единичку, т.е., все больные со стажем k-1 за день становятся обладателями стажа k. Это не единственное возможное предположение: например, некоторые больные могут не дожить до стажа k и выйти из игры раньше. Если мы интерпретируем стаж, как время между заражением и появлением симптомов, позволяющих диагностировать и изолировать больного, то это соответствует либо бессимптомной быстрой болезни, прошедшей мимо всех радаров, либо быстрому появлению симптомов (и то, и другое наруку нам и врачам, - носитель раньше выбывает из игры на заражение).

Единственное нетривиальное уравнение описывает появление свеженьких, больных со стажем 0. А их присылают все, кому не лень, от новобранцев со стажем 1 до ветеранов со стажем n, которым завтра уже всё равно на покой. Но с разной производительностью. Например, разумно предположить, что чем больше стаж, тем больше заразы носит в себе больной и тем больше он её выплёвывает на окружающих, но это и не обязательно. В любом случае, мы предполагаем, что есть уже не одно число А, а набор чисел (вектор) a1, a2, ... an, неотрицательных (нули допускаются), показывающих, сколько новых больных может заразить за один день активный больной со стажем 1,2, ..., n соответственно. Тогда

x0(t+1)=a1 x1(t)+...+an xn(t).

Для такой системы легко буквально воспроизвести определение "константы R0": каждый вступивший в игру больной заражает за время своей стажировки R0= a1 + a2 + ... + an новых больных.

Теперь мы можем описать, чего хотим от нашего уравнения, точнее, какие его решения нас интересуют. Нас интересуют экспоненциальные решения, задаваемые геометрическими прогрессиями с разными знаменателями. Собственно, даже не сами прогрессии, а только их знаменатели, "темпы роста". Разумеется, ключевое обстоятельство - линейность системы.

Предположим, что у нас есть решение, в котором xn(t)=λt. Что будет, если мы подставим его в систему?
Из первых n уравнений (зачёт стажировки) мы получим, что λxk(t)=xk-1(t), при всех k=1,2,...n. Подставляя в "главное" соотношение, получаем Основное Уравнение (ОУ):

λn=a1λn-1+ a2λn-2 + ... +an-1λ+an.


А теперь можно убрать в сторону предыдущие вычисления, обоснования и пр., и задать чисто математический вопрос. Имеется n неотрицательных чисел, a1, a2, ... an, нормированных условием R0= a1 + a2 + ... + an. В каких пределах могут меняться корни (ОУ), а точнее, самый большой положительный корень? Кстати, остальные корни тоже имеют смысл, хотя их решения и будут давать вклад, исчезающе малый на фоне "самой главной" экспоненты. Даже невещественные корни интересны: они соответствуют волнообразному (синусоидальному) росту/затуханию эпидемии, что невозможно в случае "однотактовой схемы".

Теорема. Максимальный (по абсолютной величине) корень уравнения (ОУ) и есть то, что мы наблюдаем на "среднем" промежутке времени, большем, чем начальный интервал (где всё зависит от случайных ненаблюдаемых начальных условий), но меньшем, чем "участок насышения", где начинает сказываться заметная часть популяции, приобретшей иммунитет после болезни.

Пример. Предположим, an=R0, а остальные коэффициенты - нули. Тогда мы фактически находимся в рамках однотактовой схемы, все корни=(ОУ) равны 0, кроме одного, равного R0. Ничего нового, как и следовало ожидать.

Пример. А теперь - наоборот: больной заразен только один день после инфицирования, а потом - безобиден. Тогда корень λ=R01/n. Заметим, что при R0 >> 1 корень заметно меньше подкоренного выражения.

Можно рассмотреть и промежуточные случаи, например, когда все коэффициенты равны R0/n.

Чтобы связать эту модель с публикуемыми "статистическими данными", надо просуммировать число ежедневно добавляемых "новых случаев", y(t)= x0(0)+ x0(1)+ ... + x0(t), как описано выше.

Обратная задача (мало кому интересная, но всё же формально имеющая право на существование): зная наибольший положительный корень (ОУ), какой может быть величина R0?

Короткая мораль. В одном и том же классе линейных моделей есть несколько разных вариантов. При этом о них норовят говорить, используя одни и те же слова и "параметры". Миля миле рознь, а особенно если мерять сухопутными милями и переводить в кабельтовы. А в настоящей модели с запаздыванием, помимо чисто терминологических недоразумений, есть ещё и довольно заметная "внутренняя степень свободы": один параметр не может заменить несколько независимых, даже если он очень важный.

Дисклеймер. Линейные модели, со всеми их оговорками, приемлемы лишь до тех пор, пока больные - капля в море здоровых при интенсивном перемешивании. В тот момент, когда количество выздоровевших становится сравнимо с числом восприимчивых, всё надо менять.

Замечание о непрерывном и дискретном времени. Модель с дискретным временем ("разностное уравнение") удобна тем, что она более элементарна и её легче объяснить. Существенный минус, - она гораздо менее удобна для вычислений, чем модель с непрерывным временем (обыкновенное линейное дифференциальное уравнение). Но это удобство исчезает при переходе к уравнению с запаздыванием (в котором "стаж" вместо целочисленных значений принимал бы все вещественные значения на промежутке τ∈[0,n]. Это сделало бы модель бесконечномерной, а значит, вызвало бы сильную изжогу. Но в рамках конечномерных линейных моделей ("гибридных" - стаж принимает дискретные значения, как армейские звания, а время течёт непрерывно) принципиальной разницы нет, поскольку любая матричная прогрессия X(t)=Mt, t=0,1,2,..., является дискретизацией в целых точках решений дифференциального уравнения dX/dt= A⋅X(t), t∈ R, если eA=M. А уж возможность вычислить логарифм матрицы - хорошо известная задача. Вообще связь между непрерывным и дискретным временем очень верно (на интуитивном уровне) передаётся потенцированием/логарифмированием, что часто приводит к путанице между es и 1+s при малых s (заранее извиняюсь, если нам согрешил).

Педагогический комментарий. Кажется, впервые за практику математического просвещения в "ХВ" я разродился текстом с таким количеством вычислений. Опираясь на предыдущий опыт, я почти уверен, что где-то проврался, спутал с прямым углом и т.д. Но эксперимента ради, я хотел бы попросить слушателей самих отвечать друг другу на вопросы по тексту (например, указав на мои возможные ошибки). Мне будет интересней посидеть передохнуть в сторонке, послушав пресловутых сторожилов с опытом. Заранее спасибо!

Date: 2020-04-03 01:45 pm (UTC)
cjelli: (hal9000)
From: [personal profile] cjelli
Сигмоид, вроде, описывает динамику заражения вполне адекватно на всех стадиях.

Date: 2020-04-03 02:52 pm (UTC)
cjelli: (hal9000)
From: [personal profile] cjelli
про модель, вроде?

сигмоиды

Date: 2020-04-04 11:40 am (UTC)
From: (Anonymous)
>но ввинчивать их без обоснования в модель, где такого нет, неправильно.

число заражённых и есть сигмоида разве нет ? Когда эпидемия побеждена, число заражённых перестаёт расти.

относительно моделей в эпидиомологии, их же так много что туда и уравнения хим кинетики пробуют (не помню где но видел точно, можно найти).

В простейшем случае это 1-го порядка реакция dx/dt=-kx что то же самое что и везде но с Аррениусовским k=Aexp(-E/RT) где Е/R что то вроде резистивности/иммунитета организма и Т что то вроде интенсивности экспозиции к вирусу. Обычно Т=Т(t) надо предположить для условий карантинов, лечений итд. Ну можно следуя традиции химиков подправить Е=Е(х). Важно что х это доля "ещё не заболевших" и оно ограничено, т.е. х(0)=1 и заражённые y=1-х.

И вполне будут сигмоиды- перестаёт расти число заражённых если всех заразили или k так уменшили (путем Е или Т), что уже и динамики не видно

Из хим кинетики известно что обратная задача оценки А и Е при данном Т(t) и дискретных х(t_i) некорректная, ну вычисления неустойчивы и пользоваться ею можно только как водится очень осторожно и с оговорками




Profile

xaxam: (Default)
xaxam

January 2026

S M T W T F S
     1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21222324
25262728293031

Page Summary

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 22nd, 2026 05:35 am
Powered by Dreamwidth Studios