Борис Овчинников: как понять, что творится с ковидом в вашем городе
Как с помощью поисковика понять, сколько людей болеют в определенном регионе или городе. Какие поисковые запросы выдают рост второй волны ковида? Что чаще всего ищут россияне в интернете по теме COVID-19. Обсудили тему вместе с аналитиком Борисом Овчинниковым.
Разговоры о том, что официальная статистика по коронавирусу может не дотягивать до реального положения дел, ведутся в соцсетях и СМИ с самого начала пандемии. Мы подробно разбирали эту тему с независимым демографом. В связи с этим возникает резонный вопрос - как ориентироваться в цифрах, которые предоставляет оперштаб, как понять, что происходит в отдельно взятом регионе или городе.
По мнению одного из основателей исследовательского агентства Data Insight Бориса Овчинникова, определенную картину можно получить с помощью анализа статистики поисковых запросов россиян.
Текст представляет собой резюме видеоинтервью Бориса Овчинникова. Полная версия видеоинтервью доступна ниже.
Как запросы в Яндексе зависят от роста заболеваемости
Мы видим, что в тех регионах, в которых по другим метрикам и данным есть рост заболеваемости, одновременно или чуть раньше происходит рост запросов, которые по логике и должны быть связаны с коронавирусом. То есть это запросы, связанные с симптомами, запросы о пневмонии, о потере обоняния, о повышенной температуре. Это запросы, скажем так, о мониторинге состояния. Например, запросы о сатурации, о лекарствах, которые используются для лечения и поддержания состояния на время заболевания.
Да, скажем, мы не можем доверять официальной статистике, но это не значит, что мы должны ее игнорировать по всем регионам. Есть регионы, которые показывают, предположительно, более-менее адекватную картинку. Есть еще, к сожалению, фрагментарные, но более достоверные данные по количеству обращений за врачебной помощью в отдельных регионах, по количеству госпитализаций, по заполненности больничных коек.
И самый универсальный и надежный параметр для проверки, правда, доступный с очень большим временным лагом, это данные по смертности, которые публикует Росстат. Превышение обычного уровня смертности, если уж совсем упрощенно смотреть, то рост смертности относительно того же месяца прошлого года в регионе. Это, по моему убеждению, является наиболее адекватным показателем тяжести эпидемии в конкретном регионе в конкретном месяце.
А возвращаясь к поисковой статистике: она позволяет через косвенный индикатор, оперативно с лагом в несколько дней видеть ситуацию, развитие, предполагаемый рост заболеваемости с детализацией не только до определенных регионов, но до отдельных городов.
Где наблюдается наиболее сильный рост?
Летом на такие вопросы отвечать было легко, потому что в каждый момент времени тогда было несколько регионов, которые резко отличались в худшую сторону от общероссийской ситуации. Сейчас, если говорить про октябрь, ситуация изменилась. Я в оперативной метрике использую статистику, связанную со словом «обоняние». Так вот сейчас мы видим рост коронавирусных запросов практически по всем регионам.
Проще ответить на вопрос, где нет существенных изменений в ситуации, где ситуация намного лучше, чем в среднем по стране. Это некоторые республики Северного Кавказа: Дагестан, Чечня. Это Санкт-Петербург: там тоже есть рост заболеваемости, но он ниже чем в целом по стране. Это некоторые регионы северо-запада, например, Псковская область или Карелия. И список исчерпан. Может быть, можно назвать, но с большей осторожностью, Дальний Восток, Приморье и Хабаровский край.
А регионы, в которых наблюдается сильный рост? Если отталкиваться напрямую от частоты запросов со словом «обоняние», то таких запросов в пересчете на тысячу жителей или на миллион запросов к Яндексу во многих регионах больше, чем в любые самые сильные вспышки лета. Летом мы ужасались показателям Северодвинска, Норильска, а сейчас на этом уровне находятся десятки, в том числе некоторые крупные города, некоторые областные центры, например, Барнаул, Курган и ряд других.
Как отличить интерес реальных людей от медийного фона?
Это сложный вопрос, на который у меня до сих пор нет однозначного ответа. Уверенно можно сказать, что был всплеск медийных запросов именно об обонянии. Он был примерно во вторую неделю апреля, когда, видимо, и начались активные разговоры о потере обоняния как об одном из симптомов, причем очень специфическом, редко встречающимся в других случаях. И тот апрельский подъем был повсеместно. Во всех регионах вдруг резко выросло количество таких запросов, причем в регионах, в которых на тот момент заболевших практически не было. Но дальше, на протяжении мая и всего лета, мы видели другую картину, когда есть в разы большее количество запросов в тех регионах, где и по другим метрикам видно, что идет вспышка заболеваемости.
Рост пошел почти везде, и такая повсеместность снова поставила вопрос: это потому что везде растет заболеваемость или это потому что летом люди обращали меньше внимания на такой симптом, как потеря обоняния, а сейчас почему-то стали обращать больше? Я надеюсь, что некоторый момент медийного влияния в этом все-таки есть. Но то, что этот рост по регионам очень неравномерный, то, что рост подтверждается по другим запросам, подтверждается и другими данными, в том числе, официальной статистикой по количеству заболевших, региональной статистикой по количеству госпитализированных, все это говорит вот о чем. О том, что в первую очередь рост, который мы сейчас наблюдаем, определяется тем, что растет количество людей, которые заболевают и сталкиваются с проблемой потери обоняния, как симптома коронавируса.
«Сейчас ограничений меньше, а запросов почти в 2,5 раза больше»
Получается, весной все боялись, были жесткие ограничения, и было одно количество запросов, а сейчас ограничений меньше, а запросов почти в 2,5 раза больше. Но все-таки из этого я не могу сделать точный вывод, не могу говорить, что точно сейчас больных в 2.5 раза больше, чем было на пиковых показателях весны. Возможно, что реальный рост количества заболевших больше, чем нам показывает поисковая статистика. Хочется на это надеяться.
По официальным цифрам почти треть всех новых выявленных кейсов приходится на Москву. Но при этом, если смотреть на ту же поисковую статистику и делать прикидки, исходя из данных заполняемости коек, смотреть на данные о росте смертности, то становится понятно, что вклад Москвы в общее количество заболевших - не треть, а много меньше. Просто по Москве цифры более приближены к реальным, не так смягчается количество заболевших, как в других регионах. Конечно, когда мы видим по 16 тысяч заболевших в официальной статистике, то нужно понимать, что речь идет на самом деле о десятках тысяч.
Безусловно, тут есть нюансы и риски, связанные с тем, что та статистика, которую показывает Яндекс, ее не всегда можно интерпретировать правильно. Скорее всего, это все-таки инструмент для экспертов, журналистов, врачебного сообщества, но в принципе данные доступны каждому. Тем более, если у человека есть опыт работы с этими данными, а на самом деле такой опыт есть у десятков, а может быть и сотен тысяч человек по стране, учитывая сколько компаний, людей пользуются контекстной рекламой или занимаются поисковой оптимизацией для сайтов. Если такой опыт есть или есть готовность немного вникнуть, разобрать и посмотреть, то да, конечно, можно это использовать, условно говоря, и частным лицам.
Полную версию интервью смотрите ниже.
0 комментариев