ISSN Print 2713-2757    ISSN Online 2713-2765
SCIENTIFIC AND PRACTICAL REVIEWED JOURNAL OF FMBA OF RUSSIA

Our news

2021-07-26
Разработана система глубокого обучения для диагностики COVID-19 на основе рентгеновских снимков лёгких

Золотым стандартом диагностики COVID-19 на данный момент является ПЦР с обратной транскрипцией. Однако в достаточно большом проценте случаев ПЦР-тесты могут давать ложные результаты. Так, по данным Университета Джона Хопкинса, по меньшей мере 26% тестов являются ложноотрицательными. В связи с этим по-прежнему актуален поиск альтернативных подходов к быстрой диагностике, в том числе с применением искусственного интеллекта. Известно, что рентгеновские снимки грудной клетки (РСГК) достоверно выявляют COVID-19, а также позволяют оценивать и тяжесть заболевания по размеру и плотности очагов поражения.

Учёные из Университета Лейкхед в Канаде создали первую нейронную сеть глубокого обучения, которая с высокой точностью определяет по РСГК коронавирусную инфекцию. Авторы разработали два варианта такой модели: 2- классовый и 3-классовый. В первом случае алгоритм определяет снимки, как «COVID/не COVID», во втором - определяет наличие патологии на снимке и, если она есть, проводит дифференциальную диагностику пневмонии и COVID-19.

 

Чтобы сделать свою модель лучше прочих, авторы провели ряд доработок и нововведений. Во-первых, путем анализа литературы и консультаций с врачами были выделены следующие важные признаки COVID-19 на РСГК: двусторонний феномен "матового стекла" с периферийным преобладанием, корреляция размеров уплотнений на снимках с тяжестью состояния, пятнистые или диффузные ретикулярно-узловые помутнения и уплотнения с преобладанием базальной, периферийной и билатеральной локализаций, а также преимущественное поражение правого легкого при асимметричном поражении нижних дыхательных путей. Во-вторых, авторы использовали новый подход к созданию обучающего набора для модели. Так, например, многие их предшественники обучали свои модели на имеющемся наборе РСГК детей от года до пяти, однако лёгкие детей существенно отличаются от лёгких взрослых, следовательно, такая обучающая выборка нерелевантна задаче. Кроме того, многие авторы использовали непроверенные и зачастую некачественные наборы данных из статей. Авторы настоящей работы сами собрали набор для обучения из материалов баз данных COVIDx, MIDRC-RICORD-1C и BIM CV, доведя таким образом обучающий набор до 3913 изображений с COVID-19, 7966 изображений с нормальными легкими и 5441 изображения с пневмонией (вместе группа «не COVID» для 2-классовой модели – 13417 изображений). В основу архитектуры обучающейся модели авторы положили нейронную сеть DenseNet-121.

 

В результате авторы разработали модель COV-SNET для диагностики COVID-19 по РСГК с чувствительностью 95%. Кроме того, они создали новый обучающий набор, достаточно разнообразный, чтобы избежать переобучения. Этот набор, гораздо лучший, чем у предшественников, сам по себе является большим успехом и послужит для создания новых, еще более совершенных моделей.