Рассеянный склероз (РС) – одна из самых серьезных болезней, с которой борется современная медицина. Главная проблема заболевания заключается в том, что оно атакует преимущественно молодых людей. При этом этиология заболевания неясна: факт заболевания обычно устанавливается, когда у пациента уже проявляются симптомы. Дальнейшую судьбу пациента сложно предугадать, может как наступить быстрая деградация, так и наоборот, наступить ремиссия на десятки лет.
Авторы работы, учёные из Университета Сапиенца (Италия), решили оценить, какими методами можно наиболее оптимально предсказать исход болезни. Выбор данных для оценки достаточно разнообразен, однако авторы остановились на двигательной функции, оцениваемой с помощью специальных силовых функциональных платформ. Всего было два основных типа данных: полученные от 50 здоровых людей и полученные от 50 людей с диагностированным рассеянным склерозом на трёх разных стадиях (первичный прогрессирующий рассеянный склероз, стадия ремиссии и вторичный прогрессирующий рассеянный склероз).
Данные получались в виде сигнала, поэтому их подвергали процедуре шумоподавления, затем определяли необходимое окно данных - условно, сколько дескрипторов, данных или иных параметров данных попадает в систему. Если окно было слишком маленьким, то корреляцию установить не удастся, слишком большое же окно может привести к переобучению и серьёзно замедлить процесс обучения модели. Определив эти данные, авторы также столкнулись с необходимостью снизить мерность обрабатываемого сигнала. Так среди его характеристик были частота, средняя частота, мощность сигнала и прочие. Чтобы сократить время расчёта и повысить интепретируемость результатов, авторы применили методы сокращения мерности. Наконец, обработанные данные разделили на два набора: обучающий и тестовый, каждый из которых состоял из 4-х классов: нормальные образцы и три различные стадии РС. Данные перемешали для достижения наибольшей объективности, затем авторы попытались выстроить и улучшить корреляции с помощью метода опорных векторов, древа принятия решений, адаптивной нечёткой оптимизации и прочих.
В результате работы, авторы показали лучшую специфичность для метода опорных векторов, где им удалось достичь специфичности до 83%, похожие результаты дал метод адаптивной нечёткой оптимизации - 82%. Эти результаты показывают, какие методы построения моделей предпочтительнее для обработки данных, полученных от пациентов с РС, и могут быть использованы в дальнейшем для построения более чётких и точных моделей.