Рак молочной железы является одним из самых распространенных видов онкологии, поражающей женщин во всем мире. Предыдущие исследования подчеркивали этиологическую разницу между раком груди в период до и после менопаузы. Было выявлено несколько предвестников этого заболевания, включая наследственные генетические факторы, репродуктивные факторы и образ жизни. А недавно британские ученые объединили различные подходы для точного прогнозирования рака груди у женщин, в том числе машинное обучение.
Как использовали машинное обучение
Методы машинного обучения (МО) могут анализировать большие наборы данных для раннего определения предвестников и обрабатывать сложные нелинейные связи. Предыдущие исследования использовали машинное обучение для прогнозирования риска рака молочной железы, но не для определения предикторов.
Основная цель исследования – продемонстрировать эффективное применение МО для выбора признаков, чтобы помочь классическим статистическим методам.
Для исследования потенциального взаимодействия между фенотипическими признаками и оценкой полигенного риска использовали графики зависимости признаков аддитивного объяснения SHapley (SHAP). Исследователи использовали данные Биобанка Соединенного Королевства, которые охватывают более полумиллиона участников из Англии, Уэльса и Шотландии. Информацию собирали путем устного интервью с обученной медсестрой, опросников, биологических образцов и физического осмотра.
Всего в это исследование было включено 104 313 женщин в постменопаузе в возрасте от 40 до 69 лет.
Результаты исследования
Рак молочной железы развился у 4010 участниц в течение периода наблюдения продолжительностью почти 12 лет. Сочетая машинное обучение с традиционными статистическими подходами к эпидемиологии рака, ученые обнаружили несколько известных и неизвестных факторов риска.
Определенные известные факторы риска включали возраст менопаузы, уровень тестостерона и в целом возраст. Также было выявлено пять новых предикторов, в частности массу тела, биохимию крови, анализ крови и биомаркеры мочи. Новые предикторы были тесно связаны с заболеваемостью раком груди в постменопаузе.
Новые предвестники включали детальный анализ состава тела, а не просто индекс массы (ИМТ). Базальный уровень метаболизма также был значимым предиктором рака молочной железы. Мочевина плазмы, которая является биомаркером крови, связанным с функцией почек, также имела корреляцию с раком. Это первый случай, когда сообщалось о связи между фосфатом, натрием или креатинином плазмы в моче с раком груди.
Эти выводы мотивируют дальнейшие исследования по использованию более точных антропометрических измерений для улучшения прогнозирования рака молочной железы. Внешняя проверка результатов является следующим важным шагом перед внедрением в клиническую практику.




