Машинное обучение выявляет новые предвестники рака груди

Ученые объединили машинное обучение и другие обследования для определения предикторов рака молочной железы после менопаузы.

Мария Завьялова

Рак молочной железы является одним из самых распространенных видов онкологии, поражающей женщин во всем мире. Предыдущие исследования подчеркивали этиологическую разницу между раком груди в период до и после менопаузы. Было выявлено несколько предвестников этого заболевания, включая наследственные генетические факторы, репродуктивные факторы и образ жизни. А недавно британские ученые объединили различные подходы для точного прогнозирования рака груди у женщин, в том числе машинное обучение.

Как использовали машинное обучение

Методы машинного обучения (МО) могут анализировать большие наборы данных для раннего определения предвестников и обрабатывать сложные нелинейные связи. Предыдущие исследования использовали машинное обучение для прогнозирования риска рака молочной железы, но не для определения предикторов.

Основная цель исследования – продемонстрировать эффективное применение МО для выбора признаков, чтобы помочь классическим статистическим методам.

Для исследования потенциального взаимодействия между фенотипическими признаками и оценкой полигенного риска использовали графики зависимости признаков аддитивного объяснения SHapley (SHAP). Исследователи использовали данные Биобанка Соединенного Королевства, которые охватывают более полумиллиона участников из Англии, Уэльса и Шотландии. Информацию собирали путем устного интервью с обученной медсестрой, опросников, биологических образцов и физического осмотра.

Всего в это исследование было включено 104 313 женщин в постменопаузе в возрасте от 40 до 69 лет.

Результаты исследования

Рак молочной железы развился у 4010 участниц в течение периода наблюдения продолжительностью почти 12 лет. Сочетая машинное обучение с традиционными статистическими подходами к эпидемиологии рака, ученые обнаружили несколько известных и неизвестных факторов риска.

Определенные известные факторы риска включали возраст менопаузы, уровень тестостерона и в целом возраст. Также было выявлено пять новых предикторов, в частности массу тела, биохимию крови, анализ крови и биомаркеры мочи. Новые предикторы были тесно связаны с заболеваемостью раком груди в постменопаузе.

Новые предвестники включали детальный анализ состава тела, а не просто индекс массы (ИМТ). Базальный уровень метаболизма также был значимым предиктором рака молочной железы. Мочевина плазмы, которая является биомаркером крови, связанным с функцией почек, также имела корреляцию с раком. Это первый случай, когда сообщалось о связи между фосфатом, натрием или креатинином плазмы в моче с раком груди.

Эти выводы мотивируют дальнейшие исследования по использованию более точных антропометрических измерений для улучшения прогнозирования рака молочной железы. Внешняя проверка результатов является следующим важным шагом перед внедрением в клиническую практику.

Содержимое

Советую прочитать