利用人工神经网络和计算机视觉,根据膝关节计算机断层扫描分析判断一个人的年龄。初步结果
- 作者: Zolotenkov D.D.1, Trufanov M.I.2, Solodovnikov V.I.2
-
隶属关系:
- I.M. Sechenov First Moscow State Medical University (Sechenov University)
- Design Information Technologies Center Russian Academy of Sciences
- 期: 卷 9, 编号 4 (2023)
- 页面: 403-412
- 栏目: 原创研究
- ##submission.dateSubmitted##: 14.06.2023
- ##submission.dateAccepted##: 05.09.2023
- ##submission.datePublished##: 15.12.2023
- URL: https://for-medex.ru/jour/article/view/11915
- DOI: https://doi.org/10.17816/fm11915
- ID: 11915
如何引用文章
详细
论证。目前,对通过积极利用现代医学影像方法(如电子计算机断层扫描)和人工智能来分析的现有法医年龄估计方法进行现代化改造已成为一个明确的重点。这种方法使我们有可能创造出具有更高精度和可重复性特点的生理年龄估计新方法。
该研究的目的是利用人工神经网络和计算机视觉,在膝关节计算机断层扫描分析的基础上,开发一种预测个人生理年龄的算法,并对其进行实验测试。
材料与方法。我们采用智能信息技术(一套正规的数学和软件解决方案)对膝关节计算机断层扫描图(n=334)进行了分析。计算机断层扫描是2018年至2021年在以N.N.Priorov命名的国家创伤和矫形医学研究中心(National Medical Research Centre of Traumatology and Orthopedics named after N.N.Priorov)和以R.R.Vreden命名的国家创伤和矫形医学研究中心(National Medical Research Centre of Traumatology and Orthopedics named after R.R.Vreden)的放射诊断科进行的。研究对象为年龄在13至45岁之间、无畸形、膝关节损伤和一般结缔组织病变迹象的男女个体。
结果。在该研究的基础上,我们利用膝关节计算机断层扫描数据开发了一种年龄估计算法。所开发系统的主要组成部分包括预处理模块、智能计算核心、数据分析模块、三维重建模块、特征提取模块和最终年龄估计模块。所提方法的精髓在于同时应用人工神经网络和明确的正规化数学程序来计算骺线的特征。为了获得结果并进行初步实验研究以证实该方法的可行性、正确性和可操作性,我们使用YOLOv5模型的人工神经网络实施了测试软件。学习后的误差矩阵分析结果显示,正确识别的概率约为80%。我们在46张膝关节计算机断层扫描图像上对实验研究进行了验证。目前,儿童和青少年的年龄估计误差约为一岁。
结论。实验研究的初步结果证实了,所获得的年龄估计值与个人的实际年龄相吻合,因此,有望利用所提出的算法来创建一种自动年龄估计方法,并将其进一步应用于法医机构的实践中。目前,我们开发的算法是作为一套软件组件实施的,随后将对自动计算的数据进行人工整合。计划对计算机断层扫描图像数据库进行补充,以增加训练样本,并在扩展样本上测试年龄预测的准确度,包括考虑研究对象的性别。
全文:
ОБОСНОВАНИЕ
Биологический возраст человека и его оценка представляют собой судебно-медицинскую задачу, имеющую важные юридические и социальные последствия. Помимо юридических причин, потребность в верификации возраста возникает и в клинических ситуациях. Международная практика оценки возраста живых лиц базируется на комплексной оценке результатов физического осмотра, рентгенографии левой руки, стоматологического осмотра, компьютерной томографии (КТ) ключицы [1–3]. Наиболее остро стоит проблема определения 18-летнего рубежа (возраст совершеннолетия). В настоящее время имеется множество публикаций, в которых данная проблема решается как за счёт использования новых методов исследования, так и включения в анализ иных областей интереса [4–6]. Вместе с тем сложность интерпретации результатов рентгенологического исследования часто приводит к низкой воспроизводимости предлагаемых методов [7]. В этой связи сформировалась чёткая направленность на модернизацию существующих методов оценки скелетного возраста посредством активного использования современных методов медицинской визуализации и интеллектуального анализа данных [8–10].
Применение автоматизированных методов с использованием алгоритмов машинного обучения позволяет значительно снизить субъективизм оценки. Подобные технологии уже достаточно активно используются во многих медицинских исследованиях с целью выявления закономерностей в данных и получения полезных оценок для улучшения принятия решений в области здравоохранения [11, 12]. С информационной точки зрения постановка проблемы текущего исследования состоит в следующем. В настоящее время известен ряд решений, базирующихся на слабо коррелирующих с реальными практическими ситуациями регрессионных моделях, разработанных десятилетия назад и не дающих необходимую точность [13]. Известен также ряд современных решений, основанных на искусственных нейронных сетях, основным недостатком которых являются зачастую невыполнимые требования к большому объёму выборки, необходимой для обучения качественному распознаванию заданных свойств возрастных изменений, а также отсутствие математического инструментария, который позволял бы после вычисления признаков нейронными сетями выполнять финальное принятие решения. Другим недостатком известных решений является отсутствие валидационного подхода, позволяющего оценивать точность установленного возраста. Существенным ограничением предлагаемых разработок является использование магнитно-резонансных томографических исследований (МРТ) [14, 15]. Публикации, посвящённые возможности использования КТ-изображений колена для оценки возраста, в том числе с использованием методов машинного обучения, отсутствуют.
Цель исследования ― разработка и экспериментальная апробация алгоритма прогнозирования биологического возраста индивидуума на основе анализа КТ коленного сустава с применением искусственных нейронных сетей и компьютерного зрения.
МАТЕРИАЛЫ И МЕТОДЫ
Дизайн исследования
Проведено обсервационное ретроспективное поперечное (одномоментное) исследование.
Критерии соответствия
Критерии включения. Объектами исследования служили КТ-снимки (n=334) коленного сустава лиц обоего пола в возрасте от 13 до 45 лет.
Критерии невключения: аномалии развития; повреждения колена; признаки общей патологии соединительной ткани.
Условия проведения
В исследование были включены КТ-снимки, выполненные в отделениях лучевой диагностики ФГБУ «Национальный медицинский исследовательский центр травматологии и ортопедии имени Н.Н. Приорова» Минздрава России и ФГБУ «Национальный медицинский исследовательский центр травматологии и ортопедии имени Р.Р. Вредена» Минздрава России.
Продолжительность исследования
Использовались архивные КТ-снимки коленного сустава, выполненные в период 2018–2021 годов.
Основной исход исследования
Доступный набор КТ-снимков был разделён на обучающий (70%), тестовый (16%) и проверочный (14%). Первоначально производилось обучение нейронной сети для выделения областей интереса и предварительной классификации, т.е. отнесения индивидуума к одной из трёх возрастных групп. В качестве исходных данных использовались изображения КТ коленного сустава в сагиттальной проекции, которые были обработаны (сегментированы) с использованием программного обеспечения InVesalius 3.1.1 и экспортированы в виде файлов JPEG. Полученные в результате преобразования серии снимков размечались вручную (https://www.makesense.ai/). Размечалось каждое изображение. Вначале размечались области края эпифиза («0») и центра эпифиза («00»). Затем производилась разметка классов отдельно для центральной части эпифиза и периферии. Принцип наименования классов следующий:
- класс 1 ― эпифиз и метафиз полностью разъединены, эпифизарная линия визуально определяется как двойная (класс, условно обозначенный как «ребёнок»);
- класс 2 ― начальный этап сращения: наличие участков сращения в центре в виде одинарной линии и двойной по периферии («подросток»);
- класс 3 ― полностью сросшаяся, оссифицированная эпифизарная линия («взрослый»).
Примеры разметки эталонных классов представлены на рис. 1.
Рис. 1. Разметка объектов на изображении, применяемая при реализации метода.
Fig. 1. Marking of objects in the image used in the implementation of the method.
После обучения с целью тестирования качества обученной системы выполнялись следующие шаги согласно разработанному методу.
- Ввод данных КТ посредством чтения DICOM файлов. На данном этапе выполняются геометрическое преобразование исходных данных в сагиттальную проекцию (в случае отсутствия такой проекции в исходных данных); нормализация данных посредством анализа гистограммы распределения яркости. Результатом нормализации является приведение исходных изображений, используемых как при обучении, так и при работе системы, к одному виду, что снижает дальнейшие погрешности.
- Поиск ранее заданных при обучении частей эпифизарной линии на каждом оптическом срезе на основе нейронной сети. Результатом данного распознавания является выделение областей изображения, соответствующих каждому классу, и вероятность соответствия данной области найденному классу.
- Построение объёмной модели кости для последующего исключения ложных обнаружений эпифизарной линии по критерию недопустимости местоположения и непрерывности эпифизарной плоскости.
- Формирование первичной («грубой») оценки возраста в виде выбора одного из трёх классов: класс 1 ― ребёнок (до 14 лет); класс 2 ― подросток (15–18 лет), класс 3 ― взрослый (старше 18 лет).
- Подготовка финальной оценки возраста и расчёта доверительного интервала оценки исходя из первичной классификации возраста:
- для класса 1 ― определить ширину (расстояние) между эпифизом и метафизом и геометрические свойства эпифиза и метафиза для формирования расчётных соотношений;
- для класса 2 ― определить процентное соотношение площади сросшихся частей и несросшихся частей эпифизарной плоскости;
- для класса 3 ― определить процентное соотношение площади, на которой различима и неразличима эпифизарная линия.
Дополнительные исходы исследования
Для оценки точности и эффективности решаемой задачи определения возраста, которую мы рассматривали как частный случай задачи классификации (определение возрастной группы), использовалась матрица ошибок. Матрица ошибок даёт целостное представление о том, насколько хорошо работает классификационная модель и какие ошибки она допускает.
Этическая экспертиза
Протокол исследования одобрен этическим комитетом Сеченовского Университета (протокол № 01-21 от 22.01.2021).
РЕЗУЛЬТАТЫ
Основные результаты исследования
Для получения результатов и проведения первичных экспериментальных исследований, подтвердивших реализуемость, корректность и работоспособность метода, реализовано тестовое программное обеспечение с использованием искусственной нейронной сети модели YOLOv5, обученной для распознавания типов эпифизарной линии на сагиттальных проекциях. Результат анализа матрицы ошибок обучающей и тестовой выборки показал, что точность определения классов на предварительном этапе составляет порядка 80%. В процессе обучения нейронной сети было задействовано не менее 2000 объектов для каждого класса (по 10 объектов на один оптический срез, 20–25 оптических срезов на каждый случай, на каждое КТ). Этого количества достаточно для предлагаемого метода, так как основная часть оценки возраста реализуется последующей обработкой этих данных. Далее в зависимости от предварительно определённого класса возраста производятся последующая обработка областей интереса путём выполнения сегментации и распознавания, а также подсчёт процентного соотношения найденных характерных сегментов. Для каждого из типов возраста формируется два различных подкласса (для случая возраста взрослого или подростка), либо же выполняется оценка расстояния между метафизом и эпифизом (для случая возраста ребёнка). После этого выполняется финальная оценка возраста текущего случая. Пример оценки свойств эпифизарной линии представлен на рис. 2. Показано построение распределения яркости пикселей в области нормали к эпифизарной линии (такие нормали строятся для каждой точки линии, и, в свою очередь, обработка выполняется для каждой линии на каждом оптическом срезе, что и позволяет извлечь максимально возможный и объективный объём данных, в отличие от известных подходов).
Рис. 2. Механизм оценки локальных свойств каждой точки эпифизарной линии (плоскости) при расчёте возраста.
Fig. 2. The mechanism for evaluating the local properties of each point of the epiphyseal line (plane) when calculating the age.
Сформированная в пространстве эпифизарная поверхность далее используется как самостоятельная диагностическая единица для оценки возраста. Согласно разработанному методу, выделяют две основные области ― область между костями (область «А», рис. 3) и область, примыкающую к эпифизарной линии (область «В»: «B1» ― для бедренной кости, «B2» ― для большеберцовой кости, см. рис. 3). Область «А» используется для калибровки и настройки процесса нормализации яркости, что позволяет привести все изображения любых случаев к одним и тем же нормализованным данным. Области «B1» и «B2» являются основными участками для расчёта возраста. Они (области «B1» и «B2», см. рис. 3) показаны как двумерные, однако расчёт и оценка свойств выполняются в трёхмерном пространстве, т.е. для всей поверхности эпифизарных пластин, причём и бедренной, и большеберцовой костей. Чем больше пик в областях «B», тем ближе возраст к 14(±1) годам. Отсутствие выраженного пика в областях «В» означает формирование эпифизарного сращения. Распределение значений пика яркости, связанного с плотностью костной ткани в данной области, в зависимости от его положения в трёхмерном пространстве для всей эпифизарной пластинки позволяет оценить возраст.
Рис. 3. Пример нормирования и вычисления свойств изображения при вычислении свойств эпифизарной линии (плоскости): А ― область между костями; В ― область, примыкающая к эпифизарной линии (B1 ― для бедренной кости, B2 ― для большеберцовой кости).
Fig. 3. Example of normalization and calculation of image properties when calculating the properties of the epiphyseal line (plane): A ― the area between the bones; B ― the area adjacent to the epiphyseal line (B1 ― for the femur, B2 ― for the tibia).
Разработанный метод на данный момент времени реализован в виде совокупности программных компонент с последующим ручным объединением автоматически вычисленных данных. Проверка экспериментальных исследований проведена на 46 случаях, погрешность оценки возраста составляет около одного года для детского и подросткового возраста. Таким образом, результаты предварительного экспериментального исследования подтверждают адекватность получаемых оценок возраста фактическому возрасту индивидуума и тем самым перспективность использования предложенного алгоритма для создания автоматизированного метода оценки возраста и дальнейшего его применения в практике судебно-медицинских учреждений. На данный момент, исследования продолжаются на расширенной выборке.
Дополнительные результаты исследования
Аналитическое обобщение результатов исследования использовано для построения алгоритма оценки возраста по данным КТ коленного сустава (рис. 4). Основными компонентами разработанной системы являются модуль предварительной обработки, интеллектуальное вычислительное ядро, модуль анализа данных, модуль трёхмерной реконструкции, модуль извлечения свойств и модуль финальной оценки возраста.
Рис. 4. Алгоритм оценки возраста по данным компьютерной томографии коленного сустава.
Fig. 4. Algorithm of age estimation according to computed tomography of the knee joint.
ОБСУЖДЕНИЕ
Резюме основного результата исследования
В результате реализации разработанного алгоритма указанные выше процедуры обработки позволили:
- извлечь необходимые первичные данные при малом наборе исходных данных для обучения;
- обеспечить адаптивное и дообучаемое правило финальной оценки возраста;
- обеспечить рациональное принятие решения в условиях малого объёма исходной выборки для обучения и максимально точный на представляемом для анализа объёме данных результат оценки возраста.
Другим положительным свойством предложенного алгоритма является вычисление свойств и признаков возраста по каждому оптическому срезу, что обеспечивает максимально полное извлечение первичных данных и, как следствие, адекватную имеющимся данным оценку возраста.
Программная реализация разработанного алгоритма позволит автоматизировать процедуру экспертной оценки: подавая на вход серию КТ-данных, на выходе получать ответ о возрасте индивидуума.
Обсуждение основного результата исследования
В данном исследовании для расчёта возраста индивидуума по данным КТ коленного сустава были привлечены современные цифровые технологии. Следует отметить, что большинство исследователей, которые описывают в своих публикациях применение так называемых интеллектуальных технологий, сводят процесс оценки возраста лишь к применению нейронных сетей как единственного математического инструментария. Как правило, это либо не позволяет достичь желаемых результатов, либо приводит к большому проценту ошибок в оценке возраста, что обусловлено невозможностью решения задачи построения качественного метода с использованием нейронных сетей в условиях относительно малого объёма выборки и высокого уровня разнородности в исходных данных. Отличием предлагаемого метода от уже известных является использование нейронных сетей как одного из инструментов для решения лишь некоторых частных вопросов при реализации описываемого метода оценки возраста. Сущность предложенного метода состоит в одновременном применении как искусственных нейронных сетей, так и чётко формализованных математических процедур вычисления свойств эпифизарной пластины. Такое объединение различных математических подходов позволяет с максимально возможной точностью в условиях малого объёма исходных данных для обучения решить математически корректно задачу оценки биологического возраста индивидуума.
Применение процедур компьютерной обработки изображения области эпифизарной пластины в пространстве и эпифизарной линии в каждом двумерном оптическом срезе на основе технического (компьютерного) зрения позволяет минимизировать ложные результаты при оценке свойств эпифизарной линии, реализовать численное измерение геометрических свойств и косвенную оценку плотности эпифизарной пластины.
Ограничения исследования
В данной работе представлены результаты предварительного исследования. На данном этапе разбивка выборки по половому признаку не осуществлялась, что планируется реализовать в последующем. Дальнейшие исследования направлены на привлечение расширенной выборки как для обучения, так и для тестирования.
ЗАКЛЮЧЕНИЕ
В ходе проведённого исследования представлен новый технологический подход для разработки судебно-медицинского метода оценки возраста индивидуума с использованием исходных данных КТ коленного сустава и технологий искусственного интеллекта (нейронные сети, компьютерное зрение). Инновационный подход предлагаемой интеллектуальной системы оценки возраста позволяет обеспечить рациональное принятие решения в условиях малого объёма исходной выборки для обучения и максимально точного результата оценки возраста, описываемого также доверительным интервалом, т.е. реализовать математически корректное представление результата.
ДОПОЛНИТЕЛЬНО
Источник финансирования. Исследование выполняется в рамках темы № FFSM-2019-0001.
Конфликт интересов. Авторы декларируют отсутствие явных и потенциальных конфликтов интересов, связанных с публикацией настоящей статьи.
Вклад авторов. Авторы подтверждают соответствие своего авторства международным критериям ICMJE (все авторы внесли существенный вклад в разработку концепции, проведение исследования и подготовку статьи, прочли и одобрили финальную версию перед публикацией). Наибольший вклад распределён следующим образом: Д.Д. Золотенков ― сбор данных, проведение исследования, написание текста рукописи; М.И. Труфанов, В.И. Солодовников ― проведение исследования, написание текста рукописи.
Благодарности. Авторы выражают благодарность С.М. Нефедовой за помощь в разметке КТ-снимков.
ADDITIONAL INFORMATION
Funding source. The research is carried out within the framework of topic No. FFSM-2019-0001.
Competing interests. The authors declare that they have no competing interests.
Authors’ contribution. All authors made a substantial contribution to the conception of the work, acquisition, analysis, interpretation of data for the work, drafting and revising the work, final approval of the version to be published and agree to be accountable for all aspects of the work. D.D. Zolotenkov — data collection, research, writing the manuscript; M.I. Trufanov, V.I. Solodovnikov — conducting research, writing the text of the manuscript.
Acknowledgments. The authors express their gratitude to S.M. Nefedova for help in marking CT images.
作者简介
Dmitry D. Zolotenkov
I.M. Sechenov First Moscow State Medical University (Sechenov University)
编辑信件的主要联系方式.
Email: Zolotenkovaspir@mail.ru
ORCID iD: 0000-0002-1224-1077
SPIN 代码: 1352-8848
俄罗斯联邦, Moscow
Maksim I. Trufanov
Design Information Technologies Center Russian Academy of Sciences
Email: temp1202@mail.ru
ORCID iD: 0000-0001-7269-8741
SPIN 代码: 1519-0717
Cand. Sci. (Engin.)
俄罗斯联邦, OdintsovoVladimir I. Solodovnikov
Design Information Technologies Center Russian Academy of Sciences
Email: v_solodovnikov@hotmail.com
ORCID iD: 0000-0001-5533-214X
SPIN 代码: 5418-6554
Cand. Sci. (Engin.)
俄罗斯联邦, Odintsovo参考
- AGFAD (2018) Stellungnahme: Forensische altersdiagnostik bei unbegleiteten minderjährigen flüchtlingen. Arbeitsgemeinschaft für forensische altersdiagnostik. Available from: https://www.dgrm.de/institute/deutschland/institut-essen/news-essen/stel.... Accessed: 15.5.2020.
- Schmeling A, Grundmann C, Fuhrmann A, et al. Criteria for age estimation in living individuals. Int J Legal Med. 2008;122(6):457–460. doi: 10.1007/s00414-008-0254-2
- Schmeling A, Dettmeyer R, Rudolf E, et al. Forensic age estimation: Methods, certainty, and the law. Dtsch Arztebl Int. 2016;113(4):44–50. doi: 10.3238/arztebl.2016.0044
- Lopatin O, Barszcz M, Bolechala F, Wozniak KJ. All rights reserved. The fusion of ossification centers: A comparative review of radiographic and other imaging modalities of age assessment in living groups of children, adolescents, and young adults. Leg Med (Tokyo). 2023;(61):102185. doi: 10.1016/j.legalmed.2022.102185
- Sobh ZK, Mohamed AS. A computed tomographic analysis of spheno-occipital synchondrosis ossification for age estimation in a sample of Egyptians. Am J Forensic Med Pathol. 2021;42(3):235–242. doi: 10.1097/PAF.0000000000000645
- Fan F, Zhang K, Peng Z, et al. Forensic age estimation of living persons from the knee: Comparison of MRI with radiographs. Forensic Sci Int. 2016;(268):145–150. doi: 10.1016/j.forsciint.2016.10.002
- Wittschieber D, Schulz R, Vieth V, et al. Influence of the examiner’s qualification and sources of error during stage determination of the medial clavicular epiphysis by means of computed tomography. Int J Legal Med. 2014;128(1):183–191. doi: 10.1007/s00414-013-0932-6
- Pröve PL, Jopp-van Well E, Stanczus B, et al. Automated segmentation of the knee for age assessment in 3D MR images using convolutional neural networks. Int J Legal Med. 2019;133(4):1191–1205. doi: 10.1007/s00414-018-1953-y
- Mauer MA, Well EJ, Herrmann J, et al. Automated age estimation of young individuals based on 3D knee MRI using deep learning. Int J Legal Med. 2021;135(2):649–663. doi: 10.1007/s00414-020-02465-z
- Dallora AL, Anderberg P, Kvist O, et al. Bone age assessment with various machine learning techniques: A systematic literature review and meta-analysis. PLoS One. 2019;14(7):e0220242. doi: 10.1371/journal.pone.0220242
- Arji G, Safdari R, Rezaeizadeh H, et al. A systematic literature review and classification of knowledge discovery in traditional medicine. Comp Methods Programs Biomed. 2019;(168):39–57. doi: 10.1016/j.cmpb.2018.10.017
- Zolotenkova GV, Rogachev AI, Pigolkin YI, et al. Age сlassification in forensic medicine using machine learning techniques. Modern Technol Med. 2022;14(1):15–24. doi: 10.17691/stm2022.14.1.02
- Ferrante L, Skrami E, Gesuita R, Cameriere R. Bayesian calibration for forensic age estimation. Statistics Med. 2015;34(10):1779–1790. doi: 10.1002/sim.6448
- Mauer MA, Well EJ, Herrmann J, et al. Automated age estimation of young individuals based on 3D knee MRI using deep learning. Int J Legal Med. 2021;135(2):649–663. doi: 10.1007/s00414-020-02465-z
- Dallora AL, Berglund JS, Brogren M, et al. Age assessment of youth and young adults using magnetic resonance imaging of the knee: A deep learning approach. JMIR Med Inform. 2019;7(4):e16291. doi: 10.2196/16291