利用逻辑回归方程从牙齿测量特征确定一个人的性别

封面


如何引用文章

全文:

详细

论证。开发适应阿塞拜疆人口诊断的骨质鉴定技术是一个优先事项。一种从牙齿上快速确定性别的新方法似乎很受欢迎,因为它应该能提高法医学的效率。

该研究的目的是开发一种现代方法,通过牙齿测量特征来诊断人类性别。

材料与方法。阿塞拜疆人的颅骨收藏被用来研究他们牙齿的大小。三个参数在7个上颚和7个下颚的牙齿上进行测量(对称的牙齿被当作一个阵列)。14颗解剖学牙齿中的每一颗都由80颗男性和80颗女性牙齿代表。使用Mutitouyo数字卡尺(精度为10微米)进行牙齿测量。采用ROC分析法对牙齿测量的结果进行了统计分析。MATLAB统计软件包被用于数学建模。

结果。使用ROC分析检查了在测牙期间获得的数据。发现有六个牙齿测量特征与性别有关,其中上犬牙的颊舌径和第二下臼齿、下门齿、下犬牙和上内侧门齿的冠高与性别关系最大。利用数学模型,已经实现了6个逻辑回归方程,可以通过牙齿的大小来确定个体的性别。还用ROC分析评估了这些方程式的预测潜力。

结论。根据牙齿测量指标并使用ROC分析,得出了通过牙齿大小来确定一个人的性别的诊断方程式。这些方程还没有在独立的样本上得到验证,所以还不能明确地推荐它们用于实际应用。然而,由于作者使用了相当强大的数学仪器,他们依靠自己的模型的高度合法性。

全文:

ОБОСНОВАНИЕ

Реализация новых методов, расширяющих возможности эксперта при идентификации личности по особенностям зубов, продолжает оставаться необходимым направлением и не теряет актуальности [1, 2]. При этом разработка методик, адаптированных для диагностики населения локальных географических областей, имеет приоритетное значение [3]. В ситуации с таким раскладом новый способ быстрого определения пола по зубам представлялся нам востребованным и усиливающим эффективность работы судебных медиков. С учётом высказанных соображений и проведено настоящее исследование.

Цель исследования ― разработка современной методики для диагностики пола человека по одонтометрическим признакам.

МАТЕРИАЛ И МЕТОДЫ

Краниологическая коллекция азербайджанцев (раса, пол, возраст, рост и некоторые другие известные особенности), используемая в исследовании, собиралась с 1970 года в различных районах страны и в настоящее время хранится в архиве Лица Публичного Права «Объединение судебно-медицинской экспертизы и патологической анатомии» Минздрава Азербайджанской Республики. Указанная коллекция (включает 205 черепов; 135 мужских и 70 женских), которая достаточно адекватно отображает краниологическую характеристику современного населения Азербайджана, введена в научную дискуссию с 1995 года и неоднократно становилась материалом для различных исследований [3–5].

При помощи цифрового калипера Mutitouyo (точность 10 микрометров) на этих черепах изучали одонтометрические характеристики зубов (кроме третьих моляров). Измеряли высоту коронки (ВКОР; у моляров измерялась от эмалево-цементной границы до уровня жевательной поверхности), вестибуло-лингвальный размер коронки (БУК; наибольшая толщина) и мезиально-дистальный размер коронки (МЕД; наибольшая ширина). При одонтометрии применяли стандартные процедуры по общепринятым рекомендациям А.А. Зубова [6].

Исследовали только зубы, которые можно было извлечь из альвеол. Таким образом, исследуемый материал представлял простую случайную выборку. В итоге были укомплектованы две выборки (мужская и женская), которые отвечали задачам нашего исследования и включали по 80 зубов каждая (размеры выборок предварительно не рассчитывались).

В предыдущих публикациях мы сообщали, что в прежних исследованиях нами сопоставлялись параметры одинаковых правосторонних и левосторонних зубов друг с другом, при этом явных различий в размерах между ними не выявлено [4], поэтому в обеих выборках данные по симметричным зубам были объединены в один массив. Таким образом, в целом были получены сводные одонтометрические показатели 7 зубов верхней и 7 зубов нижней челюсти. Аббревиатура верхних зубов: ВР1 ― верхний медиальный резец; ВР2 ― верхний латеральный резец; ВК ― верхний клык; ВП1 ― верхний первый малый коренной зуб; ВП2 ― верхний второй малый коренной зуб; ВМ1 ― верхний первый большой коренной зуб; ВМ2 ― верхний второй большой коренной зуб. Соответственно, если в аббревиатуре первая буква «Н», то это аналогичный зуб на нижней челюсти. В итоге на каждой выборке черепов в общей сложности было исследовано по 1680 (3×7×80) одонтометрических признаков.

Для анализа результатов одонтометрии использовали методы вариационной статистики и ROC-анализ [7]. Математическое моделирование и вычисления осуществляли с помощью пакета статистических программ MATLAB (версия 8.6).

РЕЗУЛЬТАТЫ

Вариационно-статистические характеристики мужской и женской выборки

Общее количество параметров, как мы указывали, составило 3360. Отмечено, что данные по симметричным зубам представлены в объединённом массиве. Соотношение правосторонних и левосторонних зубов в нашей выборке было очень близко к единице, что отмечалось нами в предыдущих работах [4]. Фактический цифровой материал, собранный в одонтометрических бланках, после описанных выше процедур группировки был оцифрован в электронную базу данных. Для каждого пола сводные одонтометрические показатели мы получили в отдельности. Затем вычислили соответствующие статистические характеристики отдельно для мужской и женской выборок. Итоги соответствующего статистического анализа представлены в табл. 1 и 2. Полученная база данных по одонтометрии мужских и женских совокупностей ― это пока первое масштабное освещение одонтометрических особенностей населения современного Азербайджана.

 

Таблица 1. Статистические характеристики одонтометрических признаков в выборке мужских черепов / Table 1. Statistical characteristics of odontometric features in a sample of male skulls

Признак

n

Размах

Min

Max

Х

Х (r)

σ

Сv

As

As (r)

Ek

Ek (r)

БУК_ВР1

80

2,48

5,70

8,18

7,03

0,08

0,74

0,54

-0,10

0,27

-1,19

0,53

МЕД_ВР1

80

3,26

6,94

10,20

8,45

0,11

0,99

0,98

0,25

0,27

-1,21

0,53

ВКОР_ВР1

80

1,51

8,89

10,40

9,48

0,04

0,40

0,16

0,24

0,27

-1,10

0,53

БУК_НР1

80

2,25

4,80

7,05

6,15

0,06

0,56

0,31

-0,17

0,27

-1,06

0,53

МЕД_НР1

80

2,60

4,59

7,19

5,74

0,08

0,75

0,56

0,14

0,27

-1,24

0,53

ВКОР_НР1

80

2,60

6,64

9,24

7,98

0,08

0,74

0,55

-0,17

0,27

-1,16

0,53

БУК_ВР2

80

2,84

5,08

7,92

6,48

0,09

0,77

0,60

0,16

0,27

-1,16

0,53

МЕД_ВР2

80

3,14

5,22

8,36

6,85

0,10

0,89

0,79

0,01

0,27

-1,20

0,53

ВКОР_ВР2

80

2,44

7,79

10,23

9,03

0,08

0,69

0,47

0,10

0,27

-1,31

0,53

БУК_НР2

80

2,91

4,81

7,72

6,31

0,09

0,82

0,67

0,04

0,27

-1,15

0,53

МЕД_НР2

80

2,95

4,37

7,32

5,97

0,09

0,81

0,66

-0,05

0,27

-1,13

0,53

ВКОР_НР2

80

2,44

7,14

9,58

8,25

0,08

0,69

0,48

0,06

0,27

-1,27

0,53

БУК_ВК

80

2,67

4,38

7,05

5,48

0,08

0,69

0,47

0,30

0,27

-1,09

0,53

МЕД_ВК

80

2,22

6,59

8,81

7,81

0,07

0,59

0,35

0,01

0,27

-0,97

0,53

ВКОР_ВК

80

2,75

9,25

12,00

10,87

0,08

0,73

0,53

-0,09

0,27

-1,24

0,53

БУК_НК

80

2,54

6,09

8,63

7,29

0,08

0,73

0,53

0,06

0,27

-1,17

0,53

МЕД_НК

80

2,55

5,76

8,31

6,91

0,09

0,78

0,60

0,10

0,27

-1,45

0,53

ВКОР_НК

80

2,71

8,88

11,59

10,13

0,08

0,68

0,46

-0,06

0,27

-0,89

0,53

БУК_ВП1

80

2,85

7,13

9,98

8,96

0,08

0,75

0,57

-0,48

0,27

-0,69

0,53

МЕД_ВП1

80

3,44

6,09

9,53

7,04

0,08

0,70

0,49

0,92

0,27

1,04

0,53

ВКОР_ВП1

80

2,75

7,03

9,78

8,35

0,09

0,85

0,72

0,04

0,27

-1,31

0,53

БУК_НП1

80

2,84

7,08

9,92

8,42

0,09

0,80

0,63

0,06

0,27

-1,18

0,53

МЕД_НП1

80

2,16

6,61

8,77

7,34

0,05

0,46

0,21

0,34

0,27

-0,41

0,53

ВКОР_НП1

80

2,01

6,97

8,98

8,03

0,06

0,58

0,33

0,00

0,27

-1,21

0,53

БУК_ВП2

80

3,03

7,37

10,40

8,87

0,10

0,87

0,76

0,04

0,27

-1,04

0,53

МЕД_ВП2

80

2,41

5,65

8,06

6,95

0,07

0,66

0,43

-0,02

0,27

-1,19

0,53

ВКОР_ВП2

80

2,34

6,28

8,62

7,47

0,08

0,72

0,52

0,00

0,27

-1,33

0,53

БУК_НП2

80

2,76

6,92

9,68

8,35

0,09

0,84

0,71

-0,06

0,27

-1,34

0,53

МЕД_НП2

80

2,65

6,06

8,71

7,21

0,08

0,67

0,46

0,18

0,27

-1,02

0,53

ВКОР_НП2

80

2,68

6,29

8,97

7,65

0,09

0,79

0,63

0,08

0,27

-1,12

0,53

БУК_ВМ1

80

2,86

9,81

12,67

11,17

0,09

0,78

0,61

0,00

0,27

-0,79

0,53

МЕД_ВМ1

80

3,12

9,01

12,13

10,57

0,11

0,97

0,94

-0,03

0,27

-1,30

0,53

ВКОР_ВМ1

80

2,40

5,48

7,88

6,38

0,07

0,60

0,36

0,16

0,27

-1,10

0,53

БУК_НМ1

80

3,16

8,65

11,81

10,46

0,10

0,94

0,88

-0,15

0,27

-1,25

0,53

МЕД_НМ1

80

3,51

9,15

12,66

11,04

0,12

1,04

1,09

-0,10

0,27

-1,29

0,53

ВКОР_НМ1

80

1,95

6,03

7,98

6,78

0,05

0,45

0,21

0,36

0,27

-0,43

0,53

БУК_ВМ2

80

2,98

9,85

12,83

11,39

0,10

0,93

0,86

-0,02

0,27

-1,31

0,53

МЕД_ВМ2

80

3,21

7,91

11,12

9,69

0,10

0,91

0,83

-0,01

0,27

-1,27

0,53

ВКОР_ВМ2

80

2,63

5,09

7,72

6,02

0,06

0,57

0,32

0,30

0,27

-0,35

0,53

БУК_НМ2

80

2,93

8,52

11,45

10,18

0,09

0,85

0,71

-0,08

0,27

-1,13

0,53

МЕД_НМ2

80

3,02

9,39

12,41

10,85

0,10

0,90

0,81

-0,07

0,27

-1,21

0,53

ВКОР_НМ2

80

2,38

4,78

7,16

5,97

0,07

0,66

0,43

0,07

0,27

-1,04

0,53

 

Таблица 2. Статистические характеристики одонтометрических признаков в выборке женских черепов / Table 2. Statistical characteristics of odontometric features in a sample of female skulls

Признак

n

Размах

Min

Max

Х

Х (r)

σ

Сv

As

As (r)

Ek

Ek (r)

БУК_ВР1

80

2,56

5,40

7,96

6,85

0,08

0,73

0,53

-0,06

0,27

-1,28

0,53

МЕД_ВР1

80

2,72

6,61

9,33

8,05

0,09

0,80

0,63

-0,03

0,27

-1,07

0,53

ВКОР_ВР1

80

2,97

7,23

10,20

8,68

0,10

0,87

0,75

0,11

0,27

-1,22

0,53

БУК_НР1

80

2,67

4,22

6,89

5,48

0,09

0,76

0,58

0,13

0,27

-1,13

0,53

МЕД_НР1

80

2,60

4,12

6,72

5,35

0,08

0,72

0,51

0,05

0,27

-1,14

0,53

ВКОР_НР1

80

2,28

6,03

8,31

7,05

0,07

0,66

0,44

0,18

0,27

-1,06

0,53

БУК_ВР2

80

2,89

4,53

7,42

5,91

0,10

0,94

0,88

0,02

0,27

-1,55

0,53

МЕД_ВР2

80

3,06

5,02

8,08

6,52

0,10

0,92

0,84

0,09

0,27

-1,15

0,53

ВКОР_ВР2

80

2,63

7,31

9,94

8,51

0,07

0,66

0,44

0,08

0,27

-0,92

0,53

БУК_НР2

80

3,02

4,48

7,50

5,72

0,09

0,78

0,61

0,23

0,27

-0,62

0,53

МЕД_НР2

80

2,96

4,68

7,64

5,85

0,08

0,74

0,55

0,30

0,27

-0,75

0,53

ВКОР_НР2

80

2,52

6,26

8,78

7,45

0,08

0,71

0,50

-0,03

0,27

-1,12

0,53

БУК_ВК

80

3,19

6,14

9,33

7,84

0,10

0,92

0,85

-0,11

0,27

-1,19

0,53

МЕД_ВК

80

3,16

6,02

9,18

7,62

0,11

0,98

0,97

-0,03

0,27

-1,39

0,53

ВКОР_ВК

80

2,65

8,75

11,40

10,06

0,09

0,76

0,58

0,17

0,27

-1,09

0,53

БУК_НК

80

3,23

5,38

8,61

7,01

0,11

0,95

0,90

0,00

0,27

-1,07

0,53

МЕД_НК

80

2,83

5,21

8,04

6,65

0,09

0,80

0,65

0,00

0,27

-1,10

0,53

ВКОР_НК

80

2,59

8,21

10,80

9,42

0,08

0,69

0,48

-0,09

0,27

-1,20

0,53

БУК_ВП1

80

2,93

7,14

10,07

8,62

0,10

0,92

0,85

0,18

0,27

-1,36

0,53

МЕД_ВП1

80

2,59

6,39

8,98

7,68

0,09

0,77

0,60

0,00

0,27

-1,21

0,53

ВКОР_ВП1

80

2,52

6,61

9,13

7,87

0,08

0,74

0,55

0,06

0,27

-1,28

0,53

БУК_НП1

80

2,76

6,15

8,91

7,47

0,09

0,83

0,69

-0,09

0,27

-1,17

0,53

МЕД_НП1

80

2,80

5,69

8,49

6,92

0,08

0,70

0,49

0,04

0,27

-0,79

0,53

ВКОР_НП1

80

2,61

6,58

9,19

7,95

0,09

0,77

0,59

-0,12

0,27

-1,25

0,53

БУК_ВП2

80

2,94

7,02

9,96

8,46

0,10

0,86

0,74

0,00

0,27

-1,18

0,53

МЕД_ВП2

80

2,64

5,23

7,87

6,56

0,09

0,78

0,60

0,01

0,27

-1,02

0,53

ВКОР_ВП2

80

2,61

5,95

8,56

7,06

0,08

0,67

0,45

0,07

0,27

-1,10

0,53

БУК_НП2

80

3,13

6,33

9,46

7,85

0,10

0,90

0,80

0,00

0,27

-1,26

0,53

МЕД_НП2

80

2,57

6,01

8,58

7,12

0,08

0,69

0,48

0,19

0,27

-1,05

0,53

ВКОР_НП2

80

2,71

6,11

8,82

7,41

0,08

0,74

0,55

0,06

0,27

-0,83

0,53

БУК_ВМ1

80

3,67

8,88

12,55

10,73

0,11

1,01

1,03

0,03

0,27

-1,13

0,53

МЕД_ВМ1

80

2,96

8,57

11,53

10,08

0,10

0,89

0,80

-0,10

0,27

-1,26

0,53

ВКОР_ВМ1

80

2,40

4,61

7,01

5,87

0,07

0,67

0,45

0,00

0,27

-1,03

0,53

БУК_НМ1

80

2,96

8,54

11,50

9,81

0,09

0,82

0,68

0,20

0,27

-1,12

0,53

МЕД_НМ1

80

3,18

9,03

12,21

10,68

0,10

0,91

0,83

0,04

0,27

-1,05

0,53

ВКОР_НМ1

80

2,26

5,19

7,45

6,29

0,07

0,63

0,40

-0,03

0,27

-1,30

0,53

БУК_ВМ2

80

3,05

8,85

11,90

10,47

0,09

0,82

0,67

-0,11

0,27

-1,14

0,53

МЕД_ВМ2

80

3,22

7,83

11,05

9,47

0,10

0,94

0,88

-0,03

0,27

-1,21

0,53

ВКОР_ВМ2

80

2,79

4,45

7,24

5,71

0,08

0,75

0,57

0,11

0,27

-1,22

0,53

БУК_НМ2

80

2,96

8,27

11,23

9,77

0,09

0,83

0,69

-0,11

0,27

-1,11

0,53

МЕД_НМ2

80

3,38

8,34

11,72

10,03

0,11

1,01

1,02

-0,13

0,27

-1,24

0,53

ВКОР_НМ2

80

2,63

4,28

6,91

5,16

0,06

0,57

0,32

0,52

0,27

0,01

0,53

 

Вариационно-статистические показатели исследованных выборок не обнаружили каких-либо существенных особенностей. Однако отмечались и некоторые особенности в распределении признаков, касательно, например, показателей асимметрии и эксцесса. Коэффициент эксцесса для большинства одонтометрических признаков оказался отрицательным и почти всегда превосходил значение стандартной ошибки более чем в 2 раза. Статистические параметры для первичной выборки показывали её сильную вариабельность (коэффициент вариации (Сv) только для одного параметра был равен 17%, а в остальных случаях >20%). Другими словами, результаты биометрических тестов показывали, что для реализации диагностических моделей необходим переход на непараметрическую статистику. Кроме того, были и другие ограничения. Так, не удалось построить уравнения для прогноза пола с помощью канонического дискриминантного анализа: рассмотрение соответствующих корреляционных матриц и анализ предикторного потенциала наиболее подходящих одонтометрических признаков не выявил обнадёживающих перспектив (эти результаты здесь не приводятся). Исходя из этих посылов, рациональным выходом представлялось использование другого статистического метода классификации ― логистической регрессии.

Данные ROC-анализа

Принимая во внимание описанные выше нюансы, в представляемой работе мы применили математические приёмы ROC-анализа. Полученные нами цифровые данные, относящиеся к одонтометрическим признакам, были проанализированы с помощью пакета прикладных программ MATLAB. Разбор результатов этого анализа позволил нам выделить 6 одонтометрических признаков, которые наиболее специфически были взаимосвязаны с полом. Этими признаками оказались БУК_ВК, ВКОР_НМ2, ВКОР_НР2, ВКОР_НК, ВКОР_НР1, ВКОР_ВР1. Одонтометрические параметры представлены в порядке убывания их связи с полом, т.е. в разряд наиболее «сцепленных» с полом размеров попали букко-лингвальный диаметр верхнего клыка и высота коронки второго нижнего моляра, а наиболее слабая связь с полом была у высоты коронки верхнего медиального резца.

При использовании ROC-анализа каждый одонтометрический параметр может играть роль предсказывающей модели. ROC-анализ в данном случае отсекает наиболее чувствительные в этом контексте одонтометрические параметры. Безусловно, множество других размеров зубов тоже обнаруживают какую-то связь с полом. Но использованный нами классификатор (в отличие от корреляции) учитывает также и специфичность характерности признака для прогнозируемого явления, т.е. ROC-анализ позволяет также отсекать «доподлинность» признаков (одонтометрических размеров) в контексте взаимосвязи с полом. Получаемые в ходе анализа ROC-кривые учитывают общую тенденцию в поведении признаков (как коэффициенты корреляции) и численность объектов в матрице (какое количество зубов с определённой величиной конкретного одонтометрического показателя в выборке точно совпадают, например, с мужским полом), доподлинно отвечающих критериям конкретно осуществляемой сегрегации. Эти наши интерпретации наглядно демонстрирует график соответствующих ROC-кривых на рис. 1.

 

Рис. 1. Графическое представление классификатора прогностической эффективности некоторых размеров зубов на основе ROC-анализа. Sensitivity ― чувствительность; Specificity ― специфичность. Разными цветами обозначены результаты теста для различных одонтометрических признаков. / Fig. 1. Graphic representation of the effects of prognostic classifier of some teeth sizes on the basis of ROC-analysis. The test results for various odontometric signs are indicated in different colors.

 

Прямая диагональ, которая делит наш график на две половины, называется линией неразличимости двух классов, позволяющей производить разделение (дискриминацию) точек (наши кривые — это совокупность точек) на различные классы. Эта линия неразличимости двух классов соответствует так называемому бесполезному классификатору. Чем ближе точки наших кривых к этой линии, тем ниже предикторный потенциал рассматриваемого признака. Таким образом, мы видим, что перечисленные выше шесть одонтометрических признаков демонстрируют достаточно надёжные прогностические возможности для предсказания пола. Точки на линии неразличимости двух классов полностью индифферентны к половой принадлежности зуба и тем самым являются как бы барьером разграничения в общем скалярном поле пола. Что же касается точек, из которых складываются ROC-кривые, то они, как показано выше, получаются при одновременном учёте чувствительности и специфичности «поведения» одонтометрического признака.

Из вышесказанного можно сделать вывод, что оптимальным будет считаться тот признак, который будет обладать такими характеристиками, как 100% специфичность и 100% чувствительность. Однако на практическом биометрическом материале добиться одновременного повышения чувствительности и специфичности для какого-то предиктора невозможно. Проблема в данном случае решается с помощью определения компромиссной точки, или так называемого порога отсечения ― точки, в которой значения специфичности и чувствительности максимально эффективны при взаимном учёте. Грубо говоря, порог отсечения ― это наибольший показатель суммы значений величины координат по обеим осям графика-классификатора. Координаты чувствительности и специфичности каждой точки какой-либо из наших ROC-кривых для указанных выше 6 одонтометрических признаков приведены в табл. 3.

 

Таблица 3. Показатели чувствительности и специфичности одонтометрических признаков, связанных с полом / Table 3. Sensitivity and specificity indices of gender-related odontometric features

Одонтометрический признак

Чувствительность

Специфичность

Порог отсечения

Величина признака, мм

ОДЦ, %

БУК_ВК

0,988

0,975

1,86

6,32

93,1

ВКОР_НМ2

0,838

0,650

1,49

5,32

73,8

ВКОР_НР2

0,713

0,650

1,363

7,71

68,1

ВКОР_НК

0,638

0,737

1,375

9,86

68,8

ВКОР_НР1

0,700

0,775

1,475

7,60

73,8

ВКОР_ВР1

1,000

0,575

1,575

8,87

78,8

Примечание. ОДЦ ― общая диагностическая ценность.

Note. ОДЦ ― general diagnostic value.

 

Программа, реализуя ROC-анализ с помощью пакета MATLAB, попутно рассчитывает общую диагностическую ценность (ОДЦ) анализируемой модели. Указанная характеристика отражает уровень качества модели и выражается в процентах: чем он выше, тем большей прогностической силой обладает модель. По данным табл. 3 видно, что наилучшим предиктором пола является вестибуло-лингвальный размер верхнего клыка.

Оценка эффективности и надёжности разрабатываемых для диагностики уравнений

Следующим шагом в данной работе было построение динамических моделей прогноза с помощью наиболее специфически взаимосвязанных с полом одонтометрических параметров. Суть задачи, в принципе, сводилась к проверке адекватности разрабатываемых моделей в качестве методов диагноза (прогноза пола).

Способов оценки надёжности различных динамических моделей прогноза и распознавания достаточно много. Но в последнее время хорошо себя зарекомендовали различные приёмы из теории нечёткой логики и методов классификации в машинном обучении1, 2. Используемый ROC-анализ — один из результативных приёмов таких методологий, и с помощью этого способа мы осуществляли оценку эффективности и надёжности разрабатываемых для диагностики уравнений. Модели логистической регрессии в отличие от обычных линейных регрессионных уравнений не предназначены для предсказания (вычисления) значения какого-либо параметра исходя из нескольких прочих показателей, с ним связанных. Другими словами, регрессоры, которые в этом случае являются входными переменными, не детерминируют выходную переменную такого же класса, как исходные. В данном случае по предлагаемым формулам устанавливается (точнее вычисляется) вероятность того, к какому полу (группе, совокупности и т.д.) принадлежит зуб (или зубы), исходя из значений его параметров, которые являются элементами разработанной функции. Суть логистической регрессии заключается в том, что пространство исходных значений (набор показателей одонтометрических признаков) может быть разграничено на две области, каждая из которых соответствует одной из гендерных диспозиций, а плоскость (либо линия), разграничивающая матрицу одонтометрических параметров, называется линейным дискриминантом. В описываемых моделях разграничивающая плоскость задана значениями коэффициентов такого линейного уравнения, решение которого получается в виде какой-либо одной цифры. Эта цифра сравнивается с центром дискриминантной линии, которая тоже является какой-то цифрой, т.е. заранее определённой константной величиной. Кстати, уместно отметить, что эта константа устанавливается как раз с помощью процедур ROC-анализа. В зависимости от того, является ли эта цифра больше или меньше той, которая рассчитана с помощью уравнения логистической регрессии, модель распознаёт классовую принадлежность объекта (в данном случае пол). Очевидно, что возможны исходы решения в виде результата, равного самой константной величине. В таком случае считается, что модель не может классифицировать объект исходя из введённых в него параметров этого объекта. Всего было разработано 6 уравнений логистической регрессии, которые приведены в порядке усиления их ОДЦ, где D — устанавливаемый параметр, называемый диагностическим коэффициентом.

D=-0,422+БУК_ВК×0,289; (1)

D=0,732+БУК_ВК×0,252+ВКОР_НМ2×(-0,164); (2)

D=1,719+ВКОР_НР2×(-0,123)+БУК_ВК×

×0,231+ВКОР_НМ2×(-0,143); (3)

D=2,94+ВКОР_НР2×(-0,115)+БУК_ВК×

×0,211+ВКОР_НК×(-0,118)+ВКОР_НМ2×(-0,142); (4)

D=3,837+БУК_ВК×0,183+ВКОР_НМ2×

×(-0,143)+ВКОР_НР2×(-0,105)+ВКОР_НК×

×(-0,119)+ВКОР_НР1×(-0,103); (5)

D=4,751+ВКОР_НР2×(-0,102)+БУК_ВК×

×0,162+ВКОР_НК×(-0,116)+ВКОР_НМ2×

×(-0,143)+ВКОР_НР1×(-0,096)+ВКОР_ВР1×(-0,097). (6)

ROC-кривые для разработанных уравнений

Для оценки уровня доверительной надёжности разработанных уравнений в описываемом анализе определяют их специфичность и чувствительность. Чувствительность диагностической модели в данном случае определялась относительным весом положительных результатов при диагнозе «женский пол», т.е. правильный диагноз «женский пол» составлял долю истинно положительных результатов теста. Специфичность модели устанавливали по доле истинно отрицательных результатов конкретного уравнения. В нашем случае это выглядело как диагностика мужского пола, когда пол действительно был мужским (т.е. исследовались зубы с мужского черепа).

Не углубляясь в ещё более подробное объяснение всех процедур ROC-анализа, представим непосредственно сами ROC-кривые. В нашем случае характеристические ROC-кривые для анализа уравнений были построены на основе упомянутых значений чувствительности и специфичности. Каждая кривая при этом показывала зависимость количества верно диагностированных положительных случаев от количества неверно диагностированных отрицательных случаев при работе наших моделей распознавания пола. Иными словами, осуществляется графическое отображение предложенного теста бинарной классификации на основе матрицы одонтометрических показателей с различной гендерной диспозицией. Отметим также, что идеальная ROC-кривая имеет Г-образную форму, и эффективность динамической модели тем выше, чем больше сходство её характеристической кривой с графиком подобной конфигурации. Таким образом, с помощью компьютерной программы мы получили ROC-кривые для разработанных уравнений. Сравнительное графическое представление ROC-кривых для выдвинутых нами уравнений представлены на рис. 2.

 

Рис. 2. Характеристические ROC-кривые некоторых разработанных диагностических уравнений для оценки их эффективности. Sensitivity ― чувствительность; Specificity ― специфичность. Разными цветами обозначены результаты теста для различных уравнений логистической регрессии. / Fig. 2. Characteristic ROC-curves of some developed diagnostic equations for assessments and efficiencies. The test results for various logistic regression equations are indicated in different colors.

 

На представленном графике наглядно видно, что надёжность диагностических моделей растёт от первой к шестой. Этот момент достаточно прост в понимании, ибо нумерация наших моделей ранжировалась с учётом количества регрессоров в них. Так, в первой модели в качестве регрессора используется один одонтометрический признак, а в шестой ― уже шесть. Это очевидно, что чем больше предикторов в уравнении, тем больше его предсказательная (прогностическая) способность. Именно поэтому шестое уравнение, в котором шесть регрессоров, оказалось самым надёжным для определения пола.

Первая цифра в каждом уравнении ― это константа. Вместо аббревиатуры одонтометрических признаков подставляют их численные показатели для конкретного зуба в миллиметрах. Затем эти значения перемножают на их коэффициент, что указан рядом с признаком, с соблюдением знаков. В конце все полученные показатели и константу суммируют, что даёт нам в итоге значение D. Указанный показатель D сравнивают, как мы говорили, с заранее определённой постоянной величиной ― центральной точкой дискриминантной плоскости разделения. Численные значения этих центроидов, а также некоторые статистические параметры, их детерминирующие, представлены в табл. 4.

 

Таблица 4. Центральные значения дискриминантных линий для распознавания пола на основе разработанных уравнений логистической регрессии / Table 4. Central values of discriminant lines for gender recognition based on the developed logistic regression equations

Параметр

Модель 1

Модель 2

Модель 3

Модель 4

Модель 5

Модель 6

Центроида

1,420

1,447

1,474

1,491

1,424

1,458

Sn

95

95

97,5

97,5

100

100

Sp

91,3

96,3

95

98,8

98,8

98,8

ОДЦ, %

93,1

95,6

96,3

98,1

99,4

99,4

Примечание. Sn ― численное значение чувствительности при ROC-анализе; Sp ― численное значение специфичности при ROC-анализе; ОДД ― общая диагностическая ценность модели.

Note. Sn ― the numerical value of sensitivity in ROC analysis; Sp ― the numerical value of specificity in ROC analysis; ОДД ― the overall diagnostic value of the model.

 

Сами значения центроидов, которые представлены в этой таблице, рассчитывались как раз с помощью ROC-анализа. Здесь применялись те же процедуры, когда мы выделяли наиболее информативные одонтометрические показатели для использования в динамических моделях предсказания пола. Отличие состояло в том, что в этом опыте линейный дискриминант неразличимости двух классов служил для выяснения предикторного потенциала не одного признака, а всего уравнения.

Как мы отметили выше, в данном случае компьютерная программа на матрице реальных данных вычисляет варианты ложных и истинных результатов (как отрицательных, так и положительных), которые возможны при прикладной реализации построенных уравнений. Матрицей служит вся совокупность наших одонтометрических признаков ― параметры всех 160 зубов (женские+мужские). Указанная цепь вычислений позволяет применяемому классификатору генерировать ROC-кривую для каждого из разработанных нами уравнений.

ОБСУЖДЕНИЕ

В данном исследовании, используя результаты одонтометрии и метод RОС-анализа, удалось разработать диагностические уравнения для определения пола человека по размерам его зубов. В ходе работы исследовалась достаточно репрезентативная по отношению к целевой популяции выборка. Как было отмечено, краниологическая коллекция азербайджанцев, которая изучалась в данной работе, неоднократно исследовалась и прежде. Методики, разработанные различными авторами на основе этих исследований, нашли удачное прикладное применение в повседневной работе криминалистов судебно-медицинской службы республики [3–5].

Уравнения, полученные в исследовании, тем надёжнее, чем больше предикторов в них ассоциировано, что не трудно заметить на рис. 2. Отсюда можно было предположить, что последующее увеличение количества предикторов должно улучшать качество прогноза и следует продолжать составление уравнений. Однако наша работа со следующими возможными уравнениями показала, что в дальнейшем уровень диагностики не улучшается. Мало того, надёжность и достоверность диагностики в некоторых случаях даже ухудшаются. Дело в том, что с увеличением количества регрессоров в уравнениях чувствительность их повышается практически запредельно, при этом специфичность диагностической модели (казалось бы, тоже достаточно высокая), начиная с модели № 5, остаётся стабильной. При этом и так крайне высокая чувствительность стремится к единице (чувствительность 100%). В практическом отношении это означает, что модели с указанной характеристикой (модели № 5, № 6 и выше) уже не способны нарастить специфичность, и при диагностике с их помощью при любом раскладе возможны истинно ложные выводы, которые хоть и минимальны, но неминуемы.

В принципе, на сегодняшний день не существует моделей со 100% безошибочным результатом, и такая ситуация в прикладном отношении вроде бы малозначима. Но здесь ещё есть момент с так называемой гипердиагностикой, которая, согласно теоретическим посылам из статистической науки, имеет место быть при описываемой ситуации. Суть этого явления такова, что при определённой конфигурации конструируемая динамическая модель для прогноза работает лучше только в одном направлении, т.е. тест правильно срабатывает там, где диагностика сомнительна, и при иных, чуть изменённых параметрах уравнения она не подтверждалась бы, либо был бы мотивированный отказ от принятия решения. В экспертной практике ложноположительный вывод о половой принадлежности имеет не меньше катастрофических последствий, чем в клинической практике. В данном случае наша позиция в целом совпадает с современными теоретическими представлениями о том, что к моделям прогноза, не имеющим вроде бы недостатков, следует относиться критически [8]. Это ясно даже без математических выкладок. Ведь понятно, что 100% достоверный прогноз по количественным показателям ― это уже как бы качественный признак какого-то объекта или явления (физическая характеристика наподобие цвета, плотности и т.д.).

Ввиду указанных оговорок определённые нюансы разработки выбранного нами класса диагностических моделей требуют повышенного внимания. Вместе с тем отметим, что представляемые уравнения ещё не прошли верификации на независимых выборках, поэтому пока не могут быть безоговорочно рекомендованы к прикладной реализации. Особенностью наших уравнений является использование для диагностики меньшего количества зубов (как правило, параметры одного зуба и одного-двух из рядом расположенных). Правда, в отдельных литературных источниках [9, 10] имеются данные о возможности установления половой принадлежности индивида даже по одному одонтометрическому признаку. Однако мы также рассчитываем на высокую легитимность собственных моделей ввиду того, что использовали достаточно мощный математический аппарат ROC-анализа. Отметим также, что пока нам удалось сравнить наши результаты со схожими данными иранских исследователей [11], которые представили сведения о прогностической ценности размеров верхних клыков и нижних моляров. Правда, эти результаты получены на археологическом материале достаточно далёкой по хронологии эпохи, а также отличаются методологией одонтометрии. Аналогичные сведения имеются в работе российского автора [12]. Разумеется, в данном случае обе работы наиболее интересны, так как показывают данные по сопредельным этническим группам (касательно материала с территории Ирана, можно даже предположить, что речь идёт об одонтологических данных какой-либо субэтнической группы азербайджанцев).

ЗАКЛЮЧЕНИЕ

Изучение одонтометрических показателей азербайджанцев на краниологической коллекции (музейные экспонаты) позволил разработать 6 уравнений логистической регрессии, которые предназначены для определения пола человека по размерам его зубов. Эти уравнения удалось разработать, используя эффективный в данном контексте математический аппарат ROC-анализа.

В ходе работы удалось выделить шесть одонтометрических предикторов, которые наиболее специфически были взаимосвязаны с полом. Тем самым можно говорить о том, что одонтометрические возможности для распознавания полового диморфизма зубов ещё не исчерпаны полностью. Однако в целом по каждому обнаруженному признаку необходимы более развёрнутые обсуждения, и в указанном аспекте, конечно, хотелось бы узнать мнение уважаемых коллег относительно этого вопроса.

ДОПОЛНИТЕЛЬНО

Источник финансирования. Авторы заявляют об отсутствии внешнего финансирования при проведении исследования.

Конфликт интересов. Авторы декларируют отсутствие явных и потенциальных конфликтов интересов, связанных с публикацией настоящей статьи.

Вклад авторов. Авторы подтверждают соответствие своего авторства международным критериям ICMJE (все авторы внесли существенный вклад в разработку концепции, проведение исследования и подготовку статьи, прочли и одобрили финальную версию перед публикацией). Наибольший вклад распределён следующим образом: А.Ш. Ибрагимов — сбор данных и написание текста рукописи; Ш.М. Мусаев — научное редактирование рукописи, рассмотрение и одобрение окончательного варианта рукописи.

ADDITIONAL INFORMATION

Funding source. This study was not supported by any external sources of funding.

Competing interests. The authors declare that they have no competing interests.

Authors’ contribution. All authors made a substantial contribution to the conception of the work, acquisition, analysis, interpretation of data for the work, drafting and revising the work, final approval of the version to be published and agree to be accountable for all aspects of the work. A.Sh. Ibragimov — data collection and writing a draft of the manuscript; Sh.M. Musayev — scientific revision of the manuscript, review and approval of the final version of the manuscript.

 

1 Loginom [интернет-ресурс]. Логистическая регрессия и ROC-анализ — математический аппарат [цит. 20 января 2020]. Режим доступа: https://loginom.ru/blog/logistic-regression-roc-auc. Дата обращения: 15. 07.2022.

2 Документация Statistics and Machine Learning Toolbox. Режим доступа: https://docs.exponenta.ru/stats/index.html. Дата обращения: 26.11.2022.

×

作者简介

Anar Sh. Ibragimov

Forensic examination and pathological anatomy

编辑信件的主要联系方式.
Email: medkrim@list.ru
ORCID iD: 0000-0001-6426-3246
SPIN 代码: 1124-3160

MD, Cand. Sci (Med.)

阿塞拜疆, apt. 103, 2, 823rd passage, Baku

Shakir M. Musayev

Azerbaijan State Institute for Doctors Advanced Training by A. Aliyev

Email: shakir.musayev@gmail.com
ORCID iD: 0000-0001-8598-1597

MD, Dr. Sci (Med.), Professor

阿塞拜疆, Baku

参考

  1. Popov VL, Musaev SM. Forensic medicine. Saint Petersburg: YurTsentrPress; 2009. 516 p. (In Russ).
  2. Ishcan MY, Kedici PS. Sexual variation in buccolingual dimensions in Turkish dentition. Forensic Sci Int.2003;137(2-3):160–164. doi: 10.1016/s0379-0738(03)00349-9
  3. Musayev SM. Medico-criminalistic identification populations of Caucasus on skull. Baku: Elm; 1999. 127 р.
  4. Musaev SM, Orujev NR. Diagnostics of a subject’s gender identity using mathematical modeling of its odontometric characteristics. Scientific Communications Police Academy. 2017;2(4):26–33. (In Russ).
  5. Ibragimov AS. Determination of the length of the human body by the size of the skull. Saarbrücken: LapLambertAcademic Publishing; 2017. 184 p.(In Russ).
  6. Zubov AA. Odontology. Methodology of anthropological research. Moscow: Nauka; 1968. 199 p. (In Russ).
  7. Glants S. Medical and biological statistics. Translated from English. Moscow: Praktika; 1998. 459 р. (In Russ).
  8. Kovalev AV, Shmarov LA, Tenkov AA. The reliable and plausible conclusions in the decisions of the forensic medical experts.Forensic Medical Examination. 2016;59(1):60–64. (In Russ). doi: 10.17116/sudmed201659160-6
  9. Ramandeep SN, Adesh SM, Ranjan M, Harsimranjit SB. Sex determination by mandibular canine index and molar odontometrics: A comparative study.Indian Journal of Oral Sciences. 2014;5(Suppl 2):16–20.
  10. Manashev GG, Sharaykin PN, Levenets A, Moiseev EV. Variability of the dental system depending on the sex of an individual. Sci Vedomosti. 2000;(2):176.(In Russ).
  11. Kazzazi SM, Kranioti EF. Sex estimation using cervical dental measurements in an archaeological population from Iran.Archaeological Anthropological Sci. 2016;(23):219–240. doi: 10.1007/s12520-016-0363-7
  12. Malsagov OM. Sexual determinism and odontometric analysis of teeth [dissertation abstract]. Moscow, 2005.34 р. (In Russ).

补充文件

附件文件
动作
1. JATS XML
2. Fig. 1. Graphic representation of the effects of prognostic classifier of some teeth sizes on the basis of ROC-analysis. The test results for various odontometric signs are indicated in different colors.

下载 (159KB)
3. Fig. 2. Characteristic ROC-curves of some developed diagnostic equations for assessments and efficiencies. The test results for various logistic regression equations are indicated in different colors.

下载 (127KB)

版权所有 © Eco-Vector, 2022

Creative Commons License
此作品已接受知识共享署名-非商业性使用-禁止演绎 4.0国际许可协议的许可。

СМИ зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Регистрационный номер и дата принятия решения о регистрации СМИ: серия ПИ № ФС 77 - 60835 выдано 09.09.2021 г. 
СМИ зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Регистрационный номер и дата принятия решения о регистрации СМИ: серия ЭЛ № ФС 77 – 59181 выдано 03.09.2014
г.



##common.cookie##