Validation of a data mining model against traditional dental age estimation methods among Korean adolescents and young adults

Salamat sa pagbisita sa Nature.com. Ang bersyon ng browser na iyong ginagamit ay may limitadong suporta sa CSS. Para sa pinakamahusay na mga resulta, inirerekumenda namin ang paggamit ng isang mas bagong bersyon ng iyong browser (o pag -off ang mode ng pagiging tugma sa Internet Explorer). Samantala, upang matiyak ang patuloy na suporta, ipinapakita namin ang site nang walang estilo o JavaScript.
Ang mga ngipin ay itinuturing na pinaka tumpak na tagapagpahiwatig ng edad ng katawan ng tao at madalas na ginagamit sa pagtatasa ng forensic age. Nilalayon naming mapatunayan ang mga pagtatantya ng dental na batay sa pagmimina ng data sa pamamagitan ng paghahambing ng katumpakan ng pagtatantya at pag-uuri ng pagganap ng 18-taong threshold na may tradisyonal na pamamaraan at mga pagtatantya ng edad na batay sa pagmimina. Isang kabuuan ng 2657 panoramic radiograph ang nakolekta mula sa mga mamamayan ng Korea at Hapon na may edad na 15 hanggang 23 taon. Nahahati sila sa isang set ng pagsasanay, ang bawat isa ay naglalaman ng 900 mga radiograph ng Korea, at isang panloob na set ng pagsubok na naglalaman ng 857 mga radiograp na Hapon. Inihambing namin ang kawastuhan ng pag -uuri at kahusayan ng mga tradisyunal na pamamaraan na may mga hanay ng pagsubok ng mga modelo ng pagmimina ng data. Ang kawastuhan ng tradisyonal na pamamaraan sa panloob na set ng pagsubok ay bahagyang mas mataas kaysa sa modelo ng data ng pagmimina, at ang pagkakaiba ay maliit (nangangahulugang ganap na error <0.21 taon, ang ugat na nangangahulugang error sa square <0.24 taon). Ang pagganap ng pag-uuri para sa 18-taong cutoff ay katulad din sa pagitan ng mga tradisyunal na pamamaraan at mga modelo ng pagmimina ng data. Kaya, ang mga tradisyunal na pamamaraan ay maaaring mapalitan ng mga modelo ng pagmimina ng data kapag nagsasagawa ng pagtatasa ng edad ng forensic gamit ang kapanahunan ng pangalawa at pangatlong molars sa mga kabataan ng Korea at mga kabataan.
Ang pagtatantya ng edad ng ngipin ay malawakang ginagamit sa forensic na gamot at pediatric dentistry. Sa partikular, dahil sa mataas na ugnayan sa pagitan ng kronolohikal na edad at pag -unlad ng ngipin, ang pagtatasa ng edad sa pamamagitan ng mga yugto ng pag -unlad ng ngipin ay isang mahalagang kriterya para sa pagtatasa ng edad ng mga bata at kabataan1,2,3. Gayunpaman, para sa mga kabataan, ang pagtantya ng edad ng ngipin batay sa kapanahunan ng ngipin ay may mga limitasyon dahil ang paglago ng ngipin ay halos kumpleto, maliban sa ikatlong molars. Ang ligal na layunin ng pagtukoy ng edad ng mga kabataan at kabataan ay upang magbigay ng tumpak na mga pagtatantya at ebidensya na pang -agham kung naabot na nila ang edad ng karamihan. Sa medico-legal na kasanayan ng mga kabataan at mga kabataan sa Korea, ang edad ay tinantya gamit ang pamamaraan ni Lee, at isang ligal na threshold ng 18 taon ay hinulaang batay sa data na iniulat ng Oh et al 5.
Ang pag -aaral ng makina ay isang uri ng artipisyal na katalinuhan (AI) na paulit -ulit na natututo at nag -uuri ng malaking halaga ng data, malulutas ang mga problema sa sarili, at nagtutulak ng data programming. Ang pag -aaral ng makina ay maaaring matuklasan ang mga kapaki -pakinabang na nakatagong mga pattern sa malaking dami ng data6. Sa kaibahan, ang mga klasikal na pamamaraan, na kung saan ay masinsinang paggawa at pag-ubos ng oras, ay maaaring magkaroon ng mga limitasyon kapag nakikitungo sa malaking dami ng kumplikadong data na mahirap iproseso nang manu-mano7. Samakatuwid, maraming mga pag -aaral ang isinagawa kamakailan gamit ang pinakabagong mga teknolohiya ng computer upang mabawasan ang mga pagkakamali ng tao at mahusay na iproseso ang multidimensional data8,9,10,11,12. Sa partikular, ang malalim na pag -aaral ay malawakang ginagamit sa pagsusuri ng imaheng medikal, at ang iba't ibang mga pamamaraan para sa pagtatantya ng edad sa pamamagitan ng awtomatikong pagsusuri ng mga radiograpiya ay naiulat na mapabuti ang kawastuhan at kahusayan ng pagtantya ng edad13,14,15,16,17,18,19,20 . Halimbawa, binuo ng Hengi et al 13 ang isang algorithm ng pag -aaral ng makina batay sa convolutional neural network (CNN) upang matantya ang edad ng kalansay gamit ang mga radiograph ng mga kamay ng mga bata. Ang pag -aaral na ito ay nagmumungkahi ng isang modelo na nalalapat ang pag -aaral ng makina sa mga larawang medikal at ipinapakita na ang mga pamamaraan na ito ay maaaring mapabuti ang kawastuhan ng diagnostic. Tinantya ng Li et al14 ang edad mula sa mga imahe ng pelvic x-ray gamit ang isang malalim na pag-aaral ng CNN at inihambing ang mga ito sa mga resulta ng regression gamit ang pagtatantya ng yugto ng ossification. Natagpuan nila na ang malalim na pag -aaral ng modelo ng CNN ay nagpakita ng parehong pagganap ng pagtatantya ng edad bilang tradisyunal na modelo ng regression. Sinuri ng pag -aaral ni Guo et al.
Karamihan sa mga pag -aaral sa pagtantya ng edad gamit ang pag -aaral ng machine ay gumagamit ng malalim na pamamaraan ng pag -aaral13,14,15,16,17,18,19,20. Ang pagtatantya ng edad batay sa malalim na pag -aaral ay iniulat na mas tumpak kaysa sa mga tradisyonal na pamamaraan. Gayunpaman, ang pamamaraang ito ay nagbibigay ng kaunting pagkakataon upang maipakita ang pang -agham na batayan para sa mga pagtatantya ng edad, tulad ng mga tagapagpahiwatig ng edad na ginamit sa mga pagtatantya. Mayroon ding ligal na pagtatalo tungkol sa kung sino ang nagsasagawa ng mga inspeksyon. Samakatuwid, ang pagtatantya ng edad batay sa malalim na pag -aaral ay mahirap tanggapin ng mga awtoridad sa administratibo at hudisyal. Ang Data Mining (DM) ay isang pamamaraan na maaaring matuklasan hindi lamang inaasahan ngunit din sa hindi inaasahang impormasyon bilang isang pamamaraan para sa pagtuklas ng mga kapaki -pakinabang na ugnayan sa pagitan ng malaking halaga ng data6,21,22. Ang pag -aaral ng makina ay madalas na ginagamit sa pagmimina ng data, at ang parehong data ng pagmimina at pag -aaral ng makina ay gumagamit ng parehong mga pangunahing algorithm upang matuklasan ang mga pattern sa data. Ang pagtatantya ng edad gamit ang pag -unlad ng ngipin ay batay sa pagtatasa ng tagasuri ng kapanahunan ng mga target na ngipin, at ang pagtatasa na ito ay ipinahayag bilang isang yugto para sa bawat target na ngipin. Maaaring magamit ang DM upang pag -aralan ang ugnayan sa pagitan ng yugto ng pagtatasa ng ngipin at aktwal na edad at may potensyal na palitan ang tradisyonal na pagsusuri sa istatistika. Samakatuwid, kung ilalapat namin ang mga pamamaraan ng DM sa pagtatantya ng edad, maaari naming ipatupad ang pag -aaral ng makina sa pagtatantya ng forensic age nang hindi nababahala tungkol sa ligal na pananagutan. Maraming mga paghahambing na pag-aaral ang nai-publish sa mga posibleng alternatibo sa tradisyonal na manu-manong pamamaraan na ginamit sa forensic practice at mga pamamaraan na batay sa EBM para sa pagtukoy ng edad ng ngipin. Ipinakita ng Shen et al23 na ang modelo ng DM ay mas tumpak kaysa sa tradisyonal na formula ng camerer. Nag -apply ang Galibourg et al24 ng iba't ibang mga pamamaraan ng DM upang mahulaan ang edad ayon sa demirdjian criterion25 at ang mga resulta ay nagpakita na ang pamamaraan ng DM ay nagpalabas ng mga pamamaraan ng Demirdjian at Willems sa pagtantya ng edad ng populasyon ng Pransya.
Upang matantya ang edad ng ngipin ng mga kabataan ng Korea at mga kabataan, ang pamamaraan ng Lee 4 ay malawakang ginagamit sa kasanayan sa forensic na Korean. Ang pamamaraang ito ay gumagamit ng tradisyonal na pagtatasa ng istatistika (tulad ng maraming regression) upang suriin ang ugnayan sa pagitan ng mga paksa ng Koreano at edad na magkakasunod. Sa pag -aaral na ito, ang mga pamamaraan ng pagtatantya ng edad na nakuha gamit ang tradisyunal na pamamaraan ng istatistika ay tinukoy bilang "tradisyonal na pamamaraan." Ang pamamaraan ni Lee ay isang tradisyunal na pamamaraan, at ang kawastuhan nito ay nakumpirma ng Oh et al. 5; Gayunpaman, ang kakayahang magamit ng pagtatantya ng edad batay sa modelo ng DM sa kasanayan sa forensic ng Korea ay kaduda -dudang. Ang aming layunin ay upang mapatunayan ang siyentipiko ang potensyal na pagiging kapaki -pakinabang ng pagtatantya ng edad batay sa modelo ng DM. Ang layunin ng pag -aaral na ito ay (1) upang ihambing ang kawastuhan ng dalawang mga modelo ng DM sa pagtantya ng edad ng ngipin at (2) upang ihambing ang pagganap ng pag -uuri ng 7 mga modelo ng DM sa edad na 18 taon kasama ang mga nakuha gamit ang tradisyonal na mga pamamaraan ng istatistika na kapanahunan ng pangalawa at pangatlong molars sa parehong panga.
Ang mga ibig sabihin at karaniwang mga paglihis ng magkakasunod na edad sa pamamagitan ng yugto at uri ng ngipin ay ipinapakita online sa Karagdagang Table S1 (set ng pagsasanay), Karagdagang Talahanayan S2 (Panloob na Pagsubok sa Panloob), at Karagdagang Talahanayan S3 (panlabas na set ng pagsubok). Ang mga halaga ng kappa para sa pagiging maaasahan ng intra- at interobserver na nakuha mula sa set ng pagsasanay ay 0.951 at 0.947, ayon sa pagkakabanggit. P mga halaga at 95% na agwat ng kumpiyansa para sa mga halaga ng kappa ay ipinapakita sa online na Karagdagang Talahanayan S4. Ang halaga ng Kappa ay binibigyang kahulugan bilang "halos perpekto", naaayon sa pamantayan ng Landis at Koch26.
Kapag inihahambing ang ibig sabihin ng ganap na error (MAE), ang tradisyonal na pamamaraan ay bahagyang naipalabas ang modelo ng DM para sa lahat ng mga kasarian at sa panlabas na set ng pagsubok ng lalaki, maliban sa multilayer perceptron (MLP). Ang pagkakaiba sa pagitan ng tradisyonal na modelo at ang modelo ng DM sa panloob na set ng pagsubok ng MAE ay 0.12-0.19 taon para sa mga kalalakihan at 0.17-0.21 taon para sa mga kababaihan. Para sa panlabas na baterya ng pagsubok, ang mga pagkakaiba ay mas maliit (0.001-0.05 taon para sa mga kalalakihan at 0.05-0.09 taon para sa mga kababaihan). Bilang karagdagan, ang Root Mean Square Error (RMSE) ay bahagyang mas mababa kaysa sa tradisyonal na pamamaraan, na may mas maliit na pagkakaiba (0.17-0.24, 0.2-0.24 para sa set ng panloob na pagsubok sa panloob, at 0.03-0.07, 0.04-0.08 para sa panlabas na set ng pagsubok). ). Ang MLP ay nagpapakita ng bahagyang mas mahusay na pagganap kaysa sa solong layer perceptron (SLP), maliban sa kaso ng babaeng panlabas na set ng pagsubok. Para sa MAE at RMSE, ang mga panlabas na test set ng mga marka ng mas mataas kaysa sa panloob na set ng pagsubok para sa lahat ng mga kasarian at modelo. Ang lahat ng MAE at RMSE ay ipinapakita sa Talahanayan 1 at Larawan 1.
Mae at RMSE ng tradisyonal at data ng regression ng regresyon ng data. Ibig sabihin ganap na error mae, root mean square error rmse, solong layer perceptron SLP, multilayer perceptron MLP, tradisyonal na pamamaraan ng CM.
Ang pagganap ng pag -uuri (na may isang cutoff ng 18 taon) ng tradisyonal at DM na mga modelo ay ipinakita sa mga tuntunin ng pagiging sensitibo, pagiging tiyak, positibong mahuhulaan na halaga (PPV), negatibong halaga ng mahuhulaan (NPV), at lugar sa ilalim ng curve na katangian ng operating curve (AUROC) 27 (Talahanayan 2, Larawan 2 at Karagdagang Larawan 1 online). Sa mga tuntunin ng pagiging sensitibo ng panloob na baterya ng pagsubok, ang mga tradisyunal na pamamaraan ay pinakamahusay na gumanap sa mga kalalakihan at mas masahol sa mga kababaihan. Gayunpaman, ang pagkakaiba sa pagganap ng pag -uuri sa pagitan ng mga tradisyunal na pamamaraan at ang SD ay 9.7% para sa mga kalalakihan (MLP) at 2.4% lamang para sa mga kababaihan (xGBoost). Kabilang sa mga modelo ng DM, ang logistic regression (LR) ay nagpakita ng mas mahusay na pagiging sensitibo sa parehong kasarian. Tungkol sa pagiging tiyak ng panloob na set ng pagsubok, napansin na ang apat na mga modelo ng SD ay gumanap nang maayos sa mga lalaki, habang ang tradisyunal na modelo ay gumanap nang mas mahusay sa mga babae. Ang mga pagkakaiba sa pagganap ng pag -uuri para sa mga lalaki at babae ay 13.3% (MLP) at 13.1% (MLP), ayon sa pagkakabanggit, na nagpapahiwatig na ang pagkakaiba sa pagganap ng pag -uuri sa pagitan ng mga modelo ay lumampas sa pagiging sensitibo. Kabilang sa mga modelo ng DM, ang suporta ng vector machine (SVM), puno ng desisyon (DT), at mga random na kagubatan (RF) na pinakamahusay na gumanap sa mga lalaki, habang ang modelo ng LR ay pinakamahusay na gumanap sa mga babae. Ang AUROC ng tradisyunal na modelo at lahat ng mga modelo ng SD ay mas malaki kaysa sa 0.925 (k-pinakamalapit na kapitbahay (KNN) sa mga kalalakihan), na nagpapakita ng mahusay na pagganap ng pag-uuri sa diskriminasyon ng 18-taong-gulang na mga sample28. Para sa panlabas na set ng pagsubok, nagkaroon ng pagbaba sa pagganap ng pag -uuri sa mga tuntunin ng pagiging sensitibo, pagtutukoy at AUROC kumpara sa panloob na set ng pagsubok. Bukod dito, ang pagkakaiba sa pagiging sensitibo at pagiging tiyak sa pagitan ng pagganap ng pag -uuri ng pinakamahusay at pinakamasamang mga modelo ay mula sa 10% hanggang 25% at mas malaki kaysa sa pagkakaiba sa panloob na set ng pagsubok.
Ang pagiging sensitibo at pagiging tiyak ng mga modelo ng pag -uuri ng data ng pagmimina kumpara sa mga tradisyunal na pamamaraan na may isang cutoff ng 18 taon. Knn K pinakamalapit na kapitbahay, SVM Support Vector Machine, LR Logistic Regression, DT Desisyon Tree, RF Random Forest, XGB XGBoost, MLP Multilayer Perceptron, tradisyonal na pamamaraan ng CM.
Ang unang hakbang sa pag -aaral na ito ay upang ihambing ang kawastuhan ng mga pagtatantya ng edad ng ngipin na nakuha mula sa pitong mga modelo ng DM sa mga nakuha gamit ang tradisyonal na regression. Ang Mae at RMSE ay nasuri sa mga panloob na set ng pagsubok para sa parehong kasarian, at ang pagkakaiba sa pagitan ng tradisyonal na pamamaraan at ang modelo ng DM ay mula 44 hanggang 77 araw para sa MAE at mula 62 hanggang 88 araw para sa RMSE. Bagaman ang tradisyunal na pamamaraan ay bahagyang mas tumpak sa pag -aaral na ito, mahirap tapusin kung ang isang maliit na pagkakaiba ay may klinikal o praktikal na kabuluhan. Ang mga resulta na ito ay nagpapahiwatig na ang kawastuhan ng pagtatantya ng edad ng ngipin gamit ang modelo ng DM ay halos pareho sa tradisyunal na pamamaraan. Ang direktang paghahambing sa mga resulta mula sa mga nakaraang pag -aaral ay mahirap dahil walang pag -aaral na inihambing ang kawastuhan ng mga modelo ng DM na may tradisyunal na pamamaraan ng istatistika gamit ang parehong pamamaraan ng pag -record ng mga ngipin sa parehong saklaw ng edad tulad ng sa pag -aaral na ito. Inihambing ng Galibourg et al24 ang MAE at RMSE sa pagitan ng dalawang tradisyonal na pamamaraan (Demirjian Method25 at Willems Meth29) at 10 DM na mga modelo sa isang populasyon ng Pransya na may edad na 2 hanggang 24 na taon. Iniulat nila na ang lahat ng mga modelo ng DM ay mas tumpak kaysa sa mga tradisyonal na pamamaraan, na may pagkakaiba -iba ng 0.20 at 0.38 taon sa MAE at 0.25 at 0.47 na taon sa RMSE kumpara sa mga pamamaraan ng Willems at Demirdjian, ayon sa pagkakabanggit. Ang pagkakaiba sa pagitan ng modelo ng SD at tradisyonal na pamamaraan na ipinakita sa pag -aaral ng Halibourg ay isinasaalang -alang ang maraming mga ulat30,31,32,33 na ang pamamaraan ng Demirdjian ay hindi tumpak na tinantya ang edad ng ngipin sa mga populasyon maliban sa mga Pranses na Canadians kung saan nakabatay ang pag -aaral. Sa pag -aaral na ito. Ginamit ng Tai et al 34 ang algorithm ng MLP upang mahulaan ang edad ng ngipin mula sa 1636 na mga larawan ng orthodontic na Tsino at inihambing ang katumpakan nito sa mga resulta ng pamamaraan ng Demirjian at Willems. Iniulat nila na ang MLP ay may mas mataas na kawastuhan kaysa sa tradisyonal na pamamaraan. Ang pagkakaiba sa pagitan ng pamamaraan ng Demirdjian at ang tradisyunal na pamamaraan ay <0.32 taon, at ang pamamaraan ng Willems ay 0.28 taon, na katulad ng mga resulta ng kasalukuyang pag -aaral. Ang mga resulta ng mga nakaraang pag -aaral24,34 ay naaayon din sa mga resulta ng kasalukuyang pag -aaral, at ang katumpakan ng pagtatantya ng edad ng modelo ng DM at ang tradisyunal na pamamaraan ay magkatulad. Gayunpaman, batay sa ipinakita na mga resulta, maaari lamang nating maingat na tapusin na ang paggamit ng mga modelo ng DM upang matantya ang edad ay maaaring palitan ang mga umiiral na pamamaraan dahil sa kakulangan ng paghahambing at sanggunian na mga nakaraang pag -aaral. Ang mga pag-aaral ng follow-up na gumagamit ng mas malaking mga sample ay kinakailangan upang kumpirmahin ang mga resulta na nakuha sa pag-aaral na ito.
Kabilang sa mga pag -aaral na sumusubok sa kawastuhan ng SD sa pagtantya ng edad ng ngipin, ang ilan ay nagpakita ng mas mataas na kawastuhan kaysa sa aming pag -aaral. Ang Stepanovsky et al 35 ay nag -apply ng 22 mga modelo ng SD sa mga panoramic radiograph ng 976 na mga residente ng Czech na may edad na 2.7 hanggang 20.5 taon at sinubukan ang kawastuhan ng bawat modelo. Sinuri nila ang pagbuo ng isang kabuuang 16 itaas at ibabang kaliwang permanenteng ngipin gamit ang mga pamantayan sa pag -uuri na iminungkahi ni Moorrees et al 36. Ang MAE ay mula sa 0.64 hanggang 0.94 taon at ang RMSE ay mula sa 0.85 hanggang 1.27 taon, na mas tumpak kaysa sa dalawang modelo ng DM na ginamit sa pag -aaral na ito. Ginamit ni Shen et al23 ang pamamaraan ng cameriere upang matantya ang edad ng ngipin ng pitong permanenteng ngipin sa kaliwang ipinag -uutos sa silangang mga residente ng Tsino na may edad 5 hanggang 13 taon at inihambing ito sa mga edad na tinantya gamit ang linear regression, SVM at RF. Ipinakita nila na ang lahat ng tatlong mga modelo ng DM ay may mas mataas na kawastuhan kumpara sa tradisyonal na formula ng cameriere. Ang MAE at RMSE sa pag -aaral ni Shen ay mas mababa kaysa sa mga nasa modelo ng DM sa pag -aaral na ito. Ang tumaas na katumpakan ng mga pag -aaral ni Stepanovsky et al. 35 at Shen et al. 23 ay maaaring dahil sa pagsasama ng mga mas batang paksa sa kanilang mga sample ng pag -aaral. Dahil ang mga pagtatantya ng edad para sa mga kalahok na may pagbuo ng ngipin ay nagiging mas tumpak habang ang bilang ng mga ngipin ay nagdaragdag sa panahon ng pag -unlad ng ngipin, ang kawastuhan ng nagresultang pamamaraan ng pagtatantya ng edad ay maaaring ikompromiso kapag mas bata ang mga kalahok sa pag -aaral. Bilang karagdagan, ang pagkakamali ng MLP sa pagtatantya ng edad ay bahagyang mas maliit kaysa sa SLP's, nangangahulugang ang MLP ay mas tumpak kaysa sa SLP. Ang MLP ay itinuturing na bahagyang mas mahusay para sa pagtatantya ng edad, marahil dahil sa mga nakatagong layer sa MLP38. Gayunpaman, mayroong isang pagbubukod para sa panlabas na sample ng mga kababaihan (SLP 1.45, MLP 1.49). Ang paghahanap na ang MLP ay mas tumpak kaysa sa SLP sa pagtatasa ng edad ay nangangailangan ng karagdagang mga pag -aaral sa retrospective.
Ang pagganap ng pag-uuri ng modelo ng DM at ang tradisyonal na pamamaraan sa isang 18-taong threshold ay inihambing din. Ang lahat ng nasubok na mga modelo ng SD at tradisyonal na pamamaraan sa panloob na set ng pagsubok ay nagpakita ng praktikal na katanggap-tanggap na mga antas ng diskriminasyon para sa 18 taong gulang na sample. Ang pagiging sensitibo para sa mga kalalakihan at kababaihan ay mas malaki kaysa sa 87.7% at 94.9%, ayon sa pagkakabanggit, at ang pagiging tiyak ay mas malaki kaysa sa 89.3% at 84.7%. Ang AUROC ng lahat ng nasubok na mga modelo ay lumampas din sa 0.925. Sa abot ng aming kaalaman, walang pag-aaral ang nasubok ang pagganap ng modelo ng DM para sa 18-taong pag-uuri batay sa kapanahunan ng ngipin. Maaari naming ihambing ang mga resulta ng pag -aaral na ito sa pagganap ng pag -uuri ng mga malalim na modelo ng pag -aaral sa mga panoramic radiograph. Kinakalkula ni Guo et al.15 ang pagganap ng pag-uuri ng isang modelo ng malalim na pag-aaral na batay sa CNN at isang manu-manong pamamaraan batay sa pamamaraan ni Demirjian para sa isang tiyak na threshold ng edad. Ang pagiging sensitibo at pagiging tiyak ng manu -manong pamamaraan ay 87.7% at 95.5%, ayon sa pagkakabanggit, at ang pagiging sensitibo at pagiging tiyak ng modelo ng CNN ay lumampas sa 89.2% at 86.6%, ayon sa pagkakabanggit. Napagpasyahan nila na ang malalim na mga modelo ng pag -aaral ay maaaring palitan o outperform manual na pagtatasa sa pag -uuri ng mga threshold ng edad. Ang mga resulta ng pag -aaral na ito ay nagpakita ng magkatulad na pagganap ng pag -uuri; Ito ay pinaniniwalaan na ang pag -uuri gamit ang mga modelo ng DM ay maaaring palitan ang tradisyonal na mga istatistikong pamamaraan para sa pagtatantya ng edad. Kabilang sa mga modelo, ang DM LR ay ang pinakamahusay na modelo sa mga tuntunin ng sensitivity para sa lalaki sample at pagiging sensitibo at pagiging tiyak para sa babaeng sample. Pangalawa ang ranggo ng LR sa pagtutukoy para sa mga kalalakihan. Bukod dito, ang LR ay itinuturing na isa sa mga mas madaling gamitin na mga modelo ng DM35 at hindi gaanong kumplikado at mahirap iproseso. Batay sa mga resulta na ito, ang LR ay itinuturing na pinakamahusay na modelo ng pag-uuri ng cutoff para sa mga 18 taong gulang sa populasyon ng Korea.
Sa pangkalahatan, ang kawastuhan ng pagtatantya ng edad o pagganap ng pag -uuri sa panlabas na set ng pagsubok ay mahirap o mas mababa kumpara sa mga resulta sa panloob na set ng pagsubok. Ang ilang mga ulat ay nagpapahiwatig na ang pag -uuri ng kawastuhan o kahusayan ay bumababa kapag ang mga pagtatantya ng edad batay sa populasyon ng Korea ay inilalapat sa populasyon ng Hapon na,39, at isang katulad na pattern ang natagpuan sa kasalukuyang pag -aaral. Ang kalakaran na ito ay sinusunod din sa modelo ng DM. Samakatuwid, upang tumpak na matantya ang edad, kahit na gumagamit ng DM sa proseso ng pagsusuri, ang mga pamamaraan na nagmula sa data ng katutubong populasyon, tulad ng tradisyonal na pamamaraan, ay dapat na ginustong5,39,40,41,42. Dahil hindi malinaw kung ang mga malalim na modelo ng pag -aaral ay maaaring magpakita ng mga katulad na mga uso, pag -aaral ng paghahambing ng kawastuhan at kahusayan ng pag -uuri gamit ang tradisyonal na pamamaraan, mga modelo ng DM, at mga malalim na modelo ng pag -aaral sa parehong mga halimbawa ay kinakailangan upang kumpirmahin kung ang artipisyal na katalinuhan ay maaaring pagtagumpayan ang mga pagkakaiba -iba ng lahi sa limitadong edad. Mga pagtatasa.
Ipinakita namin na ang mga tradisyunal na pamamaraan ay maaaring mapalitan ng pagtatantya ng edad batay sa modelo ng DM sa kasanayan sa pagtatantya ng edad ng forensic sa Korea. Natuklasan din namin ang posibilidad ng pagpapatupad ng pag -aaral ng machine para sa pagtatasa ng edad ng forensic. Gayunpaman, may mga malinaw na mga limitasyon, tulad ng hindi sapat na bilang ng mga kalahok sa pag -aaral na ito upang tiyak na matukoy ang mga resulta, at ang kakulangan ng mga nakaraang pag -aaral upang ihambing at kumpirmahin ang mga resulta ng pag -aaral na ito. Sa hinaharap, ang mga pag -aaral ng DM ay dapat isagawa na may mas malaking bilang ng mga sample at mas magkakaibang populasyon upang mapagbuti ang praktikal na kakayahang magamit kumpara sa mga tradisyunal na pamamaraan. Upang mapatunayan ang pagiging posible ng paggamit ng artipisyal na katalinuhan upang matantya ang edad sa maraming populasyon, ang mga pag -aaral sa hinaharap ay kinakailangan upang ihambing ang katumpakan ng pag -uuri at kahusayan ng mga DM at malalim na mga modelo ng pag -aaral na may tradisyonal na pamamaraan sa parehong mga sample.
Ang pag -aaral ay gumamit ng 2,657 na mga orthographic na litrato na nakolekta mula sa mga Korean at Japanese na may edad na 15 hanggang 23 taon. Ang mga Korean radiograph ay nahahati sa 900 mga set ng pagsasanay (19.42 ± 2.65 taon) at 900 panloob na mga set ng pagsubok (19.52 ± 2.59 taon). Ang set ng pagsasanay ay nakolekta sa isang institusyon (Seoul St. Mary's Hospital), at ang sariling set ng pagsubok ay nakolekta sa dalawang institusyon (Seoul National University Dental Hospital at Yonsei University Dental Hospital). Nakolekta din namin ang 857 radiograph mula sa isa pang data na batay sa populasyon (Iwate Medical University, Japan) para sa panlabas na pagsubok. Ang mga radiograpiya ng mga paksang Hapon (19.31 ± 2.60 taon) ay napili bilang set ng panlabas na pagsubok. Ang mga datos ay nakolekta nang retrospectively upang pag -aralan ang mga yugto ng pag -unlad ng ngipin sa mga panoramic radiograph na kinuha sa paggamot sa ngipin. Ang lahat ng mga datos na nakolekta ay hindi nagpapakilala maliban sa kasarian, petsa ng kapanganakan at petsa ng radiograph. Ang mga pamantayan sa pagsasama at pagbubukod ay pareho sa naunang nai -publish na pag -aaral 4, 5. Ang aktwal na edad ng sample ay kinakalkula sa pamamagitan ng pagbabawas ng petsa ng kapanganakan mula sa petsa na nakuha ang radiograph. Ang halimbawang pangkat ay nahahati sa siyam na pangkat ng edad. Ang mga pamamahagi ng edad at sex ay ipinapakita sa Talahanayan 3 ang pag -aaral na ito ay isinasagawa alinsunod sa Pahayag ng Helsinki at naaprubahan ng Institutional Review Board (IRB) ng Seoul St. Mary's Hospital ng Catholic University of Korea (KC22WISI0328). Dahil sa disenyo ng retrospective ng pag -aaral na ito, ang kaalamang pahintulot ay hindi maaaring makuha mula sa lahat ng mga pasyente na sumasailalim sa pagsusuri ng radiographic para sa mga layuning therapeutic. Ang Seoul Korea University St. Mary's Hospital (IRB) ay tinanggihan ang kahilingan para sa kaalamang pahintulot.
Ang mga yugto ng pag -unlad ng bimaxillary pangalawa at pangatlong molars ay nasuri ayon sa pamantayan ng Demircan25. Isang ngipin lamang ang napili kung ang parehong uri ng ngipin ay natagpuan sa kaliwa at kanang panig ng bawat panga. Kung ang mga homologous na ngipin sa magkabilang panig ay nasa iba't ibang yugto ng pag -unlad, ang ngipin na may mas mababang yugto ng pag -unlad ay napili upang account para sa kawalan ng katiyakan sa tinantyang edad. Isang daang random na napiling mga radiograpiya mula sa set ng pagsasanay ay minarkahan ng dalawang nakaranas na tagamasid upang subukan ang pagiging maaasahan ng interobserver pagkatapos ng precalibration upang matukoy ang yugto ng kapanahunan ng ngipin. Ang pagiging maaasahan ng intraobserver ay nasuri nang dalawang beses sa tatlong-buwan na agwat ng pangunahing tagamasid.
Ang yugto ng sex at pag -unlad ng pangalawa at pangatlong molars ng bawat panga sa set ng pagsasanay ay tinantya ng isang pangunahing tagamasid na sinanay na may iba't ibang mga modelo ng DM, at ang aktwal na edad ay itinakda bilang target na halaga. Ang mga modelo ng SLP at MLP, na malawakang ginagamit sa pag -aaral ng makina, ay nasubok laban sa mga algorithm ng regression. Pinagsasama ng modelo ng DM ang mga linear function gamit ang mga yugto ng pag -unlad ng apat na ngipin at pinagsasama ang mga data na ito upang matantya ang edad. Ang SLP ay ang pinakasimpleng neural network at hindi naglalaman ng mga nakatagong layer. Gumagana ang SLP batay sa paghahatid ng threshold sa pagitan ng mga node. Ang modelo ng SLP sa regression ay matematika na katulad ng maraming linear regression. Hindi tulad ng modelo ng SLP, ang modelo ng MLP ay may maraming mga nakatagong layer na may mga function na hindi pag -activate. Ang aming mga eksperimento ay gumagamit ng isang nakatagong layer na may 20 na nakatagong node na may mga function na nonlinear activation. Gumamit ng gradient na paglusong bilang paraan ng pag -optimize at MAE at RMSE bilang pag -andar ng pagkawala upang sanayin ang aming modelo ng pag -aaral ng makina. Ang pinakamahusay na nakuha na modelo ng regression ay inilapat sa panloob at panlabas na mga set ng pagsubok at ang edad ng ngipin ay tinantya.
Ang isang algorithm ng pag -uuri ay binuo na gumagamit ng kapanahunan ng apat na ngipin sa set ng pagsasanay upang mahulaan kung ang isang sample ay 18 taong gulang o hindi. Upang mabuo ang modelo, nagmula kami ng pitong representasyon ng pag -aaral ng machine algorithms6,43: (1) lr, (2) knn, (3) svm, (4) dt, (5) rf, (6) xgBoost, at (7) mlp . Ang LR ay isa sa mga pinaka -malawak na ginagamit na pag -uuri ng algorithms44. Ito ay isang pinangangasiwaan na algorithm ng pag -aaral na gumagamit ng regression upang mahulaan ang posibilidad ng data na kabilang sa isang tiyak na kategorya mula 0 hanggang 1 at inuri ang data na kabilang sa isang mas malamang na kategorya batay sa posibilidad na ito; Pangunahing ginagamit para sa pag -uuri ng binary. Ang KNN ay isa sa pinakasimpleng machine learning algorithms45. Kapag binigyan ng bagong data ng pag -input, natagpuan nito ang data ng K na malapit sa umiiral na hanay at pagkatapos ay inuri ang mga ito sa klase na may pinakamataas na dalas. Nagtakda kami ng 3 para sa bilang ng mga kapitbahay na isinasaalang -alang (k). Ang SVM ay isang algorithm na nag-maximize ng distansya sa pagitan ng dalawang klase sa pamamagitan ng paggamit ng isang function ng kernel upang mapalawak ang linear space sa isang di-linear na puwang na tinatawag na Fields46. Para sa modelong ito, gumagamit kami ng bias = 1, power = 1, at gamma = 1 bilang hyperparameter para sa polynomial kernel. Ang DT ay inilapat sa iba't ibang mga patlang bilang isang algorithm para sa paghati sa isang buong data na itinakda sa ilang mga subgroup sa pamamagitan ng kumakatawan sa mga patakaran ng desisyon sa isang istraktura ng puno47. Ang modelo ay na -configure na may isang minimum na bilang ng mga talaan bawat node ng 2 at ginagamit ang gini index bilang isang sukatan ng kalidad. Ang RF ay isang paraan ng ensemble na pinagsasama ang maraming DT upang mapabuti ang pagganap gamit ang isang paraan ng pagsasama -sama ng bootstrap na bumubuo ng isang mahina na klasipikasyon para sa bawat sample sa pamamagitan ng random na pagguhit ng mga sample ng parehong sukat nang maraming beses mula sa orihinal na dataset48. Gumamit kami ng 100 puno, 10 lalim ng puno, 1 minimum na laki ng node, at gini admixture index bilang pamantayan sa paghihiwalay ng node. Ang pag -uuri ng bagong data ay natutukoy ng isang boto ng mayorya. Ang XGBoost ay isang algorithm na pinagsasama ang mga diskarte sa pagpapalakas gamit ang isang pamamaraan na tumatagal bilang data ng pagsasanay ang error sa pagitan ng aktwal at hinulaang mga halaga ng nakaraang modelo at pinalaki ang error gamit ang gradients49. Ito ay isang malawak na ginagamit na algorithm dahil sa mahusay na pagganap at kahusayan ng mapagkukunan, pati na rin ang mataas na pagiging maaasahan bilang isang overfitting function ng pagwawasto. Ang modelo ay nilagyan ng 400 na mga gulong ng suporta. Ang MLP ay isang neural network kung saan ang isa o higit pang mga perceptron ay bumubuo ng maraming mga layer na may isa o higit pang mga nakatagong mga layer sa pagitan ng input at output layer38. Gamit ito, maaari kang magsagawa ng pag-uuri ng di-linear kung saan kapag nagdagdag ka ng isang layer ng pag-input at makakuha ng isang halaga ng resulta, ang hinulaang halaga ng resulta ay inihambing sa aktwal na halaga ng resulta at ang error ay ipinalaganap pabalik. Lumikha kami ng isang nakatagong layer na may 20 nakatagong mga neuron sa bawat layer. Ang bawat modelo na binuo namin ay inilalapat sa panloob at panlabas na mga hanay upang subukan ang pagganap ng pag -uuri sa pamamagitan ng pagkalkula ng pagiging sensitibo, pagtutukoy, PPV, NPV, at AUROC. Ang sensitivity ay tinukoy bilang ang ratio ng isang sample na tinatayang 18 taong gulang o mas matanda sa isang halimbawang tinatayang 18 taong gulang o mas matanda. Ang pagtutukoy ay ang proporsyon ng mga sample sa ilalim ng 18 taong gulang at ang tinatayang nasa ilalim ng 18 taong gulang.
Ang mga yugto ng ngipin na nasuri sa set ng pagsasanay ay na -convert sa mga yugto ng numero para sa pagsusuri sa istatistika. Ang multivariate linear at logistic regression ay isinagawa upang makabuo ng mga mahuhulaan na modelo para sa bawat sex at kumuha ng mga formula ng regression na maaaring magamit upang matantya ang edad. Ginamit namin ang mga formula na ito upang matantya ang edad ng ngipin para sa parehong panloob at panlabas na mga set ng pagsubok. Ipinapakita sa talahanayan 4 ang mga modelo ng regression at pag -uuri na ginamit sa pag -aaral na ito.
Ang pagiging maaasahan ng intra- at interobserver ay kinakalkula gamit ang istatistika ng kappa ni Cohen. Upang masubukan ang kawastuhan ng DM at tradisyonal na mga modelo ng regression, kinakalkula namin ang MAE at RMSE gamit ang tinantyang at aktwal na edad ng mga panloob at panlabas na mga set ng pagsubok. Ang mga error na ito ay karaniwang ginagamit upang suriin ang kawastuhan ng mga hula ng modelo. Ang mas maliit na error, mas mataas ang kawastuhan ng forecast24. Ihambing ang MAE at RMSE ng panloob at panlabas na mga set ng pagsubok na kinakalkula gamit ang DM at tradisyonal na regression. Ang pagganap ng pag-uuri ng 18-taong cutoff sa tradisyonal na istatistika ay nasuri gamit ang isang talahanayan ng 2 × 2 contingency. Ang kinakalkula na pagiging sensitibo, pagtutukoy, PPV, NPV, at AUROC ng set ng pagsubok ay inihambing sa mga sinusukat na halaga ng modelo ng pag -uuri ng DM. Ang data ay ipinahayag bilang ibig sabihin ± standard na paglihis o bilang (%) depende sa mga katangian ng data. Ang dalawang-panig na mga halaga ng P <0.05 ay itinuturing na makabuluhang istatistika. Ang lahat ng mga regular na pag -aaral sa istatistika ay isinagawa gamit ang SAS bersyon 9.4 (SAS Institute, Cary, NC). Ang modelo ng regulasyon ng DM ay ipinatupad sa Python gamit ang Keras50 2.2.4 Backend at TensorFlow51 1.8.0 partikular para sa mga operasyon sa matematika. Ang modelo ng pag -uuri ng DM ay ipinatupad sa kapaligiran ng pagsusuri ng kaalaman sa Waikato at ang Konstanz Information Miner (KNIME) 4.6.152 platform ng pagsusuri.
Kinikilala ng mga may -akda na ang data na sumusuporta sa mga konklusyon ng pag -aaral ay matatagpuan sa artikulo at mga pandagdag na materyales. Ang mga datasets na nabuo at/o nasuri sa pag -aaral ay magagamit mula sa kaukulang may -akda sa makatuwirang kahilingan.
Ritz-Timme, S. et al. Pagtatasa ng Edad: Estado ng sining upang matugunan ang mga tiyak na kinakailangan ng forensic practice. Internationality. J. Legal na gamot. 113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G., at Olze, A. Kasalukuyang katayuan ng pagtatasa ng edad ng forensic edad ng mga nabubuhay na paksa para sa mga layunin ng pag -uusig sa kriminal. Forensics. gamot. Patolohiya. 1, 239–246 (2005).
Pan, J. et al. Isang binagong pamamaraan para sa pagtatasa ng edad ng ngipin ng mga bata na may edad 5 hanggang 16 taon sa silangang Tsina. Klinikal. Oral Survey. 25, 3463–3474 (2021).
Lee, SS atbp. Internationality. J. Legal na gamot. 124, 659–665 (2010).
Oh, S., Kumagai, A., Kim, Sy at Lee, kawastuhan ng SS ng pagtantya ng edad at pagtatantya ng 18-taong threshold batay sa kapanahunan ng pangalawa at pangatlong molars sa mga Koreano at Hapon. PLOS ONE 17, E0271247 (2022).
Kim, JY, et al. Ang preoperative machine na batay sa pag-aaral na batay sa data ay maaaring mahulaan ang kinalabasan ng paggamot sa operasyon sa pagtulog sa mga pasyente na may OSA. ang agham. Ulat 11, 14911 (2021).
Han, M. et al. Tumpak na pagtatantya ng edad mula sa pag -aaral ng makina na may o walang interbensyon ng tao? Internationality. J. Legal na gamot. 136, 821–831 (2022).
Khan, S. at Shaheen, M. Mula sa Pagmimina ng Data hanggang sa Pagmimina ng Data. J.information. ang agham. https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. at Shaheen, M. Wisrule: Ang Unang Cognitive Algorithm para sa Pagmimina ng Rule ng Pagmimina. J.information. ang agham. https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. at Abdullah U. Karm: tradisyonal na pagmimina ng data batay sa mga patakaran na batay sa konteksto. kalkulahin. Mat. Magpatuloy. 68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. at Habib M. Malalim na pag -aaral batay sa semantikong pagkakapareho ng pagtuklas gamit ang data ng teksto. ipagbigay -alam. mga teknolohiya. kontrolin. https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z., at Shahin, M. Isang sistema para sa pagkilala sa aktibidad sa mga video sa palakasan. Multimedia. Mga Application ng Mga Tool https://doi.org/10.1007/S11042-021-10519-6 (2021).
HALABI, SS et al. RSNA Machine Learning Hamon sa Pediatric Bone Age. Radiology 290, 498–503 (2019).
Li, Y. et al. Ang pagtatantya ng edad ng forensic mula sa pelvic x-ray gamit ang malalim na pag-aaral. Euro. Radiation. 29, 2322–2329 (2019).
Guo, YC, et al. Tumpak na pag -uuri ng edad gamit ang mga manu -manong pamamaraan at malalim na convolutional neural network mula sa mga imahe ng orthographic projection. Internationality. J. Legal na gamot. 135, 1589–1597 (2021).
Alabama Dalora et al. Ang pagtatantya ng edad ng buto gamit ang iba't ibang mga pamamaraan sa pag-aaral ng makina: isang sistematikong pagsusuri sa panitikan at meta-analysis. PLOS ONE 14, E0220242 (2019).
Du, H., Li, G., Cheng, K., at Yang, J. Pagtantya ng edad na tinutukoy ng populasyon ng mga Amerikanong Amerikano at Tsino batay sa mga dami ng silid ng pulp ng mga unang molars gamit ang cone-beam computed tomography. Internationality. J. Legal na gamot. 136, 811–819 (2022).
Kim S., Lee YH, Noh YK, Park FK at OH KS na tumutukoy sa mga pangkat ng edad ng mga nabubuhay na tao gamit ang mga artipisyal na imahe na batay sa intelihensiya ng mga unang molar. ang agham. Ulat 11, 1073 (2021).
Stern, D., nagbabayad, C., Giuliani, N., at Urschler, M. Awtomatikong pagtatantya ng edad at pag -uuri ng karamihan sa edad mula sa data ng multivariate MRI. IEEE J. Biomed. Mga alerto sa kalusugan. 23, 1392–1403 (2019).
Cheng, Q., GE, Z., DU, H. at Li, G. Pagtantya ng edad batay sa 3D pulp chamber segmentation ng mga unang molars mula sa cone beam computed tomography sa pamamagitan ng pagsasama ng malalim na pag -aaral at mga set ng antas. Internationality. J. Legal na gamot. 135, 365–373 (2021).
Wu, WT, et al. Data Mining sa Clinical Big Data: Karaniwang mga database, Mga Hakbang, at Mga Modelo ng Pamamaraan. Mundo. gamot. mapagkukunan 8, 44 (2021).
Yang, J. et al. Panimula sa mga medikal na database at mga teknolohiya ng pagmimina ng data sa malaking panahon ng data. J. Avid. Pangunahing gamot. 13, 57–69 (2020).
Shen, S. et al. Paraan ng Camerer para sa pagtantya ng edad ng ngipin gamit ang pag -aaral ng makina. BMC Oral Health 21, 641 (2021).
Galliburg A. et al. Paghahambing ng iba't ibang mga pamamaraan ng pag -aaral ng makina para sa paghula ng edad ng ngipin gamit ang paraan ng pagtatanghal ng demirdjian. Internationality. J. Legal na gamot. 135, 665–675 (2021).
Demirdjian, A., Goldstein, H. at Tanner, JM isang bagong sistema para sa pagtatasa ng edad ng ngipin. snort Biology. 45, 211–227 (1973).
Landis, JR, at Koch, GG Mga Panukala ng Kasunduan sa Tagamasid sa Mga Data ng Kategoryang. Biometrics 33, 159–174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK at Choi HK. Teksto, morphological at statistical analysis ng two-dimensional magnetic resonance imaging gamit ang mga artipisyal na pamamaraan ng katalinuhan para sa pagkita ng kaibahan ng mga pangunahing bukol sa utak. Impormasyon sa Kalusugan. mapagkukunan https://doi.org/10.4258/hir.2022.28.1.46 (2022).

Oras ng Mag-post: Jan-04-2024

Ang pagpapatunay ng isang modelo ng pagmimina ng data laban sa tradisyonal na mga pamamaraan ng pagtatantya ng edad ng ngipin sa mga kabataan ng Koreano at mga batang may sapat na gulang