• tayo

Pagpapatunay ng isang modelo ng pagmimina ng data laban sa mga tradisyonal na pamamaraan ng pagtatantya ng edad ng ngipin sa mga kabataan at kabataang Koreano

Salamat sa pagbisita sa Nature.com.Ang bersyon ng browser na iyong ginagamit ay may limitadong suporta sa CSS.Para sa pinakamahusay na mga resulta, inirerekomenda namin ang paggamit ng mas bagong bersyon ng iyong browser (o i-off ang compatibility mode sa Internet Explorer).Pansamantala, upang matiyak ang patuloy na suporta, ipinapakita namin ang site nang walang pag-istilo o JavaScript.
Ang mga ngipin ay itinuturing na pinakatumpak na tagapagpahiwatig ng edad ng katawan ng tao at kadalasang ginagamit sa forensic age assessment.Nilalayon naming patunayan ang mga pagtatantya sa edad ng ngipin na nakabatay sa data sa pamamagitan ng paghahambing ng katumpakan ng pagtatantya at pagganap ng pag-uuri ng 18-taong threshold sa mga tradisyonal na pamamaraan at mga pagtatantya sa edad na nakabatay sa data.May kabuuang 2657 panoramic radiographs ang nakolekta mula sa mga Korean at Japanese citizen na may edad 15 hanggang 23 taon.Hinati sila sa isang set ng pagsasanay, bawat isa ay naglalaman ng 900 Korean radiographs, at isang internal test set na naglalaman ng 857 Japanese radiographs.Inihambing namin ang katumpakan ng pag-uuri at kahusayan ng mga tradisyonal na pamamaraan sa mga set ng pagsubok ng mga modelo ng pagmimina ng data.Ang katumpakan ng tradisyunal na pamamaraan sa panloob na set ng pagsubok ay bahagyang mas mataas kaysa sa modelo ng pagmimina ng data, at maliit ang pagkakaiba (mean absolute error <0.21 taon, root mean square error <0.24 taon).Ang pagganap ng pag-uuri para sa 18-taong cutoff ay katulad din sa pagitan ng mga tradisyonal na pamamaraan at mga modelo ng data mining.Kaya, ang mga tradisyunal na pamamaraan ay maaaring mapalitan ng mga modelo ng data mining kapag nagsasagawa ng forensic age assessment gamit ang maturity ng second at third molars sa Korean adolescents at young adults.
Ang pagtatantya ng edad ng ngipin ay malawakang ginagamit sa forensic na gamot at pediatric dentistry.Sa partikular, dahil sa mataas na ugnayan sa pagitan ng kronolohikal na edad at pag-unlad ng ngipin, ang pagtatasa ng edad sa pamamagitan ng mga yugto ng pag-unlad ng ngipin ay isang mahalagang kriterya para sa pagtatasa ng edad ng mga bata at kabataan1,2,3.Gayunpaman, para sa mga kabataan, ang pagtantya ng edad ng ngipin batay sa maturity ng ngipin ay may mga limitasyon dahil halos kumpleto na ang paglaki ng ngipin, maliban sa ikatlong molar.Ang legal na layunin ng pagtukoy sa edad ng mga kabataan at kabataan ay upang magbigay ng tumpak na mga pagtatantya at siyentipikong ebidensya kung sila ay umabot na sa edad ng mayorya.Sa medico-legal practice ng mga kabataan at young adult sa Korea, tinatantya ang edad gamit ang pamamaraan ni Lee, at ang legal na threshold na 18 taon ay hinulaang batay sa data na iniulat ng Oh et al 5 .
Ang machine learning ay isang uri ng artificial intelligence (AI) na paulit-ulit na natututo at nag-uuri ng malaking halaga ng data, nalulutas ang mga problema nang mag-isa, at nagtutulak ng data programming.Maaaring matuklasan ng machine learning ang mga kapaki-pakinabang na nakatagong pattern sa malalaking volume ng data6.Sa kabaligtaran, ang mga klasikal na pamamaraan, na masinsinang paggawa at pag-ubos ng oras, ay maaaring may mga limitasyon kapag nakikitungo sa malalaking volume ng kumplikadong data na mahirap iproseso nang manu-mano7.Samakatuwid, maraming pag-aaral ang isinagawa kamakailan gamit ang pinakabagong mga teknolohiya ng computer upang mabawasan ang mga pagkakamali ng tao at mahusay na magproseso ng multidimensional na data8,9,10,11,12.Sa partikular, ang malalim na pag-aaral ay malawakang ginagamit sa pagsusuri ng medikal na imahe, at ang iba't ibang pamamaraan para sa pagtatantya ng edad sa pamamagitan ng awtomatikong pagsusuri ng mga radiograph ay naiulat upang mapabuti ang katumpakan at kahusayan ng pagtatantya ng edad13,14,15,16,17,18,19,20 .Halimbawa, si Halabi et al 13 ay bumuo ng isang machine learning algorithm batay sa convolutional neural networks (CNN) upang tantiyahin ang skeletal age gamit ang radiographs ng mga kamay ng mga bata.Ang pag-aaral na ito ay nagmumungkahi ng isang modelo na naglalapat ng machine learning sa mga medikal na larawan at nagpapakita na ang mga paraang ito ay maaaring mapabuti ang diagnostic accuracy.Tinantyang edad ni Li et al14 mula sa pelvic X-ray na mga imahe gamit ang isang malalim na pag-aaral ng CNN at inihambing ang mga ito sa mga resulta ng regression gamit ang pagtatantya ng ossification stage.Nalaman nila na ang malalim na pag-aaral na modelo ng CNN ay nagpakita ng parehong pagganap ng pagtatantya ng edad bilang tradisyonal na modelo ng regression.Sinuri ng pag-aaral ni Guo et al. [15] ang pagganap ng pag-uuri ng pagpapaubaya sa edad ng teknolohiya ng CNN batay sa mga dental orthophoto, at ang mga resulta ng modelo ng CNN ay nagpatunay na ang mga tao ay nalampasan ang pagganap ng pag-uuri ng edad nito.
Karamihan sa mga pag-aaral sa pagtatantya ng edad gamit ang machine learning ay gumagamit ng mga deep learning na pamamaraan13,14,15,16,17,18,19,20.Ang pagtatantya ng edad batay sa malalim na pag-aaral ay iniulat na mas tumpak kaysa sa mga tradisyonal na pamamaraan.Gayunpaman, ang pamamaraang ito ay nagbibigay ng maliit na pagkakataon upang ipakita ang siyentipikong batayan para sa mga pagtatantya ng edad, tulad ng mga tagapagpahiwatig ng edad na ginamit sa mga pagtatantya.Mayroon ding legal na pagtatalo kung sino ang nagsasagawa ng mga inspeksyon.Samakatuwid, ang pagtatantya ng edad batay sa malalim na pag-aaral ay mahirap tanggapin ng mga awtoridad sa administratibo at panghukuman.Ang data mining (DM) ay isang pamamaraan na maaaring tumuklas hindi lamang sa inaasahan kundi pati na rin sa hindi inaasahang impormasyon bilang isang paraan para sa pagtuklas ng mga kapaki-pakinabang na ugnayan sa pagitan ng malalaking halaga ng data6,21,22.Madalas na ginagamit ang machine learning sa data mining, at pareho ang data mining at machine learning na gumagamit ng parehong key algorithm para tumuklas ng mga pattern sa data.Ang pagtatantya ng edad gamit ang pagpapaunlad ng ngipin ay batay sa pagtatasa ng tagasuri sa maturity ng target na ngipin, at ang pagtatasa na ito ay ipinahayag bilang isang yugto para sa bawat target na ngipin.Maaaring gamitin ang DM upang suriin ang ugnayan sa pagitan ng yugto ng pagtatasa ng ngipin at aktwal na edad at may potensyal na palitan ang tradisyonal na pagsusuri sa istatistika.Samakatuwid, kung ilalapat namin ang mga diskarte sa DM sa pagtatantya ng edad, maaari naming ipatupad ang machine learning sa forensic na pagtatantya ng edad nang hindi nababahala tungkol sa legal na pananagutan.Ang ilang mga paghahambing na pag-aaral ay nai-publish sa mga posibleng alternatibo sa tradisyonal na manu-manong pamamaraan na ginagamit sa forensic practice at EBM-based na mga pamamaraan para sa pagtukoy ng edad ng ngipin.Ipinakita ng Shen et al23 na ang modelo ng DM ay mas tumpak kaysa sa tradisyonal na formula ng Camerer.Ang Galibourg et al24 ay naglapat ng iba't ibang pamamaraan ng DM upang mahulaan ang edad ayon sa Demirdjian criterion25 at ang mga resulta ay nagpakita na ang pamamaraan ng DM ay nalampasan ang mga pamamaraan ng Demirdjian at Willems sa pagtantya ng edad ng populasyon ng Pranses.
Upang matantya ang edad ng ngipin ng mga Korean adolescent at young adult, ang paraan 4 ni Lee ay malawakang ginagamit sa Korean forensic practice.Gumagamit ang pamamaraang ito ng tradisyunal na pagsusuri sa istatistika (tulad ng maramihang pagbabalik) upang suriin ang kaugnayan sa pagitan ng mga paksang Koreano at kronolohikal na edad.Sa pag-aaral na ito, ang mga pamamaraan sa pagtatantya ng edad na nakuha gamit ang mga tradisyonal na pamamaraan ng istatistika ay tinukoy bilang "mga tradisyonal na pamamaraan."Ang pamamaraan ni Lee ay isang tradisyonal na pamamaraan, at ang katumpakan nito ay nakumpirma ng Oh et al.5;gayunpaman, ang applicability ng pagtatantya ng edad batay sa modelo ng DM sa Korean forensic practice ay kaduda-dudang pa rin.Ang aming layunin ay siyentipikong patunayan ang potensyal na pagiging kapaki-pakinabang ng pagtatantya ng edad batay sa modelo ng DM.Ang layunin ng pag-aaral na ito ay (1) upang ihambing ang katumpakan ng dalawang modelo ng DM sa pagtantya ng edad ng ngipin at (2) upang ihambing ang pagganap ng pag-uuri ng 7 mga modelo ng DM sa edad na 18 taon sa mga nakuha gamit ang mga tradisyonal na istatistikal na pamamaraan Maturity of second at ikatlong molar sa magkabilang panga.
Ang mga paraan at karaniwang paglihis ng kronolohikal na edad ayon sa yugto at uri ng ngipin ay ipinapakita online sa Karagdagang Talaan S1 (set ng pagsasanay), Karagdagang Talaan S2 (panloob na set ng pagsubok), at Pandagdag na Talahanayan S3 (panlabas na set ng pagsubok).Ang mga halaga ng kappa para sa pagiging maaasahan ng intra- at interobserver na nakuha mula sa set ng pagsasanay ay 0.951 at 0.947, ayon sa pagkakabanggit.Ang mga halaga ng P at 95% na agwat ng kumpiyansa para sa mga halaga ng kappa ay ipinapakita sa online na pandagdag na talahanayan S4.Ang halaga ng kappa ay binigyang kahulugan bilang "halos perpekto", naaayon sa pamantayan ng Landis at Koch26.
Kapag ikinukumpara ang mean absolute error (MAE), ang tradisyunal na pamamaraan ay bahagyang lumalampas sa modelo ng DM para sa lahat ng kasarian at sa panlabas na hanay ng pagsubok ng lalaki, maliban sa multilayer perceptron (MLP).Ang pagkakaiba sa pagitan ng tradisyonal na modelo at ang modelo ng DM sa panloob na set ng pagsubok ng MAE ay 0.12-0.19 taon para sa mga lalaki at 0.17-0.21 taon para sa mga kababaihan.Para sa panlabas na pansubok na baterya, ang mga pagkakaiba ay mas maliit (0.001–0.05 taon para sa mga lalaki at 0.05–0.09 taon para sa mga babae).Bukod pa rito, ang root mean square error (RMSE) ay bahagyang mas mababa kaysa sa tradisyonal na pamamaraan, na may mas maliliit na pagkakaiba (0.17–0.24, 0.2–0.24 para sa male internal test set, at 0.03–0.07, 0.04–0.08 para sa external na set ng pagsubok).).Ang MLP ay nagpapakita ng bahagyang mas mahusay na pagganap kaysa sa Single Layer Perceptron (SLP), maliban sa kaso ng female external test set.Para sa MAE at RMSE, mas mataas ang marka ng external test set kaysa sa internal test set para sa lahat ng kasarian at modelo.Ang lahat ng MAE at RMSE ay ipinapakita sa Talahanayan 1 at Larawan 1.
MAE at RMSE ng tradisyonal at data mining regression models.Mean absolute error MAE, root mean square error RMSE, single layer perceptron SLP, multilayer perceptron MLP, tradisyonal na CM method.
Ang pagganap ng pag-uuri (na may cutoff na 18 taon) ng tradisyonal at mga modelo ng DM ay ipinakita sa mga tuntunin ng sensitivity, specificity, positive predictive value (PPV), negative predictive value (NPV), at lugar sa ilalim ng receiver operating characteristic curve (AUROC) 27 (Talahanayan 2, Larawan 2 at Karagdagang Larawan 1 online).Sa mga tuntunin ng pagiging sensitibo ng panloob na baterya ng pagsubok, ang mga tradisyonal na pamamaraan ay pinakamahusay na gumaganap sa mga lalaki at mas masahol pa sa mga kababaihan.Gayunpaman, ang pagkakaiba sa pagganap ng pag-uuri sa pagitan ng mga tradisyonal na pamamaraan at SD ay 9.7% para sa mga lalaki (MLP) at 2.4% lamang para sa mga kababaihan (XGBoost).Sa mga modelo ng DM, ang logistic regression (LR) ay nagpakita ng mas mahusay na sensitivity sa parehong kasarian.Tungkol sa pagtitiyak ng panloob na set ng pagsubok, napagmasdan na ang apat na modelo ng SD ay mahusay na gumanap sa mga lalaki, habang ang tradisyonal na modelo ay gumanap nang mas mahusay sa mga babae.Ang mga pagkakaiba sa pagganap ng pag-uuri para sa mga lalaki at babae ay 13.3% (MLP) at 13.1% (MLP), ayon sa pagkakabanggit, na nagpapahiwatig na ang pagkakaiba sa pagganap ng pag-uuri sa pagitan ng mga modelo ay lumampas sa sensitivity.Sa mga modelong DM, ang support vector machine (SVM), decision tree (DT), at random forest (RF) na mga modelo ay pinakamahusay na gumanap sa mga lalaki, habang ang modelo ng LR ay gumanap nang pinakamahusay sa mga babae.Ang AUROC ng tradisyunal na modelo at lahat ng mga modelo ng SD ay mas malaki kaysa sa 0.925 (k-pinakamalapit na kapitbahay (KNN) sa mga lalaki), na nagpapakita ng mahusay na pagganap ng pag-uuri sa pagdidiskrimina ng 18 taong gulang na mga sample28.Para sa panlabas na hanay ng pagsubok, nagkaroon ng pagbaba sa pagganap ng pag-uuri sa mga tuntunin ng pagiging sensitibo, pagtitiyak at AUROC kumpara sa panloob na hanay ng pagsubok.Bukod dito, ang pagkakaiba sa sensitivity at pagtitiyak sa pagitan ng pagganap ng pag-uuri ng pinakamahusay at pinakamasamang mga modelo ay mula 10% hanggang 25% at mas malaki kaysa sa pagkakaiba sa panloob na set ng pagsubok.
Sensitivity at specificity ng data mining classification models kumpara sa mga tradisyunal na pamamaraan na may cutoff na 18 taon.KNN k pinakamalapit na kapitbahay, SVM support vector machine, LR logistic regression, DT decision tree, RF random forest, XGB XGBoost, MLP multilayer perceptron, tradisyonal na CM method.
Ang unang hakbang sa pag-aaral na ito ay upang ihambing ang katumpakan ng mga pagtatantya ng edad ng ngipin na nakuha mula sa pitong mga modelo ng DM sa mga nakuha gamit ang tradisyonal na regression.Ang MAE at RMSE ay nasuri sa mga panloob na set ng pagsubok para sa parehong kasarian, at ang pagkakaiba sa pagitan ng tradisyonal na pamamaraan at ang modelo ng DM ay mula 44 hanggang 77 araw para sa MAE at mula 62 hanggang 88 araw para sa RMSE.Kahit na ang tradisyonal na pamamaraan ay bahagyang mas tumpak sa pag-aaral na ito, mahirap tapusin kung ang maliit na pagkakaiba ay may klinikal o praktikal na kahalagahan.Ang mga resultang ito ay nagpapahiwatig na ang katumpakan ng pagtatantya ng edad ng ngipin gamit ang modelo ng DM ay halos kapareho ng sa tradisyonal na pamamaraan.Ang direktang paghahambing sa mga resulta mula sa mga nakaraang pag-aaral ay mahirap dahil walang pag-aaral ang nagkumpara sa katumpakan ng mga modelo ng DM sa mga tradisyonal na istatistikal na pamamaraan gamit ang parehong pamamaraan ng pagtatala ng mga ngipin sa parehong hanay ng edad tulad ng sa pag-aaral na ito.Inihambing ng Galibourg et al24 ang MAE at RMSE sa pagitan ng dalawang tradisyonal na pamamaraan (Demirjian method25 at Willems method29) at 10 DM na modelo sa isang populasyon ng Pransya na may edad 2 hanggang 24 na taon.Iniulat nila na ang lahat ng mga modelo ng DM ay mas tumpak kaysa sa mga tradisyonal na pamamaraan, na may mga pagkakaiba ng 0.20 at 0.38 taon sa MAE at 0.25 at 0.47 na taon sa RMSE kumpara sa mga pamamaraan ng Willems at Demirdjian, ayon sa pagkakabanggit.Ang pagkakaiba sa pagitan ng modelo ng SD at mga tradisyonal na pamamaraan na ipinakita sa pag-aaral ng Halibourg ay isinasaalang-alang ang maraming ulat30,31,32,33 na ang paraan ng Demirdjian ay hindi tumpak na tinatantya ang edad ng ngipin sa mga populasyon maliban sa mga French Canadian kung saan ibinatay ang pag-aaral.Sa pag-aaral na ito.Ginamit ng Tai et al 34 ang MLP algorithm upang mahulaan ang edad ng ngipin mula sa 1636 Chinese orthodontic na litrato at inihambing ang katumpakan nito sa mga resulta ng pamamaraang Demirjian at Willems.Iniulat nila na ang MLP ay may mas mataas na katumpakan kaysa sa mga tradisyonal na pamamaraan.Ang pagkakaiba sa pagitan ng pamamaraang Demirdjian at ng tradisyonal na pamamaraan ay <0.32 taon, at ang pamamaraang Willems ay 0.28 taon, na katulad ng mga resulta ng kasalukuyang pag-aaral.Ang mga resulta ng mga nakaraang pag-aaral24,34 ay pare-pareho din sa mga resulta ng kasalukuyang pag-aaral, at ang katumpakan ng pagtatantya ng edad ng modelo ng DM at ang tradisyonal na pamamaraan ay magkatulad.Gayunpaman, batay sa ipinakita na mga resulta, maaari lamang nating maingat na tapusin na ang paggamit ng mga modelo ng DM upang matantya ang edad ay maaaring palitan ang mga umiiral na pamamaraan dahil sa kakulangan ng paghahambing at sanggunian sa mga nakaraang pag-aaral.Ang mga follow-up na pag-aaral gamit ang mas malalaking sample ay kailangan para kumpirmahin ang mga resultang nakuha sa pag-aaral na ito.
Kabilang sa mga pag-aaral na sumusubok sa katumpakan ng SD sa pagtantya ng edad ng ngipin, ang ilan ay nagpakita ng mas mataas na katumpakan kaysa sa aming pag-aaral.Inilapat ni Stepanovsky et al 35 ang 22 SD na modelo sa mga panoramic radiograph ng 976 na residenteng Czech na may edad na 2.7 hanggang 20.5 taon at sinubukan ang katumpakan ng bawat modelo.Sinuri nila ang pagbuo ng kabuuang 16 sa itaas at ibabang kaliwang permanenteng ngipin gamit ang pamantayan sa pag-uuri na iminungkahi ng Moorrees et al 36 .Ang MAE ay mula 0.64 hanggang 0.94 taon at ang RMSE ay mula 0.85 hanggang 1.27 taon, na mas tumpak kaysa sa dalawang modelo ng DM na ginamit sa pag-aaral na ito.Ginamit ni Shen et al23 ang pamamaraang Cameriere upang tantyahin ang edad ng ngipin ng pitong permanenteng ngipin sa kaliwang mandible sa mga residente ng silangang Tsino na may edad 5 hanggang 13 taon at inihambing ito sa mga tinantyang edad gamit ang linear regression, SVM at RF.Ipinakita nila na ang lahat ng tatlong modelo ng DM ay may mas mataas na katumpakan kumpara sa tradisyonal na formula ng Cameriere.Ang MAE at RMSE sa pag-aaral ni Shen ay mas mababa kaysa sa mga nasa modelo ng DM sa pag-aaral na ito.Ang tumaas na katumpakan ng mga pag-aaral ni Stepanovsky et al.35 at Shen et al.23 ay maaaring dahil sa pagsasama ng mga mas batang paksa sa kanilang mga sample ng pag-aaral.Dahil nagiging mas tumpak ang mga pagtatantya ng edad para sa mga kalahok na may lumalagong ngipin habang tumataas ang bilang ng mga ngipin sa panahon ng pagpapaunlad ng ngipin, maaaring makompromiso ang katumpakan ng resultang paraan ng pagtatantya ng edad kapag mas bata ang mga kalahok sa pag-aaral.Bukod pa rito, ang error ng MLP sa pagtatantya ng edad ay bahagyang mas maliit kaysa sa SLP, ibig sabihin ay mas tumpak ang MLP kaysa sa SLP.Ang MLP ay itinuturing na bahagyang mas mahusay para sa pagtatantya ng edad, posibleng dahil sa mga nakatagong layer sa MLP38.Gayunpaman, mayroong isang pagbubukod para sa panlabas na sample ng mga kababaihan (SLP 1.45, MLP 1.49).Ang paghahanap na ang MLP ay mas tumpak kaysa sa SLP sa pagtatasa ng edad ay nangangailangan ng mga karagdagang pag-aaral sa retrospective.
Ang pagganap ng pag-uuri ng modelo ng DM at ang tradisyonal na pamamaraan sa isang 18-taong threshold ay inihambing din.Ang lahat ng nasubok na modelo ng SD at tradisyonal na pamamaraan sa panloob na set ng pagsubok ay nagpakita ng praktikal na katanggap-tanggap na mga antas ng diskriminasyon para sa 18 taong gulang na sample.Ang pagiging sensitibo para sa mga kalalakihan at kababaihan ay higit sa 87.7% at 94.9%, ayon sa pagkakabanggit, at ang pagtitiyak ay higit sa 89.3% at 84.7%.Ang AUROC ng lahat ng nasubok na modelo ay lumampas din sa 0.925.Sa abot ng aming kaalaman, walang pag-aaral ang sumubok sa pagganap ng modelo ng DM para sa 18-taong pag-uuri batay sa kapanahunan ng ngipin.Maaari nating ihambing ang mga resulta ng pag-aaral na ito sa pagganap ng pag-uuri ng mga modelo ng malalim na pag-aaral sa mga panoramic radiograph.Kinakalkula ni Guo et al.15 ang pagganap ng pag-uuri ng isang modelo ng malalim na pag-aaral na nakabase sa CNN at isang manu-manong pamamaraan batay sa pamamaraan ni Demirjian para sa isang tiyak na limitasyon ng edad.Ang sensitivity at specificity ng manual method ay 87.7% at 95.5%, ayon sa pagkakabanggit, at ang sensitivity at specificity ng CNN model ay lumampas sa 89.2% at 86.6%, ayon sa pagkakabanggit.Napagpasyahan nila na ang mga modelo ng malalim na pag-aaral ay maaaring palitan o madaig ang manu-manong pagtatasa sa pag-uuri ng mga limitasyon ng edad.Ang mga resulta ng pag-aaral na ito ay nagpakita ng katulad na pagganap ng pag-uuri;Ito ay pinaniniwalaan na ang pag-uuri gamit ang mga modelo ng DM ay maaaring palitan ang mga tradisyonal na istatistikal na pamamaraan para sa pagtatantya ng edad.Sa mga modelo, ang DM LR ang pinakamahusay na modelo sa mga tuntunin ng pagiging sensitibo para sa sample ng lalaki at pagiging sensitibo at pagtitiyak para sa sample ng babae.Pangalawa ang LR sa pagiging tiyak para sa mga lalaki.Bukod dito, ang LR ay itinuturing na isa sa mga modelong DM35 na madaling gamitin at hindi gaanong kumplikado at mahirap iproseso.Batay sa mga resultang ito, ang LR ay itinuturing na pinakamahusay na modelo ng pag-uuri ng cutoff para sa mga 18 taong gulang sa populasyon ng Korea.
Sa pangkalahatan, ang katumpakan ng pagtatantya ng edad o pagganap ng pag-uuri sa panlabas na hanay ng pagsubok ay hindi maganda o mas mababa kumpara sa mga resulta sa panloob na hanay ng pagsubok.Ang ilang mga ulat ay nagpapahiwatig na ang katumpakan ng pag-uuri o kahusayan ay bumababa kapag ang mga pagtatantya ng edad batay sa populasyon ng Korea ay inilapat sa populasyon ng Hapon5,39, at ang isang katulad na pattern ay natagpuan sa kasalukuyang pag-aaral.Ang kalakaran ng pagkasira na ito ay naobserbahan din sa modelo ng DM.Samakatuwid, upang tumpak na matantya ang edad, kahit na gumagamit ng DM sa proseso ng pagsusuri, ang mga pamamaraan na nagmula sa data ng katutubong populasyon, tulad ng mga tradisyonal na pamamaraan, ay dapat na mas gusto5,39,40,41,42.Dahil hindi malinaw kung ang mga modelo ng malalim na pag-aaral ay maaaring magpakita ng mga katulad na uso, ang mga pag-aaral na naghahambing ng katumpakan at kahusayan ng pag-uuri gamit ang mga tradisyonal na pamamaraan, mga modelo ng DM, at mga modelo ng malalim na pag-aaral sa parehong mga sample ay kinakailangan upang kumpirmahin kung ang artificial intelligence ay maaaring madaig ang mga pagkakaiba-iba ng lahi sa limitadong edad.mga pagtatasa.
Ipinakita namin na ang mga tradisyonal na pamamaraan ay maaaring mapalitan ng pagtatantya ng edad batay sa modelo ng DM sa pagsasanay sa pagtatantya ng edad ng forensic sa Korea.Natuklasan din namin ang posibilidad ng pagpapatupad ng machine learning para sa forensic age assessment.Gayunpaman, may mga malinaw na limitasyon, tulad ng hindi sapat na bilang ng mga kalahok sa pag-aaral na ito upang tiyak na matukoy ang mga resulta, at ang kakulangan ng mga nakaraang pag-aaral upang ihambing at kumpirmahin ang mga resulta ng pag-aaral na ito.Sa hinaharap, ang mga pag-aaral ng DM ay dapat isagawa na may mas malaking bilang ng mga sample at mas magkakaibang populasyon upang mapabuti ang praktikal na kakayahang magamit kumpara sa mga tradisyonal na pamamaraan.Upang mapatunayan ang pagiging posible ng paggamit ng artificial intelligence upang matantya ang edad sa maraming populasyon, kailangan ang mga pag-aaral sa hinaharap upang ihambing ang katumpakan at kahusayan ng pag-uuri ng DM at mga modelo ng malalim na pag-aaral sa mga tradisyonal na pamamaraan sa parehong mga sample.
Gumamit ang pag-aaral ng 2,657 orthographic na litrato na nakolekta mula sa mga Korean at Japanese na nasa hustong gulang na 15 hanggang 23 taon.Ang mga Korean radiograph ay nahahati sa 900 set ng pagsasanay (19.42 ± 2.65 taon) at 900 panloob na set ng pagsubok (19.52 ± 2.59 taon).Ang set ng pagsasanay ay nakolekta sa isang institusyon (Seoul St. Mary's Hospital), at ang sariling test set ay nakolekta sa dalawang institusyon (Seoul National University Dental Hospital at Yonsei University Dental Hospital).Nakakolekta din kami ng 857 radiograph mula sa isa pang data na nakabatay sa populasyon (Iwate Medical University, Japan) para sa panlabas na pagsubok.Ang mga radiograph ng mga Japanese subject (19.31 ± 2.60 taon) ay napili bilang panlabas na set ng pagsubok.Ang data ay nakolekta nang retrospektibo upang pag-aralan ang mga yugto ng pag-unlad ng ngipin sa mga panoramic radiograph na kinuha sa panahon ng paggamot sa ngipin.Ang lahat ng data na nakolekta ay hindi nagpapakilala maliban sa kasarian, petsa ng kapanganakan at petsa ng radiograph.Ang pamantayan sa pagsasama at pagbubukod ay pareho sa mga naunang nai-publish na pag-aaral 4, 5.Ang aktwal na edad ng sample ay kinakalkula sa pamamagitan ng pagbabawas ng petsa ng kapanganakan mula sa petsa ng pagkuha ng radiograph.Ang sample na grupo ay nahahati sa siyam na pangkat ng edad.Ang mga distribusyon ng edad at kasarian ay ipinapakita sa Talahanayan 3 Ang pag-aaral na ito ay isinagawa alinsunod sa Deklarasyon ng Helsinki at inaprubahan ng Institutional Review Board (IRB) ng Seoul St. Mary's Hospital ng Catholic University of Korea (KC22WISI0328).Dahil sa retrospective na disenyo ng pag-aaral na ito, ang may-kaalamang pahintulot ay hindi maaaring makuha mula sa lahat ng mga pasyente na sumasailalim sa radiographic na pagsusuri para sa mga layuning panterapeutika.Inalis ng Seoul Korea University St. Mary's Hospital (IRB) ang kinakailangan para sa may-kaalamang pahintulot.
Ang mga yugto ng pag-unlad ng pangalawa at pangatlong molar ng bimaxillary ay nasuri ayon sa pamantayan ng Demircan25.Isang ngipin lamang ang napili kung ang parehong uri ng ngipin ay matatagpuan sa kaliwa at kanang bahagi ng bawat panga.Kung ang mga homologous na ngipin sa magkabilang panig ay nasa magkaibang yugto ng pag-unlad, ang ngipin na may mas mababang yugto ng pag-unlad ay pinili upang isaalang-alang ang kawalan ng katiyakan sa tinantyang edad.Isang daang random na piniling radiographs mula sa set ng pagsasanay ang na-iskor ng dalawang may karanasang tagamasid upang subukan ang pagiging maaasahan ng interobserver pagkatapos ng precalibration upang matukoy ang yugto ng maturity ng ngipin.Ang pagiging maaasahan ng intraobserver ay nasuri nang dalawang beses sa tatlong buwang pagitan ng pangunahing tagamasid.
Ang kasarian at yugto ng pag-unlad ng pangalawa at pangatlong molar ng bawat panga sa set ng pagsasanay ay tinantya ng isang pangunahing tagamasid na sinanay na may iba't ibang mga modelo ng DM, at ang aktwal na edad ay itinakda bilang target na halaga.Ang mga modelo ng SLP at MLP, na malawakang ginagamit sa machine learning, ay sinubukan laban sa mga algorithm ng regression.Pinagsasama ng modelo ng DM ang mga linear na function gamit ang mga yugto ng pag-unlad ng apat na ngipin at pinagsasama ang data na ito upang matantya ang edad.Ang SLP ay ang pinakasimpleng neural network at hindi naglalaman ng mga nakatagong layer.Gumagana ang SLP batay sa threshold transmission sa pagitan ng mga node.Ang modelo ng SLP sa regression ay mathematically katulad sa maramihang linear regression.Hindi tulad ng SLP model, ang MLP model ay may maraming nakatagong layer na may nonlinear activation function.Gumamit ang aming mga eksperimento ng isang nakatagong layer na may 20 na mga nakatagong node lamang na may mga nonlinear activation function.Gamitin ang gradient descent bilang paraan ng pag-optimize at ang MAE at RMSE bilang loss function para sanayin ang aming machine learning model.Ang pinakamahusay na nakuha na modelo ng regression ay inilapat sa panloob at panlabas na mga set ng pagsubok at ang edad ng mga ngipin ay tinantya.
Ang isang algorithm ng pag-uuri ay binuo na gumagamit ng maturity ng apat na ngipin sa set ng pagsasanay upang mahulaan kung ang isang sample ay 18 taong gulang o hindi.Upang bumuo ng modelo, nakuha namin ang pitong representasyon ng machine learning algorithm6,43: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBoost, at (7) MLP .Ang LR ay isa sa pinakamalawak na ginagamit na algorithm sa pag-uuri44.Ito ay isang pinangangasiwaang algorithm sa pag-aaral na gumagamit ng regression upang mahulaan ang posibilidad ng data na kabilang sa isang partikular na kategorya mula 0 hanggang 1 at inuuri ang data bilang kabilang sa isang mas malamang na kategorya batay sa posibilidad na ito;pangunahing ginagamit para sa binary classification.Ang KNN ay isa sa pinakasimpleng machine learning algorithm45.Kapag binigyan ng bagong data ng input, hahanapin nito ang k data na malapit sa umiiral na set at pagkatapos ay inuuri ang mga ito sa klase na may pinakamataas na dalas.Nagtakda kami ng 3 para sa bilang ng mga kapitbahay na isinasaalang-alang (k).Ang SVM ay isang algorithm na nagpapalaki ng distansya sa pagitan ng dalawang klase sa pamamagitan ng paggamit ng kernel function upang palawakin ang linear space sa isang non-linear space na tinatawag na fields46.Para sa modelong ito, ginagamit namin ang bias = 1, power = 1, at gamma = 1 bilang mga hyperparameter para sa polynomial kernel.Ang DT ay inilapat sa iba't ibang larangan bilang isang algorithm para sa paghahati ng isang buong set ng data sa ilang mga subgroup sa pamamagitan ng kumakatawan sa mga panuntunan ng desisyon sa isang istraktura ng puno47.Ang modelo ay na-configure na may pinakamababang bilang ng mga tala sa bawat node na 2 at ginagamit ang Gini index bilang isang sukatan ng kalidad.Ang RF ay isang ensemble method na pinagsasama-sama ang maraming DT para mapahusay ang performance gamit ang isang bootstrap aggregation method na bumubuo ng mahinang classifier para sa bawat sample sa pamamagitan ng random na pagguhit ng mga sample ng parehong laki nang maraming beses mula sa orihinal na dataset48.Gumamit kami ng 100 puno, 10 lalim ng puno, 1 minimum na laki ng node, at gini admixture index bilang pamantayan sa paghihiwalay ng node.Ang pag-uuri ng bagong data ay tinutukoy ng mayoryang boto.Ang XGBoost ay isang algorithm na pinagsasama ang mga diskarte sa pagpapalakas gamit ang isang paraan na kumukuha bilang data ng pagsasanay sa error sa pagitan ng aktwal at hinulaang mga halaga ng nakaraang modelo at pinalalaki ang error gamit ang gradients49.Ito ay isang malawakang ginagamit na algorithm dahil sa mahusay na pagganap at kahusayan ng mapagkukunan nito, pati na rin ang mataas na pagiging maaasahan bilang isang overfitting na function ng pagwawasto.Ang modelo ay nilagyan ng 400 suportang gulong.Ang MLP ay isang neural network kung saan ang isa o higit pang perceptron ay bumubuo ng maramihang mga layer na may isa o higit pang mga nakatagong layer sa pagitan ng input at output layer38.Gamit ito, maaari kang magsagawa ng non-linear na pag-uuri kung saan kapag nagdagdag ka ng input layer at nakakuha ng value ng resulta, ang hinulaang halaga ng resulta ay inihahambing sa aktwal na halaga ng resulta at ang error ay pinalaganap pabalik.Gumawa kami ng nakatagong layer na may 20 nakatagong neuron sa bawat layer.Ang bawat modelong binuo namin ay inilapat sa panloob at panlabas na mga hanay upang subukan ang pagganap ng pag-uuri sa pamamagitan ng pagkalkula ng sensitivity, specificity, PPV, NPV, at AUROC.Ang pagiging sensitibo ay tinukoy bilang ang ratio ng isang sample na tinatantiyang 18 taong gulang o mas matanda sa isang sample na tinatayang 18 taong gulang o mas matanda.Ang pagtitiyak ay ang proporsyon ng mga sample na wala pang 18 taong gulang at ang mga tinatayang wala pang 18 taong gulang.
Ang mga yugto ng ngipin na nasuri sa set ng pagsasanay ay na-convert sa mga numerical na yugto para sa pagsusuri sa istatistika.Ang multivariate linear at logistic regression ay isinagawa upang makabuo ng mga predictive na modelo para sa bawat kasarian at makakuha ng mga formula ng regression na maaaring magamit upang matantya ang edad.Ginamit namin ang mga formula na ito upang tantyahin ang edad ng ngipin para sa parehong panloob at panlabas na set ng pagsubok.Ipinapakita sa talahanayan 4 ang regression at classification models na ginamit sa pag-aaral na ito.
Ang pagiging maaasahan ng intra-at interobserver ay kinakalkula gamit ang istatistika ng kappa ni Cohen.Upang subukan ang katumpakan ng DM at tradisyonal na mga modelo ng regression, kinakalkula namin ang MAE at RMSE gamit ang tinantyang at aktwal na edad ng mga internal at external na set ng pagsubok.Ang mga error na ito ay karaniwang ginagamit upang suriin ang katumpakan ng mga hula ng modelo.Kung mas maliit ang error, mas mataas ang katumpakan ng forecast24.Ihambing ang MAE at RMSE ng panloob at panlabas na mga set ng pagsubok na kinakalkula gamit ang DM at tradisyonal na regression.Ang pagganap ng pag-uuri ng 18-taong cutoff sa mga tradisyunal na istatistika ay nasuri gamit ang isang 2 × 2 contingency table.Ang kinakalkula na sensitivity, specificity, PPV, NPV, at AUROC ng test set ay inihambing sa mga sinusukat na halaga ng DM classification model.Ang data ay ipinahayag bilang mean ± standard deviation o numero (%) depende sa mga katangian ng data.Ang dalawang panig na halaga ng P <0.05 ay itinuturing na makabuluhan sa istatistika.Ang lahat ng nakagawiang pagsusuri sa istatistika ay isinagawa gamit ang bersyon ng SAS 9.4 (SAS Institute, Cary, NC).Ang modelo ng DM regression ay ipinatupad sa Python gamit ang Keras50 2.2.4 backend at Tensorflow51 1.8.0 partikular para sa mathematical operations.Ang modelo ng pag-uuri ng DM ay ipinatupad sa Waikato Knowledge Analysis Environment at ang Konstanz Information Miner (KNIME) 4.6.152 na platform ng pagsusuri.
Kinikilala ng mga may-akda na ang data na sumusuporta sa mga konklusyon ng pag-aaral ay matatagpuan sa artikulo at mga pandagdag na materyales.Ang mga dataset na nabuo at/o nasuri sa panahon ng pag-aaral ay makukuha mula sa kaukulang may-akda sa makatwirang kahilingan.
Ritz-Timme, S. et al.Pagtatasa ng edad: state of the art upang matugunan ang mga partikular na pangangailangan ng forensic practice.internasyonalidad.J. Legal na gamot.113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G., at Olze, A. Kasalukuyang status ng forensic age assessment ng mga nabubuhay na paksa para sa mga layuning pang-kriminal na pag-uusig.Forensics.gamot.Patolohiya.1, 239–246 (2005).
Pan, J. et al.Isang binagong paraan para sa pagtatasa ng edad ng ngipin ng mga batang may edad na 5 hanggang 16 na taon sa silangang Tsina.klinikal.Oral survey.25, 3463–3474 (2021).
Lee, SS atbp. Kronolohiya ng pag-unlad ng pangalawa at pangatlong molar sa mga Koreano at ang aplikasyon nito para sa forensic age assessment.internasyonalidad.J. Legal na gamot.124, 659–665 (2010).
Oh, S., Kumagai, A., Kim, SY at Lee, SS Katumpakan ng pagtatantya ng edad at pagtatantya ng 18-taong threshold batay sa maturity ng pangalawa at pangatlong molar sa mga Koreano at Japanese.PLoS ONE 17, e0271247 (2022).
Kim, JY, et al.Ang pagsusuri ng data na nakabatay sa pag-aaral ng machine bago ang operasyon ay maaaring mahulaan ang resulta ng paggamot sa sleep surgery sa mga pasyenteng may OSA.ang agham.Ulat 11, 14911 (2021).
Han, M. et al.Tumpak na pagtatantya ng edad mula sa machine learning na mayroon o walang interbensyon ng tao?internasyonalidad.J. Legal na gamot.136, 821–831 (2022).
Khan, S. at Shaheen, M. Mula sa Data Mining hanggang sa Data Mining.J.Impormasyon.ang agham.https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. at Shaheen, M. WisRule: Ang Unang Cognitive Algorithm para sa Association Rule Mining.J.Impormasyon.ang agham.https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. at Abdullah U. Karm: Tradisyunal na data mining batay sa context-based association rules.kalkulahin.Matt.magpatuloy.68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. at Habib M. Deep learning based semantic similarity detection gamit ang text data.ipaalam.mga teknolohiya.kontrol.https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z., at Shahin, M. Isang sistema para sa pagkilala sa aktibidad sa mga sports video.multimedia.Mga Application sa Tool https://doi.org/10.1007/s11042-021-10519-6 (2021).
Halabi, SS et al.RSNA Machine Learning Challenge sa Pediatric Bone Age.Radiology 290, 498–503 (2019).
Li, Y. et al.Forensic na pagtatantya ng edad mula sa pelvic X-ray gamit ang malalim na pag-aaral.EURO.radiation.29, 2322–2329 (2019).
Guo, YC, et al.Tumpak na pag-uuri ng edad gamit ang mga manu-manong pamamaraan at malalim na convolutional neural network mula sa orthographic projection na mga imahe.internasyonalidad.J. Legal na gamot.135, 1589–1597 (2021).
Alabama Dalora et al.Ang pagtatantya ng edad ng buto gamit ang iba't ibang paraan ng pag-aaral ng makina: isang sistematikong pagsusuri sa panitikan at meta-analysis.PLoS ONE 14, e0220242 (2019).
Du, H., Li, G., Cheng, K., at Yang, J. Ang pagtatantya ng edad na partikular sa populasyon ng mga African American at Chinese batay sa dami ng pulp chamber ng mga unang molar gamit ang cone-beam computed tomography.internasyonalidad.J. Legal na gamot.136, 811–819 (2022).
Kim S., Lee YH, Noh YK, Park FK at Oh KS Pagtukoy sa mga pangkat ng edad ng mga nabubuhay na tao gamit ang mga larawang nakabatay sa artificial intelligence ng mga unang molar.ang agham.Ulat 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N., at Urschler, M. Awtomatikong pagtatantya ng edad at pag-uuri ng edad ng karamihan mula sa multivariate na data ng MRI.IEEE J. Biomed.Mga Alerto sa Kalusugan.23, 1392–1403 (2019).
Cheng, Q., Ge, Z., Du, H. at Li, G. Pagtatantya ng edad batay sa 3D pulp chamber segmentation ng mga unang molar mula sa cone beam computed tomography sa pamamagitan ng pagsasama ng malalim na pag-aaral at mga set ng antas.internasyonalidad.J. Legal na gamot.135, 365–373 (2021).
Wu, WT, et al.Pagmimina ng data sa klinikal na malaking data: karaniwang mga database, hakbang, at mga modelo ng pamamaraan.Mundo.gamot.mapagkukunan.8, 44 (2021).
Yang, J. et al.Panimula sa Mga Medikal na Database at Data Mining Technologies sa Big Data Era.J. Masugid.Pangunahing gamot.13, 57–69 (2020).
Shen, S. et al.Paraan ng Camerer para sa pagtantya ng edad ng ngipin gamit ang machine learning.BMC Oral Health 21, 641 (2021).
Galliburg A. et al.Paghahambing ng iba't ibang paraan ng machine learning para sa paghula ng edad ng ngipin gamit ang Demirdjian staging method.internasyonalidad.J. Legal na gamot.135, 665–675 (2021).
Demirdjian, A., Goldstein, H. at Tanner, JM Isang bagong sistema para sa pagtatasa ng edad ng ngipin.nguso.biology.45, 211–227 (1973).
Landis, JR, at Koch, GG Mga sukat ng kasunduan ng tagamasid sa kategoryang data.Biometrics 33, 159–174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK at Choi HK.Textural, morphological at statistical analysis ng two-dimensional magnetic resonance imaging gamit ang mga pamamaraan ng artipisyal na katalinuhan para sa pagkita ng kaibahan ng mga pangunahing tumor sa utak.Impormasyon sa kalusugan.mapagkukunan.https://doi.org/10.4258/hir.2022.28.1.46 (2022).


Oras ng post: Ene-04-2024