A BME IIT Orvosinformatikai Laboratóriuma a Heim Pál Gyermekkórházzal együttműködve 2007 közepén kutatási projektet indított egészséges és túlsúlyos kiskorú populáció paramétereinek biostatisztikai vizsgálatára, különös tekintettel az elhízás jelentette kockázat elemzésére. A vizsgált paraméterek antropometriai mutatókból (csípő- derék- és karkörfogat ), testösszetételi adatokból (InBody 3.0 multifrekvenciás impedancia-analizátorral mérve) és különféle laboreredményekből tevődnek össze. Célunk olyan noninvazív vizsgálati rendszer kidolgozása volt, amellyel a populációból megjósolható a veszélyeztetettek csoportja. Az eltelt időben 4 budapesti iskola összesen 114, 12-16 év közötti diákja került lemérésre (83 fiú, 31 lány). Fenti adatbázist a Heim Pál Kórház beteganyagából vett 81 (44 fiú, 37 lány) elhízás miatt gondozott páciens adataival egészítettük ki. A felépített adatbázist biostatisztikai elemzéseknek vetettük alá. Az elvégzett vizsgálatok hangsúlyos eleme volt az obes és az egészséges populáció laboreredményei közti különbségek szisztematikus, statisztikailag is jól megalapozott és teljesen szabatos vizsgálata. Ennek körében egyrészt megmutattuk, hogy a legtöbb laborváltozó vagy normális eloszlást követ (legalábbis csoportokon belül), vagy logaritmikus transzformációval normalizálható, másrészt igazoltuk a szóráshomogenitás teljesülését. Ezek alapján foglalkoztunk a státusz (obes/egészséges) szerinti csoportok közti különbségek operacionalizálási lehetőségeivel, és a választott (egyváltozós) értelmezés szerinti szignifikáns különbségeket fel is tártuk. A kis mintaszámra tekintettel külön is foglalkoztunk a kismintás vizsgálatok során felmerülő módszertani problémákkal és azok kezelési lehetőségeivel. Demonstráltuk, hogy a kapott adatbázis nem csak klasszikus statisztikai eszközökkel vizsgálható, hanem a gépi tanulás modern eszközei is alkalmazhatóak rajta. Példaként a döntési fák alkalmazását mutattuk be, részletesen is indokolva e felügyelt tanulóeljárás kiválasztását a feladatra.