Tartu Ülikooli Kehalise Erksuse Kuva Andmestiku (KEKA) koostamine

Development of the University of Tartu Physical Activity Display dataset (UTPAD)

Mida me teeme?

Koostame masinõppe andmestikku, mille abil saaks välja töötada tehisintellekte, mis suudaksid videot analüüsides hinnata kaamera vaateväljas toimuva kehalise aktiivsuse intensiivsust.

Milleks me seda teeme?

Tänapäeval on madal kehaline aktiivsus saanud kriitiliseks rahvatervise probleemiks, seega on eriti tähtis uurida just laste kehalist aktiivsust (lapseeas kujunevad liikumisharjumused võivad mõjutada terviseseisundeid kogu elu jooksul). Selle andmestiku eesmärgiks on luua nutisensor, mille abil saaks hinnata kehalist aktiivsust koolis ilma õpilasi tülitamata ning teha seda privaatsust säilitades. Kui tehisintellekt suudab videosignaalist tuletada vaatevälja jäävate õpilaste kehalise aktiivsuse tasemed, ei ole vaja inimestel neid kaadreid näha – nõnda saab analüüsida visuaalset informatsiooni ilma kellegi privaatsust ohustamata (eeldusel, et nutisensor on ehitatud selliselt, et inimesel ei olegi võimalik sealt kaadreid kätte saada).

Kuidas me seda teeme?

Selleks, et saavutada privaatsust säilitav nutisensor, on vaja esialgu koguda isikuandmeid (laste näod) sisaldav masinõppe treeningandmestik. Kogume mitmemodaalse andmestiku, kus video 7-14 aastastest lastest on sünkroniseeritud nende kantavate aktseleromeetrite signaalidega. Käsitledes aktseleromeetri näitu masinõppe märgendina, püüame luua tehisnärvivõrgu, mis tabaks video pikslites erinevatele kehalise aktiivsuse tasemetele viitavaid mustreid (milline näeb välja madal, mõõdukas ja intensiivne kehaline aktiivsus ja kuidas neid eristada?).

Kuna see on uudne masinõppe ülesanne, kogume andmestiku selliselt, et see oleks avatud juurdepääsuga avaldatav. Sedasi saaksid töömahukat andmestikku kasutada kõik teadlased ja tudengid üle maailma ning võrrelda oma masinõppe lähenemise tulemusi teistega samadel alustel (võrdlusanalüüsi andmestik). Selline vaba rahvusvahelise arendustöö võimaldaks jõuda täpse ja ökonoomse tehisnärvivõrguni kiiremini, et seda rakendada kehalise aktiivsuse mõõtmiseks koolides.

Kavandatav masinõppe andmestik ja nutisensor on täpselt ära kirjeldatud järgmises avatud juurdepääsuga artiklis:

Hõrak, H. (2019). Computer Vision-Based Unobtrusive Physical Activity Monitoring in School by Room-Level Physical Activity Estimation: A Method Proposition. Information, 10(9), 269. https://www.mdpi.com/2078-2489/10/9/269

Privaatsus

Kuna soovime andmestiku avaldada ning tegemist on videoga, kus on näha laste näod (võimaldab isikute tuvastamist), on siin aspekte, millega andmestikus osalevad lapsed ja nende vanemad peaksid arvestama:

  • Euroopa Liidu isikuandmete kaitse üldmäärus (GDPR) annab eurooplastele „õiguse olla unustatud“. See tähendab, et kui lapse seaduslik esindaja on andnud informeeritud nõusoleku andmete kogumiseks ja säilitamiseks, peab temal (või lapsel endal teovõimeliseks saades) olema igal hetkel võimalus nõusolek tagasi võtta ning nõuda oma andmete kustutamist. Sellisel juhul saame garanteerida andmete kustutamise ainult Tartu Ülikooli andmekogust.
  • GDPR kohustab isikuandmete kogujal määrata andmete säilitamise periood. Kuna see andmestik ei ole ühekordseks kasutamiseks ning on muuseas kasutatav ka õppevahendina, siis me ei saa määrata andmete säilitamise lõppkuupäeva, kuna andmestiku eesmärgi täitumine ei ole selgesti piiritletav.

Kui teie laps soovib sellesse andmestikku panustada või kui teil on muresid või küsimusi, palun pöörduge peamise andmete koguja, Hans Hõraku poole (hans.horak@ut.ee).