Во „Minority Report“ од 2002 година, научно-фантастичен блокбастер, Том Круз ги користеше рацете во ракавици за да управува со проѕирен компјутерски екран со големина на ѕид. Две децении подоцна, луѓето сè уште комуницираат со компјутери користејќи глушец, тастатура, далечински управувач или мал екран на допир.
Добар баланс
Компјутерското управување засновано на гестови е сè уште во зародиш поради голем број ограничувања, од сложеност на процесот и бавноста на системот до неточности и мал број препознатливи гестови.
За да се справат со овие проблеми, кинеските истражувачи од Универзитетот Сун Јат-сен развија нов алгоритам за препознавање на движењата на рацете што постигнува добар баланс помеѓу сложеноста, точноста и применливоста.
Нивната работа е објаснета во Journal of Electronic Imaging.
Традиционалните едноставни алгоритми имаат тенденција да страдаат од ниски стапки на препознавање бидејќи не можат да се справат со различни типови на раце. Овој алгоритам го заобиколува овој проблем бидејќи е прилагодлив на различни типови раце.
Три мерења
Алгоритмот прво се обидува да го класифицира типот на рака на корисникот како тенка, нормална или широка врз основа на три мерења кои ги земаат предвид односите помеѓу ширината на дланката, должината на дланката и должината на прстот. Ако оваа класификација е успешна, следните чекори во процесот на препознавање гестови со рака го споредуваат само влезниот гест со складирани примероци од ист тип на рака.
Алгоритмот за препознавање може да идентификува девет можни гестови, така што споредувањето на сите карактеристики на влезниот гест со складираните примероци за сите можни гестови би одземало време. За да го решат овој проблем, кинеските истражувачи користеле и „карактеристики за кратенки“ кои го намалуваат бројот на гестови на кандидатите на три.
Голема точност
Претходното препознавање на гестот го намалува бројот на потребните пресметки и хардверски ресурси и ја подобрува брзината на препознавање без да се загрози точноста, велат истражувачите кои го тестирале алгоритмот на комерцијален компјутерски процесор и FPGA платформа користејќи USB камера.
Алгоритмот ги препозна движењата на рацете во реално време со прецизност од повеќе од 93%, дури и кога сликите од влезните гестови се ротирани или намалени.
Идната работа ќе се фокусира на подобрување на перформансите на алгоритмот во услови на слаба осветленост и зголемување на бројот на можни гестови.