Trwa budowa polskiej bazy scenariuszy drogowych. Posłuży testowaniu pojazdów autonomicznych
Na stronie internetowej projektu darts-database.com znajduje się mapa z wybranymi lokalizacjami (będzie ich docelowo ponad 100). Każde z tych miejsc –zarówno infrastruktura, jak i znaki drogowe oraz zachowania innych kierowców – zostanie nagrane kilkukrotnie, w różnych warunkach: za dnia i w nocy oraz w różnych porach roku. Jak podkreśla ekspertka, wskazane na mapie lokalizacje to miejsca problematyczne dla kierowców, w których zdarza się najwięcej wypadków, ale też charakterystyczne dla polskich regionów.Projekt DARTS-PL ma na celu budowę polskiej bazy danych scenariuszy drogowych do testowania pojazdów zautomatyzowanych i pojazdów wysoce zautomatyzowanych, to znaczy pojazdów autonomicznych. Naszym celem jest nagranie 840 scenariuszy, które będą odzwierciedlały warunki drogowe panujące w Polsce, na polskich drogach – mówi agencji Newseria Aleksandra Rodak, starsza specjalistka badawczo-techniczna w Instytucie Transportu Samochodowego. Zależy nam na tym, żeby to było odzwierciedlenie polskich warunków, ponieważ w Polsce mamy trochę inną infrastrukturę, inne znaki drogowe, zachowanie kierowców jest też zgoła inne niż w pozostałych krajach na świecie, dlatego bardzo nam zależało, żeby taka polska narodowa baza danych powstała. Jesteśmy na etapie, w którym możemy już wyjeżdżać na drogi, możemy zacząć nagrywać.
Adnotacja to technika rozpoznawania i oznaczania etykietą każdego obiektu w zbiorze danych, tj. klatce nagrania lub ramce. Dane te są kluczowe dla szkolenia modeli AI w celu wykrywania obiektów, rozumienia otoczenia drogowego i podejmowania decyzji dotyczących jazdy w czasie rzeczywistym. Zautomatyzowane narzędzia do adnotacji, oparte na algorytmach uczenia maszynowego, usprawniają ten proces, automatycznie identyfikując i etykietując poszczególne typy obiektów: pieszych, pojazdy, znaki drogowe czy oznakowania pasów ruchu. Zautomatyzowana adnotacja nie tylko przyspiesza przetwarzanie danych, ale także poprawia dokładność i skalowalność.Zbudowaliśmy przy pomocy naszych partnerów technologicznych pojazd badawczy, którym wyjeżdżamy na drogi i będziemy ogrywać dane miejsca. Następnie Politechnika Warszawska, partner, konsorcjant projektu DARTS-PL, będzie odpowiedzialna za nałożenie adnotacji, małych prostokątów informujących o tym, jakiego typu obiekt znajduje się na danym nagraniu, czy jest to osoba piesza, czy jest to samochód, czy budynek. Głównie rzeczy, które znajdują się w ruchu, będą oznaczane takimi adnotacjami – wskazuje Aleksandra Rodak.
Mobilna platforma pomiarowa DARTS-PL wykorzystuje zaawansowane instrumentarium sensoryczne, w tym m.in. cztery LiDAR-y, siedem kamer, które zapewniają pokrycie 360°, sześć radarów czy kamerę termowizyjną. Stworzona na podstawie tych pomiarów baza obejmie 840 scenariuszy i planowane 168 tysięcy klatek danych, 15 typów uczestników ruchu (w tym pieszych, rowerzystów czy maszyn rolniczych), ponad 100 różnych znaków drogowych, 27 zdarzeń specjalnych, a także różnorodną infrastrukturę (np. przejazdy kolejowe i wszystkie klasy dróg).
Według zapowiedzi twórców projektu scenariusze drogowe będą szeroko dostępne – zarówno do użytku naukowego, jak i komercyjnego.Pojazdy autonomiczne opierają się na algorytmach sztucznej inteligencji, to znaczy algorytmach uczenia maszynowego. Żeby móc poprawnie zaprojektować algorytm sterowania, potrzebujemy danych uczących – wskazuje ekspertka ITS. Testowanie jest bardzo istotne z uwagi na to, że wpływa na jakość, na dokładność sterowania pojazdu autonomicznego w przyszłości, na jego zachowanie i bezpieczeństwo. Jeżeli algorytm sterowania będzie dobrze nauczony, dobra baza będzie wgrana jako baza ucząca, zawarte w niej adnotacje również będą wysokiej jakości i będą poprawne, to samochód będzie odpowiednio rozpoznawał wszystkich uczestników ruchu drogowego i będzie potrafił się zachować odpowiednio do warunków
Jak zaznacza ITS, algorytmy AI wymagają ogromnych ilości wysokiej jakości danych treningowych. Choć dostępnych jest około 200 publicznych baz danych dla pojazdów autonomicznych, tylko 90 z nich ma zastosowanie w nauce sterowania AV. Poza tym wiele z nich wykorzystuje ograniczoną liczbę sensorów lub cechuje się niską jakością danych. Przykładowo algorytmy trenowane na danych z USA mogą z kolei działać niepoprawnie w Europie z powodu odmiennej charakterystyki ruchu i infrastruktury.Liczymy na to, że osoby projektujące algorytmy sterowania pojazdów autonomicznych będą korzystały z naszej bazy i na jej podstawie trenowały swoje algorytmy, żeby pojazd, który finalnie znajdzie się na polskich drogach, był w stanie zareagować i odnaleźć się w polskich warunkach drogowych – podkreśla Aleksandra Rodak.
Na świecie jest około 200 baz danych tego typu. Niestety nie wszystkie są otwarte do użytku komercyjnego, nie wszystkie są dostępne również dla ośrodków badawczych, część jest pozamykana wyłącznie na potrzeby danej firmy, danego dewelopera systemu. My będziemy naszą bazę udostępniać non-profit. Każdy, kto się do nas zgłosi, będzie mógł ją otrzymać i przetestować. Więc wychodzimy naprzeciw klientowi i liczymy na to, że również ośrodki naukowe czy usługodawcy z innych krajów świata będą się do nas zgłaszać – wskazuje starsza specjalistka badawczo-techniczna w Instytucie Transportu Samochodowego.