Co je strojové vidění a jak důležité je pro samořídící auta?

Photo of author

By etechblogcz

Základní body

  • Autonomní vozidla využívají technologii strojového vidění pro vnímání a interpretaci okolního prostředí. To jim umožňuje rozpoznávat objekty, identifikovat dopravní značení a navigovat v provozu.
  • Strojové vidění v samořídících autech se skládá z kamerového systému, výpočetní techniky na okraji sítě (edge computing) a algoritmů umělé inteligence (AI). Tyto komponenty spolupracují na sběru vizuálních dat, jejich okamžitém zpracování a na rozpoznávání vzorů a objektů.
  • Strojové vidění má zásadní význam pro dosažení plné autonomie samořídících vozidel. Umožňuje klasifikaci objektů, detekci jízdních pruhů a semaforů, rozpoznávání dopravních značek a sledování provozu. Vývoj autonomních vozidel je úzce spojen s pokroky v AI, edge computingu a technologii kamer.

Samořídící automobily jsou předmětem velkého zájmu. I když zatím nemáme k dispozici plně autonomní vozidla, existují automobily vybavené pokročilými asistenčními systémy řidiče (ADAS), které jsou schopny automaticky řídit, měnit jízdní pruhy, parkovat a udržovat rychlost v závislosti na provozu.

Samořídící automobily využívají pro ADAS různé senzory. Strojové vidění je klíčové pro detekci, identifikaci a výpočet vzdálenosti objektů a celkového okolí. Bez strojového vidění by samořídící automobily s tempomatem a autopilotem byly velmi nepravděpodobné.

Co je strojové vidění?

Strojové vidění je technologie, která umožňuje strojům „vidět“ a rozpoznávat objekty v jejich okolí. Je to specifická oblast počítačového vidění, která se zaměřuje na průmyslové aplikace detekce objektů v autonomních strojích, jako jsou roboti a vozidla.

Moderní strojové vidění využívá algoritmy hlubokého učení umělé inteligence, například konvoluční neuronové sítě (CNN). Tyto sítě vytvářejí robustní a univerzální modely, které dokáží přesně rozpoznávat objekty v různých podmínkách. Díky tomu se strojové vidění uplatňuje v mnoha oblastech, kde je vyžadována vysoká spolehlivost, jako je výroba, zemědělství, robotika a automobilový průmysl.

Jak funguje strojové vidění v samořídících autech?

Strojové vidění v samořídících autech se obvykle skládá ze tří částí: kamerový systém, zpracování (edge computing) a umělá inteligence. Tento technologický celek umožňuje autonomnímu vozidlu „vidět“, „přemýšlet“ a identifikovat značky a překážky během jízdy. Podívejme se podrobněji na každou z těchto částí, abychom pochopili, jak tyto technologie spolupracují a vytvářejí strojové vidění samořídícího auta.

Kamerový systém

Strojové vidění se opírá o kamerové systémy, které sbírají vizuální informace o prostředí. Samořídící automobily používají několik kamer umístěných po celém obvodu vozidla, aby získaly co nejvíce vizuálních dat.

V kamerách pro strojové vidění se nejčastěji používají dva typy senzorů: komplementární metal-oxid-polovodiče (CMOS) a zařízení s nábojovou vazbou (CCD). Pro samořídící auta je CMOS často preferován díky své vysoké rychlosti čtení, výkonné palubní elektronice a schopnosti paralelního zpracování. To z něj dělá rychlejší snímač, i když může být náchylný k šumu nebo artefaktům. Problémy s horšími světelnými podmínkami se řeší různými režimy osvětlení, digitálním nočním viděním a filtry.

V samořídících autech jsou kamery instalovány v určitých vzdálenostech od sebe, aby se vytvořilo stereoskopické vidění. Stereoskopické vidění je schopnost kombinovat dva nebo více vizuálních vstupů a tím vytvářet pocit hloubky nebo trojrozměrnosti objektů a okolí. To umožňuje autům pomocí triangulace vypočítat přibližnou vzdálenost mezi objektem a automobilem.

Stejně jako lidé, kteří mají dvě oči, i auta profitují ze stereoskopického vidění. Zkuste si to sami: zavřete jedno oko a vyberte malý předmět na stole. Položte ruku vedle předmětu, špička předmětu by měla být alespoň dva palce od vaší dlaně. Zkuste se na chvíli zastavit a uvidíte, jak si nejste jisti svým přiblížením. Nyní zkuste otevřít obě oči a uvidíte, jak je váš smysl pro hloubku mnohem lepší.

Edge computing

Zatímco kamerový systém samořídícího automobilu shromažďuje data, palubní počítač (procesor edge) zpracovává všechny vstupy v reálném čase. Díky tomu systém okamžitě aktualizuje stav okolního prostředí. Ačkoli by se u typických úloh strojového vidění dalo ušetřit s využitím cloud computingu, u samořídících aut existuje příliš velké riziko spojené s připojením do cloudu. I když by se tak mohl ušetřit čas při zpracování dat.

Použití edge počítače pro zpracování vstupních dat eliminuje problémy s latencí a zajišťuje, že data jsou přijímána, zpracovávána a komunikována v reálném čase. Počítače edge pro samořídící automobily používají specializované procesory s integrovanými grafickými procesory AI, jako jsou NVIDIA Tensor Core a CUDA Core.

Algoritmy AI

Algoritmy jsou vždy klíčovou součástí strojového vidění. Algoritmus umožňuje počítači rozpoznávat všechny vzory, tvary a barvy poskytnuté kamerovým systémem. Použití umělé inteligence namísto tradičních algoritmů strojového vidění významně zvyšuje schopnost samořídícího automobilu spolehlivě rozpoznávat objekty, dopravní značky, vodorovné dopravní značení a semafory. Pro trénink samořídících aut se používá mnoho algoritmů umělé inteligence. Mezi nejoblíbenější patří:

  • YOLO (You Only Look Once): Algoritmus pro detekci objektů v reálném čase, který identifikuje a sleduje objekty v zorném poli auta.
  • SIFT (Scale-Invariant Feature Transform): Používá se k extrakci prvků a pomáhá autu rozpoznávat charakteristické orientační body a objekty v jeho okolí.
  • Histogram orientovaných gradientů (HOG): Používá se pro rozpoznávání objektů a zaměřuje se na extrahování lokálních vzorů a přechodů z obrázků.
  • TextonBoost: Algoritmus, který pomáhá s rozpoznáváním objektů analýzou textur v prostředí.
  • AdaBoost: Používá se pro klasifikaci dat. Kombinuje několik slabých klasifikátorů, aby učinil silná rozhodnutí o objektech a překážkách v dráze vozidla.

Význam strojového vidění v samořídících autech

Obrázek: Automobile Italia/Flickr

Strojové vidění je hlavním způsobem, jak samořídící auto vnímá a interpretuje své okolí. Bez strojového vidění by se samořídící automobily vrátily zpět na úroveň 1 na stupnici autonomie vozidel a nikdy by nemohly dosáhnout plné autonomie.

Díky strojovému vidění jsou samořídící automobily schopny klasifikovat objekty, detekovat jízdní pruhy a signály, rozpoznávat dopravní značky a sledovat provoz.

Ačkoli mnoho samořídících vozidel používá různé senzory, jako je LIDAR, RADAR a SONAR, všechny se do značné míry spoléhají na strojové vidění při sledování okolí, identifikaci objektů a pochopení významu značek a semaforů na silnici. Všechny tyto další senzory slouží pouze k rozšíření schopností strojového vidění a ke zvýšení bezpečnosti lidí, zvířat a majetku.

To znamená, že strojové vidění může fungovat nezávisle bez pomoci dalších senzorů a může poskytovat funkce autopilota. Například nejnovější samořídící automobily Tesla se vzdaly radaru a nyní se pro svůj systém Autopilot spoléhají výhradně na strojové vidění.

I když to nijak nesnižuje užitečnost ostatních senzorových technologií, ukazuje to důležitost a sílu strojového vidění v samořídících autech.

Budoucnost strojového vidění v autonomních vozidlech

Strojové vidění je základem samořídících automobilů. Díky strojovému vidění mohou auta „vidět“ a vnímat okolí podobně jako lidé. I když problémy stále přetrvávají, nelze podceňovat výhody strojového vidění z hlediska bezpečnosti a navigace. V budoucnu autonomních vozidel bude jakýkoli další pokrok v oblasti umělé inteligence, edge computingu a/nebo technologie kamer zaručeně činit samořídící automobily schopnější a posune je na vyšší úroveň automatizace.