LiDAR v iPhonu umí vidět za roh. Vědci z MIT ukázali, jak sledovat objekty mimo zorné pole kamery
Výzkumníci z MIT Media Lab publikovali metodu, která z levného LiDAR senzoru třídy iPhone vytěží polohu, pohyb a hrubý tvar objektů za rohem.
Obsah článku
Představte si, že stojíte v chodbě a váš telefon vám řekne, že za rohem se někdo pohybuje, aniž by ho kamera viděla. Přesně to v laboratorních podmínkách předvedl tým kolem Siddhartha Somasundarama z MIT. Jejich práce, recenzovaná a publikovaná v Nature 20. května 2026, ukazuje, že spotřebitelský LiDAR dokáže zachytit extrémně slabé vícenásobné odrazy světla od objektů mimo přímý výhled. A že nové algoritmy z nich dovedou vyčíst mnoho. Nejde o fotografii skryté scény. Jde o něco, co ještě před pár lety vyžadovalo laboratorní sestavu za desítky tisíc dolarů.
Co znamená „vidět za roh“
Princip se jmenuje NLOS imaging, tedy zobrazování mimo přímou viditelnost. Senzor vyšle infračervené světlo na viditelnou plochu typicky stěnu. Část fotonů se od ní odrazí, doputuje ke skrytému objektu za rohem, odrazí se od něj a vrátí se zpět přes stěnu k senzoru. Signál je po dvou extra odrazech extrémně slabý a zašuměný. Právě tady přichází klíčová inovace MIT.
Tým vyvinul model nazvaný motion-induced aperture sampling , který sjednocuje tři proměnné: tvar skrytého objektu, jeho pohyb a pohyb samotného senzoru. Místo jednoho šumového algoritmu skládá desítky měření v čase, podobně jako burst fotografie na mobilu, jen s tím rozdílem, že každé nové postavení senzoru přidá další „pohled“ na tentýž slabý signál. je odhad polohy, směru pohybu a hrubé geometrie objektu. Ne ostrý snímek. Spíš rozmazaný obrys, ale v reálném čase, při 30 jasně za sekundu.
Proč je iPhone v titulku oprávněně
Somasundaram a jeho kolegové mluví o „smartphone-grade“ a „consumer LiDAR“ a zmiňují Apple iPhone Pro jako referenční platformu. LiDAR Scanner najdete ve všech Pro modely iPhone od roku 2020, od iPhone 12 Pro až po aktuální 16 Pro Max, a v iPadech Pro od stejného roku.
Jenže háček: dnešní iOS z toho nedělá uživatelskou funkci. Apple zpřístupňuje vývojářům zpracovaná hloubková data přes ARKit (sceneDepth, perspektivně korigované hloubkové mapy navázané na viditelnou scénu). Ne syrové časově rozlišené histogramy vícenásobných odrazů, které MPO potřebuje. Somasundaram to říká otevřeně: aby se podobná schopnost dostala na smartphony, musely by firmy zpřístupnit surová data ze senzoru. Proč je Apple neotevírá, veřejně nikdy nevysvětlil.
Veřejný kód na GitHubu existuje, ale aktuální demo míří na externí ST senzor VL53L8CH za zhruba 1 150 Kč (50 dolarů), ne na appku pro iPhone. Kdo chce experimentovat, potřebuje vývojářský kit, Python skripty a trochu trpělivosti.
Od laboratoře za statisíce k senzoru za padesát dolarů
Právě tady leží skutečný průlom. NLOS zobrazování není nové; MIT na něm pracuje od roku 2009. Klasická demonstrace z roku 2012, publikovaná v Nature Communications, dosahovala submilimetrové hloubkové přesnosti v malém skrytém objemu 40 × 40 × 40 cm. Jenže vyžadovala ultrarychlý pulzní laser, časově rozlišený detektor a náročnou kalibraci. Pozdější práce z roku 2018 v Nature přidaly konfokální skenování viditelné plochy, opět na drahém, specializovaném hardwaru.
Srovnání mluv jasně:
- Starší NLOS systémy: pulzní laser, SPAD detektor, laboratorní měření, cena v řádu desítek tisíc dolarů, submilimetrová přesnost ve velké kalibraci.
- MIT 2026: běžně dostupný LiDAR pod 100 dolarů, žádný dodatečný setup, hrubší výstup (obrys, poloha, pohyb), ale charakter „zapoj a používej“ a potenciál pro masové nasazení.
Přesnost klesla. Dostupnost vyletěla o několik řádů nahoru. A to je v technologii často důležitější.
Co to ještě neumí, a kam to míří
Autoři sami označují svou práci za prototyp v rané fázi výzkumu. Mezi otevřené problémy patří spolehlivý provoz na delší vzdálenosti (řádově metry, ne desítky metrů), robustnost v nepředvídatelném prostředí a výpočet v reálném čase přímo na mobilním hardwaru bez externího počítače. Přesný maximální dosah „za roh“ v metrech v publikacích chybí, a to je poctivé, protože závisí na odrazivosti povrchů, okolním osvětlení i geometrii scény.
Z hlediska aplikací projektový web MIT zmiňuje indoor lokalizaci, rozšířenou realitu s trackingem mimo zorné pole, ale i pátrání a záchranu: detekci lidí za dveřmi nebo v sutinách před vstupem záchranářů. Podle nás právě záchranářství a robotika dávají v nejbližších letech větší smysl než spotřebitelská appka. Telefon v kapse hasiče, který odhadne, jestli je za zavřenými dveřmi člověk, nepotřebuje fotografickou přesnost. Stačí mu vědět, že tam někdo je.
A co soukromí?
Pokud vás napadlo, jestli vás tímhle někdo může sledovat bez vašeho vědomí, zatím ne, není to reálná hrozba. Dnešní prototyp je na komerční zneužití příliš raný. Ale směr je čitelný: tichá inference přítomnosti a pohybu lidí za překážkou, bez jejich viditelného záběru. Až se zlepší dosah, výpočetní výkon a přístup k datům, regulátoři budou muset řešit otázku, co všechno smí senzor v telefonu „vidět“ nad rámec toho, co ukazuje displej.
Hardware na NLOS zobrazování už dnes nosí v kapse několik milionů lidí. Chybí software, přístup k datům a pár generací vylepšení. Žádná z těch překážek není nepřekonatelná.