l a b . . ๐Ÿซง/๋…ผ๋ฌธ review

[UrbanScene3D ๋…ผ๋ฌธ๋ฆฌ๋ทฐ] Capturing, Reconstructing, and Simulating: the UrbanScene3D Dataset

H J 2023. 1. 17. 15:21
 

VCC

 

vcc.tech

๋„์‹œํ™˜๊ฒฝ 3D ๋ฐ์ดํ„ฐ์…‹์ธ UrbanScene3D์˜ ๋…ผ๋ฌธ์„ ์ฝ์–ด๋ดค๋‹ค!

๋ช‡๋‹ฌ ์ „์— ์ •๋ฆฌํ•ด๋’€๋Š”๋ฐ ์ด์ œ์•ผ ์˜ฌ๋ฆฌ๋Š” ๋‚˜ .. 

์ฉ

 

์ผ๋‹จ ์šฐ๋ฆฌ UrbanScene3D๋Š”์š”~?

์ž…๋‹ˆ๋‹ค


0. Abstract

UrbanScene3D : urban scene ์ธ์‹ ๋ฐ ์žฌ๊ตฌ์„ฑ์„ ์œ„ํ•œ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ ํ”Œ๋žซํผ

 

๋Œ€๊ทœ๋ชจ ์‹ค์ œ ๋„์‹œ ์ง€์—ญ๊ณผ ํ•ฉ์„ฑ ๋„์‹œ๋ฅผ ํฌํ•จํ•œ 16๊ฐœ scene์„ ํฌํ•จํ•˜๋Š” 128k ์ด์ƒ์˜ ๊ณ ํ•ด์ƒ๋„ ์ด๋ฏธ์ง€๊ฐ€ ํฌํ•จ

 

๊ณ ์ •๋ฐ€ LiDAR ์Šค์บ”๊ณผ ์„œ๋กœ ๋‹ค๋ฅธ ๊ด€์ฐฐ ํŒจํ„ด์„ ๊ฐ€์ง„ ์ˆ˜๋ฐฑ ๊ฐœ์˜ ์ด๋ฏธ์ง€ ์„ธํŠธ๋„ ํฌํ•จ

→ ํ•ญ๊ณต ๊ฒฝ๋กœ ๊ณ„ํš ๋ฐ 3D ์žฌ๊ตฌ์„ฑ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์„ค๊ณ„ํ•˜๊ณ  ํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ๋Š” ํฌ๊ด„์ ์ธ ๋ฒค์น˜๋งˆํฌ๋ฅผ ์ œ๊ณต

 

๊ฐ ๊ฑด๋ฌผ์— ๋Œ€ํ•ด ์ˆ˜๋™์œผ๋กœ ์ฃผ์„์ด ๋‹ฌ๋ฆฐ ๊ณ ์œ ํ•œ ์ธ์Šคํ„ด์Šค ๋ ˆ์ด๋ธ”๊ณผ ํ•จ๊ป˜ Unreal Engine ๋ฐ Airsim ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์— ๊ตฌ์ถ•๋œ ๋ฐ์ดํ„ฐ ์„ธํŠธ

→ 2D ๊นŠ์ด ๋งต, 2D/3D ๊ฒฝ๊ณ„ ์ƒ์ž ๋ฐ 3D ํฌ์ธํŠธ ํด๋ผ์šฐ๋“œ/๋ฉ”์‰ฌ ๋ถ„ํ•  ๋“ฑ๊ณผ ๊ฐ™์€ ๋ชจ๋“  ์ข…๋ฅ˜์˜ ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑ

 

๋ฌผ๋ฆฌ์  ์—”์ง„๊ณผ ์กฐ๋ช… ์‹œ์Šคํ…œ์„ ๊ฐ–์ถ˜ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ๋Š” ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•  ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ํ–ฅํ›„ ์—ฐ๊ตฌ๋ฅผ ์œ„ํ•ด ์ œ์•ˆ๋œ ๋„์‹œ ํ™˜๊ฒฝ์—์„œ ์ž๋™์ฐจ๋‚˜ ๋“œ๋ก ์„ ์‹œ๋ฎฌ๋ ˆ์ด์…˜


1. Introduction

๋ฐ์ดํ„ฐ ์ฆ๊ฐ€ → ๊ด€๋ จ ์—ฐ๊ตฌ ๋น ๋ฅด๊ฒŒ ์ฆ๊ฐ€

  • ์‹ค๋‚ด scene : ์ถฉ๋ถ„ํ•œ ๋ฐ์ดํ„ฐ + ์‹ค์‹œ๊ฐ„ ์ƒํ˜ธ์ž‘์šฉ → ๋ฐ์ดํ„ฐ ์ค‘์‹ฌ ๋ฐฉ์‹์œผ๋กœ ์ž˜ ํ•ด๊ฒฐ
  • ์‹ค์™ธ scene : ํšจ๊ณผ์ ์ธ ์žฅ์น˜ ๋ถ€์กฑ + ๊ด‘๋ฒ”์œ„ํ•œ ํ™•์žฅ → ์‹ค์™ธ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ์–ด๋ ค์›€ ๋‹ค์–‘ํ•œ ๋‚ ์”จ, ๋น› → ๋น ๋ฅด๊ฒŒ ๋ณ€ํ•จ → ๋ฐ์ดํ„ฐ๋ฅผ ๊ตฌ์กฐํ™”ํ•˜๊ณ  ๊ฐ•๋ ฅํ•œ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์„ค๊ณ„ํ•˜๋Š” ๋ฐ ์–ด๋ ค์›€์„ ๊ฒช์Œ

ํ˜„์žฌ ์‹ค์™ธ ๋ฐ์ดํ„ฐ์…‹์€ ์˜จ๋ณด๋“œ ์žฅ๋น„์— ์˜ํ•ด ๊ตฌ์ถ•๋จ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ์ „์ฒด ํ™˜๊ฒฝ์„ ์™„๋ฒฝํ•˜๊ฒŒ ํฌ์ฐฉํ•˜๋Š” ๊ฒƒ์€ ์ œํ•œ๋œ ์‹œ์•ผ์™€ ๋ผ์šฐํŒ… ์„ ํƒ์— ์˜ํ•ด ์–ด๋ ค์›€

3D ๋ชจ๋ธ๋Ÿฌ์— ์˜ํ•ด ๊ตฌ์„ฑ๋œ ๋„์‹œ ๋ฐ์ดํ„ฐ์…‹์€ ์ผ๋ฐ˜์ ์œผ๋กœ ๊นจ๋—ํ•˜๊ณ  ์™„์ „ํ•˜์ง€๋งŒ, ๋‚ด๋ถ€ ๋ชจ๋ธ์€ ๊ธฐํ•˜ํ•™์ , ํ…์Šค์ฒ˜ ๋””ํ…Œ์ผ์ด ๋ถ€์กฑ

⇒ ์ด๋Ÿฌํ•œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด UrbanScene3D๋ฅผ ์ œ์‹œ

(UrbanScene3D : Unreal Engine ๋ฐ AirSim์— ๊ตฌ์ถ•๋œ ํŽธ๋ฆฌํ•œ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์™€ ํ•จ๊ป˜ ๋‹ค์–‘ํ•œ ๊ทœ๋ชจ์˜ ์ธ๊ณต ๋ฐ ์‹ค์ œ ์žฌ๊ตฌ์„ฑ ์žฅ๋ฉด์œผ๋กœ ๊ตฌ์„ฑ๋œ ๋Œ€๊ทœ๋ชจ ๋„์‹œ ์žฅ๋ฉด ๋ฐ์ดํ„ฐ ์„ธํŠธ)

UrbanScene3D์˜ ํ•ฉ์„ฑ(์ƒ๋‹จ) ๋ฐ ์‹ค์ œ(ํ•˜๋‹จ) ์žฅ๋ฉด ๊ฐœ์š”

man-made scene models(๊ทธ๋ฆผ์˜ ์ƒ๋‹จ) :

์ปดํŒฉํŠธํ•œ ๊ตฌ์กฐ๋ฅผ ๊ฐ–๊ณ  ์žˆ์Œ

 

UrbanScene3D(๊ทธ๋ฆผ ํ•˜๋‹จ) :

์กฐ๋ฐ€ํ•˜๊ณ  ์ƒ์„ธํ•œ scene ๋ชจ๋ธ ์ œ๊ณต (๋‹ค์ค‘ ๋ทฐ ์Šคํ…Œ๋ ˆ์˜ค(MVS) ๊ธฐ์ˆ ์„ ํ†ตํ•œ ํ•ญ๊ณต ์ด๋ฏธ์ง€๋กœ ์žฌ๊ตฌ์„ฑ๋œ)

์‚ฌ์‹ค์ ์ธ ์งˆ๊ฐ๊ณผ ๊ผผ๊ผผํ•œ ๊ธฐํ•˜ํ•™์  ๊ตฌ์กฐ๋ฅผ ๊ฐ–๊ณ  ์žˆ์Œ

 

ํŠนํžˆ ์•ผ์™ธ scene์„ ๋” ์ž˜ ํš๋“ํ•˜๊ณ  ์žฌ๊ตฌ์„ฑํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์กฐ์‚ฌํ•˜๊ธฐ ์œ„ํ•ด

  • scene ๋Œ€ํ‘œ ์„ธํŠธ๋ฅผ ์„ ํƒํ•˜๊ณ  ์ผ๋ จ์˜ ๊ณต์ค‘ ๊ฒฝ๋กœ๋ฅผ ๋”ฐ๋ผ ๋น„ํ–‰ํ•˜๋Š” ๋“œ๋ก ์„ ์‚ฌ์šฉํ•˜์—ฌ ์บก์ฒ˜
  • ์ด๋Ÿฌํ•œ ๋น„ํ–‰์€ 3D ๋„์‹œ ์žฅ๋ฉด ์žฌ๊ตฌ์„ฑ์„ ์œ„ํ•œ ๋‹ค์–‘ํ•œ ๊ณ„ํš ์•Œ๊ณ ๋ฆฌ์ฆ˜์— ์˜ํ•ด ๊ณ„์‚ฐ๋จ → ๊ฐ ๋Œ€ํ‘œ์ ์ธ ํ™˜๊ฒฝ์— ๋Œ€ํ•ด ํ•ด๋‹น ์žฅ๋ฉด ๊ด€์ฐฐ(ํ•ญ๊ณต ํš๋“ ๊ฒฝ๋กœ ๋ฐ ์บก์ฒ˜๋œ ์ด๋ฏธ์ง€ ์„ธํŠธ)๊ณผ ํ•จ๊ป˜ ๋‹ค์–‘ํ•œ ์žฌ๊ตฌ์„ฑ๋œ ๋ฉ”์‹œ๋ฅผ ์ œ๊ณต

์‹ค์ œ ์„ธ๊ณ„์™€ ํ•ฉ์„ฑ ์ง€์ƒ ์‹ค์ธก ๋ชจ๋ธ์— ์ ์šฉ๋œ ๊ณ ์ •๋ฐ€ ๋ ˆ์ด์ € ์Šค์บ๋„ˆ์— ์˜ํ•ด ์žฌ๊ตฌ์„ฑ๋œ ๊ฐ ๋ฉ”์‹œ์˜ ํฌ์ธํŠธ ์ˆ˜์ค€ ์ •ํ™•๋„์™€ ์™„์ „์„ฑ ๋ถ„์„์„ ์ œ๊ณตํ•˜๋Š” ๋ฒค์น˜๋งˆํฌ๋ฅผ ๊ตฌ์„ฑ

→ ๊ฒฝ๋กœ ๊ณ„ํš ์ „๋žต๊ณผ MVS ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๋ชจ๋‘์— ๋Œ€ํ•œ ๊ฐ•๋ ฅํ•œ ํ‰๊ฐ€๊ฐ€ ๊ฐ€๋Šฅ

AirSim์˜ ๋ฌผ๋ฆฌ์  ์—”์ง„์„ ํ†ตํ•ด ์‚ฌ์šฉ์ž๋Š” ๋กœ๋ด‡(์ž๋™์ฐจ/๋“œ๋ก )์„ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ํ•˜๊ณ  ์ œ์•ˆ๋œ ํ™˜๊ฒฝ์—์„œ ๋‹ค์–‘ํ•œ ์ž์œจ ์ž‘์—…์„ ํ…Œ์ŠคํŠธ ํ•  ์ˆ˜ ์žˆ์Œ

ํ•ฉ์„ฑ ์žฅ๋ฉด๊ณผ ์‹ค์ œ ์žฅ๋ฉด์„ ๋ชจ๋‘ ํฌํ•จ → ๊ฒฐ๊ณผ ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์„ ํšจ๊ณผ์ ์œผ๋กœ ํ™•์žฅ

 

์š”์•ฝ

i) ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์˜ ์—ฐ๊ตฌ๋ฅผ ์šฉ์ดํ•˜๊ฒŒ ํ•˜๋Š” ๋Œ€๊ทœ๋ชจ ๋„์‹œ ์žฅ๋ฉด ๋ฐ์ดํ„ฐ ์„ธํŠธ(3).

ii) 3D ๋„์‹œ ์žฌ๊ฑด์„ ์œ„ํ•œ **ํ•ญ๊ณต ๊ฒฝ๋กœ ๊ณ„ํš์—์„œ ๋‹ค์–‘ํ•œ ์š”์ธ์˜ ์˜ํ–ฅ์„ ์กฐ์‚ฌ(4)**ํ•˜๊ธฐ ์œ„ํ•œ ํฌ๊ด„์ ์ธ ๋ฒค์น˜๋งˆํฌ(5)

iii) ์ž์œจ ์ฃผํ–‰, ๋กœ๋ด‡ ๊ณตํ•™ ๋ฐ ๊ตฌํ˜„๋œ AI ์—ฐ๊ตฌ๋ฅผ ์œ„ํ•œ ์‚ฌ์šฉํ•˜๊ธฐ ์‰ฌ์šด ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ”Œ๋žซํผ(6)


2. Related Work

Outdoor datasets

์ž์œจ ์ฃผํ–‰์˜ ๋น ๋ฅธ ๋ฐœ์ „ → ๊ฑฐ๋Œ€ํ•œ ์•ผ์™ธ ๋ฐ์ดํ„ฐ์…‹ ํฌํ•จ

 

์ง€์ƒ ๊ธฐ๋ฐ˜ ์„ผ์„œ : ์†Œ๊ทœ๋ชจ scene ์บก์ฒ˜ ๊ฐ€๋Šฅ but ๋ทฐ์™€ ๋ผ์šฐํŒ… ์„ ํƒ์ด ๋งค์šฐ ์ œํ•œ์ 

→ ๋Œ€๊ทœ๋ชจ ๋„์‹œ ์ง€์—ญ์„ ์ปค๋ฒ„ํ•˜๋Š” ๋ฐ ์–ด๋ ค์›€

 

๋ฌด์ธํ•ญ๊ณต๊ธฐ(UAV), ๋“œ๋ก  : ๋ทฐ๊ฐ€ ์ข‹๊ณ  ์ž์œ ๋„๊ฐ€ ๋†’์Œ

→ ๋„“์€ ์ง€์—ญ์˜ ์™„์ „ํ•œ ์ปค๋ฒ„๋ฆฌ์ง€์— ์ ํ•ฉ

 

๋Œ€๋ถ€๋ถ„์˜ ๊ธฐ์กด UAV ๊ธฐ๋ฐ˜ ๋ฐ์ดํ„ฐ์…‹ : ์ „์ฒด ์žฅ๋ฉด์„ ์บก์ฒ˜ํ•˜์ง€ ์•Š๊ณ  ์ธ์‹ ์ž‘์—…์— ๋Œ€ํ•œ ๋ถ€๋ถ„ ๊ด€์ฐฐ๋งŒ ์ œ๊ณต

UrbanScene3D : ์ „์ฒด 3D ์žฅ๋ฉด์„ MVS ๋ฐฉ์‹์œผ๋กœ ์žฌ๊ตฌ์„ฑํ•  ์ˆ˜ ์žˆ๋Š” ์™„์ „ํ•œ ์บก์ฒ˜๋ฅผ ์–ป๊ธฐ ์œ„ํ•ด ๋“œ๋ก  ๊ฒฝ๋กœ๋ฅผ ๊ณ„ํš

 

Synthetic CAD datasets

์‹ค์ œ ๋ฐ์ดํ„ฐ ์„ธํŠธ์™€ ๋‹ฌ๋ฆฌ CAD ๋ชจ๋ธ๋กœ ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ• → ์ €๋ ดํ•œ ๋น„์šฉ์œผ๋กœ ์™„์ „ํžˆ ๊ตฌ์กฐํ™”๋œ ํ™˜๊ฒฝ ์ œ๊ณต ๊ฐ€๋Šฅ

but ๊ธฐํ•˜ํ•™์ , ํ…์Šค์ฒ˜ ๋””ํ…Œ์ผ ๋ถ€์กฑ

⇒ ๊ฒฉ์ฐจ ํ•ด์†Œ๋ฅผ ์œ„ํ•ด HoliCity๋Š” ์‹ค์ œ ํŒŒ๋…ธ๋ผ๋งˆ๋ฅผ CAD ๋ชจ๋ธ๊ณผ ์ •๋ ฌํ•˜์—ฌ ์‹ค์ œ ์งˆ๊ฐ์„ ์ œ๊ณต

๊ทธ๋Ÿฌ๋‚˜ geometry๊ฐ€ ๋„ˆ๋ฌด ๊ฑฐ์น ๊ณ  ํŒŒ๋…ธ๋ผ๋งˆ๊ฐ€ ์ „์ฒด ์žฅ๋ฉด์˜ ์ผ๋ถ€๋งŒ ํฌํ•จ → ์—ฌ์ „ํžˆ ๋ถˆ์ผ์น˜

 

UrbanScene3D : ์‹ค์ œ CAD ์žฅ๋ฉด๊ณผ ํ•ฉ์„ฑ CAD ์žฅ๋ฉด์„ ๋ชจ๋‘ ํฌํ•จ

→ ๊ณ ํ’ˆ์งˆ ๋„์‹œ ์žฌ๊ตฌ์„ฑ๊ณผ ์ „์ฒด๋ก ์  ์žฅ๋ฉด ์ดํ•ด๋ฅผ ์œ„ํ•œ ์—ฐ๊ตฌ๋ฅผ ์šฉ์ด

3D ๋„์‹œ ์žฅ๋ฉด์˜ ์˜จ๋ผ์ธ ์‹ค์‹œ๊ฐ„ ์บก์ฒ˜ ๋ฐ ์ดํ•ด๋ฅผ ์ž๊ทนํ•˜๋Š” ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ๋ฅผ ์ œ๊ณต

 

Aerial path planning for urban scene capture

๋“œ๋ก ์œผ๋กœ urban scene์„ ์บก์ฒ˜ํ•˜๊ธฐ ์œ„ํ•ด Aerial path planning์€ ๋งค์šฐ ์ค‘์š”

์ˆ˜๋™์ œ์–ด, ์ง€๊ทธ์žฌ๊ทธ ํŒจํ„ด :

๋น„ํšจ์œจ์  + ์ ์ ˆํ•œ ์ปค๋ฒ„๋ฆฌ์ง€ ๋‹ฌ์„ฑ ์–ด๋ ค์›€ + ์‹ค์šฉ์  ์š”์†Œ(์•ˆ์ „์ œํ•œ, ๋ฐฐํ„ฐ๋ฆฌ ์šฉ๋Ÿ‰) ์ถฉ์กฑ ์–ด๋ ค์›€

→ ๋ฌธ์ œ ํ•ด๊ฒฐ์„ ์œ„ํ•œ ๊ธฐ์กด์˜ ๋ฐฉ๋ฒ• :

๊ฑฐ์นœ ํ”„๋ก์‹œ ๋ชจ๋ธ์ด๋‚˜ ์ƒ๋‹จ ๋ทฐ ์ด๋ฏธ์ง€๋ฅผ input์œผ๋กœ ํ•˜์—ฌ ํŠน์ • ๋ชฉํ‘œ์™€ ์ œ์•ฝ ์กฐ๊ฑด์— ๋”ฐ๋ผ ๋“œ๋ก  ๊ฒฝ๋กœ๋ฅผ ์ตœ์ ํ™”

  • Smith : ๋” ๋‚˜์€ ๋‹ค์ค‘ ๋ทฐ ์Šคํ…Œ๋ ˆ์˜ค ๊ฒฐ๊ณผ๋ฅผ ์œ„ํ•œ ์ตœ์ ํ™” ๋ชฉํ‘œ๋ฅผ ์„ค๊ณ„ํ•˜์—ฌ ์žฌ๊ตฌ์„ฑ์˜ ์™„์ „์„ฑ๊ณผ ์ •ํ™•์„ฑ์„ ๋ณด์žฅ
  • Zhang : ๊ฒฝ๋กœ ๊ธธ์ด๋ฅผ ์ ์ ˆํ•˜๊ฒŒ ๋‹จ์ถ•ํ•˜๊ณ  ๊ธ‰๊ฒฉํ•œ ํšŒ์ „์„ ์ค„์ด๊ธฐ ์œ„ํ•œ ์—ฐ์† ๊ฒฝ๋กœ ํ”Œ๋ž˜๋„ˆ๋ฅผ ์ œ์•ˆ
  • Zhou : ์˜คํ”„์‚ฌ์ดํŠธ ๊ณ„ํš์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜๊ธฐ ์œ„ํ•ด ์œ„์„ฑ ์ด๋ฏธ์ง€๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋ทฐ ์„ ํƒ์„ ์œ„ํ•œ 2.5D ํ”„๋ก์‹œ๋ฅผ ์ถ”์ •

์˜จ๋ผ์ธ ๊ณ„ํš์„ ์œ„ํ•ด ์—ฐ๊ตฌ์ž๋“ค์€ ๋“œ๋ก  ํƒ์ƒ‰ ๋ฐ ํƒ์‚ฌ๋ฅผ ์œ„ํ•ด 2.5D ๋†’์ด ๋งต์„ ๊ตฌ์ถ•ํ•˜๊ฑฐ๋‚˜ ๊ฑด๋ฌผ์˜ 3D ๊ฒฝ๊ณ„ ์ƒ์ž๋ฅผ ์ฆ‰์‹œ ์ถ”์ •ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ๋ฐฐ์›€ → ์œ ํšจํ•œ ๋ฐ์ดํ„ฐ๊ฐ€ ๋ถ€์กฑํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์ผ๋ฐ˜์ ์œผ๋กœ ํฌ์ฐฉ ๋ทฐ ๋˜๋Š” ๋น„ํ–‰ ๊ถค์ ์„ ์ตœ์ ํ™”ํ•˜๊ธฐ ์œ„ํ•ด ์ˆ˜๊ณต ํœด๋ฆฌ์Šคํ‹ฑ ๊ธฐ๋Šฅ์— ์˜์กด

but ์ตœ์ข… ์žฌ๊ตฌ์„ฑ์˜ ํ’ˆ์งˆ์€ ๊ด€์ธก์น˜ ๊ฐ„์˜ ๊ณ ์ฐจ ๊ด€๊ณ„์— ์˜ํ•ด ์ œํ•œ๋˜๋ฉฐ, ์ด๋Š” ํœด๋ฆฌ์Šคํ‹ฑ ๋ฐ ์ตœ์ ํ™” ์„ค๊ณ„๋กœ ๋ชจ๋ธ๋งํ•˜๊ธฐ ์–ด๋ ค์›€

 

๋…ผ๋ฌธ์˜ ๋ฐ์ดํ„ฐ์™€ ๋ฒค์น˜๋งˆํฌ๋Š” ์ด ์ฃผ์ œ์— ๋Œ€ํ•œ ํ–ฅํ›„ ์—ฐ๊ตฌ๋ฅผ ํšจ์œจ์ ์œผ๋กœ ์ด‰์ง„


3. The UrbanScene3D Dataset

UrbanScene3D์˜ ๋ชฉํ‘œ : ์„œ๋กœ ๋‹ค๋ฅธ ์Šค์ผ€์ผ์˜ ๋„์‹œ scene ํ™˜๊ฒฝ์—์„œ 3D ๋น„์ „, ๊ทธ๋ž˜ํ”ฝ ๋ฐ ๋กœ๋ด‡ ์—ฐ๊ตฌ๋ฅผ ์œ„ํ•œ ์ผ๋ฐ˜์ ์ธ ๋ฐ์ดํ„ฐ ํ”Œ๋žซํผ์„ ์ œ๊ณต

UrbanScene3D๋Š” CAD ๋ฐ ์žฌ๊ตฌ์„ฑ๋œ ๋ฉ”์‹œ ๋ชจ๋ธ๊ณผ ํ•ด๋‹น ํ•ญ๊ณต ์ด๋ฏธ์ง€๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ 10๊ฐœ์˜ ํ•ฉ์„ฑ ์žฅ๋ฉด๊ณผ 6๊ฐœ์˜ ์‹ค์ œ ์žฅ๋ฉด์„ ์ œ๊ณต

ํ•ฉ์„ฑ CAD scene์€ ๊ฑด๋ฌผ, ๋‹ค๋ฆฌ, ๊ฑฐ๋ฆฌ, ์ดˆ๋ชฉ ๋“ฑ ๋‹ค์–‘ํ•œ ์ฝคํŒฉํŠธํ•œ ์›์‹œ ๊ตฌ์กฐ๋กœ ๊ตฌ์„ฑ๋˜๋ฉฐ, ์ด ๋ชจ๋“  ๊ฒƒ์€ ์ „๋ฌธ ์˜ˆ์ˆ ๊ฐ€์— ์˜ํ•ด ๊ฑด์„ค

์‹ค์ œ scene์€ ๋“œ๋ก ์„ ์‚ฌ์šฉํ•˜์—ฌ MVS์˜ ์ด๋ฏธ์ง€๋ฅผ ์บก์ฒ˜

๋…ผ๋ฌธ์—์„œ๋Š” 3D ๋„์‹œ ํš๋“์„ ์œ„ํ•ด DJITerra1์—์„œ ์ผ๋ฐ˜์ ์œผ๋กœ ์‚ฌ์šฉ๋˜๋Š” ์‚ฐ์—… ์†”๋ฃจ์…˜์ธ ๊ฒฝ์‚ฌ ์‚ฌ์ง„์œผ๋กœ ์ƒ์„ฑ๋œ ๊ณต์ค‘ ๊ฒฝ๋กœ๋ฅผ ๋”ฐ๋ฅด๋„๋ก ๋“œ๋ก ์„ ํ”„๋กœ๊ทธ๋ž˜๋ฐ

์ด๋Ÿฌํ•œ ์ด๋ฏธ์ง€๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์ƒ์šฉ MVS ์†”๋ฃจ์…˜์ธ ContextCapture2๋กœ ์žฅ๋ฉด์„ ์žฌ๊ตฌ์„ฑ

ํŠนํžˆ, ๋ฒค์น˜๋งˆํฌ์— ๋Œ€ํ•ด ์„ ํƒ๋œ ๋Œ€ํ‘œ์ ์ธ ์žฅ๋ฉด์—๋Š” ๋‹ค์–‘ํ•œ ์„ค์ • ํ•˜์—์„œ ๋‹ค์–‘ํ•œ ๊ฒฝ๋กœ ํ”Œ๋ž˜๋„ˆ๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ์—„์ฒญ๋‚œ ์–‘์˜ ์บก์ฒ˜ ๋ฐ์ดํ„ฐ๊ฐ€ ์ถ”๊ฐ€๋กœ ํฌํ•จ๋จ

 

4๊ฐœ์˜ ํ•ฉ์„ฑ scene๊ณผ 2๊ฐœ์˜ ์‹ค์ œ ๋Œ€ํ‘œ scene

 

UrbanScene3D์™€ ๊ธฐ์กด ์‹ค์™ธ ๋ฐ์ดํ„ฐ ์„ธํŠธ์˜ ์ฐจ์ด์ ์„ ์š”์•ฝ & ํŠน์ง•

  • Extensive scale

๋Œ€๋ถ€๋ถ„์˜ ๊ธฐ์กด ๋ฐ์ดํ„ฐ์…‹์€ ๋Œ€๊ทœ๋ชจ scene์˜ complete ์บก์ฒ˜๋ฅผ ์ œ๊ณตํ•˜์ง€ ์•Š์Œ

๋…ผ๋ฌธ์˜ ๋ฐ์ดํ„ฐ์…‹์—๋Š” 24km2 ์ด์ƒ์˜ ์ง€์—ญ์„ ํฌ๊ด„ํ•˜๋Š” ์„ธ ๊ฐœ์˜ ๋Œ€๊ทœ๋ชจ ๋„์‹œ scene์ด ํฌํ•จ๋จ

multiple real-world complete scene ์ œ๊ณต

๋‹ค์–‘ํ•œ๋„์‹œ scene๊ณผ ๊ทธ์— ์ƒ์‘ํ•˜๋Š” ์ƒท ํฌ์ฆˆ๊ฐ€ ์žˆ๋Š” ํ•ญ๊ณต ์ด๋ฏธ์ง€๋„ ์ด์šฉํ•  ์ˆ˜ ์žˆ์Œ

๋…ผ๋ฌธ์˜ ๋“œ๋ก  ๋น„ํ–‰ ๊ฒฝ๋กœ ๊ธธ์ด๋Š” ์ตœ๋Œ€ 17km์ผ ์ˆ˜ ์žˆ์–ด SLAM ๋˜๋Š” SfM ์—ฐ๊ตฌ์— ๋„์›€์ด ๋จ

 

  • Path planning research

ํ˜„์žฌ ๊ฒฝ๋กœ ๊ณ„ํš ๋ฐฉ๋ฒ•์˜ ๊ฒฝ์šฐ ํ”„๋ก์‹œ ์ •ํ™•๋„ ๋ฐ ์˜ค๋ฒ„๋žฉ ์†๋„์™€ ๊ฐ™์€ ์š”์†Œ๊ฐ€ ์ค‘์š”ํ•œ ์—ญํ• ์„ ํ•จ

๋…ผ๋ฌธ์˜ ๊ฒฝ๋กœ ๊ณ„ํš ๋ฒค์น˜๋งˆํฌ๋Š” ํŠนํžˆ ์ด๋Ÿฌํ•œ ์š”์ธ์— ๋Œ€ํ•œ ๋‹ค์–‘ํ•œ ์„ค์ •์„ ํฌํ•จํ•จ

์ตœ์ข… ์žฌ๊ตฌ์„ฑ ํ’ˆ์งˆ๊ณผ ํš๋“ ํšจ์œจ์„ฑ์— ๋Œ€ํ•œ ๊ทธ๋“ค์˜ ์˜ํ–ฅ์„ ๋ณด์—ฌ์คŒ(5ํ•ญ)

๊ธฐ์กด ๋ฒค์น˜๋งˆํฌ๋Š” ์ด๋Ÿฌํ•œ ์š”์†Œ๋ฅผ ๊ณ ๋ คํ•˜์ง€ ์•Š๊ณ  ํ•ฉ์„ฑ scene๋งŒ ํฌํ•จํ•จ

๋…ผ๋ฌธ์˜ ๋ฒค์น˜๋งˆํฌ๋Š” ๋งŽ์€ ๋น„ํ–‰ ๊ฒฝ๋กœ๋ฅผ ํฌํ•จํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๊ฒฝ๋กœ ๊ณ„ํš ๊ธฐ์ˆ ์— ๋Œ€ํ•œ ์—ฐ๊ตฌ์— ๋„์›€์ด ๋จ

 

  • Multiple captures

์‹ค์™ธ ํ™˜๊ฒฝ์˜ ๋‚ ์”จ, ์กฐ๋ช… ์กฐ๊ฑด์€ ์ธ์‹๊ณผ ์žฌ๊ตฌ์„ฑ์— ํฐ ๋ฌธ์ œ์ž„

๋…ผ๋ฌธ์˜ ๋ฒค์น˜๋งˆํฌ๋Š” ๋‹ค๋ฅธ ์‹œ๊ฐ„์— ๊ฑธ์ณ ๊ฐ ์žฅ๋ฉด์— ๋Œ€ํ•ด ์—ฌ๋Ÿฌ ๊ฐœ์˜ ๋“œ๋ก  ๋น„ํ–‰์„ ์ œ๊ณตํ•˜๋ฉฐ, ์ด๋Š” ๋ฐ์ดํ„ฐ์˜ ๋‹ค์–‘์„ฑ์„ ํฌ๊ฒŒ ์ฆ๊ฐ€์‹œ์ผœ ํ•™์Šต ๊ธฐ๋ฐ˜ ๋ฐฉ๋ฒ•์„ ํ†ตํ•ด ์ด ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๋ฐ ๋„์›€์ด ๋จ

(๋‹ค์–‘ํ•œ ์กฐ๋ช… ์กฐ๊ฑด์—์„œ ๋ฒค์น˜๋งˆํฌ์˜ ์‹ค์ œ ์žฅ๋ฉด ์ด๋ฏธ์ง€์˜ ํ’๋ถ€ํ•จ(10k+)์€ ๊ธฐํ•˜ํ•™, ์žฌ๋ฃŒ ๋ฐ ๋น›์„ ๋ถ„๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” NeRF์— ๋Œ€ํ•œ ํ–ฅํ›„ ์—ฐ๊ตฌ๋ฅผ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•จ)

 

  • Simulation environment

๋Œ€๋ถ€๋ถ„์˜ ๊ธฐ์กด ์ž์œจ ์ฃผํ–‰ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ, UAV๋Š” ๊ฐ€์ƒ scene์—์„œ๋งŒ ์ž‘๋™ํ•จ

๋…ผ๋ฌธ์˜ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ๋Š” ์‹ค์ œ scene์„ ๊ฐ€์ ธ์™€ ๊ทธ ์•ˆ์— ์žˆ๋Š” ๋“œ๋ก ์„ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ํ•˜๊ธฐ ๋•Œ๋ฌธ์— sim-to-real gap์ด ์ค„์–ด๋“ฆ

๋…ผ๋ฌธ์˜ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ๋Š” ํ˜„์žฅ์˜ ๋ฒ”์œ„๋ฅผ ์‹ค์‹œ๊ฐ„์œผ๋กœ ๋ณด์—ฌ์ค„ ์ˆ˜ ์žˆ์–ด UAV ํƒ์‚ฌ์— ๋Œ€ํ•œ ์—ฐ๊ตฌ์— ์šฉ์ดํ•จ


4. Scene Acquisition with Aerial Path Planning

UrbanScene 3D ๋ฐ์ดํ„ฐ ์„ธํŠธ๋ฅผ ๋ฒค์น˜๋งˆํฌ๊นŒ์ง€ ํ™•์žฅํ•˜์—ฌ ๋‹ค์–‘ํ•œ ๊ฒฝ๋กœ ๊ณ„ํš ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ํ’ˆ์งˆ๊ณผ ํšจ์œจ์„ฑ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ 5์ ˆ์˜ ์ž…๋ ฅ ํ”„๋ก์‹œ์˜ ์˜ํ–ฅ์„ ํ‰๊ฐ€

UrbanScene3D๋Š” ์ธ์Šคํ„ด์Šค ๋ถ„ํ• , ๋‹ค์ค‘ ๋ทฐ ์Šคํ…Œ๋ ˆ์˜ค์—์„œ depth estimation(๊นŠ์ด ์ถ”์ •) ๋ฐ ์ƒˆ๋กœ์šด ๋ทฐ ํ•ฉ์„ฑ์— ์ด๋ฅด๊ธฐ๊นŒ์ง€ ๋‹ค์–‘ํ•œ ์ž ์žฌ์  ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์„ ์ œ๊ณต (6ํ•ญ)

UrbanScene 3D์—๋Š” ํ”„๋ก์‹œ, ์ง€์ƒ ์‹ค์ธก ์ž๋ฃŒ ๋“ฑ ๊ฒฝ๋กœ ๊ณ„ํš ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ํ…Œ์ŠคํŠธํ•˜๊ณ  ์žฌ๊ตฌ์„ฑ๋œ ๊ฒฐ๊ณผ๋ฅผ ๋ถ„์„ํ•˜๋Š” ๋ฐ ํ•„์š”ํ•œ ๋ชจ๋“  ๋ฐ์ดํ„ฐ๊ฐ€ ํฌํ•จ๋˜์–ด ์žˆ์Œ

๋Œ€๋ถ€๋ถ„์˜ path planners๋Š” ์ผ๋ฐ˜์ ์œผ๋กœ ํ™˜๊ฒฝ์˜ ์‚ฌ์ „ ๊ณ„์‚ฐ๋œ coarse model(ํ”„๋ก์‹œ๋ผ๊ณ ๋„ ํ•จ)์— ์˜์กดํ•จ

ํ”„๋ก์‹œ๋Š” ๋‹จ์ˆœํ™”๋œ ๊ฒฝ์‚ฌ ์‚ฌ์ง„ ํ†ต๊ณผ ํ›„ ๋น ๋ฅธ ์žฌ๊ตฌ์„ฑ, ์œ„์„ฑ ์ด๋ฏธ์ง€, ์ง€๋„ ์ œ๊ณต์ž ๋˜๋Š” ์‹ค์‹œ๊ฐ„ ์žฌ๊ตฌ์„ฑ์„ ํ†ตํ•ด ์–ป์„ ์ˆ˜ ์žˆ์Œ

ํ† ํด๋กœ์ง€์˜ ์ •ํ™•๋„ ๋ฐ ๋ฉด ์ •๊ทœ์„ฑ์„ ํฌํ•จํ•œ ํ”„๋ก์‹œ์˜ ํ’ˆ์งˆ์€ ์žฌ๊ตฌ์„ฑ์˜ ์ตœ์ข… ํ’ˆ์งˆ์— ์˜ํ–ฅ์„ ๋ฏธ์น  ์ˆ˜ ์žˆ์Œ

  • 4.1 : ์„œ๋กœ ๋‹ค๋ฅธ ๊ถค์ ์„ ์ƒ์„ฑํ•˜๋Š” ๋ฐ ์‚ฌ์šฉํ•œ 4๊ฐ€์ง€ ๊ฒฝ๋กœ ๊ณ„ํš์ž๋ฅผ ๊ฐ„๋žตํ•˜๊ฒŒ ์†Œ๊ฐœ
  • 4.2 : ๊ฒฝ๋กœ ๊ณ„ํš์—์„œ ํ”„๋ก์‹œ์˜ ์˜ํ–ฅ์„ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•ด ๋ฐ์ดํ„ฐ ์„ธํŠธ์—์„œ ์‚ฌ์šฉํ•œ ๋‹ค์–‘ํ•œ ํ”„๋ก์‹œ ์†Œ๊ฐœ

4.1 Aerial Path Planning Methods

๋” ๋งŽ์€ ๊ฒฝ๋กœ์™€ ์ด๋ฏธ์ง€๋ฅผ ์ œ๊ณตํ•˜๊ธฐ ์œ„ํ•ด, Oblique photography, ์Šค๋ฏธ์Šค, ์ €์šฐ, ์žฅ์ด ์ œ์•ˆํ•œ ๋ฐฉ๋ฒ•์„ ํฌํ•จํ•œ ๋„ค ๊ฐ€์ง€ ๋‹ค๋ฅธ ๊ฒฝ๋กœ ํ”Œ๋ž˜๋„ˆ๋ฅผ ์‚ฌ์šฉ

4.2์ ˆ์— ์–ธ๊ธ‰๋œ ๋‹ค๋ฅธ ํ”„๋ก์‹œ์˜ ๊ฒฝ๋กœ๋ฅผ ์„œ๋กœ ๋‹ค๋ฅธ ์”ฌ์— ๋Œ€ํ•ด ์„œ๋กœ ๋‹ค๋ฅธ ์˜ค๋ฒ„๋žฉ ์†๋„๋กœ ์ƒ์„ฑํ•จ์œผ๋กœ์จ ํ•ฉ์„ฑ scene์— ๋Œ€ํ•ด 100๊ฐœ, ์‹ค์ œ scene์— ๋Œ€ํ•ด 26๊ฐœ์˜ ์„œ๋กœ ๋‹ค๋ฅธ ๊ฒฝ๋กœ๋ฅผ ์ƒ์„ฑ

ํ•ฉ์„ฑ scene school๊ณผ ์‹ค์ œ scene ploytec์—์„œ 4๊ฐœ์˜ ํ”Œ๋ž˜๋„ˆ๋กœ ์ƒ์„ฑ๋œ ๊ฒฝ๋กœ

Oblique photography

์ด๋ฏธ์ง€ ์ค‘์ฒฉ๊ณผ ์ง€์ƒ ์ƒ˜ํ”Œ ๊ฑฐ๋ฆฌ(GSD)๋ฅผ ๊ณ ๋ คํ•˜์—ฌ, ๋น„์Šค๋“ฌํ•œ ์‚ฌ์ง„์€ ๊ณ ์ •๋œ ๋†’์ด(GSD์— ์˜ํ•ด ๊ณ„์‚ฐ๋จ)์—์„œ S์žํ˜• ๊ถค์ ์„ ์ƒ์„ฑํ•˜๊ณ  ํ•„์š”ํ•œ ์บก์ฒ˜ ์œ„์น˜๋ฅผ ๊ณ„์‚ฐ

S์žํ˜• ๊ถค์ ์€ ์ผ๋ฐ˜์ ์œผ๋กœ ๋ถˆ๊ทœ์น™ํ•œ ๋ชจ์–‘์œผ๋กœ๋„ ์˜์—ญ์˜ ์™„์ „ํ•œ ์ปค๋ฒ„๋ฆฌ์ง€๋ฅผ ๋ณด์žฅํ•  ์ˆ˜ ์žˆ๋Š” CCPP(Complete Coverage Path Planning) ์•Œ๊ณ ๋ฆฌ์ฆ˜์— ์˜ํ•ด ๊ณ„์‚ฐ๋จ

ํ„ด ์ˆ˜๊ฐ€ ์ตœ์†Œํ™”๋˜์–ด ์บก์ฒ˜ ํšจ์œจ์„ฑ์ด ํฌ๊ฒŒ ํ–ฅ์ƒ

Planner proposed by Smith et al

Oblique photography์™€ ๋‹ฌ๋ฆฌ, smith๋Š” ๋‹ค์ค‘ ๋ทฐ ์Šคํ…Œ๋ ˆ์˜ค(MVS) ํ”„๋กœ์„ธ์Šค์—์„œ ์‚ผ๊ฐ์ธก์ •์˜ ์ž ์žฌ์  ์˜ค๋ฅ˜์™€ ํŠน์ง• ์ผ์น˜๋ฅผ ๋ชจ๋‘ ๊ณ ๋ คํ•˜๋Š” ํœด๋ฆฌ์Šคํ‹ฑ ๊ธฐ๋Šฅ, ์žฌ๊ตฌ์„ฑ ๊ฐ€๋Šฅ์„ฑ์— ๋”ฐ๋ผ ์‹œ์ ์„ ์ง์ ‘ ์ตœ์ ํ™”ํ•จ

๊ฐ ๋ฐ˜๋ณต์—์„œ ์Šค๋ฏธ์Šค๋Š” ๋จผ์ € ํ˜„์žฌ ์‹œ์  ์ง‘ํ•ฉ์— ๋Œ€ํ•œ ๊ฐ ์ ์˜ ์†Œ์œ„ ์žฌ๊ตฌ์„ฑ ๊ฐ€๋Šฅ์„ฑ์„ ๊ณ„์‚ฐ

→ ๊ฐ ๊ด€์ ์˜ ์œ„์น˜์™€ ๋ฐฉํ–ฅ์„ ์กฐ์ •ํ•˜์—ฌ ์ด ์ธก์ •์„ ์ตœ๋Œ€ํ™”

Planner proposed by Zhou et al

Smith์™€ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ, Zhou๋Š” ๊ณ„ํš ์ค‘์— ๊ฐ ์ง€์ ์˜ ์žฌ๊ตฌ์„ฑ ๊ฐ€๋Šฅ์„ฑ์„ ๊ณ ๋ คํ•จ

but ์“ธ๋ชจ์—†๋Š” ๊ด€์ ์„ ์ค„์ด๊ธฐ ์œ„ํ•ด์„œ๋งŒ ์ด ์ธก์ •์„ ์‚ฌ์šฉ

completeํ•˜๊ณ  highly redundant(๋งค์šฐ ์ค‘๋ณต) ํ•ด์•ผ ํ•˜๋Š” large viewpoint set๋ฅผ ์ƒ์„ฑํ•จ

๊ฐ ๋ฐ˜๋ณต์—์„œ ๊ณ„์‚ฐ๋œ ์žฌ๊ตฌ์„ฑ ๊ฐ€๋Šฅ์„ฑ์— ๋Œ€ํ•œ ๋ทฐ ์ค‘๋ณต์„ฑ์„ ์ •์˜ํ•˜๊ณ  ๊ทธ์— ๋”ฐ๋ผ ๊ฐ€์žฅ ์ค‘๋ณต๋œ ๊ด€์ ์„ ์‚ญ์ œ

Planner proposed by Zhang et al

Oblique photography์— ๋น„ํ•ด smith์™€ zhou๋Š” ๋” ๋†’์€ ์บก์ฒ˜ ํ’ˆ์งˆ๋กœ ๊ถค์ ์„ ์ƒ์„ฑํ•จ

but ๊ด€์ ์— ์ •์˜๋œ ํœด๋ฆฌ์Šคํ‹ฑ ํ•จ์ˆ˜๋Š” ์ตœ์ข… ๊ถค๋„์—์„œ ๋งŽ์€ ๊ธ‰๊ฒฉํ•œ ์ „ํ™˜์„ ๊ฐ€์ ธ์˜ด

→ ๊ธ‰๊ฒฉํ•œ ์†๋„ ๋ณ€ํ™”๋Š” ์บก์ฒ˜ ํšจ์œจ์„ ํฌ๊ฒŒ ๊ฐ์†Œ

Zhang์€ ํœด๋ฆฌ์Šคํ‹ฑ ๊ธฐ๋Šฅ์— ๊ฒฝ๋กœ ๋ถ€๋“œ๋Ÿฌ์›€์„ ํฌํ•จํ•˜๊ณ  RRT(Rapid-exploring Random) ํŠธ๋ฆฌ๋ฅผ ํ™œ์šฉํ•˜์—ฌ ํšจ์œจ์ ์ด๊ณ  ๊ณ ํ’ˆ์งˆ์˜ ๊ถค์ ์„ ๊ฒ€์ƒ‰ํ•จ

 

4.2 Geometric Proxies

ํ”„๋ก์‹œ๋Š” ํ•ญ๊ณต ๊ฒฝ๋กœ ๊ณ„ํš ๋ฐฉ๋ฒ•์— ํ•„์ˆ˜์ ์ž„

์ž์„ธํ•œ ํ”„๋ก์‹œ๋Š” ์ผ๋ฐ˜์ ์œผ๋กœ ํ›จ์”ฌ ๋” ๋‚˜์€ ์žฌ๊ตฌ์„ฑ ๊ฒฐ๊ณผ๋กœ ์ด์–ด์ง

๊ธฐ์กด ์—ฐ๊ตฌ : ๊ฒฝ๋กœ๋ฅผ ๊ณ„ํšํ•˜๊ธฐ ์œ„ํ•ด ๋Œ€๋žต์ ์ธ scene ํ”„๋ก์‹œ, ์œ„์„ฑ ์ด๋ฏธ์ง€์—์„œ ์ถ”์ถœ๋œ 2.5D ๋ชจ๋ธ ์‚ฌ์šฉ

UrbanScene3D : ํ”„๋ก์‹œ, ๊ฒฝ๋กœ ๋ฐ ์žฌ๊ตฌ์„ฑ๋œ ๋ชจ๋ธ์˜ ํ•ด๋‹น ํŠน์„ฑ ๊ฐ„์˜ ๊ด€๊ณ„๋ฅผ ๋ถ„์„ํ•˜๋Š” ๋ฐ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ๋‹ค์–‘ํ•œ ์ˆ˜์ค€์˜ ์„ธ๋ถ€์ •๋ณด ์ œ๊ณต

scene ํ”„๋ก์‹œ๋Š” ๋‹ค๋ฅธ ์ˆ˜์ค€์˜ ์„ธ๋ถ€์‚ฌํ•ญ / Box: the roughest proxy (๊ฐ€์žฅ ๊ฑฐ์นœ) Coarse: the coarse level of proxy (๊ฑฐ์นœ) Inter: the intermediate level of proxy (์ค‘๊ฐ„) Fine: the finest level of proxy (๋ฏธ์„ธ)

 

  • box proxy

incorrect topology๋ฅผ ๊ฐ€์ง„ ํ”„๋ก์‹œ ์ค‘ ๊ฐ€์žฅ ๊ฑฐ์นœ ์ˆ˜์ค€์ž„

scene์—์„œ ์„ค์ •๋œ ๊ฑด๋ฌผ์„ ๊ฒฝ๊ณ„ ์ƒ์ž๋กœ ๊ต์ฒดํ•˜์—ฌ ๊ตฌ์ถ•๋จ

์‹ค์ œ scene์—์„œ๋Š” ์•ˆ์ „ ๋ฌธ์ œ๋กœ ์ธํ•ด box proxy๊ฐ€ ์‚ฌ์šฉ๋˜์ง€ ์•Š์Œ

 

  • coarse proxy

box proxy์™€ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ scene์—์„œ ๊ฐ ๊ฑด๋ฌผ์˜ ๊ฒฝ๊ณ„ ์ƒ์ž๋ฅผ ์ฐพ์•„ ๊ตฌ์ถ•๋จ

๊ทธ๋Ÿฌ๋‚˜ coarse proxy๋Š” ํ† ํด๋กœ์ง€๊ฐ€ ๋” ์ •ํ™•ํ•˜๋ฏ€๋กœ ๊ฒฝ๋กœ ๊ณ„ํš ๊ฒฐ๊ณผ๊ฐ€ ๋” ์ •ํ™•ํ•จ

 

  • intermediate proxy

oblique photography๋กœ ์บก์ฒ˜๋œ ๋‹ค์šด์ƒ˜ํ”Œ๋œ ์ด๋ฏธ์ง€๋กœ ์žฌ๊ตฌ์„ฑ๋จ

ํ•ฉ์„ฑ scene์˜ ground-truth meshes (fine)๋„ ํ”„๋ก์‹œ๋กœ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์ด๋Š” ๊ฒฝ๋กœ ๊ณ„ํš ํ”„๋กœ์„ธ์Šค ์ค‘์— ๊ฐ€์žฅ ํฐ ๊ธฐํ•˜ํ•™์  ์ •๋ณด๋ฅผ ์ œ๊ณตํ•จ

 

  • fine proxy

์‹ค์ œ scene์˜ fine proxy๋Š” oblique photography์œผ๋กœ ์บก์ฒ˜๋œ non subsampled ๋œ ์ด๋ฏธ์ง€๋กœ ์žฌ๊ตฌ์„ฑ๋จ

์‹ค์ œ scene์—๋Š” ์ง€์ƒ ์‹ค์ธก ๋ฉ”์‹œ๊ฐ€ ์—†๊ธฐ ๋•Œ๋ฌธ์— ๊ณ ๋ฐ€๋„ ์ด๋ฏธ์ง€์— ์˜ํ•ด ์žฌ๊ตฌ์„ฑ๋œ ๋ชจ๋ธ์„ ํ•ด๋‹น ๋ฏธ์„ธ ํ”„๋ก์‹œ๋กœ ์‚ฌ์šฉ

 


5. Scene Reconstruction Benchmarks

์—๋„ˆ์ง€ ๋น„์šฉ, Aerotriangulation ์ •ํ™•๋„ ๋ฐ ์žฌ๊ตฌ์„ฑ ํ’ˆ์งˆ์— ๋Œ€ํ•ด ์„œ๋กœ ๋‹ค๋ฅธ ๊ฒฝ๋กœ ๊ณ„ํš ๋ฐฉ๋ฒ•์œผ๋กœ ์ƒ์„ฑ๋œ ๊ฒฝ๋กœ๋ฅผ ํ‰๊ฐ€ํ•˜์—ฌ ์žฌ๊ตฌ์„ฑ๋œ ๋ฉ”์‹œ์˜ ํฌ์ธํŠธ ์ˆ˜์ค€ ์ •ํ™•๋„์™€ ์™„์„ฑ๋„ ๋ถ„์„์„ ์ œ๊ณต

  • 5.2 : UAV ํฌ์ฐฉ์˜ ์—๋„ˆ์ง€ ์†Œ๋น„ ํ†ต๊ณ„
  • 5.3 : ์„œ๋กœ ๋‹ค๋ฅธ ๊ณ„ํš์ž์˜ Aerotriangulation ๊ฒฐ๊ณผ๋ฅผ ๋ถ„์„
  • 5.4 : ์žฌ๊ตฌ์„ฑ ๊ฒฐ๊ณผ๋ฅผ ํ‰๊ฐ€
  • 5.5 : ๋„ค ๋ช…์˜ ๊ณ„ํš์ž ๋ชจ๋‘๋ฅผ ์ „์ฒด์ ์œผ๋กœ ๋น„๊ต
  • supplementary material : ๋‹ค๋ฅธ ์ค‘๋ณต์— ๋Œ€ํ•œ ํ‰๊ฐ€, ๋ชจ๋ธ ์žฌ๊ตฌ์„ฑ ๋น„์šฉ, ๊ธฐํƒ€ ์žฅ๋ฉด์˜ ์žฌ๊ตฌ์„ฑ ํ‰๊ฐ€์™€ ๊ฐ™์€ ๊ธฐํƒ€ ์ •๋ณด

5.1 High-precision LiDAR Scan

ํ•ฉ์„ฑ scene์€ ํ‰๊ฐ€๋ฅผ ์œ„ํ•œ ์‹ค์ธก ์ž๋ฃŒ ๋ฉ”์‹œ์™€ ํ•จ๊ป˜ ์ œ๊ณต๋จ

์‹ค์ œ scene์˜ ๊ฒฝ์šฐ GPS localization ์žฅ์น˜๊ฐ€ ์žฅ์ฐฉ๋œ ๊ณ ์ •๋ฐ€ LiDAR ์Šค์บ๋„ˆ๋กœ ๊ฑด๋ฌผ ์ „์ฒด๋ฅผ ์Šค์บ”ํ•จ

๊ทธ๋Ÿฐ ๋‹ค์Œ ํฌ์ธํŠธ ํด๋ผ์šฐ๋“œ๊ฐ€ ์„œ๋กœ ๋“ฑ๋ก๋˜๋ฏ€๋กœ ๊ฑด๋ฌผ ์ „์ฒด๋ฅผ ์ •๋ฐ€ํ•˜๊ฒŒ LiDAR ์Šค์บ”ํ•จ

LiDAR ์Šค์บ๋„ˆ๋Š” ์ž๊ฐ€ ๊ต์ • ๋ฐ ์ž๊ฐ€ ๋“ฑ๋ก ๊ธฐ์ˆ ์„ ๊ฐ–์ถ˜ ํŠธ๋ฆผ๋ธ” X7

ranging noise๋Š” 0.5mm, ๊ฑฐ๋ฆฌ ์ •ํ™•๋„๋Š” 2mm, ๊ฐ๋„ ์ •ํ™•๋„๋Š” 21'์ด๋ฉฐ 3D ํฌ์ธํŠธ์˜ ์ •ํ™•๋„๋Š” 10m์—์„œ 1.5mm, 20m์—์„œ 2.4mm์ž„

์ž๊ฐ€ ๊ต์ •์„ ํฌํ•จํ•˜์—ฌ ๊ฐ ์Šค์บ”์—๋Š” 2๋ถ„ 34์ดˆ๊ฐ€ ๊ฑธ๋ฆผ

์‹ค์ œ ์žฅ๋ฉด ํด๋ฆฌํ…์˜ ๊ฒฝ์šฐ ์ „์ฒด ๋“ฑ๋ก ์˜ค์ฐจ๊ฐ€ 6mm์ด๊ณ , ์‹ค์ œ ์žฅ๋ฉด ์•„ํŠธ์‚ฌ์ด์—์„œ๋Š” ์ „์ฒด ๋“ฑ๋ก ์˜ค์ฐจ๊ฐ€ 3mm์ž„

ํ•ฉ์„ฑ ์žฅ๋ฉด์—์„œ ์„œ๋กœ ๋‹ค๋ฅธ ํ”„๋ก์‹œ๋ฅผ ๊ฐ–๋Š” ์„œ๋กœ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•์˜ Aerotriangulation ์˜ค์ฐจ

 

5.2 UAV Capturing Cost

๋น„ํ–‰ ๊ฒฝ๋กœ์˜ ๊ธธ์ด์— ๋”ฐ๋ผ, ์ด ํšŒ์ „๊ฐ๊ณผ ๊ฐ™์€ ๊ฒฝ๋กœ์˜ ํšจ์œจ์€ ์ „์ฒด ์—๋„ˆ์ง€ ์†Œ๋น„์— ์˜ํ–ฅ์„ ๋ฏธ์นจ

๋“œ๋ก ์€ ํšŒ์ „ ๊ทผ์ฒ˜์—์„œ ๊ฐ€์† ๋ฐ ๊ฐ์†ํ•  ๋•Œ ๋” ๋งŽ์€ ์—๋„ˆ์ง€๋ฅผ ์†Œ๋น„ํ•จ

ํ•ฉ์„ฑ ์žฅ๋ฉด์—์„œ ์„œ๋กœ ๋‹ค๋ฅธ ํ”„๋ก์‹œ๋ฅผ ๊ฐ–๋Š” ์„œ๋กœ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•์˜ Aerotriangulation ์˜ค์ฐจ

์‹ค์ œ scene ArtSci์—์„œ ์„œ๋กœ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•์œผ๋กœ ๊ณ„ํš๋œ ๋น„ํ–‰ ๊ฒฝ๋กœ์˜ ๋ฐฐํ„ฐ๋ฆฌ ์†Œ๋ชจ๋Ÿ‰ ํ†ต๊ณ„๋ฅผ ๋ณด์—ฌ์คŒ

ํฌํš ๋น„์šฉ, ์ฆ‰ ๋น„ํ–‰ ๊ฒฝ๋กœ์˜ ํšจ์œจ์„ฑ์€ ์ฃผ๋กœ ๊ฒฝ๋กœ ํŒจํ„ด์— ์˜ํ•ด ์˜ํ–ฅ์„ ๋ฐ›์Œ

oblique photography์€ ๊ฒฝ๋กœ๊ฐ€ ๊ฐ€์žฅ ๊ฐ„๋‹จํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๋ฐฐํ„ฐ๋ฆฌ ๋น„์šฉ์ด ๊ฑฐ์˜ ๋‚ฎ์Œ

์ผ๋ฐ˜์ ์œผ๋กœ Zhang์ด ์ œ์•ˆํ•œ ๋ฐฉ๋ฒ•์€ ๋น„์šฉ ํ•จ์ˆ˜์— ๊ฒฝ๋กœ ํšจ์œจ์„ ๋ช…์‹œ์ ์œผ๋กœ ์ตœ์ ํ™”ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๋‹ค๋ฅธ ๋‘ ๋ฐฉ๋ฒ•๋ณด๋‹ค ๋ฐฐํ„ฐ๋ฆฌ ์†Œ๋ชจ๋Ÿ‰์ด ๋‚ฎ์Œ

 

5.3 Aerotriangulation Error

์žฅ๋ฉด์„ ์žฌ๊ตฌ์„ฑํ•˜๊ธฐ ์ „์— ์บก์ฒ˜๋œ ์ด๋ฏธ์ง€์— ๋Œ€ํ•ด ํ•ญ๊ณต ์ด๋ฏธ์ง€๋ฅผ ์‚ฌ์šฉํ•œ ์‚ผ๊ฐ ์ธก๋Ÿ‰์ธ aerotriangulation ํ”„๋กœ์„ธ์Šค๋ฅผ ์ˆ˜ํ–‰ํ•˜์—ฌ ์นด๋ฉ”๋ผ์˜ ํฌ์ฆˆ๋ฅผ ๊ฒฐ์ •ํ•˜๊ณ  ํ™˜๊ฒฝ์˜ sparse point cloud์„ ์–ป์Œ

ํ˜„์žฅ Town์—์„œ ํ…Œ์ŠคํŠธํ•œ 90%์™€ ์ค‘๋ณต๋˜๋Š” ๋‹ค์–‘ํ•œ ํ”„๋ก์‹œ์˜ aerotriangulation ์˜ค๋ฅ˜ ํ†ต๊ณ„

 

Smith, Zhou๊ฐ€ ์ œ์•ˆํ•œ ๋ฐฉ๋ฒ•์˜ aerotriangulation ๊ฒฐ๊ณผ๋Š” ์„œ๋กœ ๋‹ค๋ฅธ ์ˆ˜์ค€์˜ ํ”„๋ก์‹œ์— ์ƒ๋‹นํžˆ ๋ฏผ๊ฐํ•จ

Zhang์ด ์ œ์•ˆํ•œ ๋ฐฉ๋ฒ•์˜ ๊ฒฝ์šฐ, ํ”„๋ก์‹œ๊ฐ€ ๋ฏธ์„ธํ•ด์งˆ์ˆ˜๋ก RMS-ํ”ฝ์…€(ํ”ฝ์…€์˜ ๋ฃจํŠธ ํ‰๊ท  ์ œ๊ณฑ ์˜ค์ฐจ), RMS-meter(๋ฏธํ„ฐ์—์„œ์˜ ๋ฃจํŠธ ํ‰๊ท  ์ œ๊ณฑ ์˜ค์ฐจ) ๋ฐ reprojection ์˜ค์ฐจ๋Š” ๊ฐ์†Œ

๊ทธ๋Ÿฌ๋‚˜, Zhou๊ณผ ๋น„๊ตํ–ˆ์„ ๋•Œ, ์ด ๋ฐฉ๋ฒ•์œผ๋กœ ์บก์ฒ˜๋œ ์ผ๋ถ€ ์ด๋ฏธ์ง€๋Š” ์ž˜ ๋ณด์ •๋˜์ง€ ์•Š์Œ

Zhou, Zhang์˜ aerotriangulation ๊ฒฐ๊ณผ๋Š” Smith๋ณด๋‹ค ๋‚ฎ์€ RMSE๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ์Œ

oblique photography์œผ๋กœ ์ดฌ์˜๋œ ์˜์ƒ๋„ ๊ต์ •์ด ์ž˜ ๋˜์–ด ์žˆ๊ณ , ์„œ๋กœ ์—„๋ฐ€ํ•˜๊ฒŒ ๊ฒน์ณ์ ธ ์žˆ์–ด aerotriangulation error๊ฐ€ ์ ์Œ

 

5.4 Reconstruction Accuracy and Completeness

์„œ๋กœ ๋‹ค๋ฅธ ํ”„๋ก์‹œ๋ฅผ ๊ฐ€์ง„ ๋„ค ๋ช…์˜ ๊ณ„ํš์ž์˜ ์žฌ๊ตฌ์„ฑ ๊ฒฐ๊ณผ๋ฅผ ํ‰๊ฐ€

์žฌ๊ตฌ์„ฑ ์ •ํ™•๋„์™€ ์™„์„ฑ๋„์˜ ๊ฒฐ๊ณผ

ํ‰๊ฐ€๋Š” ์”ฌ ์Šค์ฟจ(scene School)์—์„œ 90% ์ค‘์ฒฉ๋˜์–ด ์ˆ˜ํ–‰

90% ๋˜๋Š” 95% ์ •ํ™•๋„ x์˜ ๊ฐ’์€ ground-truth ๋ชจ๋ธ์—์„œ ์žฌ๊ตฌ์„ฑ ๋ชจ๋ธ์˜ ์ •์  ์ค‘ ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด ๋ชจ๋“  ์ ์— ๋Œ€ํ•ด 90% ๋˜๋Š” 95%์˜ ๊ฑฐ๋ฆฌ๊ฐ€ x๋ณด๋‹ค ์ž‘๋‹ค๋Š” ๊ฒƒ์„ ์˜๋ฏธ

0.02m, 0.075m ๋˜๋Š” 0.075m ์™„์ „์„ฑ x%์˜ ๊ฐ’์€ ์žฌ๊ตฌ์„ฑ ๋ชจ๋ธ์—์„œ ground-truth ๋ชจ๋ธ์˜ ๊ผญ์ง“์  ์ค‘ ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด ๋ชจ๋“  ์ ์— ๋Œ€ํ•ด x%๊ฐ€ 0.02m, 0.05m ๋˜๋Š” 0.075m ๋ฏธ๋งŒ์˜ ๊ฑฐ๋ฆฌ๋ฅผ ๊ฐ–๋Š” ๊ฒƒ์„ ์˜๋ฏธ

90% and 95% ์ •ํ™•๋„๋ณด๋‹ค ์ž‘์„ ๊ฒฝ์šฐ ์ •ํ™•๋„๊ฐ€ ๋†’์•„์ง€๊ณ , 0.02m, 0.05m, or 0.075m ์•ˆ์ •์„ฑ๋ณด๋‹ค ํด ์ˆ˜๋ก ์ •ํ™•๋„๊ฐ€ ๋†’์•„์ง

 

smith, Zhour๊ฐ€ ์ œ์•ˆํ•œ ๋ฐฉ๋ฒ•์˜ ์žฌ๊ตฌ์„ฑ ๊ฒฐ๊ณผ์˜ ์ •ํ™•์„ฑ๊ณผ ์™„์„ฑ๋„๋Š” ํ”„๋ก์‹œ๊ฐ€ ๋ฏธ์„ธํ•ด์งˆ์ˆ˜๋ก ๋ชจ๋‘ ์ฆ๊ฐ€ํ•จ

Zhang์˜ ๊ฒฐ๊ณผ์˜ ์ •ํ™•์„ฑ๊ณผ ์™„์ „์„ฑ์€ ํ”„๋ก์‹œ์™€ ๊ทธ๋‹ค์ง€ ์ผ์น˜ํ•˜์ง€ ์•Š์Œ

๋‹ค๋ฅธ ๋ฐฉ๋ฒ•์œผ๋กœ ์ƒ์„ฑ๋œ ์žฌ๊ตฌ์„ฑ๋œ ๊ฒฐ๊ณผ์™€ ์žฌ๊ตฌ์„ฑ ์˜ค๋ฅ˜์˜ ์‹œ๊ฐํ™”, ๊ฐ’์ด ํด์ˆ˜๋ก ๋‘ ๋ฒˆ์งธ ๋ฐ ์„ธ ๋ฒˆ์งธ ํ–‰์— ๋Œ€ํ•œ ์ •ํ™•๋„, ์™„์„ฑ๋„๊ฐ€ ๋–จ์–ด์ง

์ •ํ™•๋„ ๋ฐ ์™„์ „์„ฑ ๊ฐ’์€ 0 ~ 0.04 ๋ฐ 0 ~ 0.1๋กœ ๊ณ ์ •

๋ณต์žกํ•œ ๊ธฐํ•˜ํ•™๊ณผ ๋†’์€ ํ์ƒ‰์€ ์žฌ๊ตฌ์„ฑ์˜ ์ •ํ™•๋„์™€ ์™„์„ฑ๋„๋ฅผ ๋‚ฎ์ถค

Smith, Zhou์ด ์ œ์•ˆํ•œ ๋ฐฉ๋ฒ•์€ oblique photography ๋ฐ Zhang์— ๋น„ํ•ด ์ •ํ™•๋„์™€ ์™„์„ฑ๋„๊ฐ€ ๋†’์Œ

๊ทธ๋Ÿฌ๋‚˜ Zhang์ด ์ œ์•ˆํ•œ ๋ฐฉ๋ฒ•์— ์˜ํ•ด ์ƒ์„ฑ๋œ ๊ฒฝ๋กœ๋Š” ๋” ๋†’์€ ํ’ˆ์งˆ์„ ๊ฐ€์ง€๋ฉฐ ๋” ์ ์€ ์—๋„ˆ์ง€๋ฅผ ์†Œ๋น„ํ•จ

 

5.5 Comparison of Different Planners

oblique photography๋กœ ์ƒ์„ฑ๋œ ๊ฒฝ๋กœ๋Š” ๋‹จ์ˆœํžˆ ์ง€๊ทธ์žฌ๊ทธ ํŒจํ„ด์„ ๋”ฐ๋ฅด๋ฏ€๋กœ ๋Œ€์ƒ scene์ด ์™„์ „ํžˆ ์ปค๋ฒ„๋˜๊ณ  ์บก์ฒ˜๋œ ์ด๋ฏธ์ง€๊ฐ€ ์ž˜ ๊ณ„์‚ฐ๋จ

baseline planner๋กœ์„œ, oblique photography์€ ๋„ค ๊ฐ€์ง€ ๊ณ„ํš์ž ์ค‘ ์—๋„ˆ์ง€ ๋น„์šฉ์ด ๊ฐ€์žฅ ๋‚ฎ์ง€๋งŒ roughest reconstruction(๊ฐ€์žฅ ๊ฑฐ์นœ) ์žฌ๊ตฌ์„ฑ์„ ์ดˆ๋ž˜ํ•จ

์žฌ๊ตฌ์„ฑ ์˜ค๋ฅ˜๋Š” ์ฃผ๋กœ ์„œ๋กœ ๋‹ค๋ฅธ ๊ฑด๋ฌผ๊ณผ ๋‹ค๋ฅธ ๋ฌผ์ฒด ์‚ฌ์ด์˜ ๊ณต๊ฐ„์— ๋›ฐ์–ด๋“ค ์ˆ˜ ์—†๊ธฐ ๋•Œ๋ฌธ์— ์„œ๋กœ ๋‹ค๋ฅธ ๊ฑด๋ฌผ๊ณผ ๋‹ค๋ฅธ ๋ฌผ์ฒด ์‚ฌ์ด์˜ ํ์ƒ‰์—์„œ ๋น„๋กฏ๋จ

Smith, Zhou๊ฐ€ ์ œ์•ˆํ•œ ๋ฐฉ๋ฒ•์€ ๋ชจ๋‘ oblique photography๋ณด๋‹ค ํ›จ์”ฌ ๋†’์€ ํ’ˆ์งˆ์˜ ์žฌ๊ตฌ์„ฑ์„ ์–ป์Œ

์ผ๋ฐ˜์ ์œผ๋กœ Zhou๊ฐ€ ์ œ์•ˆํ•œ ๋ฐฉ๋ฒ•์€ Smith์— ๋น„ํ•ด ์—๋„ˆ์ง€ ๋น„์šฉ์ด ์ ๊ฒŒ ๋“ฆ

Zhang์ด ์ œ์•ˆํ•œ ๋ฐฉ๋ฒ•์˜ ๊ฒฝ์šฐ Smith, Zhou๋ณด๋‹ค ์žฌ๊ตฌ์„ฑ ์˜ค์ฐจ๊ฐ€ ๋†’์ง€๋งŒ ์ƒ์„ฑ๋œ ๊ฒฝ๋กœ์˜ ์—ฐ์†์„ฑ์œผ๋กœ ์ธํ•ด ๋ฐฐํ„ฐ๋ฆฌ ์†Œ๋ชจ๋Ÿ‰์ด ๊ฐ์†Œ๋จ


6. Simulator and Applications

3D ์ธ์Šคํ„ด์Šค ๋ถ„ํ•  ๋ฐ์ดํ„ฐ์…‹(S3DIS, ScanNet, SceneNN)์ด ์žˆ์ง€๋งŒ ๋ชจ๋‘ ์‹ค๋‚ด scene์—์„œ ์ˆ˜์ง‘๋˜๋ฉฐ ๋”ฅ ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜ ๋ฐฉ๋ฒ•์—๋Š” ์—ฌ์ „ํžˆ ์ถฉ๋ถ„ํ•˜์ง€ ์•Š์Œ

๋„“์€ ์•ผ์™ธ scene, ํŠนํžˆ ๋ณต์žกํ•œ ๋„์‹œ ์ง€์—ญ์˜ ๊ฒฝ์šฐ ๊ธฐ๋ณธ์ ์œผ๋กœ 3D ๊ฑด๋ฌผ ์ธ์Šคํ„ด์Šค ๋ถ„ํ• ์„ ํ•™์Šตํ•˜๊ธฐ ์œ„ํ•œ ์ ์ ˆํ•œ ๋ฐ์ดํ„ฐ์…‹์ด ์—†์Œ

UrbanScene3D

3D instance segmentation research๋ฅผ ์œ„ํ•œ ํ’๋ถ€ํ•œ large-scale urban scene building annotation data๋ฅผ ์ œ๊ณต

3D ์•„ํ‚คํ…์ฒ˜๋ฅผ ๋ถ„ํ• ํ•˜๊ณ  ๋ ˆ์ด๋ธ”์„ ๋ถ™์ด๊ธฐ ์œ„ํ•ด ์ „์ฒด scene ๋ชจ๋ธ์—์„œ ๋ชจ๋“  ๋‹จ์ผ ๊ฑด๋ฌผ ๋ชจ๋ธ์„ ์ˆ˜๋™์œผ๋กœ ์ถ”์ถœํ•จ

๊ทธ๋Ÿฐ ๋‹ค์Œ ๋ชจ๋“  ๊ฑด๋ฌผ์— ๊ณ ์œ ํ•œ ๋ ˆ์ด๋ธ”์ด ํ• ๋‹น๋˜์–ด ์ธ์Šคํ„ด์Šค ๋ถ„ํ•  ๋งต์„ ํ˜•์„ฑํ•จ

(์•„๋ž˜ ์‚ฌ์ง„์˜ ์™ผ์ชฝ ์œ„์ฒ˜๋Ÿผ)

UrbanScene3D๋Š” ํ™˜๊ฒฝ๋ณ„ ๋นŒ๋”ฉ ์ธ์Šคํ„ด์Šค ID(์™ผ์ชฝ ์œ„), ์‹ค์ œ ์žฅ๋ฉด ํš๋“์„ ๋ชฉํ‘œ๋กœ ํ•˜๋Š” 4K ํ•ญ๊ณต ๋น„๋””์˜ค(์˜ค๋ฅธ์ชฝ ์œ„), Unreal Engine๊ณผ AirSim(์•„๋ž˜)์— ๋‚ด์žฅ๋œ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ๋ฅผ ์ œ๊ณต

UrbanScene 3D์˜ ์ธ์Šคํ„ด์Šค ๋ถ„ํ•  ๋ ˆ์ด๋ธ”์ด ์žˆ๋Š” 3D ํ…์Šค์ฒ˜ ๋ชจ๋ธ์„ ํ†ตํ•ด ์‚ฌ์šฉ์ž๋Š” ์›ํ•˜๋Š” ๋ชจ๋“  ์ข…๋ฅ˜์˜ ๋ฐ์ดํ„ฐ(instance segmentation ๋งต, ์ž„์˜ ํ•ด์ƒ๋„์˜ ๊นŠ์ด ๋งต, ๋ณด์ด๊ฑฐ๋‚˜ ๋ณด์ด์ง€ ์•Š๋Š” ์žฅ์†Œ์˜ 3D ํฌ์ธํŠธ ํด๋ผ์šฐ๋“œ/๋ฉ”์‰ฌ ๋“ฑ)๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ์Œ

3D ์žฌ๊ตฌ์„ฑ์„ ๋ชฉํ‘œ๋กœ ํ•˜๋Š” ์ผ๋ถ€ ํŠน์ • ์‹ค์ œ scene์—์„œ 4K ์บก์ฒ˜๋œ ํ•ญ๊ณต ๋น„๋””์˜ค๋ฅผ ์ œ๊ณตํ•จ

(์‚ฌ์ง„์˜ ์˜ค๋ฅธ์ชฝ ์œ„)

→ ๊ณ ์ •๋ฐ€ ๋ ˆ์ด์ € ์Šค์บ”๊ณผ ํ•จ๊ป˜ ground-truth์™€ ํ•จ๊ป˜ ๋‹ค์–‘ํ•œ SLAM ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ํ›ˆ๋ จํ•˜๊ณ  ํ‰๊ฐ€ํ•˜๋Š” ๋ฐ ํšจ๊ณผ์ ์œผ๋กœ ์‚ฌ์šฉ๋  ์ˆ˜ ์žˆ์Œ

 

UrbanScene 3D๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์‚ฌ์šฉ์ž๋Š” ๋กœ๋ด‡(์ž๋™์ฐจ ๋˜๋Š” ๋“œ๋ก )์„ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ํ•˜์—ฌ ์ œ์•ˆ๋œ ๋„์‹œ ํ™˜๊ฒฝ์—์„œ ๋‹ค์–‘ํ•œ ์ž์œจ ์ž‘์—…์„ ํ…Œ์ŠคํŠธํ•  ์ˆ˜ ์žˆ์Œ

์ค‘๋ ฅ, ๊ด€์„ฑ, ์ถฉ๋Œ์€ ์—์–ด์‹ฌ์˜ ๋ฌผ๋ฆฌ์  ์—”์ง„์œผ๋กœ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ์Œ

→ ์‚ฌ์šฉ์ž๋Š” ๋งŽ์€ ์ž‘์—… (depth estimation(๊นŠ์ด ์ถ”์ •), ์ž์œจ ํƒ์ƒ‰ ๋ฐ ์ƒˆ๋กœ์šด ๋ทฐ ํ•ฉ์„ฑ)์— ๋Œ€ํ•ด ๋งค์šฐ ํ˜„์‹ค์ ์ธ ๋ฐ์ดํ„ฐ๋ฅผ ์‰ฝ๊ฒŒ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์Œ

 

๊ฐ ๋„์‹œ scene์˜ ์กฐ๋ช… ์ƒํƒœ์™€ ๋‚ ์”จ ๋ชจ๋‘ ์‚ฌ์šฉ์ž์— ์˜ํ•ด ์กฐ์ž‘๋  ์ˆ˜ ์žˆ์Œ

(์‚ฌ์ง„ ์•„๋ž˜์ชฝ)

 

ํฐ ๋‹ค์–‘์„ฑ์„ ๋ถ€์—ฌ๋ฐ›์€ ์ด๋Ÿฌํ•œ ๋ฐ์ดํ„ฐ๋Š” ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ๊ณผ ์‹ค์ œ ํ™˜๊ฒฝ ์‚ฌ์ด์˜ ๋ถˆ์ผ์น˜๋ฅผ ๊ฐ์†Œ์‹œ์ผœ ์ œ์•ˆ๋œ ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ์ผ๋ฐ˜ํ™”๋ฅผ ์ฆ๊ฐ€์‹œํ‚ด

 


7. Conclusion and Future Work

rich data annotations์™€ 6๊ฐœ์˜ ๋Œ€ํ‘œ์ ์ธ ํ™˜๊ฒฝ์— ๋Œ€ํ•œ ๋‹ค์–‘ํ•œ ๊ด€์ฐฐ์„ ์ œ๊ณตํ•˜๋Š” ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ ์„ธํŠธ์ธ UrbanScene3D๋ฅผ ์ œ์‹œ

ํ•ด๋‹น ์žฌ๊ตฌ์„ฑ ๊ฒฐ๊ณผ์™€ ground-truth ๋ชจ๋ธ/์Šค์บ”์„ ์‚ฌ์šฉํ•˜์—ฌ ๊ฒฝ๋กœ ๊ณ„ํš ๋ฐ MVS ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ์Œ

์ œ์•ˆ๋œ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ๋ฅผ ํ†ตํ•ด ์‚ฌ์šฉ์ž๋Š” ๋‹ค์–‘ํ•œ ์กฐ๋ช…/๋‚ ์”จ ์กฐ๊ฑด์„ ๊ฐ€์ง„ ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ ํŒจํ„ด์—์„œ ๋„์‹œ ์žฅ๋ฉด์„ ์ถ”๊ฐ€๋กœ ํƒ์ƒ‰ํ•˜๊ณ  ์บก์ฒ˜ํ•  ์ˆ˜ ์žˆ์Œ

UrbanScene 3D์˜ ์ถœ์‹œ๋Š” ์ปค๋ฎค๋‹ˆํ‹ฐ์— ํฐ ๋„์›€์ด ๋  ๊ฒƒ

 

์•ž์œผ๋กœ ์ปดํ“จํ„ฐ ๋น„์ „๊ณผ ์ปดํ“จํ„ฐ ๊ทธ๋ž˜ํ”ฝ ๋ชจ๋‘์—์„œ ์ถ”๊ฐ€ ์—ฐ๊ตฌ๋ฅผ ์ง€์›ํ•˜๊ธฐ ์œ„ํ•ด ๋ฐ์ดํ„ฐ ์„ธํŠธ์—์„œ 3D ๊ตฌ์กฐ ์ง€์ , ๋‹จ๋ฉด ํ”„๋กœํŒŒ์ผ, ์™€์ด์–ด ํ”„๋ ˆ์ž„ ๋˜๋Š” ํ‰๋ฉด ์„ธ๊ทธ๋จผํŠธ ๋“ฑ๊ณผ ๊ฐ™์€ ๋†’์€ ์ˆ˜์ค€์˜ ๊ธฐํ•˜ํ•™์  ์„ค๋ช…์„ ์ˆ˜ํ–‰ํ•  ๊ณ„ํš์ž„

UrbanScene3D๋Š” ๋ฐ์ดํ„ฐ ์ค‘์‹ฌ ์—ฐ๊ตฌ์— ๋” ๋งŽ์€ ๊ธฐ์—ฌ๋ฅผ ํ•  ์ˆ˜ ์žˆ๋„๋ก ์ง€์†์ ์œผ๋กœ ์„ฑ์žฅํ•  ๊ฒƒ


์šฐ์™€ ๋~

๋‚ด๊ฐ€ ์š”์ฆ˜ ๊ฐ–๊ณ ์‹ถ์€.. ํƒ„ ํ‚คํ‹ฐ..

'l a b . . ๐Ÿซง > ๋…ผ๋ฌธ review' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

[SBERT] Sentence-BERT  (0) 2023.04.27