Trasformazione prospettica

Quando gli occhi umani vedono cose vicine, sembrano più grandi rispetto a quelle che sono lontane. Questa si chiama prospettiva in modo generale. Mentre la trasformazione è il trasferimento di un oggetto ecc. Da uno stato all'altro.

Quindi, nel complesso, la trasformazione della prospettiva si occupa della conversione del mondo 3D in un'immagine 2D. Lo stesso principio su cui funziona la visione umana e lo stesso principio su cui funziona la telecamera.

Vedremo in dettaglio perché questo accade, che quegli oggetti che ti sono vicini sembrano più grandi, mentre quelli che sono lontani, sembrano più piccoli anche se sembrano più grandi quando li raggiungi.

Inizieremo questa discussione dal concetto di quadro di riferimento:

Quadro di riferimento:

Il quadro di riferimento è fondamentalmente un insieme di valori in relazione ai quali misuriamo qualcosa.

5 quadri di riferimento

Per analizzare un mondo / immagine / scena 3D, sono necessari 5 diversi frame di riferimento.

  • Object
  • World
  • Camera
  • Image
  • Pixel

Cornice coordinate oggetto

La cornice delle coordinate degli oggetti viene utilizzata per modellare gli oggetti. Ad esempio, controllando se un particolare oggetto è in una posizione corretta rispetto all'altro oggetto. È un sistema di coordinate 3D.

Cornice delle coordinate del mondo

La cornice delle coordinate mondiali viene utilizzata per mettere in relazione oggetti in un mondo tridimensionale. È un sistema di coordinate 3D.

Cornice delle coordinate della telecamera

La cornice delle coordinate della telecamera viene utilizzata per mettere in relazione gli oggetti rispetto alla telecamera. È un sistema di coordinate 3D.

Cornice delle coordinate dell'immagine

Non è un sistema di coordinate 3d, piuttosto è un sistema 2d. Viene utilizzato per descrivere come i punti 3d vengono mappati su un piano immagine 2D.

Pixel coordinate frame

È anche un sistema di coordinate 2d. Ogni pixel ha un valore di coordinate pixel.

Trasformazione tra questi 5 fotogrammi

È così che una scena 3d viene trasformata in 2d, con l'immagine di pixel.

Ora spiegheremo matematicamente questo concetto.

Dove

Y = oggetto 3d

y = 2d Immagine

f = lunghezza focale della telecamera

Z = distanza tra l'oggetto e la telecamera

Ora ci sono due diversi angoli formati in questa trasformata che sono rappresentati da Q.

Il primo angolo è

Dove meno denota che l'immagine è invertita. Il secondo angolo che si forma è:

Confrontando queste due equazioni otteniamo

Da questa equazione, possiamo vedere che quando i raggi di luce si riflettono dopo aver colpito l'oggetto, passato dalla fotocamera, si forma un'immagine invertita.

Possiamo capire meglio questo, con questo esempio.

Per esempio

Calcolo delle dimensioni dell'immagine formata

Supponiamo che sia stata scattata un'immagine di una persona alta 5 metri e che si trova a una distanza di 50 metri dalla fotocamera, e dobbiamo dire che la dimensione dell'immagine della persona, con una fotocamera di lunghezza focale, è 50 mm.

Soluzione:

Poiché la lunghezza focale è in millimetri, dobbiamo convertire ogni cosa in millimetri per calcolarla.

Così,

Y = 5000 mm.

f = 50 mm.

Z = 50000 mm.

Mettendo i valori nella formula, otteniamo

= -5 mm.

Anche in questo caso, il segno meno indica che l'immagine è invertita.