본문 바로가기
영화

영화 보는 눈이 달라지는 용어들 — 알아두면 쓸모 있는 영화 문법 기초

by fadedfilm 2026. 3. 12.
반응형

영화 리뷰나 비평을 읽다 보면 낯선 용어들이 자주 등장한다. 미장센, 몽타주, 클로즈업, 딥 포커스. 뜻을 정확히 몰라도 영화를 즐기는 데는 지장이 없다. 하지만 이 용어들이 무엇을 가리키는지 알게 되면, 같은 영화를 보면서 훨씬 많은 것이 보이기 시작한다.

이 글은 영화를 더 깊이 즐기고 싶은 분들을 위한 기초 용어 해설이다. 어렵지 않다. 알고 나면 "아, 그게 그거였구나" 싶은 것들이다.


미장센 (Mise-en-scène)

프랑스어로 '장면 안에 배치된 것'이라는 뜻이다. 영화에서는 카메라 프레임 안에 보이는 모든 것, 즉 배우의 위치, 조명, 세트, 소품, 의상, 색깔 등을 통틀어 가리킨다.

간단히 말해 "화면 안에 무엇이 어떻게 있는가"다.

미장센을 의식하며 보기 시작하면, 감독이 특정 장면에서 무엇을 어디에 두었는지가 보인다. 인물 뒤에 있는 배경, 프레임 가장자리에 살짝 걸쳐 있는 사물, 특정 색의 옷을 입은 인물 — 이것들이 모두 의도된 선택이다.

예시로 이해하기: 두 인물이 대화하는 장면에서 한 사람은 환한 빛 아래, 다른 한 사람은 그림자 속에 있다면, 이것은 미장센을 통해 두 사람의 관계나 심리적 위치를 표현하는 것이다.


몽타주 (Montage)

몽타주는 편집을 통해 서로 다른 장면들을 연결해 새로운 의미를 만들어내는 기법이다.

가장 유명한 예는 '쿨레쇼프 효과'다. 1920년대 소련의 영화 실험으로, 같은 배우의 무표정한 얼굴 앞에 음식 사진, 관 사진, 아이 사진을 각각 이어 붙였더니 관객들이 배우의 표정에서 각각 허기, 슬픔, 기쁨을 읽었다. 얼굴 자체는 변하지 않았는데 옆에 무엇이 오느냐에 따라 의미가 달라진 것이다.

몽타주는 이 원리를 영화 전체에 적용한다. 따로 찍힌 두 장면을 붙이면, 각 장면에는 없던 새로운 의미가 생겨난다. 이것이 영화 편집의 가장 강력한 힘이다.

예시로 이해하기: 누군가가 웃는 장면 다음에 장례식 장면이 이어지면, 그 웃음이 불길하거나 냉소적으로 느껴진다. 반대 순서로 붙이면 전혀 다른 감정이 만들어진다.


샷의 크기 — 클로즈업부터 풀샷까지

카메라가 피사체를 얼마나 가까이 담느냐에 따라 샷의 이름이 달라진다. 각각의 샷 크기가 만들어내는 감각이 다르기 때문에, 감독은 이것을 의도적으로 선택한다.

익스트림 클로즈업 (Extreme Close-Up): 눈, 입, 손가락 등 신체의 극히 일부만 담는다. 강렬한 집중과 긴장감을 만든다. 세부 정보를 강조하거나 관객이 인물에게 극단적으로 밀착되는 느낌을 준다.

클로즈업 (Close-Up): 얼굴 전체를 가득 채우는 샷. 감정을 전달하는 데 가장 강력한 도구다. 클로즈업이 많은 영화일수록 인물의 내면에 집중하는 경향이 있다.

미디엄 샷 (Medium Shot): 허리 위나 무릎 위를 담는 샷. 대화 장면에서 가장 자주 사용된다. 인물과 적당한 거리를 유지하며 자연스러운 관찰의 느낌을 준다.

풀샷 (Full Shot): 인물의 전신이 보인다. 행동이나 움직임을 보여줄 때 효과적이다.

익스트림 롱샷 (Extreme Long Shot): 인물이 아주 작게 보이거나 풍경 속에 묻힌다. 고독, 광대함, 압도감을 표현할 때 쓰인다.


카메라 움직임

카메라가 움직이는 방식도 의미를 만든다. 정지해 있는 카메라와 움직이는 카메라는 전혀 다른 감각을 준다.

패닝 (Panning): 카메라가 고정된 채로 좌우로 회전한다. 넓은 공간을 보여주거나, 두 대상을 연결할 때 사용한다.

틸팅 (Tilting): 카메라가 위아래로 회전한다. 높은 건물을 올려다보거나 발에서 얼굴까지 훑어볼 때 등에 사용된다.

트래킹 (Tracking): 카메라 자체가 이동하며 피사체를 따라간다. 인물과 함께 걷는 느낌을 주며 관객이 그 공간 안에 있는 느낌을 만든다.

핸드헬드 (Handheld): 카메라를 손으로 들고 촬영해 약간의 흔들림이 있다. 다큐멘터리적 현장감, 불안감, 생동감을 준다. 의도적으로 사용될 때와 기술적 한계로 나타날 때의 효과는 다르다.

줌 (Zoom): 카메라가 이동하지 않고 렌즈 배율이 바뀐다. 트래킹과 달리 배경과 인물의 원근 관계가 달라지지 않아 독특한 평면적 느낌을 만든다.


딥 포커스 (Deep Focus)

화면의 앞, 중간, 멀리 있는 것들이 모두 선명하게 보이는 촬영 방식이다. 반대는 특정 피사체만 선명하고 나머지가 흐릿한 얕은 심도(shallow focus)다.

딥 포커스를 사용하면 관객이 프레임 안의 여러 요소를 동시에 볼 수 있다. 앞에 있는 인물과 먼 배경에서 일어나는 일을 동시에 인식하면서, 관객 스스로 무엇에 집중할지를 선택하게 된다. 오손 웰스와 촬영감독 그레그 톨런드가 《시민 케인》에서 이 기법을 적극 활용한 것이 영화사에서 유명하다.

반대로 얕은 심도는 감독이 관객의 시선을 한 곳으로 유도할 때 효과적이다. 배경이 흐려지면 자연스럽게 선명한 피사체에 집중하게 된다.


다이제틱 사운드와 논다이제틱 사운드

영화 속 소리는 크게 두 가지로 나뉜다.

다이제틱 사운드 (Diegetic Sound): 영화 속 세계에서 실제로 나는 소리다. 인물들도 들을 수 있다. 대화, 발소리, 화면 속 라디오에서 흘러나오는 음악이 여기에 해당한다.

논다이제틱 사운드 (Non-diegetic Sound): 영화 속 세계와 무관하게 관객에게만 들리는 소리다. 배경 음악이 대표적이다. 인물들은 이 음악을 듣지 못한다. 관객의 감정을 조율하기 위해 외부에서 더해진 소리다.

이 구분을 알면, 영화 속 음악이 인물이 듣는 음악인지 우리만 듣는 음악인지를 의식하게 된다. 어떤 영화는 이 경계를 의도적으로 흐리면서 현실과 내면의 경계를 모호하게 만들기도 한다.


마치며

이 용어들을 한꺼번에 외울 필요는 없다. 하나씩, 다음 영화를 볼 때 하나만 의식해보는 것으로 충분하다. "이 장면에서 클로즈업을 쓴 이유가 뭘까?" 하는 작은 질문 하나가 영화를 보는 방식을 바꾼다.

영화 문법을 안다는 것은 영화를 분석하기 위해서가 아니다. 감독이 어떤 선택을 했는지를 인식할 수 있을 때, 영화가 건네는 이야기가 더 선명하게 들리기 시작하기 때문이다.


이 글은 영화 기초 용어에 대한 입문 해설 에세이입니다. 특정 작품의 홍보와 무관하며, 필자의 독자적인 관점에서 작성되었습니다.

반응형