합성의 계보학
 
하재용
 
0034.jpg

Ich vermute, dass wir nur sehen, was wir kennen.

나는 우리가 오로지 아는 것 만을 볼 수 있다고 추정한다. – Friedrich Nietzsche

Medien bestimmen unsere Lage

매체가 우리의 상황을 결정한다. – Friedrich Kittler

각기 다른 미디엄은 이 같은 각기 다른 정신 과정을 사용하게 한다. – Lev Manovich

 

          하나의 유령이 예술계를 떠돌고 있다. 인공지능이라는 유령이. 이 인공지능은 그것의 발생적 측면에서 너무나도 고도로 전문적으로 이해되고 있음에도 불구하고 수용의 측면에서는 여전히 그 빈곤함이 쉽게 드러난다. 이러한 상황 속에서 시각 예술에서 이미지를 생성하는 새로운 가능성으로 인공지능이 대두되기 시작해왔다. 그리고 이러한 인공지능에 의해서 만들어지는 이미지를 폭넓게 말해 ‘합성-이미지’라고 지칭하기도 한다. 더 포괄적으로 말하면 인공 지능의 개입을 통해서 만들어지는 생산물을 ‘합성-미디어’라고 할 수 있다. 그런데 여기서 ‘합성’이란 무엇인가? 이러한 질문이 바로 이 글의 출발점이라고 볼 수 있다. 사실 합성으로 나타나는 결과물에는 시각적인 것 이상의 영역들이 함께 검토되어야 할 필요가 있지만 적어도 이 글에서는 ‘시각 문화’에 국한해서 살펴볼 것이다. 이미지와 연관된 합성의 개념을 크게 나누면 세 가지로 분류할 수 있는데, 여기서는 먼저 양극단을 설정하는 것이 한층 더 쉽다. 한쪽에는 현실에서 추출돼 ‘동시적’으로 매끄럽게 정돈되어 ‘현실처럼’ 등장한 장면들과 그 반대쪽에 현실과 상관없이 응집된 노이즈의 결과로서의 ‘진짜-가짜인 현실’이 있다. 두 경우 모두 인간이 사용하려는 이미지를 구상적이든 추상적이든 상관 없이 최대한 ‘그럴 듯’하게 만들고, 가능하면 ‘사실’ 처럼 형성하는 게 중요하다. 그리고 이 두 극단 사이에 전자의 속성을 지닌 채 후자를 예견하는 중간축을 설정할 수 있다. 전자는 아날로그적 합성, 중간축은 디지털적 합성 그리고 마지막으로 후자를 인공지능 합성으로 나눠서 이 글은 각 부분이 어떠한 계보로 이어지는지 살펴볼 것이다. 흥미롭게도 전통적 합성, 즉 이 글에서 아날로그적 합성이라고 주장하는 것이 이 계보를 망상하도록 자극하지 않았다. 반대로 후자인 ‘인공 지능 합성’이 원인이다. 세 가지 합성의 계보는 자신이 연루된 매체적 상황에 따라서 그 작동 방식이 너무나 판이하기에 그들 각각을 그저 나열했을 때 도통 어떻게 연관되는지 알 수 없다. 따라서 이 글은 이 계보들을 텍스트의 형식을 빌려서 짜 맞춰보려는 시도로 볼 수 있다. 인공지능 자체는 예술과는 전혀 관련이 없을 수 있다. 마찬가지로 예술 자체는 인공지능과 상관없을 수 있다. 하지만 그 둘이 연루된 순간에 그 연결점을 파악할 수 있는 추가적인 작업이 요구된다. 그건 예술이 스스로 말하려는 것이 아니다. 이 글의 지향점은 무엇보다도 시각 예술이라는 분과에서 ‘합성’이라는 개념이 어떻게 구체화되고 통용될 수 있는지 생각해보는 것과 인공지능 합성을 통한 이미지 생성이 인간의 창작과 어떻게 비교될 수 있는지 문제시 삼는 것이다. 각각의 합성에서 실천적인 사례들은 과학과 예술을 굳이 나누지 않더라도 뒤섞인 곳에서 너무나 빠른 속도로 덧붙여지는데 그러한 흐름을 따라가기 위해서 나는 이 글을 쓰는 것이 아니다. 반대로 그것에서 빠져나와 멈춘 상태가 이 글의 위상이라고 할 수 있다.


합성의 개념에 대하여 – 어원학적 및 철학적 고찰들

          ‘합성’이라는 단어는 필연적으로 고대 그리스어에서 뿌리를 가지는데 일반적으로 라틴문자에서 Synthesis 라는 개념어로 사용되었기 때문이다. Synthesis는 고대 그리스어에서 명사형으로 σύνθεσις(súnthesis, “함께 놓음; 구성”), 동사형으로 συντίθημι(suntíthēmi “함께 놓다, 결합하다”)로 서술 되었다. 이 단어가 가지는 가장 핵심적인 의미는 무엇보다도 떨어진 대상이 하나로 합쳐진 상태다. 이러한 상태는 특정 위상에 각기 다른 대상을 함께 놓는 것에 가깝다. 그리고 이렇게 함께 놓인 대상들을 합성된 또는 종합된 것으로 파악하는 것은 인간의 지각과 실존적인 필요에서도 핵심이다. 그리스-라틴어의 어원을 분석해보면 우리는 이 단어가 일종의 개념으로서 다른 것들이 하나로 모이는 상황을 서술하게 한다는 인상을 받는다. 따라서 우리 인간들이 아날로그와 디지털 합성의 질적 차이를 무시한 채 ‘같은 것’이라고 이해하는 건 바로 두 방향의 합성이 같은 모양새를 보여주고, 그 결과를 지시하기 위해서 우리가 같은 단어를 사용하기 때문이라는 점이 밝혀진다.

          다시 그리스-라틴어 Synthesis로 돌아가자. 독일의 철학자 ‘마르쿠스 가브리엘’은 <생각이란 무엇인가>라 는 저서에서 인공지능의 기능과 인간의 생각-감각을 구분하면서 ‘종합’, 즉 Synthesis에 대해 아리스토텔레스를 경유 하며 이야기한다. “아리스토텔레스는 우리의 생각하기는 다양한 인상들을 종합하기라고 말한다. <종합 Zusammenstellung>은 희랍어로 <Syn-thesis>(syn=함께, tithenai=놓다)다. 아리스토텔레스와 마찬가지로 칸트는 생각하기를 개념들로 결합하기로, 곧 <신테시스>로 이해한다.”1 가브리엘은 좀 더 나아가 앞의 내용을 자세히 전개하는데, 이를테면 생각하기를 일종의 배열과 구별을 동시에 전개하는 종합 인지 과정으로서 이해한다. 재차 아리스토텔레스가 여기서 언급되는데, 실재가 단일한 인상으로써 여러 부분들의 배치와 그 사이의 구분으로써 ‘종합’되는 것이 바로 생각을 통일하는 과정으로서의 Synthesis라고 말할 수 있다. 게다가 이것은 ‘차근차근 생각한다’라는 말과 거의 동일한 것으로 취급되는데 ‘차근차근’이라는 수식어가 아날로그적인 합성이 가지는 특유의 속성을 내포하기 때문이다. 따라서 여기서 아날로그란 연속적인 유사 관계들의 포개짐을 의미한다. 2

          가브리엘이 아리스토텔레스로 되돌아감으로써 서술해내는 인간적인 합성의 메커니즘은 캐나다의 철학자 ‘브라이언 마수미‘에게서 더욱 자세히 서술된다. 그는 저서 <가상계>에서 갈라질 수 없는, 즉 절대적인 것과 관련되어 논의한다. “절대적인 것의 해체는 경험적인 것의 활동성, 즉 전체로부터 분리된 부분들의 가변적 총계로 그 전체를 감소시키는 것이다. 관계를 감소시켜 해체하는 것을 “분석”이라고 부른다. 관계의 발생은 분석의 반대가 아니다. 분석의 반대는 “종합” Synthesis이다. 이것은 “구조화”의 다른 말이다.”3 인간이 어떤 절대적인 것, 그러니까 지독히 실제적인 특정 순간 혹은 발생을 부분으로 나눌 때 그 역전 관계로 합성이 탄생한다. 이 합성은 인간에게서 이미 와해된 절대적인 것을 다시 구성해내지는 못한다. 차라리 이렇게 말하는 것이 나을 것이다. 어떤 것을 합성한다는 것은 무언가를 해체하거나 산산조각 내기 위해서 가상적으로 이미 ‘맥락을 전제’하는 것이다. 가상이라는 맥락에서 우리는 무엇보다 쉽게 ‘허구’에 대해서 이야기하게 된다. 하지만 합성이라는 것은 ‘현실성’을 획득하기 위한 활동이 아니었는가? 어째서 허구가 여기서 튀어나오는 것일까? 이와 관련해 랑시에르가 역시나 ‘아리스토텔레스’를 경유하며 던지는 경구와 같은 말이 핵심적이다. 여기서 ‘허구’는 “상상적 세계의 발명”이 아니고, 반면에 “이해 가능한 방식으로 사고 되고 연결될 수 있는 틀을 구축하는 것.”이다. 4

          우리는 이제 이러한 결론에 도달할 수 있게 되었다. 아날로그적 합성이란 오래전부터 연속적으로 이어지는 인간의 생각-인지에 수반되는 것이며, 그 과정은 단일하게 감각되는 어떤 실재적인 순간을 가분화하기 위해 일종의 잠 재적인 활동으로 전제되는 것이다. 이는 결단코 예측이나 예언으로 작동하지 않는데, 왜냐면 종합과 합성은 이루어지지 않은 채로만 전제되기 때문이다. 즉 종합될 수 있을 것이라는 잠재성이 선결될 뿐이지 인식된 단일한 대상이 인식 전의 종합적 전제와 동일하진 않다는 것이다. 해체 이후의 종합에서 인식된 절대적인 것은 준-절대적인 것(Quasi-Absolute)으로 쪼그라든다. 지금까지 우리는 합성이라는 용어의 어원과 철학적 토대를 검토했다. 그리고 그 과정에서 디지털적인 그리고 인공지능과 연관된 합성이 감춘 지질층으로서의 아날로그적 합성이 발굴되었다. 따라서 잊혔던 그러나 우리 앞으로 던져진 계보의 시작점에 대해 자세히 다룰 필요가 있다.

아날로그적 합성

          지금까지 합성의 어원학적 및 철학적 개념들을 검토하며 얻어진 결론은 그러한 과정이 차근차근 이루어지며 궁극적으로 어떤 대상과의 접촉 관계에서 그것을 해체하기 위한 망상적 맥락 형성의 일환으로 작동한다는 것이다. 이러한 개념에 가장 잘 들어맞는 것은 우리를 여전히 맴돌며 기계적 기록의 보편화 이전에 세계를 지배했던 아날로그적 합성이라고 할 수 있다. 아날로그적 합성의 메커니즘을 보편화하면 다음과 같다. 1. 아날로그적(차근차근) 2. 관계적 (인간의 신체와 정신 양자에 모두 접촉) 3. 통합적 (결과로 나타나는 이미지의 분리 불가능성) 5 이러한 메커니즘을 이미지 생성의 측면에 집중해 살펴보면 결국 ‘재현성’이 가장 핵심이 된다. 여기서 거론하는 재현(Darstellung)이라는 용어는 좁은 의미의 모방(Imitation)과의 동의어가 아니다. 반대로 이러한 재현으로서의 합성이란 인간들이 지금까지 이미지의 목표가 된 존재를 이상화하거나 세속화함으로써 자신의 문화 영역 내로 재투사(Wiedergeben)함으로써 달성 할 수 있었다. 그 원료는 현실에서 추출되는데, 그것이 비록 찰나의 국지적 현상일지라도 예술가는 그것을 다른 위상(시공간)에 이행가능한 형태로, 즉 인식 가능한 변환 자체로 탈바꿈 시켜왔다.6 따라서 예술 혹은 이미지를 생성하는 활동은 실질적으로 특정한 물질적 혹은 비물질적 매체에 외상을 기입하는 것에 더해 이미지 자체를 방출하는 바로 그 매개체를 통해 수행되는 과정이라는 점이 드러난다. 그리고 이런 이미지들은 항상 인간의 의식에서 필수적으로 수반되는 과정으로서 합성의 초월화를 통해 순간적이면서도 반복 가능하게 나타난다. 따라서 아날로그적 합성으로서의 이미지 생성은 이미 감각적인 측면에서 본질적인 활동이며, 실제로 우리가 이미지를 ‘표출’하기 전에도 작동한다. 그러나 그것을 실체화하는 일이란 더 많은 작업들을 요구한다.

 

 

 

 

 

 

 

 

 

 

 

 

 

아레초의 키메라, 청동상, 기원전 400년,

피렌체 국립 고고학 박물관
https://commons.wikimedia.org/wiki/
 

 

          아날로그적 합성이 앞서 말했듯 인간의 인식에 필수적으로 수반되는 과정이라면 반대로 그것의 실체화로서 어떤 사례를 거론할 수 있을까? 사실 수많은 언급 가능한 합성의 순간과 결과물이 존재할 것이다. 하지만 여기서는 아주 제한적인 대표적 사례만을 다루자. 우선 ‘합성’이라는 개념은 이제 ‘창작’과 비교 분석을 통해 재개념화 해볼 필요 가 있다. 한 문화권 내에서 점진적으로 이루어지는 공동 창작의 한 사례는 ‘신화’이며, 그 대척점에 개인의 산물로 여겨지는 ‘예술’의 창작이 있다. 신화란 궁극적으로 인간들에 의해서 빚어지지만, 재차 인간들을 조건 짓는 공동의 장으로 자리 잡는다. 그리고 여기서 신화적 존재들은 인간이 샅샅이 판단할 수 없어 두려워하는 것들이 선제적으로 종합됨으로써 탄생한다. 대표적으로 신화 속의 괴물과 반인반수들이 이러한 아날로그적 합성의 작동 과정을 잘 보여준다. 가장 흥미로운 사례는 바로 고대 그리스에서부터 이어진 키메라에 대한 이미지다. 고대 그리스어에서 키메라의 의미란 단순히 암컷 염소였다. 하지만 고대 그리스인들은 현재의 터키 지방인 ‘야나타스Yanyaart산’에서 메탄을 비롯한 가스들 을 통해 끊임없이 피어오르는 불과 그 지역의 뱀, 염소 그리고 사자라는 개별의 이미지들을 합성해 괴물로서의 키메라를 형성했다. 꺼지지 않는 불이라는 해명 불가능한 현상은 각 동물들의 육체를 뜯어 붙이는 과정에서 안정화되어 ‘괴물이 뿜는 불’로 변형된다. 즉 키메라란 실재하는 야나타스산의 해명 불가능한 원리를 ‘이해 가능한 방식‘으로 소급시킨 결과물이다. 이러한 아날로그적 합성에서 핵심은 어디까지나 인간이 인지할 수 있는 영역으로 대상을 끌어들이는 것이다. 따라서 신화적인 아날로그적 합성은 창작의 일환에서는 초월적인 것(이해 불가능한 것)을 내재적인 것(이해 가능한 것)으로 만드는 방식이다. 이 단계에서 합성은 곧 현실화 되지 않는 잠재적인 것으로 도처의 순간에서 다르게 튀어 나오지만, 매번 다르게 구체화되어 고정되어 있지 않다.7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


[코뿔소], 알브레히트 뒤러, 1515, 239x298mm, 목판화,

슈테델 뮤지엄, 프랑크푸르트 암 마인
 https://commons.wikimedia.org/wiki/

 

          신화적 합성과 반대로 우리가 흔히 개인의 혹은 집단의 표명으로서 이해하는 예술의 창작에서 합성이란 정반대의 원칙을 따라 작동해야 한다. 우리는 이런 방식의 대표적 사례로 ‘뒤러’의 [코뿔소Rhinocervs]를 언급할 수 있 다. 1515년 뒤러는 코뿔소를 실제로 보지 않은 채, 이후에도 보지 못한 채 거의 동일하게 인식 가능한 정도의 외상을 간략한 스케치와 언어적 묘사의 도움으로 달성할 수 있었다. 당시 코뿔소는 포르투갈의 마누엘 1세에게 1515년 5월 20일 바쳐진 후 재차 교황 레오 10세에게 12월에 헌상된다. 이러한 과정 속에서 여러 명이 코뿔소를 보고 이미지와 텍스트로 묘사했다. 교황에게 바쳐지기 전 리스본에 머물던 시기에 ‘발렌팀 페르난데스’는 뉘른베르크의 친구에게 코뿔소에 대 해 묘사해 편지를 보냈는데, 익명의 화가가 코뿔소를 묘사한 그림도 뉘른베르크로 보내졌다. 당시 뒤러는 교역소 사람들과 교류했기에 편지와 그림을 볼 수 있었다. 이를 바탕으로 그는 실제로 존재하지 않는 코뿔소를 실재하는 것과 거의 흡사하게 여길 수 있게 형상화했다. 신화의 사례에서 어떠한 합성 대상은 내재적으로 남은 반면 구체적 형상을 가지지 않는 애매한 상황에 처한다. 반대로 여기서 코뿔소란 실재하는 것과 합치 되지 않더라도 아주 구체적으로 ‘하나로 귀결’ 된다. 여기서 준-코뿔소로 종합된 해체된 부분들은 다른 도상적 묘사와 언어적 서술의 파편들 그리고 뒤러라는 예술가의 훈련된 안목과 기술을 관통하여 ‘준 절대적인 것 이상’, 즉 절대적인 것으로 초월된다. 이미 당시에 코뿔소는 로마제국 이후로 유럽 땅을 밟지 않아서 일종의 신화적 생물로 여겨졌는데, 게다가 기술적으로도 현상을 포착해 전달할 수 없었기에 그저 소문으로만 남을 수 있었다. 그 중 ‘뒤러’의 이미지도 단순한 소문과 신화적 파편으로 남을 수 있었겠지만, 그는 반복적으로 획득된 후험적인 생물체에 대한 접근법들과 정보들로부터 코뿔소가 실제로 가지지 않는 속성들마저 지나치게 세세히 그 자신의 준-코뿔소의 외상에 기입해 초월성을 획득해낸다.

          우리가 신화와 예술 안에서 아날로그적 합성의 양태를 파악함으로써 얻을 수 있는 결론은 다음과 같다. 예술이 초월 되기 위해서는 신화가 필요하며, 신화가 내재되기 위해서는 또한 예술이 필요하다. 두 쌍극은 서로에게 맞물리며 돌아가는 톱니바퀴처럼 인간의 문화에서 여전히 핵심적인 기능을 맡는다. 그리고 어떤 이미지(구체적이든 추상적이든)는 항상 아날로그적 합성을 통해서 만들어져 왔다. 아날로그적 합성은 따라서 인간의 문화 내에서 작동하며, 그 안에서 인간의 오감을 통한 인지와 그 이후의 대상에 대한 사유가 ‘차례차례’ 이루어지면서 동작한다. 다시 말해 아날로그적 합성은 그 자체로 인간을 포함하는 물질적인 예술 매체에 각인되거나 문화 안으로 심상을 퍼뜨리는 과정을 지칭한다. 그리고 여기서 ‘이미지’의 힘의 측면에서 구체적으로 응집된 예술이(연극이든 회화든) 더 강력했다. 그러나 이러한 순환 관계는 처음으로 디지털적 합성을 통해 다른 형태로 변질된다.

디지털적 합성

          아날로그적 합성이 가지는 내재적 속성이 파열된 채 디지털적 합성이라는 것이 유사한 정도로 나타나기 위한 첫 번째 조건은 정보의 ‘시간축 조작’의 가능성이다. 프리드리히 키틀러가 주장하듯, 미국 남북전쟁 시기의 ‘저장’, 제 1차 세계 대전 동안의 ‘전송‘ 그리고 마지막으로 제 2차 세계 대전 과정의 ‘시간축 조작’이라는 매체적 기능의 근본적 발전이 우리가 말하려는 디지털적 합성의 토대를 제공한다.8 시간축 조작을 토대 삼아 우리가 논하려는 ‘디지털적’이라 는 수사가 지칭하는 대상은 무엇일까? 기술 철학자 ‘허욱’(Yuk Hui)는 이에 대한 명쾌한 실마리를 제공한다. 그에 따르면 디지털적 대상이란 “화면 위에서 형성되는 또는 컴퓨터 프로그램의 백엔드 속에 숨어 있는 대상.”9이다. 그렇다면 디지털적 합성이란 곧 다음과 같이 일컬을 수 있겠다. ‘화면 위에서 형성되는 또는 컴퓨터 프로그램의 백엔드 속에 숨어 있는 대상을 구성하는 행위.’ [포토샵 브러쉬 텍스트(이하 PBT)]의 서문에서 저자 ‘정현’은 회화가 가진 지독한 물질성과 대비되는 디지털적 대상의 지독한 비물질성을 거론한다. 이런 대비 속에서 가장 큰 차이란 ‘디지털’은 ‘삭제’가 가 능하다는 것이다.10 삭제 가능성이란 곧 ‘레이어적 존재’로서의 디지털적 대상의 조건을 상기시킨다. 시간과 공간의 축적이 일련의 결과로서 제시되는 ‘아날로그적 대상’과 달리 디지털 조건에서 이러한 축적은 ‘조작’ 될 수 있어야 하기 때 문이다. 이러한 조작은 수평(시간)적이거나 수직(공간)적인데 어떤 축이 핵심인지만 다를 뿐 본질적으로 두 가지 모두 일종의 위상으로서 요구된다.

          그렇다면 디지털적 합성이 다루는 원료들은 어디서 출현할까? 디지털적 합성의 원료란 당연히 디지털적 대상이고 그 결과도 디지털적 대상이다. 다르게 말해서 일련의 데이터다. 최초의 ‘저장’된 정보들은 어쨌든 물리적 신체를 요구했었다. 하지만 시간축 조작의 영역에서 그것의 신체란 언제든 다르게 현시될 수 있는 선택지에 불과하게 되었다. 이미지 생산의 측면에서 현실의 장면을 장치를 통해 포획해 물리적으로 기입하든 정보로 변환하든 ‘저장’한 결과물을 나는 ‘장치 이미지’라고 부를 것이다. 그 반대에 ‘디지털적 근원 외상’이 출현한다. 장치 이미지란 현실의 조건들을 장치의 한도 내로 소급시킨 결과물이면서 디지털적 근원 외상과 섞일 준비를 마친 이미지다. 반대로 ‘디지털적 근원 외상’이란 현실에서의 추출 과정과 전혀 연관 없이 프로그램 내에서 구성할 수 있는 종류의 이미지다. 장치 이미지와 디지털적 근원 외상을 조합하거나 각각의 것을 조작해내 이미지를 제시하는 것이 ‘디지털적 합성’의 한 측면이다. 장치 이미지의 경우 무수한 사진 이론이 그 매체의 속성으로 지적하는 ‘지표성’을 붙잡는다. 반대로 디지털적 근원 외상은 지 표성은 커녕 ‘환영성’이 핵심 속성이 된다. 이 두 가지 속성은 필연적으로 부딪히는데 디지털적 합성은 둘을 조합해 준 안정적인 상태로 만들고 마지막으로 내보내 특정한 확장자의 형태로 뽑아낸다.

          장치 이미지의 지표성을 극대화하기 위해서 인간의 개입은 손의 클릭이라는 최소화된 모습이 되어야만 했 다. 실제로 오늘날 “형상을 창조하는 것은 더 이상 인간의 숙련-물음이라기보다는 기계의 표준-물음”11이다. 이것은 비관적으로 말하자면 디지털적 근원 외상의 발생관계에서 “인간의 손은 단지 점과 점의 좌표를 결정짓는 기계”12가 되었다고 할 수 있겠다. 사진을 위시한 장치 이미지들은 완벽히 사실적일 수 없으며 항상 부분적으로 사실적인데, 왜냐면 그것들은 우리가 원하는 어떤 장면의 외상을 있는 그대로가 아니라 장치가 수용 가능한 한도 내로 축소 시키기 때문이다. 따라서 현실 자체의 이미지 보다는 프로그램 내에서 형성된 것들이 그 내재적 조건, 즉 디지털적 합성의 조건에서 근원적으로 사실적이다. ‘레프 마노비치’는 이러한 종류의 이미지들이 “너무 심하게 사실적”이며 “초사실적이다. 완전 하게 사실적이다. 합성 이미지는 인간의 시각과는 다른, 더 완벽한 시각의 결과”라고 이야기한다. 궁극적으로 “컴퓨터로 만들어진 합성 이미지는 우리 현실을 열등하게 재현한 것이 아니라 다른 현실을 사실적으로 재현한 것이다.”13 우리가 이 글에서 구분한 ‘장치 이미지’와 ‘디지털적 근원 외상’은 디지털적 합성을 거치면서 최종적으로 ‘디지털적 합성 이미지’가 된다. 따라서 디지털적 합성이란 곧 인간이 자기 자신의 눈에 기계의 시각을 준안정적으로 만들기 위해 사용하는 현실의 열화 과정이다. 애초에 장치 이미지의 생성은 물질적 현실의 열화를 동반하며, 디지털적 근원 외상이 인간에게 인식 가능하게 나타나기 위해서도 장치의 현실은 열화되어야 한다. 두 이미지의 결합, 즉 디지털적 합성이란 인간 현실의 열화를 디지털의 초사실성을 통한 극복으로 읽을 수 있다. 따라서 장치 이미지의 지표성은 디지털 조건에서 인간 개입을 요구하는 디지털적 근원 외상의 초 사실적 환영을 동반함으로써 자신의 결여를 충족한다. 따라서 여전히 지배적인 디지털적 합성 이미지의 근본적 속성이란 지표적 환영성이다.

          아날로그적 합성의 양축으로 설정한 신화와 예술이라는 이미지들은 디지털적 합성의 시대에 같은 방식으로 작동하지 못한다. 신화의 모호성과 예술의 구체성이 깨진 후 디지털 조건에서 이미지 데이터는 해상도와 출력의 강도의 차이만을 갖는다. 이제 이미지의 형상이 연기와 같은지 혹은 돌과 같은지 걱정할 필요가 없다. 우리의 걱정은 디지털 조건에서 ‘속도’로 바뀐다. 어떤 이미지들은 빠르게 유통되고 사라진다. 이것을 ‘가벼운 이미지’라고 여길 수 있다. 이 이미지들은 신화와 유사한데, 모호해서가 아니고 쉽게 사라지기 때문이다. 반대로 많은 시간과 자본을 투여한 ‘무거운 이미지’가 있다. 가벼운 이미지는 이 무거운 이미지의 파편이거나 변조인 경우가 많다. ‘무거운 이미지’의 위상이란 아날로그적 합성에서 예술과 유사하다. 하지만 예술과 비교되는 속성은 그저 이미지의 파악을 위해 긴 시간이 요구된다는 것에 지나지 않는다. 이미지의 무게란 파일의 크기로 결정되는 것이 아니다. 반대로 지표적인 환영성을 구조적으로 체현해 허구의 실현을 보여주는 무거운 이미지와 그것을 긁어낸 가벼운 이미지가 있을 뿐이다. 가벼운 이미지는 무거운 이미지를 자신의 준거 조건으로 삼지만 그것에 복무하지 않는다. 따라서 이런 종류의 이미지는 ‘환영적인 지표성’ 을 보유한다.14 무겁거나 가벼운 이미지들을 형성하고 유포하는 과정 내에서 인간은 자신을 소외 시키는 장치와 요구하는 프로그램을 조합해 모욕 받은 스스로의 위상을 다시 내세우려 한다. 합성이라는 행위 관계에서 인간이 아닌 장치와 프로그램의 진정한 해방이란 이미지 생성 과정 내의 완전한 소외가 인공지능적 합성을 통해 가능해지면서 도래할 수 있는 것이었다.

인공지능 합성

          우리가 인공지능 합성이라는 용어를 나름의 결을 따라 정의하기 위해서는 무엇보다 그 용어와 연관된 핵심 개념인 ‘합성 미디어’에 대해 이해해야 한다. <합성 매체에 대한 2020년 가이드>를 참고하면 ‘합성 미디어’는 다음과 같이 정의된다. “합성 미디어에는 인공적으로 생성된 비디오, 음성, 이미지 또는 텍스트가 포함되며 AI가 창작 과정의 일부(혹은 전부)를 담당”하며 “이것은 합성, 인공 또는 가상 현실 (포토리얼리스틱 혹은 AR/VR)의 더 넓은 범위에 속 하는 꽤 새롭고 흥미로운 공간”이다. 이러한 새로운 매체는 ‘생성적 적대 신경망’, 즉 GAN(Generative Adversarial Network) 혹은 Difussion 모델들을 통해 오늘날 가늠할 수 없을 정도로 빠른 속도의 가속화된 성장세를 보이고 있다.15

          이런 과정에서 다소 전통적으로 보이는 ‘올드 미디어’와 ‘뉴 미디어’의 이분법적 구분에 하나의 축이 더 세워지는데 바로 ‘합성 미디어’다. 다르게 말하면 아날로그적 합성 이미지와 디지털적 합성 이미지 그리고 오늘날 등장하는 인공지능 합성 이미지를 구분할 수 있을 것이다. 이미지를 생성하는 모델은 앞서 말한 GAN이나 Difussion을 비롯해 너무나 빠른 속도로 개선되고 제시되기 때문에 이 글에서 그 속성을 하나하나 분석하는 것은 의미가 없다. 따라서 여기서는 좀 더 넓은 범위의 인식을 시도해보고자 한다.

 

 

 

 

 

 

 

(왼쪽)

 GAN 모델로 생성된 실제로 존재하지 않는 고양이

http://thiscatdoesnotexist.com

(오른쪽)
Stable diffusion 모델로 생성한 이미지
프롬프트 : 검은 고양이의 얼굴, 사진, 구체적.

 

 

 

 

(왼쪽)

GAN 모델로 생성된 인간의 얼굴
https://thispersondoesnotexist.com

(오른쪽)

Stable diffusion 모델로 생성한 이미지

프롬프트 : 한국 남성의 얼굴. 사진. 구체적.

         

          대표적인 모델 중 하나인 GAN의 경우 Generator(생성기)와 Discriminator(판별기)라는 두 축의 알고리즘 모델을 통해 ‘적대적’으로 이미지를 생성한다. 여기서 적대적이라는 의미는 생성기의 산출과 판별기의 판결이 특정 이미지를 얻어내려는 인간의 의도에 부합할 때까지 번갈아 학습되기 때문이다. Difussion 모델은 이와 달리 ‘확산’이라 는 그 의미에 부합하게 특정 이미지를 노이즈로 변환시키고 다시 거꾸로 노이즈에서 이미지를 추출하는 과정을 학습 한다. 여기에 쓰인 문장들이 각 모델에 대한 완전한 이해를 제공할 수 없다.16 하지만 적어도 우리가 생각해볼 수 있는 점은 각각의 경우에 이미지를 생성하는 순간에 인간 존재를 필요로 하지 않는다는 점이다. 인공지능이 우리를 필요로 하는 순간은 생성이 아니라 그 이전, 즉 모델을 작성할 때와 그리고 이후, 즉 만들어진 이미지를 인간이 수용할 때다. 흥미롭게도 인공지능의 기능은 우리가 디지털적 합성에서 ‘장치 이미지’로 정의한 것, 즉 최소한의 접촉으로 나타나는 종류에 가깝다. 하지만 반대로 현실을 추출하는 렌즈-장치와 달리 인공지능은 이미지 편집 소프트웨어를 통해 우리가 이야기한 ‘근원 외상’, 혹은 진짜로 가짜인 이미지를 제공한다. 즉 인공지능 합성 이미지는 기존의 디지털적 합성이 가진 부분적 속성을 결합한 것으로 보인다. 따라서 인공지능 합성 이미지는 인간을 극단적으로 소외 시키게 되는데 다르게 말하면 인간을 더 편리하게 만든다.

 

 

 

 

 

 

 

 

 

 

 

 

Stable diffusion 모델로 생성한 이미지
프롬프트 : 불을 뿜는 키메라, 청동상.

 

          근원외상이라는 관점에서 우리는 인간의 상상과 기계의 상상을 다른 방식으로 바라보아야 할 필요를 느끼게 된다. 인간은 이미지 자체를 근본적으로 생성해낼 수 없다. 인간이 만들어내는 이미지란 결국 언제나 물질적 지지체에 포로로 붙잡힌 상태로 조절되어 나타날 수 밖에 없다. 심지어 디지털적 합성에서도 여전히 지표적 환영성을 이유로 이미지는 장치와 근원 외상 사이에서 적절한 협상점을 찾아야만 한다. 반대로 인공지능이 산출하는 이미지란 물질적 지지체에 근본적으로 끼워져 있는 것이 아니라 그것을 초월한다. 어떤 방식으로든(인공지능이 이미지를 만드는 메커니즘 자체를 이해할 수 없는 경우가 많아진다.) 만들어진 이미지는 재차 인간이 이해할 수 있는 것 혹은 수용 가능한 것이어야 선택된다. 그리고 이런 이미지들은 아날로그적 합성에서 이미지가 물질로 타락할 수 밖에 없는 것과 디지털적 합성에서 이미지는 아직도 물질적 타락의 입구에 머물러있는 상황을 벗어난다. 생성된 이미지들은 현실의 재현이나 모사가 아니라 그 자체로 ‘진짜인 가짜’다. 따라서 이들은 존재할 수 없는데, 존재하는 것들이 이미지가 된다는 것은 그것 이 어떤 방식으로든 원래의 존재적 위상으로 남을 수 없다는 말이기 때문이다. 다시 말해 무언가는 죽어야 이미지가 될 수 있다. 따라서 합성 미디어란 아날로그적 그리고 디지털적 이미지와 다르게 자체적으로 근원 외상을 우리에게 제공 한다. 근원 외상이라는 용어가 AI가 마치 과거의 흔적이 없는 완전히 새로운 이미지를 만들어 낸 것으로 이해될 여지가 있는데, 정확히 말하자면 여기서 ‘근원’이란 이미지 생성 메커니즘의 속성을 지칭할 뿐이다. 결과적으로 산출된 이미지 는 인간의 시지각을 통해 문화적 연결고리안에서, 즉 아날로그적으로 재합성되어야 하는 운명에 처한다. 이 재합성이란 근원외상에 대한 사형집행과 다르지 않다. 앞에서 디지털적 합성 이미지가 디지털적으로 근원적인 데이터를 손으로 주물주물거려 생산 과정에서 여전히 인간과 느슨한 결합을 유지하는 반면에, 인공지능 합성에서 오로지 생산 이후에 우리의 자리가 주어진다.

          아날로그적 합성과 디지털적 합성의 계보에서 내재적 순환관계는 각각 신화와 예술 그리고 가볍고 무거운 이미지로 분석되었다. 여기서 재차 관계성을 설정하면 지금 계속 다루고 있는 근원 외상과 인공지능 그 자체가 대비될 수 있을 것이다. 실질적으로 인공지능이 이미지 자체는 아님에도 여기서 포함시킨 이유는 내가 ‘인공지능’이 진정으로 창작된 무언가라고 생각하기 때문이다. 인공지능은 우리의 지능 모형으로 설계된 것이고, 따라서 예술적 측면보다 컴퓨터 공학적 측면에서 더 진지하게 ‘창작’된 것이다. 차라리 이렇게 말하는 것이 직설적이다. 인공지능을 설계하는 것은 시를 쓰는 것이다. 하지만 인공지능이 시를 쓰는 것은 인간이 시를 쓰는 것과 동일하지 않다. 그것은 시를 쓰는 모형으로 쓰여진 시가 인간이 ‘시’로 받아들이는 형태로 기입할 수 있게 조건 지어진 것에 불과하다. 이미지의 측면에서 인공지능 이미지의 생성은 우리가 지표성을 가졌다고 여전히 주장하는 사진의 활용이 없었다면 출현 불가능했다. 왜냐면 이미지로만 가능한 것이 의사-현실로서 작동하게 놔두기 위해서는 근원 외상 자체가 그렇게 만들어지기 보다는 그렇게 ‘읽힐’ 수 있는 예비적 자리가 제공되어야 하기 때문이다.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


Stable diffusion 모델로 생성한 이미지
프롬프트: 들판 위에 서 있는 코뿔소.

뒤러 스타일. 목판화.

 

          따라서 인공지능은 출현할 ‘근원 외상’이 인간과의 관계에서 작동할 예비적 조건을 이미 가지고 있다. 이는 바로 인공지능 이미지 생성의 궤적이 구조태에서 현실태로 향하는 것임을 보여준다. 구조태란 이미 그려진 길을 따라서 나올 기호적으로 ‘가능한 것’들의 상태다. 이것은 현실화되었을 때 선택할 수 있는 문제다. 반대로 아날로그적 합성과 디지털적 합성에서 인간의 개입 여지가 남아있을 때는 ‘잠재태’에서 ‘현실태’로 향한다. 잠재태는 구조태와 달리 현실화 되었을 때 ’그렇게 될 것‘이었다기 보다는 ‘그렇게 될 수 있는 것’으로 해석해야 한다. 따라서 인공지능 합성에서 이미지는 스스로 영향을 미치는 것이 아니라 인공지능의 구조에 의해서 통제된다. 구조태의 현실화로서 나타나는 실천은 획득되어야 하는 결과물 그 자체라기 보다는 언제나 대체될 수 있는 불안정한 것이다. 순환 관계 안에서 이미지는 영향을 미치는 존재보다는 피드백 혹은 다른 데이터셋의 조각이 될 운명에 처하기도 한다. 반대로 인공지능은 이미지 생성과 유포 모두에 결정적으로 작용하기에 인공지능 합성의 중추가 된다. 인공지능이라는 것이 필연적으로 초래하는 자동화 프로세스에서 소외된 인간의 자리와 생성된 이미지 자체의 비극적 운명을 모두 회복 시키기 위해서는 우리에게 다른 방식의 사유가 필요하다. 이러한 사유는 인공지능을 우선 물감과 캔버스 혹은 다른 질료들 혹은 좋은 사양의 노트북, 그러니까 우리가 일반적으로 ‘도구’라고 여기는 것과 다르지 않게 취급할 것을 요구한다. 하지만 거기서 한발 더 나아가 이 새로운 사유는 인공지능을 통해서 예술에 붙어있는 바로 그 도구들 자체가 사실 수동적 존재자가 아닌 수동적 행위성을 발휘하는 능동적 협력자로서 창작에 개입한다는 새로운 인식을 촉발한다.

 

 

 

결론을 대신하여 - 창작과 발생에서 창발로…

          이 글에서 내가 시도했던 계보화란 실제로 특정한 사례들의 발전사를 아우르는 식의 작동방식을 가지지 않는다. 반대로 ‘합성’이라는 활동이 어떠한 상태에서 다종 다양한 방식으로 수행되는지 점검하는 것이 중요했다. 아날로그적 합성과 디지털적 합성을 지나며 나타나게 된 인공지능 합성에서 핵심이란 이미지 생성 과정의 핵심 주체가 더 이 상 인간이 될 수 없다는 것이다. 디지털적 합성의 우리가 몰랐던 특수한 기능이란 아이러니하게도 인공지능 합성이 야기하는 소외 이후에 나타나는 다른 감각적 문제들에 대한 훈련 교재일지도 모른다. 인공지능 합성을 거론하면서 우리가 결과적으로 되짚은 질문이란 인공지능은 어떠한 행위자냐는 것이다. 언뜻 순진해 보이기까지 하는 객체 지향적 존재론이나 사변적 실재론을 비롯한 신철학들의 모든 것의 동일한 가치에 대한 인식은 여기에 크게 도움이 되지 않을지도 모른다. 왜냐면 인공지능이라는 행위자는 철학이 아닌 일상의 실천 안에서 처음으로 인간이 수립한 대전제 안에서 해석되지 않는 것이기 때문이다. 아날로그적 합성의 실행 중 하나였던 ‘신화’는 이미 말했듯 이해 가능한 것을 만드는 행위다. 그러나 인공지능은 그것의 형성 자체는 이해 불가능한 것이 아님에도 작동 자체는 블랙 박스로 변한다. 이것이 무엇을 의미하는가? 우리에게 또 다른 신화가 필요한가? 그러나 나는 여기서 신화보다는 우리가 마주하는 것(Gegenstand)을 재차 사물존재(Ding)로 재인식하는 과정이 필요하다고 제안하고 싶다. “물Ding은 자체에 고유한 힘으로 서 있는 반면 대상Gegenstand은 마주해 [대해] 서 있다. 물은 모두고, 대상은 거리를 세운다.”17 다르게 말하면 이는 하이데거가 말하는 전재자(Das Vorhandenes)와 용재자(Das Zuhandenes)의 구분이 도움이 될지도 모른다. 인 공지능을 개발하거나 연구하는 일에서 그것을 전재자로서 사유하는 것은 필연적일지도 모른다. 하지만 인공지능과의 상호작용 혹은 상호행위 안에서 여전히 그것이 마주 선 객체(Gegenstand)혹은 전재자로 남아있다면 관계 속에서 사유 가능한 인공지능의 용재자로서의 특질들을 우리는 잃어버릴지도 모른다.

 

 

 

 

 

 

 

 

 

 

 

 


Stable diffusion 모델로 생성한 이미지

(왼쪽)

프롬프트:

쇠 해머를 바라보는 하이데거

(오른쪽)
프롬프트:

쇠 해머로 벽에 못을 박는 하이데거

 

          인공지능의 제작과 수정에서 그것은 필연적으로 ‘대상’이 될 것이다. 하지만 우리가 그것을 활용하는 순간에는 발생하는 관계망이 물적 존재로서 그러 모아진다. 그런데 여기서 창의성이라는 단어가 문제가 된다. 이미지를 발생 하거나 적어도 현실에서 조절하는 주도권이 예술가에게 주어지지 않는 상황에서 인공지능은 창의적으로 예술을 발생 시키는가? 창의성에 대한 수 많은 논의가 있지만 여기서는 보덴Boden의 이중적 창의성을 검토해보자. 보덴은 “역사적인 창의성과 심리학적인 창의성을 구분한다. 역사적인 창의성은 아직 이전에 누군가 가지지 않았던 대단한 가치의 아이디어라는 특징을 가지며, 심리학적인 창의성은 이전에 아이디어를 가졌던 생각하는 이의 머리에 출현하지 못했을 위대한 가치의 아이디어로서의 특징을 가진다. 컴퓨터는 명백히 역사적으로 창의적인 아이디어를 산출할 수 있다. 의문시되는 심리학적으로 창의적인 아이디어를 야기하는 것도 그것들의 능력이다.”18 이러한 관점에서 주의해야 할 것은 인간이 정의하는 창의성이 인공지능이나 컴퓨터에 그대로 적용될 수 없다는 것이다. 이를테면 전자인 역사적 창의성 은 인간과의 상호작용에서 나타날 수 있고, 심리학적 창의성은 인간이 산출된 대상을 마주할 때 ‘창의적’이라는 인상을 받음으로써 창의적이게 될 수 있다. 두 창의성 모두 진정한 인공지능 자신의 창의적 능력과의 연결 고리보다는 여전히 인간에게 지극히 의존적인 경향을 보인다. 더 극단적으로 말하면 우리는 인공지능이 창의적일 수 있을지 알 수 없는데, 왜냐면 인간이 인간적인 너무나 인간적인 방식으로 작동들을 해석하려고 시도하기 때문이다.

          가브리엘은 “인공지능과 인간지능 사이의 관계는 지도와 영토 사이의 관계와 같다. 인공지능에서 관건은 사유가 아니라 사유 모형이다.”라고 말하며 “모형은 복제품이 아니다. 모형은 우리가 모형을 통해 이해하고 설명하고자 하는 것과 전혀 다른 속성들을 가질 수 있다.”고 말한다. 더 나아가 그에게 오늘날의 기계적 인공지능은 최초의 인공지능이 아니라고 주장한다. 이를테면 인간으로서 “교육과 가르침을 통해 우리는 후손들을 프로그래밍하고 우리가 우리의 패턴 인식을 최적화하기 위해 발명한 알고리즘들을 그들에게 전달한다.” 따라서 ”오늘날 인공지능으로 불리는 놈은 실은 2차 인공지능이다.”19 가브리엘에게 2차 인공지능과 1차 인공지능으로서 인간이 구분되는 지점은 바로 ‘감정지능’20 이다. 인간이 인공지능에서 쉽게 야기되는 편향성 문제를 스스로 극복할 수 있는 수단도 바로 이 감정지능인데, 자신의 몸으로부터 비롯된 감정지능이 주입된 인공지능과 부딪혀 삶의 형태를 제련해나가기 때문이다. 가브리엘식으로 말하면 인공-인공지능은 감정 지능을 결여했다. 따라서 그 존재는 ‘인간처럼’ 창작할 수 없다. 우리가 인공지능이 창작하냐고 여전히 고루하게 질문하는 이상 인공지능의 창작이란 인간의 창작의 구체적 모델(그리는 법, 보는 법, 쓰는 법, 읽는 법, 듣는 법 그리고 말하는 법 등…)일 뿐이다.

          하지만 단순히 이렇게 인공지능은 ‘창작’하지 않는다는 말로는 부족하다. 우리에게 필요한 것은 앞서 말했듯 행위자 자체로서의 인공지능에 대한 재사유다. 이런 관점에서 한 논문은 인공지능의 활용을 흉내, 협력 그리고 창작으로 구분했다.21 여기서 제기할 수 있는 문제점은 여전히 인공지능이 흉내 내거나 창작을 하는 ‘인간적 가능성’의 보고로 혹은 그런 것이 기대되는 ‘기능’의 집합으로서 여겨진다는 점이다. 반대로 우리는 인공지능이 창작한다고 가정할 필요가 있다. 그리고 그 창작은 우리의 창작을 모델링한 것이지만, 반대로 그러한 모델링으로부터 빚어지는 너머의 것이 도래할 것이다. 그리고 이러한 의미에서 인공지능이 인간 없이 홀로 창작한다고 상상하기는 어렵다. 반대로 인공지능과 인간은 창작이라는 용어로는 정의될 수 없는 어떤 결과물을 산출하는 행위를 함께 해낸다. 이런 관점에서 ‘창작’과 연관된 인간과 인공지능의 공동 행위성은 ‘하노 라우터버그’Hanno Rauterberg가 주장하는 다음과 같은 세 가지 모델과 더 잘 어울린다. 첫 번째로 그녀는 이미지나 아이디어를 ‘생성’하는 행위로서 ‘사용’(Nutzung)을 거론한다. 두 번째는 기술이 선사하는 황홀한 이미지에 대한 ‘감격’(Begeisterung)이다. 마지막으로 가장 중요하다고 보이는 것은 ‘비판적인 반성’인데, 왜냐면 인간의 모든 삶의 영역에 영향을 미치는 알고리즘에 대한 비판적 접근을 ‘감각적’으로 가능하게 만들기 때문이다. ‘사용’의 측면에서 인공지능은 이미지를 발생시키고, 예술가는 그것을 어떻게 실체화할 것인지 고민 할 수 있다. ‘감격’의 측면에서 인간 예술가는 인공지능이 선사하는 미래적 가능성 그 자체를 구현화할 수 있다. ‘비판적 반성’의 경우 앞의 두 전략을 모두 사용하거나 혹은 인공지능을 전혀 사용하지 않고도 그것에 대한 비판적 입장을 전개 하는 데 도움을 줄 수 있을 것이다.22 라우터버그가 정의한 사용과 감격 모델은 인간의 입장에서 드러나는 행위성이다. 반대로 인공지능의 관점이라면, 사용은 제시로, 감격은 현혹으로 서술될 수 있을 것이다. 마지막 비판적 반성이라는 모델은 인공지능의 출현 이후 그리고 그것의 실사용 감각을 통해서 획득 될 수 있는 것이기에 인간과 인공지능 양자를 분리시킨 행위성이라기 보다는 하나된 상태에서 나타날 수 밖에 없는 것으로 이해할 수 있다.

 

 

 

 

 

 

 

 

 

 

 


Stable diffusion 모델로 생성한 이미지

(왼쪽)
프롬프트:

인공지능과 함께있는 인간.

이 이미지는우리가 인공지능에게 원료로 제시하는 것들이 여전히

디스토피아적인 상상력 안에 갇혀있다는 점을 보여준다.

 

(오른쪽)
프롬프트:

인공지능이 제공한 이미지를 검토하는 인간들.
이 이미지에서 인간은 전경에 있는 두 인물일까? 혹은 후경에 놓인
마치 화상회의 화면과 같은 곳의 인간들일까?

 

 

          어떤 모델을 택해 예술을 하던 결과적으로 인공지능과의 상호작용이 불러일으키는 종류의 합성은 ‘허욱’이 주장하듯 우리가 첫 번째 주석에서 살펴본 칸트의 세 가지 종합 너머에 있는 네 번째 종합으로 나아가야 한다. 이를테면 “디지털화는 우리의 상상력을 넘어서는 엄청난 양의 데이터와 지식의 논리적 종합을 허용한다. 디지털화 이후에 등장한 이 네 번째 종합은 우리에게 새로운 감성을 가져다주었다.”23 결과적으로 네 번째 종합이란 “다른 종합을 횡단하고 재조직하는 함수[기능]이다.”24 이러한 네 번째 종합에 있어서 핵심은 결국 인간 자신의 주체적 인식을 ‘이미지’의 형태로 구성하려는 것이 아닌 그 인식 자체를 수행하는 기능이다. 하지만 애석하게도 “네 번째 명제의 완성은 이미지의 조직(화)를 재구축한다. 실제로 초월론적 상상력은 수동적 종합력이 되고 있다. 인식 과정이 단락될 수 있기 때문이다. 미래는 항상 현재이다.”25 이런 상황에서 네 번째 종합의 출현 자체는 인간의 완전 소외 혹은 멸종위기의 초래로 비춰질 수 있다. 그래서 ‘허욱’은 시스템을 넘어선 ‘환경’Milieu/Enviorment에 대한 사유가 필요하다고 주 장한다.26 이 글에서 완전히 구체화할 수 없지만 적어도 합성의 계보학을 거치며 얻어낼 수 있는 결론은 바로 인공지능 과의 ‘연합 환경’을 구축해야한다는 것이다.

          그렇다면 이러한 ‘연합 환경’은 어떤 식으로 망상될 수 있을까? 나는 우선 용어적으로 인간의 만듦 Schaffung과 인공지능의 생성Generieren의 연합이 필요하다고 생각한다. 그리고 여기서 사용될 수 있는 용어는 바로 창발Emergieren이다. 보통 창발이란 용어는 요소들에 없는 특성과 행동이 전체 구조에서 돌연 나타날 때 사용한다. 이 경우에 인간과 인공지능이라는 요소들이 연합 환경(전체 구조)에서 창의적인 무엇을 출현시킬 때 창발한다고 말할 수 있다. 연합환경에서 이미지를 창발하는 것은 ‘허욱’이 주장하는 ‘결탁’complicity/Mitschuld에 가깝다. 그에 따르면 디지털적 대상을 문화적 대상으로 변형시키는 ‘태깅’ 혹은 ‘기여적 주석달기’라는 행위를 통해 “음implicit과 양explicit 을 넘어선 새로운 항을 추가”할 수 있다.27 인공지능과의 연합 이전에도 예술이라는 행위 자체는 바로 이러한 방식의 결탁 또는 상호연관을 발생시켜왔다. 오늘날의 유령과도 같은 인공지능에 대한 인상을 명확하게 하기 위해서 우리에게 필요한 것은 사용과 제시 사이에서, 감격과 현혹 사이에서 그리고 비판적 반성이라는 상호행위 안에서 ‘연합 환경’이 어떤 식으로 존재하며 그것을 통한 창발이 어떻게 가능한지 이해하는 일이다. 인간 예술가와 인공지능 이미지 생성자의 연합 환경 구축을 위해서는 따라서 먼저 인공지능 자체에 대한 그리고 그 다음으로 생성된 이미지에 대한 이중의 결탁이 필요하다. 이러한 연합 환경의 구축만이 오늘날 수 없이 제기되는 무의미한 공회전에 가까운 질문들을 극복하고 더 많은 새로운 관점들을 ‘창발’할 수 있을 것이다.

 

글 하재용

점차 하나로 수렴해서 보기 힘들어지는 예술이라는 것 혹은 예술계라는 시스템 안에서 우리가 어떻게 예술작품과 만나고 접촉하는지에 특히나 관심이 있다. 개별 예술 작품보다는 때론 그것들을 대상으로 삼는 미학 이론에 대해서 사고하는 것이 더 즐거운 아이러니한 상황에 스스로 놓여 있다고 생각한다. 현재 독일에서 예술학(Kunstwissenschaft)를 전공하면서 여러가지 질문들에 대한 답을 찾기 위해 시도 중이다.  

-
1 칸트가 언급하는 바 신테시스는 크게 세 가지로 나뉜다. 1. 포착 혹은 모사Abbildung 2. 기억 혹은 재생 Nachbildung 3. 인식 혹은 예비적 구성 Vorbildung. 세 경우 모두 이미지Bild가 생각하기와 깊은 연관성을 가진다. 모사로서의 종합은 수동적으로 ‘받아들이기’에 가까우며, 재생의 경우 추가적 작업, 즉 상상력을 통해 포착된 것을 활용한다. 마지막인 인식이 다른 말로 예비적 구성이라고 명명되는 이유는 모사와 재생을 통해 만들어 진 ‘개념’이 활용되어 과거와 현재를 앞서는 미래로의 기투로 작동하기 때문이다. 가브리엘과 칸트의 합성에 대한 관점은 다음을 참고하라.

마르쿠스 가브리엘 [생각이란 무엇인가], 전대호 역, 열린책들, 2021, 75페이지
허욱, [디지털적 대상의 존재에 대하여], 조형준, 이철규, 임완철 역, 새물결출판사, 2021, 419페이지

2 무언가를 산출해내는 과정으로서의 ‘합성’이 아날로그에서 차례대로 발생하여 최종적으로 종합된다면, 알고리즘 합성에서는 순서가 인간에게 지 각되지 못한 채 외부적으로 혹은 지나치게 즉물적으로 흐른다. 이러한 그 자체로 지극히 이산적(디지털)인 합성 체계에서는 인간의 생각 또는 인지 과정과의 관계가 소외되어버린다. 이런 의미에서 “컴퓨터는 관심을 갖지 않는다.”고 말할 수 있다. 여기서 관심 또는 흥미Interesse는 라틴어에서 함 께inter 있다esse라는 의미를 갖는다. 즉 흥미가 없다는 것은 곧 인공지능과 컴퓨터 모두 대상과 감각적으로 관계하지 않는다는 것이다. 즉 철저히 계산적이며, 외화되어 있다. 흥미와 관심은 ‘포개짐’에서 발생하는 것이다.

[생각이란 무엇인가], 389페이지
인공지능과 관심에 대한 문제는 다음을 참고하라. Hanno Rauterberg, [Die Kunst der Zukunft], suhrkamp, 2021, 18페이지 3 브라이언 마수미, [가상계], 조성훈 역, 갈무리, 2011, 287페이지

4 자크 랑시에르, [모던 타임즈], 양창렬 역, 현실문화A, 2018, 13페이지

5 이런 일반적 속성들은 우리에게 주어진 디지털적 합성이나 인공지능 합성과는 다른 것으로 ‘이미지‘ 생성의 관점에서 역행 불가능한 어떠한 외상 이 차례대로 인간의 신체와 정신과 조응하며 발생하는 예술적 창작의 메커니즘에 상응한다.

6 이러한 논의는 특히나 근대성을 예술안에서 발견하고자 하는 ‘보들레르‘의 작업에서 핵심적이었는데, 그는 이를테면 예술가가 순간을 영원으로 만드는 이들이라고 말한다. 하지만 보들레르의 주장은 질베르 시몽동에 의해 조금 다르게 수정된다. 그는 보들레르의 ‘순간에서 영원을’이라는 명제 를 “국지적으로 완수된 실재에게 다른 장소들과 다른 순간들로 이행할 수 있는 능력을 주면서 변환적으로 만드는 것“이라고 재해석한다. 따라서 ”예 술은 영원하게 하는 것이 아니라 다시 태어나고 다시 실행되는 능력을 주는 것이다.” “예술은 동일성이기를 그치지 않으면서 반복될 수 있는 능력을 그 동일성에 부여하면서 개성[이것임]을 다양화 한다.”

질베르 시몽동, [기술적 대상들의 존재 양식에 대하여], 김재희 역, 그린비, 288페이지


7 여기서 우리는 신화의 도상적 해석을 점검해볼 필요가 있다. 신화와 도상의 관계에 대한 분석의 실마리를 제공한 ‘송효섭‘의 <신화의 질서>의 구 절을 참고해보자. “신화와 도상은 먼저 ‘신화적인 것’ 혹은 ‘도상적인 것‘을 나타낸다. 신화와 도상이라는 말에서 현실태로서의 함의를 제외하면, 이 말이 다양한 상황 안에서 구현할 가능성을 내재한 잠재태와 그 과정에서 드러나는 표현 형식인 구조태로서의 함의가 남는다.” 즉 신화라는 것이 현 실태에서 잠재태의 영역으로 들어선 이후에 특정한 구조태를 거쳐 도상화되어야 한다. 그런데 “뮈토스가 스스로를 강화하는 과정에서 필연적으로 로고스의 힘에 의존“한다. “뮈토스가 로고스를 끌어들임으로써 뮈토스가 강화된다는 것은, 뮈토스와 로고스가 함께 확산되는 신화적 기호작용을 보 여”준다. 따라서 신화는 그 스스로 존속하는 것이 아닌 구조적으로 나타난 도상들의 힘과 상호보완적으로 강화되며 살아남는다. 즉 ”신화도상은 신 화와 자질 공유성을 가지면서도 또한 다른 표현 형식을 통해 새로운 의미를 생산“한다. 핵심은 잠재태로서의 ‘신화’와 구조태로서의 ‘도상‘은 그 자질 이 공유될 뿐 일대일로 대응하는 관계를 가지지 못한다. 그래서 신화의 이미지란 연기와 같은 것이다.

송효섭, [신화의 질서], 문학과 지성사, 2012, 18-62페이지

8 키틀러에 따르면 우선 미국 남북전쟁 기간에 매체의 저장 시스템이 극도로 발달되기 시작했다. 사진으로 예견된 ‘현실‘의 저장이라는 인간의 꿈은 이미지의 측면에서 영화로, 음향햑적 측면에서 그라마폰으로 그리고 문자적 측면에서 타자기라는 장치들을 통해 이루어진 것으로 보였다. 문제는 아직 저장이 용이해졌을 뿐 그렇게 구체화된 정보들을 전송해야하는 어려움이 남아있었다. 그리고 제 1차 세계 대전을 거치며 전송 문제는 소리의 경우 라디오 장치, 이미지는 텔레비전을 통해 ‘상영’이 아닌 ‘전송‘을 기능적 핵심으로 삼게 되면서 해결되었다. 제 2차 세계 대전의 시공에서 저장과 전송의 문제는 조작이라는 영역에 들어선다. 타자기에서 부터 계산 가능한 기술, 즉 프로그래밍으로 나아가는 길에서 1936년 튜링의 수학적인 정의 로부터 ‘컴퓨터’라는 장치로 구체화 될 ‘시간축 조작‘이 가능해졌다.

프리드리히 키틀러, [축음기, 영화, 타자기], 유현주, 김남시 역, 문학과 지성사, 2019, 431-434페이지

9 [디지털적 대상의 존재 양식에 대하여], 52페이지

10 정현, [PBT(Photoshop Brush Text)], 초타원형, 2014, 1-4페이지

11 “모든 도구에 똑같이 사용되는 언어는 현상을 인식 가능한 모델로 만들 준비를 – 시점에 따른 렌더링을 변환할 준비를- 해두고 있다는 점을 또한 시사한다.”
같은 책 77페이지

12 같은 책 36페이지

13 레프 마노비치, [뉴 미디어의 언어], 서정신 역, 커뮤니케이션북스, 2014, 274페이지

14 ‘무거운 이미지‘들은 할리우드 거대 자본 영화의 형태로 대표적으로 나타난다. 어떤 경우에서든지 우리가 흔히 순수예술이라고 불렀던 종류의 이 미지 생산 활동은 디지털적 합성 시대 이후 시각성에 지배적인 역할을 차지하지 않는다. 오히려 무거운 이미지의 결집과 거기서 깎여져 나온 가벼운 이미지의 유포라는 관계성이 핵심이다. 예술가들은 이 이미지들의 진동 사이에서 나타나는 것을 주제화해 아날로그적 합성(단순히 이미지를 만드 는 것이 아니라 그것을 지각하는 제반조건들을 모두 포함하는 순수한 의미의 아날로그적 합성)의 형태로 예술을 만들기도 한다. 이러한 추가적인 ‘예 술’의 작업은 디지털적 합성 이미지도 ‘예술‘로 제시되기 위해서 결국 전시를 비롯한 문화적 형식에 알맞게 재가공되야 한다는 사실을 보여준다.

15 Sudharshan Chandra Babu, [A 2020 Guide to Synthetic Media],

16 GAN 모델에 대한 이해: Bharath K, [Complete Guide to Generative Adversarial Networks(GANs)],

Difussion 모델에 대한 이해: Ryan O’Connor, [Introduction to Diffusion Models for Machine Learning],

 

17 [디지털적 대상의 존재양식에 대하여], 304페이지

 

18 Dominic Mclver Lopes, [Digitale Kunst], {Die Kunst und die K+nste}, Friederike Allner 역, suhrkamp, 2021, 421페이지

 

19 [생각이란 무엇인가], 467페이지

 

20 “의식적 체험의 배후에서 우리의 인간적 삶꼴과 개인적 삶이 우리가 주목할 생각들을 선별한다.”는 것이 감정지식의 성격이다. 또한 ”감정지능 은 우리의 생태적, 사회적 보금자리의 맥락 안에서 발생한다.“

같은 책, 165페이지

21 정신영, [기계와 예술 사이: 컴퓨터 비전, 인공지능 그리고 이미지의 문제], 미술이론과 현장 32, 2021, 89-125페이지

22 [Die Kunst der Zukunft], 15페이지

23 [디지털적 대상의 존재양식에 대하여], 429페이지

24 같은 책 443페이지

25 같은 책 445페이지

26 다음과 같은 허욱의 환경에 대한 관점은 대부분 시몽동의 사유에서 기인한다. “연합 ’환경‘은 기술적 대상 외부의 ’환경’이 아니다. 반대로 그것은 대신 강이 엔진의 연합 ‘환경’인 갱발터빈 사례에서 볼 수 있듯이 기술적 개체와 기술적 앙상블 내부에 있으며, 자연 ‘환경’의 역할과 동시에 기능성으로 쓰인다.”
같은 책, 450페이지

27 같은 책, 393-395페이지