top of page
장난감 모형과 취한 시인 ― GPT와 생성성의 모델
이계성 & 최빛나

*일러두기 _ 이 글 중 고딕체로 표기된 글은 GPT가 생성한 글이다. 
model_poet (2).jpg

2023년 2월 발표된 컴퓨터 보안 회사 맥아피의 “모던 러브” 보고서.

“너는 나의 열렬한 공감이야. 알 수 없게도 내 애정은 너의 열정적인 소망에 매달리지.내 호감이 너의 마음을 그리워 해. 너는 나의 애석한 동정심이자, 부드러운 호감이야.”
(크리스토퍼 스트레이치의 연애편지 알고리즘, 1953년)

Christopher Strachey. “The “Thinking” Machine”, Ecounter, October (1954): 26. 이하 인용된 모든 영문 글은 이계성이 번한 것이다.


“너를 처음 본 순간, 내 마음은 영원히 너의 것임을 알았어. 너처럼 얼굴도 마음도 아름다운 사람은 본 적이 없고, 너의 따뜻하고 사랑스러운 마음은 나를 더 빠져들게 하지. 너는 내 심장, 내 영혼, 내 모든 것이야. 너 없는 삶은 상상할 수가 없고, 너를 행복하게 해줄 수만 있다면 내가 할 수 있는 일은 뭐든지 할 거야. 지금처럼 영원히 너를 사랑해.”
(ChatGPT, 2023년) 
 
McAfee. (2023). McAfee’s Modern Love Research Report.

https://www.mcafee.com/content/dam/consumer/en-us/docs/reports/rp-mcafee-modernlove-report.pdf

 

1)

ChatGPT가 이미 널리 보급됐던 2023년 발렌타인 데이는 인공지능에 의해 생성된 텍스트가 집단적인 차원에서 실질적인 문제로 대두된 첫 번째 기념일일지도 모른다. 맥아피에서 올해 2월 발표한 설문조사에 따르면 “4명 중 1명 이상(26%)이 인공지능을 활용해 연인에게 편지를 쓸 계획이라고 답했지만, 44%는 쓰지 않겠다고 답했고, 31%는 쓸 줄 모른다고 답해, 여전히 직접 쓰겠다는 사람이 훨씬 더 많았다. (...) AI를 활용해 연애편지를 쓰고 싶은 이유는 다양했다. 27%가 편지에 대한 반응이 더 좋을 것 같다고 답한 반면, 21%는 인공지능 없이는 무엇을 써야 할지 모르겠다고 답했고, 또 다른 21%는 스스로 무언가를 생각해 낼 시간이 없다고 답했다.” 같은 글 

  처음으로 컴퓨터를 통해 생성된 텍스트가 아마도 연애편지였다는 점을 염두에 두면, 이 설문조사는 생성 텍스트와 관련해 현재 우리가 어디에 와 있는지를 보여 주는 유용한 지표이기도 하다. 영국의 컴퓨터 과학자 크리스토퍼 스트레이치는 1953년 맨체스터 마크 1 컴퓨터를 활용해 연애편지 알고리즘을 개발했다. 스트레이치의 알고리즘은 특정한 규칙에 따라 단어를 배열하는 방식으로 연애편지를 생성했다. 이 알고리즘은 형용사, 명사, 부사 등의 선결된 범주 내에서 단어를 임의로 선택하고 결합해서 통상적인 연애편지와 유사한 구조의 문장을 만들어 냈다. 알고리즘을 가동시킬 때마다 예상치 못한 조합으로 단어들이 배열된 색다른 편지가 생성됐다.

  어쩌면 이런 합성적 연애편지들은 탄광의 카나리아일지도 모른다. 사람들이 알고리즘을 통해 생성된 연애편지를 기꺼이 받아들인다는 점은 다른 형태의 합성적 글쓰기에도 개방적일 확률이 높음을 의미하기 때문이다. 인공지능과의 관계가 앞으로 어떻게 변화할지 정확히 알 수는 없지만, 1953년 스트레이치의 연애편지 알고리즘에서 2023년 발렌타인 데이에 이르는 여정이 흥미로운 여정인 것만큼은 분명하다.

model_poet (3).jpg

광각 렌즈로 촬영된 맨체스터 마크 1 컴퓨터.

model_poet (4).jpg

MUC(Manchester University Computer, 맨체스터 마크 1 컴퓨터의 별칭)의 연애 편지.

 

2)

우리는 어디서부터 이 작업을 시작해야 할지 고민하며 생성성의 개념 언저리를 서성이고 있었다. 최근의 대규모 언어 모델의 줄어드는 환각을 바라보며, 그리고 한편으로는 생산성을 위한 스테로이드적 사용의 폭발을 바라보며 아쉬운 마음을 가지고 있었다. 그 마음은 이것들이 “술 취한 시인”의 상태에 머물기를 바라는 마음일지도 모르겠다. 그러니까 지나치게 분석적이거나 추론적이지 않으면서, 엉뚱한 지도 속을 헤매게 하는 환영의 파트너로 남길 바라는 마음 같은 것 말이다.

  그러다가 『내면의 비행사들 ― 국제적 전위 활동 모음집(Astronauts of Inner-Space: An International Collection of Avant-garde Activity)』을 읽게 되었는데, 46편의 매니페스토, 편지, 글, 시, 필름 스크립트가 담긴 이 선집은 처음부터 눈길을 끌었고, 특히 우주 시대의 꿈이 폭발하기 직전인 1966년에 발간되었다는 점이 여러모로 의미심장해 보였다. 거대과학의 패러다임은 어느 시대에나 존재해 왔고, 그것이 지금은 대규모 생성 인공지능이라면 1960년대는 단연코 우주 항공이었다. 지구를 뚫고 나가 우주로 팽창하는 당시의 욕망을 내부로 틀어 버리는 제목부터 상당히 마음을 끌어당겼다. 무엇보다도 대규모-초대규모로 이름을 갈아 치우며 가중치를 늘려 나가는 대규모 생성 AI의 시대에, 이 제목은 우리에게 어떤 다른 영토를 유영하듯 탐험하길 초대하는 메시지처럼 느껴졌다.

  그중에서도 마거릿 매스터먼의 에세이 <언어의 의미론적 장난감 모형을 제작하기 위한 컴퓨터의 사용(The Use of Computers to Make Semantic Toy Models of Language)>은 오늘날의 대규모 언어 모델(Large Language Model, LLM)을 둘러싼 논의를 선취하고 있다는 점에서 매력적이었다. 특히나 언어의 “장난감 모형”에 대한 다음과 같은 설명이 눈길을 끌었다.

 

  “이러한 모형들은 작고, 제작하기 쉽고 (최소한 처음에 제작하기 시작할 때는 그렇게 생각하고는 한다) 또 조작하기도 쉽기 때문에 장난감이다. 또한 인간이 일반적으로 분간할 수 없는 언어의 일부 특징을 분간하고, 과장하고, 대량으로 생성하도록 설계되었기 때문에 모형이다. (...) 생각해 보면, 실상은 컴퓨터에게 새로운 단어를 일일이 성가시게 가르쳐서 그 단어들을 결합하는 방법을 터득하게 하는 문제가 아니라, 컴퓨터가 언어 전체의 거대한 순열 자원을 누그러뜨려서 어지간한 개념적, 의미론적 연관성을 형성하도록 가르치는 문제다. 달리 말하면, 컴퓨터는 아이처럼 행동하지 않고, 술 취한 시인처럼 행동한다.”  Margaret Masterman. “The Use of Computers to Make Semantic Toy Models of Language.” In Astronauts of Inner-Space: An International Collection of Avant-Garde Activity. Stolen Paper Review Editions. San Francisco: Stolen Paper Review Editions. p. 36-7.

 

  이는 지금의 대규모 언어 모델의 바탕이라고 할 만한 트랜스포머 알고리즘을 연상시키는 흥미로운 언급이었고, 우리를 단박에 끌어당기는 통찰력이 있었다. 우리는 그녀의 의견에서부터 시작해 보고 싶었다.

model_poet (5).jpg

『내면의 비행사들』의 겉표지.

model_poet (6).jpg

『내면의 비행사들』의 목차.
마셜 매클루언, 막스 벤제, 윌리엄 S. 버로스 등이
필진으로 참여했다.

 

3)

술 취한 시인의 비유는 컴퓨터가 자연어를 처리하는 방식을 이해하는 데에 흥미로운 틀을 제공한다. 취한 시인은 문법이나 구문 규칙에 얽매이지 않고 다양한 표현 방식을 찾아낸다. 단어와 단어를 색다르게 연결 지어서 개념과 감정을 더 정확히 표현하기도 한다. 예상치 못한 언어의 패턴을 탐지하고 핵심적인 의미론적 연관성을 형성하는 술 취한 시인의 접근 방식은, 보다 추상적인 차원에서 언어를 분석함으로써 비슷한 패턴을 식별해 내는 언어 모델에 의해 모방될 수도 있다.

  술 취한 사람이나 어린애는 거짓말을 하지 않는다는 한국 속담이 있다. 하지만 이는 술 취한 사람이 항상 진실만을 말한다는 뜻이라기보다는, 술 취한 사람은 맨정신인 사람보다 현실을 더 즉각적으로 해석한다는 뜻일 테다. 언어 모델 또한 진실을 말한다기보다, 진실의 유사성을 제공한다고 하는 편이 더 정확할 것이다.

  언어 모델은 실제적 경험을 모델이 해석 가능한 형식으로 표현하기 위해 추상화된 데이터셋을 기반으로 출력값을 생성한다. 여기서 술 취한 시인은 특정한 추상의 상태를 상징한다. 대규모 언어 모델은 이런 상태에서 하나의 ‘진실한’ 결과물이 아닌 진실의 유사성들을 포착한다. 데이터셋에서 추출되고 데이터셋에서 영감을 얻은 일련의 잠재적 진실들. 달리 말하면, LLM이 생성한 결과물에 절대적인 것은 없고 잠재적인 것만 존재한다고 할 수도 있겠다.
 

4)

<언어의 의미론적 장난감 모형을 제작하기 위한 컴퓨터의 사용>에는 장난감 모형의 이미지로 대변되는 조작적 모델에 대한 언급과 더불어 술 취한 시인의 이미지로 대변되는 시적인 것에 대한 고찰이 두드러지게 나타난다.

 

  “컴퓨터가 만들어 내는 결과물을 읽음으로써 (그리고 필요에 따라 컴퓨터로 다시 분석함으로써) 우리는 마침내 모두가 직관적으로 느껴지는 시적 패턴의 복잡성을 연구할 수가 있다. 그리고 시적 패턴에 대한 보다 깊은 이해는 결국 시 자체에 대한 숙달과 이해를 심화시킬 테다.”

 같은 글. 37.

 

  매스터먼이 시적인 것을 강조하는 이유는 순전히 분석적이고 구문론적인 접근 방식으로 인간의 언어를 모형화하려는 시도가 놓치기 쉬운 것들(직관적으로 느껴지는 시적 패턴의 복잡성)을 구제하기 위함일지도 모른다. 이러한 관점에서 볼 때, 그녀에게 언어의 장난감 모형을 제작하는 행위는 언어의 유동적이고 모호한 측면들을 일종의 시적 보간법을 통해 파악해 보려는 시도인 듯하다. 이는 인지 과정의 복잡성을 헤아려 보려는 시도로도 볼 수 있는데, 언어를 모형화하는 과정에 시적 요소를 응용한다는 것은 결국 인간 인지능력의 무작위성을 더 깊이 헤아리려는 시도일 테기 때문이다.

5)

거대과학과 관련해서는 늘 모형(모델)이 존재해 왔다. 1960년대의 우주 항공이라는 거대과학은 수많은 로켓 모형과 그것을 실험하는 로켓 키드를 탄생시켰다. 이러한 기술의 모형화는 기술사에서 흔히 나타나는 현상이다. 라디오, 텔레비전, 컴퓨터 등 한 시대의 주류적 기술은 수많은 모형과 키트를 탄생시키고는 했다. 이런 모형들은 대개 거대과학의 축소판이자, 거대과학의 암흑상자, 즉 블랙박스적인 면을 사용자 측에서 재구성하게 하는 시스템이기도 했다. 이런 모형들은 발전주의적 인식틀에서 도달하고 성취해야 할 기술들을 압축적으로 만들어 놓은 것이라는 측면도 있지만, 이리저리 팅커링하는 과정을 통해 기술의 원리를 이해하게 한다는 측면에서는 기술적 접근법과 사고법을 매개하는 지식 시스템으로 생각해 볼 수도 있다.

  그리고 이런 팅커링의 관점에서 본다면, 모형은 어떠한 기술을 블랙박스보다 ‘회색상자’에 더 가까운 무언가로 다루는 것이기도 했다. 더 나아가면, 단순한 거대과학의 축소판을 넘어 메타적 전유로 넘어가게 하는 다리이기도 했다. 팅커링(tinkering)은 두서없이 기술을 다루고 조합하면서 뜻밖의 것을 만들거나 발견하는 행위를 의미한다. 기술 기반 DIY 문화에서 중요하게 다루어지는 태도다. 폭넓은 의미로는 주어진 기술을 그대로 쓰지 않고, 자기 정의적으로 전유하거나 사용하는 것을 의미한다.

이처럼 거대과학에서 모형 혹은 모델이 작동하는 방식은 매스터먼이 언급한 언어의 장난감 모형, 그리고 오늘날의 대규모 생성 모델을 연결 지어 생각해 보도록 이끌었다.

model_poet (7).jpg

대량 생산된 모델 로켓을 최초로 선보인 에스테스 사의 1970년 잡지 광고.

6)

기술과 관련한 또 다른 클리셰인 블랙박스라는 개념 역시 하나의 모형적 사고로 접근해 본다면 또 다른 해석이 가능해진다. 우리는 흔히 블랙박스를 내부를 알 수 없는 폐쇄된 상자로 생각하고는 한다. 알고리즘과 같은 기술적 대상들뿐만 아니라 인간의 정신이나 마음도 블랙박스로 간주할 수 있다.

  하지만 과학, 컴퓨팅, 엔지니어링에서의 블랙박스는 내부 작업에 대한 지식 없이도 입력과 출력을 관찰할 수 있는 장치 또는 대상을 가리킨다. 즉 블랙박스는 무엇보다도 입력과 출력의 인과 관계에 대한 가설을 기반으로 한다는 뜻이다. 달리 말하면, 내부적 작동 원리를 몰라도 입력값과 출력값을 볼 수만 있다면 블랙박스적인 것으로 생각해 볼 수 있다는 말이다.

  이런 해석은 블랙박스를 내부적 작동이 불투명하기 때문에 오히려 입력과 출력 사이의 인과 관계를 가설적으로 이야기할 수 있는 장치로 생각해 보게 한다. 즉 내부 작동에 대한 인식의 모형을 지속적으로 만들어 볼 수 있는 접근법이 되는 것이다. 이런 측면에서 생각해 볼 때, 블랙박스는 폐쇄된 상자가 아닌 인식을 촉발하는 또 다른 모형이 된다.

model_poet (8).jpg

블랙박스, 입력값과 출력값, 그리고 관찰자와 행위자

7)

종종 오해를 사는 튜링 테스트 역시 같은 방식으로, 보다 촉발적인 모델로 생각해 볼 수도 있다. 익히 알고 있듯이, 인간 평가자가 인간과 기계의 반응을 확실하게 구별할 수 없다면 기계는 튜링 테스트를 통과했다고 여겨진다. 달리 말하면, 인간과 구분할 수 없을 정도의 수준에 도달한 기계의 성취도를 측정하는 테스트로 흔히들 이해하고는 한다. 하지만 튜링 테스트를 인식의 모형으로 생각해 보면 그 의미가 더욱 풍부해진다. 기계의 언어적 성취도라든지, 기계에 정말로 속아 넘어가 그것을 인간으로 여길 수 있는지를 질문하기 이전에, 튜링 테스트는 독특한 모형의 기질을 띄고 있다는 것을 상기할 필요가 있다.

  튜링 테스트의 가장 흥미로운 점은 ‘생각한다’는 것이 무엇인가에 대한 본질적이고 존재론적인 질문으로 빠지지 않도록 모형의 관점에서 접근해 보기를 제안한다는 점이다. 그러니까, ‘생각한다’는 것이 무엇인지를 본질적으로 정의할 수 없어도 ‘이것을 통과하면 생각한다고 치자’라는 접근 자체가 하나의 의미론적 모형을 내포한다고 볼 수도 있다는 것이다.

  튜링 테스트는 AI에 ‘생각’으로 간주할 만한 특정 내적 자질이 존재하는지를 질문하지 않는다. 그 대신 ‘생각’의 정의라는 본질적 또는 존재론적 논쟁을 우회하는 실천적 접근법을 채택함으로써, 인공지능의 결과물을 인간 언어와의 상호 작용 속에서 평가하는 것으로 초점을 전환한다. 이러한 맥락에서, 튜링 테스트는 그 접근 자체에 내재된 모형적 기질 외에도, 의사소통이라는 관찰 가능하고 측정 가능한 측면에 초점을 맞추어 복잡한 사고의 개념을 모형화한다. 그리고 이를 통해 소통적 측면에서 인공지능을 사유하는 인식틀을 제공한다.

  따라서 튜링 테스트는 어찌 보면 이러한 인식의 모형을 통해 인공지능과 언어 처리에 대한 이해를 촉발하는 방식을 제안한다고 할 수도 있다. 우리가 초점을 ‘생각’에서 의사소통 도구인 ‘언어’로 전환할 때, 대규모 언어 모델은 하나의 행위자로서 소통에 개입하는 동시에 또 다른 실천적 모형을 산란하는 기계가 될 수도 있는 것이다.

8)

거대과학의 영역에서, AI는 거울이기도 하고 현미경이기도 하다. 거울로서, AI는 방대한 데이터셋을 통해 우리의 집단적 지식, 편견, 열망을 반영한다. 생성된 결과물은 인간의 집단적 사고를 반영하기에, 때로는 묘하게 친숙한 느낌을 주기도 한다. 그리고 현미경으로서, AI는 인간의 정신이 간과하기 쉬운 데이터의 복잡한 패턴을 확대하고 또 뚜렷하게 해 준다. 이러한 이중 렌즈를 통해, AI는 내적 성찰과 외적 탐구를 넘나드는 흥미로운 상호 작용을 낳는다.

  AI는 인간의 인지와 디지털 역량 간의 사이 공간에 자리하며 거울과 현미경의 간극을 메운다. 거울로서, AI는 보편적 감정이나 상황을 활용해 폭넓은 공감대를 형성하는 예술이나 문학을 제작 가능하다. 그러나 현미경으로서의 AI는 개개인의 심리에 맞게 맞춤 제작된 경험이나 서사를 만들어 내는 초개인화의 영역으로 우리를 몰아가기도 한다. 이러한 이분법은 보편적인 AI 예술이라는 가능성과 개인의 창조성을 확률적 알고리즘으로 축소하는 위험성 양쪽 모두를 동반한다.

  보편적인 AI 예술을 추구한다면, 예술이 경계를 초월해 보편 언어로 거듭나는 미래의 모습을 그려보지 않을 수 없다. 이러한 미래는 매혹적이지만, 여러 난관을 동반하기도 한다. 미묘한 차이나 지역성 또는 특정 장소와 역사에 얽힌 이야기와 같은 것들이 번역 과정에서 소실되지는 않을까?

  AI로 인해 예술이 보편 언어로 변모하게 된다면, 이 새로운 인식 체계에서의 저자는 누구일까? AI가 전 세계 관객들의 피드백, 비평, 의견을 지속적으로 흡수함에 따라, 전통적인 저자성의 개념은 아마도 모호해질 테다. 규정된 예술의 창작이라는 개념은 집단적이고 지속적인 베타 테스트의 개념으로 바뀔 테다.

  집단적이고 지속적인 베타 테스트라는 개념을 더 깊이 파고들면, 고대 구전 전통과의 유사성이 자명해진다. 이야기, 신화, 노래가 구전될 때마다 변형되듯이, 이러한 새 시대의 예술 역시도 끊임없는 전승의 상태 속에 존재한다. 각각의 상호 작용은 변전의 가능성을 내포하며, 진위성과 ‘원본’의 신성함에 대한 인식에 의문을 제기한다.

9)

1960년대에는 주로 인공두뇌학에서 영감을 얻은 시스템적 감각을 적극적으로 수용한 작품들이 등장하기 시작했다. 테리 라일리가 1964년에 작곡한 <C조(In C)>와 B.S. 존슨이 1969년에 발표한 소설 『불행아들(The Unfortunates)』은 독자와 연주자에게 무수한 방식으로 재구성 가능한 시스템을 제공한다. 두 작품은 매체는 다를지언정, 유동성, 확률성, 무한한 재구성의 가능성을 적극적으로 수용한다는 공통분모를 지닌다. 

  B.S. 존슨의 『불행아들』은 첫 장과 마지막 장을 제외하고는 어떤 순서로든 읽을 수 있는 25개의 분리된 부분들로 구성된 ‘상자 속의 책’이다. 그러니까 이 소설은 25 계승, 즉 15,511,210,043,330,985,984,000,000가지의 각기 다른 배열로 읽을 수가 있다. 독자는 소설이라는 시스템을 배열하는 작업에 적극적으로 참여하게 되고, 존슨은 이런 형식이 제본된 책에 의해 강요되는 질서보다 정신의 무작위성을 더 잘 표현한다고 믿었다. 그리고 이처럼 지극히 체계적인 매개 변수의 틀 속에서 이루어지는 무수한 배열의 감각은 1980년대와 90년대에 유행했던 게임북이나 비슷한 시기의 하이퍼텍스트 픽션과도 상통한다.

  테리 라일리의 <C조>는 번호가 매겨진 53개의 짧은 악구로 구성돼 있는데, 원하는 악기 조합을 활용해, 원하는 순서대로, 원하는 횟수만큼 반복해서 연주할 수가 있다. 처음으로 녹음될 때는 11명의 연주자가 참여했지만, 나중에 많게는 124명의 연주자가 참여하기도 했다. 여기서도 중요한 건 특정 순서대로 배열된 하나의 버전이 아니라, 무수히 많은 버전을 생성해 내기 위한 매개변수를 설정하는 작업이었다. 

  하나의 완성된 곡이 아니라 곡의 매개 변수를 설정하고 이를 배포하고자 했던 라일리의 음악적 실험, 그리고 자체적인 시스템에 기인해 끊임없이 재구성되는 텍스트의 가능성을 내다봤던 존슨의 글쓰기 실험에서 드러나는 공통점은 전통적인 서사보다 창발적인 시스템에 중점을 둔다는 점이다. 달리 말하면, 이런 작품들에서는 서사적 선형성보다 시스템적 배열이 훨씬 두드러지게 나타난다. 이런 작품들은 더 이상 제작자의 의도에 따라 온전히 규정되지 않는다. 여기서의 작가나 작곡가는 고정된 결과물의 창작자가 아닌 작품의 틀과 매개 변수를 설정하는 프로그래머에 더 가깝다고 할 수 있다. 

model_poet (9).jpg

<C 조>의 53개의 악구.

model_poet (10).jpg

제본되지 않은 채로 출간된 <불행아들>을 들고 있는 B.S. 존슨.

10)

존 설이 제안한 중국어 방 논쟁은 튜링 테스트를 통한 판정 가능성에, 그리고 기계가 언어를 진정으로 이해하고 의식을 소유할 수 있다는 생각에 도전하기 위해 고안된 사고 실험이다. 사고 실험 속의 방 안에 있는 사람은 한자로 구성된 텍스트를 입력값으로 받아, 글의 의미를 전혀 이해하지 못한 채 정해진 규칙에 따라서만 처리하고, 그에 상응하는 한자의 배열을 출력값으로 내놓는다. 설은 이 방이 겉보기에는 의미 있는 반응을 하는 듯해도, 여기에는 진정한 이해나 의식이 결여되어 있다고 주장한다. 이런 주장은 언어 모델이 인간의 사고를 이해하거나 시뮬레이션할 수 있다는 생각에 대한 비판이기도 하다.

  다시 말해, 튜링 테스트는 언어 모델이 대화에서 인간과 같은 반응을 생성한다면 지능이 있다고 봐도 무방하다고 제안하는 반면, 설의 중국어 방은 언어 모델이 일관적이고 문맥적으로 적절한 응답을 생성하더라도 그것은 여전히 진정한 의미에서의 이해나 의식이 아니라고 주장한다.

  어찌 보면, 중국어 방은 튜링 테스트가 제시하는 인식의 모형을 무시한 해석으로 보이기도 한다. 한편 이 둘은 지금의 대규모 언어 모델 시대에 다시 불려 나와, 인공지능의 전체적 해석에 다다르려는 두 축을 대변하는 기원처럼 보이기도 한다.

  어쩌면 앞서 블랙박스와 튜링 테스트에 적용했던 인식을 촉발하는 실천적 모형이라는 틀을 중국어 방에도 대입해 볼 필요가 있는지도 모른다. 그때 중국어 방이라는 모형은 중국어 체육관과 같은 가설적 사고 실험의 모형으로 변이될 수도 있다. 이 가상의 체육관에서는 문자들이 수동적으로 조합되기만 하는 것이 아니라, 마치 운동기구처럼 사용되기도 한다. 각각의 운동 또는 언어 처리 작업은 기계의 근육 기억 또는 데이터베이스에 일조한다. 이는 단순한 복제의 문제가 아니라, 각각의 상호 작용을 통해 변화를 거듭하는 것의 문제다. 이러한 체육관에서 ‘훈련’을 하는 개체는 정적인 공간에 갇혀 있는 개체와는 어떻게 다른 사고방식을 갖게 될까?

  정해진 지침을 따르는 폐쇄된 공간 대신에, 문자뿐만 아니라 책, 시, 대화, 심지어 멀티미디어 속의 문맥에 노출된 열린 공간을 상상해 보자. 여기서의 목표는 암기식 답변이 아닌 정제된 답변이며, 데이터에 노출될 때마다 지식은 업데이트를 거듭한다. 방은 정적이고 고립된 환경이지만, 체육관은 동적이며 상호 작용이 가능하다. 방에서는 구문론이 우선시되지만, 체육관에서는 문맥과 의미론이 강조된다.

  그러나 중국어 방에서 중국어 체육관으로의 전환은 단순히 복잡성의 층위를 추가하는 것에 그치지 않으며, 우리가 AI의 역량을 인식하는 방식에 근본적인 변화를 불러일으킨다. 전자는 경직된 규칙 기반의 인식을 암시하는 반면에, 후자는 적응적이고 경험적인 학습을 유도한다. 어쩌면 핵심은 AI가 진정으로 이해할 수 있는지 없는지가 아니라, 다양한 맥락 속에서 이해가 진화하고 변화하는 방식일지도 모른다. 결론적으로, 튜링 테스트와 중국어 방은 AI를 이해하기 위한 기초적인 모형을 제공하지만, 대규모 생성 모델은 그 토대 위에 또다른 인식의 모형을 생각하게 한다. 이는 인지에 대해 통합적이기 보다는 분산되고 네트워크화된 관점에서 생각하도록 우리를 이끈다.

11)

1980년대에는 개인용 컴퓨터가 상대적으로 널리 보급되면서 컴퓨터 프로그램을 활용한 새로운 형태의 생성성이 대두됐다. 윌리엄 체임벌린과 토마스 에터가 제작한 일종의 챗봇 프로그램인 <랙터(Racter)>가 1984년에 출시됐고, 1987년에는 로리 스피겔의 <뮤직 마우스(Music Mouse)>가 출시되기도 했다. 예술가들이 생성적 소프트웨어를 직접 제작하고 또 배포하는 개발자의 역할을 기꺼이 도맡은 것이다.

  <랙터>의 개발자들은 이 프로그램을 “산문 합성을 다루는 인공 작가”라고 설명했다. 랙터의 가장 유명한 결과물인 『경찰관의 수염은 반쪽만 구성되었다(The Policeman's Beard Is Half Constructed)』는 “컴퓨터가 쓴 최초의 책”, “기계의 머릿속으로 떠나는 기묘하고 환상적인 여행”이라는 표지 문구와 함께 1984년에 출간됐다. 이 책에 실린 글들은 어느 정도의 일관성을 보여 주기는 하지만, 종종 초현실적이고 두서없는 방향으로 전개된다. 이런 식으로 말이다.

 

“어쨌든 사랑과 그 끝없는 고통과 영원한 즐거움에 대한 나의 에세이와 논문들은 이 글을 읽고 근심에 찬 친구나 긴장에 휩싸인 적에게 이를 이야기하거나 노래하거나 외치는 모든 사람에게 알려지고 이해될 테다. 사랑은 이 에세이의 질문이자 주제다. 이런 질문으로 시작해 보자. 스테이크는 양상추를 사랑하는가? 이 질문에 답하기란 매정하도록 까다롭고 필연적으로 어렵다. 다음 질문이다. 전자는 양성자를 사랑하는가, 아니면 중성자를 사랑하는가? 다음 질문이다. 남자는 여자를 사랑하는가 또는, 더 구체적이고 정확하게 말하면, 빌은 다이안을 사랑하는가? 이 질문에 대한 흥미롭고 핵심적인 답은, 그렇지 않다는 것이다! 그는 그녀에게 집착하고 그녀에게 매료되어 있다. 그는 그녀에게 홀딱 반하고 그녀에게 미쳐 있다. 그것은 스테이크와 양상추의 사랑, 전자와 양성자와 중성자의 사랑이 아니다. 본고는 남자와 여자의 사랑이 스테이크와 양상추의 사랑이 아님을 보여줄 것이다. 사랑은 나에게는 흥미롭고 너에게는 매혹적이지만 빌과 다이안에게는 고통스럽다. 그것이 바로 사랑이다!”

Christian Bök. “The Piecemeal Bard Is Deconstructed: Notes Towards a Potential Robopoetics.” Object 10 (2001). https://www.ubu.com/papers/object/03_bok.pdf

  그럼에도 불구하고, 이 책은 컴퓨터 생성 텍스트의 가능성을 보여 줬고, 이후의 많은 생성 문학 작품들의 개념적 토대가 됐다. 실험 문학가 크리스찬 부크은 『경찰관의 수염은 반쪽만 구성되었다』 이후로 인간은 더 이상 글쓰기의 필수 요소가 아니라고 평하기도 했다. Racter. The Policeman’s Beard is Half Constructed. New York: Warner Books, 1984.

  작곡가이자 프로그래머이기도 한 로리 스피겔의 <뮤직 마우스>는 1987년에 출시된 컴퓨터 프로그램으로, 사용자가 인터페이스를 통해 음악을 생성하도록 제작됐다. 사용자는 배음, 박자, 포르타멘토와 같은 매개변수를 설정하고, 지정된 격자판 안에서 마우스 커서를 움직여서 피아노 음악 또는 전자 음악을 생성할 수 있었다. <뮤직 마우스>는 브라이언 이노가 1990년대 중반부터 제작하기 시작한 생성 음악 프로그램과 같은 작업의 토대를 마련한 혁신적인 작품이었다. 

  <뮤직 마우스>와 <랙터>는 인간 작가나 작곡가에 의해 제작된 내용물에 의존하던 과거의 예술적 실험들로부터의 전환을 의미했다. 확률적, 우연적, 무작위적 과정을 강조한 1960년대의 작품들과는 달리, 1980년대 들어서 알고리즘적, 지능적 감각이 대두되기 시작한 것도 같은 맥락인데, 이와 관련해서는 로리 스피겔이 1989년에 쓴 <우연적, 알고리즘적, 지능적 음악 분간하기(Distinguishing Random, Algorithmic, and Intelligent Music)>라는 짧은 글을 참고해 봐도 좋다. Laurie Spiegel. “Distinguishing Random, Algorithmic, and Intelligent Music.” Active Sensing 1, no. 3 (1989). https://web.archive.org/web/20220629204447/http://retiary.org/ls/writings/alg_comp_ltr_to_cem.html

model_poet (11).jpg

마인드스케이프에서 플로피 디스크로 출시된 <랙터>의 표지.

model_poet (12).jpg

<뮤직 마우스> 맥 버전 인터페이스.

12)

1990년대에는 예술가 겸 프로그래머들이 자신들의 작업을 위한 플랫폼으로 인터넷을 활용하기 시작했다. 넷 아트는 전통적인 캔버스와 무대로부터 탈피한 새로운 예술 장르였다. 작가들은 사용자들과 실시간으로 상호 작용하는 코드를 짜기 시작했다. 이 시대의 중요한 작품 중 하나로는 사용자 인터페이스를 혼란스럽고 예측할 수 없는 풍경으로 바꿔놓은 JODI의 <My%Desktop>을 꼽을 수 있다. 이와 같은 작품에서는 예술가, 도구, 관객 모두가 작품의 최종 형태에 일조하며, 이들 간의 경계가 모호해진다.

  디지털 인터페이스가 널리 퍼지기 시작하면서, 퍼포먼스도 본질적인 변화를 겪게 됐다. 알렉세이 슐긴의 <386 DX> 프로젝트는 이러한 변화를 상징적으로 보여 줬다. 인간들로 구성된 밴드가 순회공연을 하는 대신, 여기서는 윈도우 3.1을 구동하는 낡은 PC가 <California Dreaming>, <Smells Like Teen Spirit> 같은 상징적인 곡들을 리메이크했다. 빈티지 사운드 카드와 MIDI 파일을 통해 전달되는 <386 DX>의 음악은 우리가 흔히 ‘라이브’ 음악이나 퍼포먼스라고 생각하는 것들에 대한 본질적인 의문을 제기했다.

  넷 아트는 예술가 커뮤니티의 역학 관계도 재편하기 시작했다. 스튜디오나 갤러리에 물리적으로 존재해야 했던 기존의 예술 매체들과는 달리, 넷 아트는 분산된 디지털 공간 속에서 번창했다. 포럼, 채팅방, 메일링 리스트는 작가들이 서로 협업하고 비평을 주고받으며 작품을 전시하는 새로운 살롱이 됐다. <The Thing>과 같은 프로젝트는 디지털 아트 컬렉티브로 등장했지만, 작가들이 실험적인 작품을 호스팅하며 초창기 넷 아트 커뮤니티를 육성하게끔 해 준 플랫폼이기도 했다.

model_poet (13).jpg

“최초의 사이버펑크 밴드” <386 DX>와 기타 대신 키보드를 둘러 맨 알렉세이 슐긴.

model_poet (14).jpg

“미술과 비평 이론을 논하는 전자 게시판이자, 이메일, 데이터베이스 아카이브,

온라인 프로젝트를 다루는 가상 갤러리”라고 소개된 <The Thing>의 홍보용 포스터.

13)

그렇다면 이러한 역사적 선례들을 어디까지 현재의 생성적 감각의 전신으로 볼 수 있을까? 앞서 언급된 작품들은 시대에 따른 생성성이 예술의 맥락에서 체현된 다양한 모습들을 나타낸다. 하지만 현재의 예술적 생성성은 전례 없는 양의 정보로 훈련된 기성 생성 모델에 의존한다는 점에서 과거와 다르다는 사실을 염두에 두어야 한다. 

  여기서의 핵심은 예술가가 시스템 제작에 미치는 영향력의 정도다. 이전의 예술가들은 종종 프로그램의 개발자이자 작품의 제작자라는 이중적인 역할을 수행하면서 본인이 고안하고 활용하는 시스템과의 밀접성을 유지할 수가 있었다. 일례로, 컴퓨터 예술의 선구자 중 한 명이자 벨 연구소의 연구원이기도 했던 마이클 놀은 예술가와 프로그래머가 하나가 되어야 한다고 일찍이 주장한 바 있다. 유원준. 「예술작품의 인공적 자율성에 관하여 ― 사이버네틱스 및 발생예술을 중심으로」. 『인공지능시대의 예술』. 유현주 엮음. 도서출판 b, 2019. p. 154-5.

  반면 오늘날의 예술가들은 대다수가 기성 모델을 통해 작업하고, 예술가가 모델의 설계 또는 기능에 미치는 영향력은 없는 것이나 마찬가지다. 자신만의 데이터셋으로 파운데이션 모델을 파인튜닝하는 데도 한계가 있다. AI 모델의 학습에 사용되는 데이터셋의 방대함과 복잡성을 고려할 때, 파인튜닝이 모델의 근본적인 작동방식에 미치는 영향력은 지극히 미미하다고 할 수 있다.

  따라서, 앞서 언급한 예술적 선례들은 현재의 표현 방식들과 개념적 유사성을 일부 공유하기도 하지만, 생성성의 역학 관계는 크게 달라졌다. 과거의 예술가들이 생성 시스템의 설계와 개발에 깊이 관여한 반면, 현재의 예술가들은 작품에 활용하는 생성 모델과 훨씬 더 분리된, 사용자와 같은 입장에서 작업을 하는 경우가 많다. 이러한 예술적 역학 관계의 변화는 생성성의 전개 과정을 이해하는 데에 핵심적인 요소인 듯하다.


 

14)

이쯤에서 프롬프트 엔지니어링이라는 것을 떠올려 볼 수도 있겠다. 이는 한편으로는 (폐쇄된 상자라는 의미로의) 블랙박스 안에 내재된 잠재 공간에 대한 신화를 기반으로, 가중치의 계곡을 탐사하는 행위의 묘사이기도 하다. 기계 학습 모델의 잠재 공간은 숨겨진 관계, 패턴, 표현이 존재하는 개념적, 신화적 또는 허구적 영역으로 종종 생각되고는 한다. 이 공간은 복잡한 모델이 새로운 결과물을 생성해 내고, 방대한 데이터 속의 보이지 않는 패턴을 발견하는 창의성의 마술이 발생하는 곳으로 여겨지기도 한다.

  대규모 언어 모델의 공간을 거대한 세계로 생각해 볼 때, 그곳에 학습된 가중치에 따라 형성되는 협곡, 산맥, 강, 낮은 평지, 혹은 구멍과 같은 다양한 지형을 떠올려 볼 수 있다. 비교적 가중치가 높은 음식이나 인간의 문화와 관련된 것들은 도드라지게 끊임없이 이어진 산맥과도 같고, 가장 탐사하기 어려운 곳은 가중치가 낮은 지형들일 테다.

  이 영토는 우리가 인식하는 대로, 인간의 관습대로, 또는 지정학적 논리대로 형성되어 있으면서도, 여전히 신비롭게 남아 있다. 모델이 학습한 추상적인 개념의 환상과 마주하고, 인간의 인식을 뛰어넘는 보간이 발현되는 영토로 말이다. 잠재 공간은 이처럼 기계 학습 모델이 드러내는 탁월함과 복잡성이 묻혀있는 지대로 그려지고는 한다. 그리고 우리는 골드러시의 일꾼들처럼 게걸스럽게 그곳으로 향한다.

  그럼에도 이 잠재공간의 가능성은 유효할 수 있다. 그러나 우리는 그보다는 실천적이고 의도적인 언어의 모형을 생성하는 일에 더 집중해야 한다. 이것은 신화적인 잠재 공간을 효율적으로 탐험하기 위한 프롬프트-모형을 고안해 내는 문제가 아니다. 그보다는 배워야 하는 음계가 없는 악기의 연주법을 스스로 구성하는 문제에 더 가깝다. 

model_poet (15).jpg

미드저니를 통해 생성된 이미지

Prompt
“대규모 언어 모델의 공간을 거대한 세계로 생각해 볼 때, 그곳에 학습된 가중치에 따라 형성되는 협곡, 산맥, 강, 낮은 평지, 혹은 구멍과 같은 다양한 지형을 떠올려 볼 수 있다. 비교적 가중치가 높은 음식이나 인간의 문화와 관련된 것들은 도드라지게 끊임없이 이어진 산맥과도 같고, 가장 탐사하기 어려운 곳은 가중치가 낮은 지형들일 테다. 이 영토는 우리가 인식하는 대로, 인간의 관습대로, 또는 지정학적 논리대로 형성되어 있으면서도, 여전히 신비롭게 남아 있다. 모델이 학습한 추상적인 개념의 환상과 마주하고, 인간의 인식을 뛰어넘는 보간이 발현되는 영토로 말이다. 잠재 공간은 이처럼 기계 학습 모델이 드러내는 탁월함과 복잡성이 묻혀있는 지대로 그려지고는 한다.” 

15)

미리 규정된 음계가 없는 디지털 악기라는 개념은 디지털 미학의 탄생을 연상시킨다. 전통적으로 모든 예술 매체에는 매개 변수와 경계가 존재했다. 하지만 디지털 영역에서의 경계는 끊임없이 변화한다. 다시 말해, 디지털 음악가의 악기들은 고정돼 있지 않고 계속해서 진화한다. 이러한 현상은 우리에게 다음과 같은 질문을 던진다. 악기는 어디까지이고, 예술가는 또 어디서부터일까?

  역사적으로, 새로운 매체가 등장할 때마다 예술가들은 자신의 분야를 재고하며 이에 적응해야 했다. 영화는 단순히 스크린으로 옮겨 놓은 연극이 아니었고, 공간과 서사와 관객의 역할에 대한 재해석을 동반했다. 오늘날의 가변적인 생성 모델을 다루는 예술가들은 새로운 악기를 배우는 것은 물론이고, 진화하는 음색과 리듬에도 끊임없이 적응해야 하는데, 여기서는 숙련과 내려놓음의 적절한 균형이 요구된다.

  영화의 탄생과 오늘날의 AI 예술을 비교하면 흥미로운 유사점들이 보인다. 거친 질감과 흔들리는 프레임이 특징이었던 초기 영화는 지금 보면 기술적으로 단순해 보이지만 당시에는 혁신적이었다. 마찬가지로, AI를 통해 생성된 예술도 처음에는 불완전해 보일 수도 있다.

  초기 영화의 매력은 이전에는 볼 수 없었던 현실을 묘사 가능하다는 점이었다. 찰나의 순간이 영원처럼 느껴지고, 아득하게 먼 곳이 손에 닿을 듯했다. 하지만 영화 속의 장면들은 우리가 공유하는 현실에 기인했다. AI 예술은 바로 이러한 질서를 뒤흔든다. AI 예술은 가시성에서부터 시작하지 않으며, 비가시성의 영역을 향해 나아간다.

  영화라는 매체는 공유된 과거와 집단적 기억을 상기시킴으로써 관객을 사로잡는다. 프레임 하나하나가 우리의 세계와 이야기와 경험을 떠올리게 한다. 이에 반해, AI를 통해 생성된 예술은 우리를 항시적인 창작의 흐름 속으로 이끈다. 사진적 지표성이라는 안전장치 없이 데이터 기반 바다의 가능성에서 부유하고, 표류하며, 신기루를 본다. 여기서의 정서적 울림은 익숙함이 아닌 의외의 설렘 속에 새겨진 익숙함의 흔적에서 비롯된다.

  AI 예술은 친숙한 세계와 잠재성의 영역을 잇는 다리 역할을 한다. AI의 창작물을 초자연적으로 여기면 편리할지는 모르지만, 자세히 들여다보면 세상의 흔적으로 가득함을 알 수 있다. 훈련 데이터를 비롯해 우리가 내리는 선택과 설정하는 매개 변수는 모두 현실에서 추출된 것들이다. 하지만 그 결과물은 종종 생소하게만 느껴진다. 이처럼 AI 예술은 지금의 것과 앞으로 올지도 모르는 것을 비추는 거울을 통해 익숙함과 알고리즘적 미지의 잠재성을 엮어 낸다.

model_poet (16).jpg

에드워드 머이브리지, <움직이는 말>, 1878.

16)

말의 움직임을 분석하고 분해한 후 그것들을 다시 재구성하여 영상의 시대를 연 에드워드 머이브리지의 작업은, 복잡한 정보를 더 작은 부분으로 분해한 후 새로운 통찰이나 표현을 생성하기 위해 재구성한 초기의 예로 생각해 볼 수 있다. 어쩌면 이러한 과정은 생성 AI 및 기계 학습 모델이 오늘날 세계를 거대한 분류 데이터셋으로 나누고 그것으로부터 새롭게 합성 미디어들을 만들어 내고 있는 현재의 방식과 비교해 볼 수 있을지도 모른다. 

  즉 머이브리지가 말의 움직임을 연구하기 위해 개별 프레임으로 분해했듯이, 기계 학습 모델은 데이터 내의 패턴, 특징, 관계를 식별하는 분해 및 분석의 과정을 거쳐왔다. 그리고 머이브리지가 말의 동작을 이해한 후 그것을 움직이는 이미지로 만들기 위해 프레임을 다시 조립하듯, 생성 AI는 분석 및 분해를 통해 학습한 가중치를 기반으로 합성 텍스트, 이미지, 사운드를 재구성하고 생성한다.

  머이브리지의 연구는 이와 같은 과정을 통해 사람들이 운동의 복잡성과 뉘앙스를 감상할 수 있게 해 주었다. 같은 맥락에서, 생성 AI를 통해 사용자는 대규모 데이터 세트 내의 복잡한 관계와 패턴을 탐색하여 다른 통찰력과 발견으로 이어질 수 있는 가능성을 가지고 있다(고 여겨진다). 정리하자면 둘 다 인간이 인지하기 어려운 복잡한 정보를 더 작은 부분으로 나누고, 기본 패턴을 이해하고, 데이터를 재구성하여 다른 확장을 생각해 볼 수 있게 했다는 점에서 연결해 볼 수 있는 것이다. 물론 생성 AI는 사진과 같은 ‘진실’을 드러내는 것과는 거리가 있지만, 일종의 통계적 합성을 통해 새로운 ‘현실 효과’를 낸다는 측면에서는 비교해 볼 만하다. 

17)

머이브리지의 연구가 세상의 복잡성에 대한 현미경과도 같은 관점을 제공했다면, 오늘날의 생성 AI는 상호 연결된 현실의 거대한 태피스트리를 시각화하는 망원경과도 같은 관점을 제시한다. 이는 마치 살아 있는 유기체와도 같은 각각의 데이터 조각이 전체적인 서사에 일조하는 복잡한 생태계를 관찰하는 일과도 비슷하다. 여느 생태계와 마찬가지로, 미적인 것은 개별 요소가 아닌 요소 간의 상호 작용 속에 존재한다.

  데이터와 디지털 영역이 뒤섞인 이 거대한 태피스트리로부터, ‘디지털 자연주의’라는 새로운 예술적 개념이 창발된다. 예술가는 더 이상 단순한 창작자가 아니라, 복잡한 데이터 환경을 조성하고 실험하는 디지털 생태학자의 역할을 맡게 된다. 각각의 작품은 균형이 최우선시되는 섬세한 생태계이며, 모든 요소와 바이트 하나하나는 생물들의 상호 작용처럼 조화와 혼돈의 흐름 속에 존재한다.

  에밀 졸라가 <실험 소설>에서 설명하고자 했던 것도, 서사의 창작자가 아니라 실험의 매개 변수를 설정하고 그 상호 작용의 결과를 관찰하는 일종의 생태학자로서의 소설가가 아니었을까? 졸라가 등장인물들을 통제된 문학 실험 속의 현상으로 봤다면, 디지털 자연주의자는 데이터 클러스터들을 통제된 디지털 생물군계 속의 유기체로 본다. ‘디지털 자연주의’는 큐레이팅된 환경 그 자체가 바로 서사인 영역을 상정한다. 인간의 조건을 설명하기 위해 집필된 이야기들과는 달리, 겹겹의 데이터로 이루어진 이러한 디지털 지형들은 기술과 우리의 관계가 진화하는 방식을 이야기한다. 실증적 관찰자의 역할을 겸하는 예술가는 각기 다른 데이터 스트림 간의 교류를 촉진하여, 공생과 마찰에 대한 창발적 이야기들을 끌어낸다.

  흥미로운 점은, 졸라의 서사적 세계에 비해 디지털 생물군계 속에서 통제가 분산되는 정도다. 졸라는 등장인물이 특정한 고난에 어떻게 반응하는지를 관찰하지만, ‘디지털 자연주의’에서는 고난 그 자체가 데이터의 반응에 따라 변화하기도 한다. 데이터 클러스터, 알고리즘, 사용자 입력과 같은 디지털 유기체들은 작가의 예상 밖에서 상호 작용하며, 환경과 그에 속한 요소들이 서로에게 지속적인 영향을 미치는 피드백 루프를 형성한다.

  소설을 바라보는 졸라의 관점은 유리로 둘러싸인 생명의 소우주인 테라리움을 관찰하는 것과도 비슷하다. 조명을 조절하고, 새로운 식물을 들여놓고, 행동의 변화를 관찰한다. ‘디지털 자연주의’에서의 테라리움은 유리 속에 갇혀 있지 않고, 수많은 디지털 생물군계와 연결돼 있다. 졸라의 실험 소설가가 초기 장면을 설정하고는 관찰자로 남는다면, 디지털 자연주의자는 자신이 관찰하는 생물군계가 더 큰 디지털 생태계와 합쳐지고 또 상호 작용하는 과정을 목격하며 재조정, 재협상, 재해석을 거듭한다.

  이처럼 방대한 디지털 생태계에서는 저자성의 개념이 더더욱 미묘해진다. 여기서의 디지털 자연주의자는 진정으로 유일한 창작자일까, 아니면 생물군계를 작동시키고 데이터의 상호 작용을 통해 서사가 형성되도록 하는 촉매제에 불과할까? 생성 예술에서는 모든 픽셀이나 사운드 바이트 하나하나가 궤적을 바꿀 잠재력을 지닌 채 자율적으로 진화한다. 디지털 생태계의 이러한 역동성은 예술가가 지닌 의도의 정적인 표현으로서 예술 작품을 바라보는 우리의 전통적인 이해 방식에 의문을 제기한다.

model_poet (17).jpg

에두아르 마네, <에밀 졸라의 초상>, 1868, 오르세 미술관.

18)

영화를 비롯한 전통적인 예술 형식들이 개인적 표현이나 사회적 성찰에 중점을 두었다면, AI 예술은 작품 속 자아의 위치에 대한 질문을 던진다. AI 예술은 개인적 주관과 집단적 데이터가 뒤엉키는 흐름 속에서 디지털 시대의 예술적 정체성의 본질을 재고하게끔 한다.

  영화감독이자 현대미술 작가인 아핏차퐁 위라세타쿤의 작업에서는 기억에 의해 좌우되는 가변적인 정체성에 대한 고찰이 다양한 형태로 나타난다. 그런 그가 GPT-3를 통해 『태양과의 대화』라는 제목의 극본 형식으로 된 실험적 서사를 생성했다는 사실은 놀랍지 않다. 『태양과의 대화』에서는 크리슈나무르티, 아서 C. 클라크, 틸다 스윈튼과 같은 인물들, 그리고 태양, 블랙홀, 늑대와 같은 비인간 개체들을 아우르는 다양한 등장인물들이 우주를 여행하면서 기억, 죽음, 우정, 사랑, 정체성 등의 주제를 아우르는 우화적 이야기를 풀어나간다.

  이야기가 진행될수록, 등장인물들의 정체성이 점점 모호해지면서 정체성이 뒤바뀌고, 합쳐지고, 심지어 단순한 환각으로 드러나기도 한다. 이를테면, 아핏차퐁이라는 등장인물이 갑자기 태양이 되기도 하고, 크리슈나무르티, 달리, 아서 C. 클라크는 상상 속에 존재하던 신기루로 드러나며, 몇몇 등장인물들의 전생의 영혼들이 체현되어 나타나기도 한다. 『태양과의 대화』에서는 이처럼 자아의 모호성과 혼성성이 강조되는데, 이는 대규모 언어 모델들의 기본적인 특성이기도 하다. GPT-3와 같은 대규모 언어 모델은 절대로 단일적이지 않으며, 방대한 훈련 데이터는 수많은 지식의 모형들의 집합이기도 하다. 언어 모델들은 입력값으로 주어진 프롬프트에 담긴 의도와 느낌을 반영해 각양각색의 목소리를 취하는데, 아핏차퐁은 바로 이러한 가변적 정체성에 주목한다.

  아핏차퐁 본인은 단 한 문장도 직접 쓰지 않았지만, 일련의 프롬프트들을 통해 GPT-3를 감독했는데, 이러한 프롬프트들 또한 별도로 기록되어 있어서, 작품의 형성 과정은 물론이고 입출력의 형태로 기록된 언어 모델과 예술가의 상호 작용을 볼 수 있다는 점 또한 아주 흥미롭다. 아피찻퐁이 GPT-3에게 제공한 프롬프트들은 다음과 같다. “아핏차퐁, 태양, 크리슈나무르티, 달리, 그리고 아서 C. 클라크는 지구로 향하는 우주선 안에 있다. 아핏차퐁과 태양은 다른 세 명의 등장인물이 사실은 존재하지 않는다는 걸 깨닫는다. 그들의 대화를 지어내라.” “그러고는 태양이 아핏차퐁에게 이틀 전에 꿨던 꿈 얘기를 들려준다.” “그러고는 아핏차퐁이 태양에게 꿈 얘기를 들려준다.” 아핏차퐁 위라세타쿤. 『태양과의 대화』. 이계성 옮김. 미디어버스, 2023. p. 130.

20240228_211604.jpg

아핏차퐁 위라세타쿤. 『태양과의 대화』. 이계성 옮김. 미디어버스, 2023 

 

  아핏차퐁은 『태양과의 대화』에서 크리슈나무르티가 제안한 “생각하지 않으면서 살기”라는 개념을 염두에 두었다고 한다. GPT-3와의 공동 창작 과정에 대해 그는 다음과 같이 이야기한다. “생각하고 있었다고 해야겠지만, 세심하게 생각하지는 않았어요. 저는 대화의 전반적인 구조를 생각하고 있었죠. 하지만 동시에, 작품 속에 아핏차퐁이라는 등장인물이 있어서, 그가 저를 상징한다고 생각하지 않을 수는 없었죠.” 같은 책. 107. 다시 말해, 인공 신경망 모델과의 공동 창작 과정에서 나타나는 생각의 부재는 기계적인 과정에 의해 생각이 대채되는 것이 아니라, 통상적인 창의적 사고에 반하는 어떠한 창발적인 감각에 더 가까울 테다. 또한, 작가의 정체성이 인공 신경망 모델에 의해 종종 예상치 못한 방식으로 모형화되고 증폭된다는 점도 이러한 감각에 일조한다. 

 

19)

크리슈나무르티에게 생각과 시간은 호환 가능한 개념이었다. 따라서 생각을 멈추는 것은 시간의 움직임을 멈추는 것과 같다(『태양과의 대화』에도 관련된 내용이 등장한다). 크리슈나무르티에 따르면, 생각을 멈출 수 없다는 사실을 직시함으로써 “생각하지 않고 살기”에 다가갈 수 있는데, 아주 단순히 말하자면 순간을 긍정하라는 말이다. 그러니까, “생각하지 않고 살기”는 생각의 부재가 아니라 생각의 불가피함이라는 본질을 명확하게 인식하고 받아들이는 것을 의미한다. 크리슈나무르티는 이를 통해 개개인의 마음을 자기중심적인 상태로부터, 자기만의 반향실로부터 해방시킬 수 있다고 봤다.

  생각에 대한 크리슈나무르티의 관점을 살펴보면 생성 예술과의 유사점들이 보인다. 생각의 필연성을 직시하라는 크리슈나무르티의 말처럼, 생성 예술은 매체에 내재된 예측 불가능성과 불규칙성을 받아들인다. 이러한 무질서함에 저항하거나 이를 통제하려고 들지 않고, 흘러가도록 내버려 둠으로써 즉흥적이면서도 구조화된 작품을 생성해 낸다. 이는 인간의 경험에 내재하는 통제와 내려놓음 간의 긴장감과도 맞닿아 있다. 생성 예술 작품은 이러한 이분법을 반영하여, 의도와 결과, 의식적인 마음과 길들여지지 않은 생각의 흐름 사이의 예측 불가능한 상호작용을 가시적으로 표현한다.

  근본적으로 생성 예술은 연속적인 생각의 흐름과 마찬가지로, 표현될 때마다 진화를 거듭하는 끊임없는 가변의 상태 속에 존재한다. 생각을 멈춤으로써 시간을 멈춘다는 크리슈나무르티의 개념은, 특정한 찰나를 포착하여 작품으로 고착시키려는 생성 예술의 의도와도 통한다. 어떠한 순간을 선택할 때, 예술가는 특정한 생각이나 개념을 고르고 구체화해서 공유함으로써 시간을 멈추지만, 그 밖의 무수한 가능성은 체현되지 못한 채로 사라져 버리기도 한다.


 

20)

머이브리지의 사진 이후로 테오도르 제리코나 에두아르 마네의 그림에서 볼 수 있는 날아가듯 질주하는 낭만적인 말의 삽화, 즉 시각적 환영은 구식이 되었고, 이러한 이미지들은 시각문화와 대중의 상상 속에서 점점 흐려졌다고 한다.

  이는 당시 예술가들 사이에서도 상당한 논란거리였는데, 프랑스 아카데미 화풍의 대표적 화가인 장 루이 에르네스트 메소니에는 “그동안 내 눈이 나를 속였군요”라며 탄식했다고 한다. 한편 조각가 오귀스트 로댕은 머이브리지의 사진에 대해 “진실을 말하는 것은 예술가이며 사진은 거짓말을 한다. 현실에서 시간은 머물러 있지 않기 때문이다”라는 말을 남겼다고 한다.  리베카 솔닛. 『그림자의 강』. 김현우 옮김. 창비, 2020. p. 300-1.

  이는 재현의 위기라기보다는 어떠한 세계의 상실일까? 로댕의 말은 우리가 어떤 재현의 모델 혹은 기호의 모델에 속아 넘어가지 않기를, 어떠한 세계의 다차원성이 하나의 모델 속으로 축소되지 않기를 바라는 마음을 이야기하는 듯하다. 그리고 이는 지금 폭증하는 대규모 생성 모델을 다시 생각해 보게 한다. 모델에 속아 넘어가지 않으며 모델을 만들기라는 문제를 생각하게 한다.

model_poet (18).jpg

에두아르 마네, <부아 드 불로뉴에서의 경주>, 1872, 휘트니 컬렉션.

21)

아무리 복잡한 모델도 결국에는 이해의 매개체다. 머이브리지의 혁신적인 사진 작업은 새로운 이해의 모델이 불러일으킬 수 있는 격변의 증거이기도 하다. 흔히들 간결한 모델을 매력적이라고 생각하는데, 여기에 오해의 소지가 있다. 모델에 속아 넘어가지 않으려면, 아무리 진보한 모델일지라도, 모든 모델은 미완의 개념으로, 즉 추상으로 존재한다는 사실을 이해해야만 한다.

  아무리 강력할지언정, 이와 같은 추상은 득이 되기도 하고 실이 되기도 한다. 머이브리지의 사진이 시각 예술을 재정의했듯이, 오늘날의 AI 모델은 우리가 복잡한 시스템을 이해하는 방식을 재구성한다. 하지만 사진의 셔터 소리가 회화를 멈춰 세우지 못했듯이, AI가 생성한 결과물 또한 우리의 이해를 멈추게 할 수는 없다. 핵심은 픽셀들의 사이 공간과 알고리즘에서 손실된 미묘한 차이들을 해석하는 데에 있다.

  사진이 발전함에 따라 회화는 구상에서 추상으로, 확실성에서 상상성으로 옮겨갔다. 인상주의는 현실로부터의 도피가 아니라, 무수한 감각을 더 깊게 파고든 데에 따른 결과물이었다. AI가 정량화된 지식과 정밀한 모델을 제공하는 지금, 우리의 과제는 AI가 생성한 결과물을 단순히 받아들이기만 하는 것이 아니라, 이를 진정으로 느끼고, 재해석하고, 재창조하는 일일 테다.

  머이브리지가 사진을 통해 드러낸 것은 당대의 인식 체계에 반하는 새로운 시각적 시대의 시작에 불과했다. 이와 비슷하게, 현재의 AI 모델 역시도 다가오는 지적 지평의 서막에 불과하다. 우리는 이러한 기술에 감탄만 할 것이 아니라, 아직 초기 단계에 있다는 사실을 잊지 말아야 한다. AI의 진정한 가치는 그 결과물뿐만 아니라 우리에게 던지는 질문에 있다.


22)

그렇다면 여기에서 질문을 던지고, 인식을 촉발하는 실천적인 모델을 개념화하는 문제와 직면하게 되는데, 우리는 이를 ‘무지의 모델’이라고 불러 보려 한다. 언뜻 생각하면 ChatGPT와 같은 대규모 언어 모델은 ‘모른다’고 답할 줄 모를 것 같지만, 실제로는 가능하다. 이러한 모델은 방대한 양의 텍스트로 훈련됨과 동시에 불확실성 또는 지식 부족을 인정하는 것 역시 인간과 유사한 반응을 생성하도록 설계되었다. GPT가 ‘모른다’고 답하는 영역은 아래와 같으며, ‘감정적 혹은 인지적 압도’를 제외하고는 인간과 상당히 겹친다.

 

  • 지식 또는 전문 지식 부족

  • 불확실성 또는 모호성

  • 추측 또는 미래 예측

  • 개인적인 의견 또는 경험

  • 기밀성 또는 개인 정보 보호 문제

  • 감정적 또는 인지적 압도

 

  하지만 우리는 또 다른 무지의 모델을 떠올려 봐야 한다. 단순히 ‘모른다’라는 답을 끌어낼 수 있는 모델을 이야기하는 것이 아니다. 그보다는 자크 랑시에르의 ‘무지한 스승’과도 같은 무지의 모델일 테다. 지능과 역량의 증강을 위한 인공지능이 아닌, 우리의 지식의 한계와 불확실성을 인정하고 또 더듬어 모색해 보기 위한 무지의 모형 말이다. 분석하고 모형화할 수 있는 것에만 몰두하는 모델이 아닌, 지식에 내재하는 미지와 간극들을 인식할 필요성을 강조하는 모델을 이야기하는 것이다. 인공지능으로부터 직접적인 답변을 얻어내는 대신, 생각을 불러일으키는 질문을 함께 만들어 내고, 여러 관점을 종합하고, 지적 자율성을 강화하는 방식으로 모형화 해 나가는 것을 의미한다.

  랑시에르의 ‘무지한 스승’은 공통된 무지의 상태를 수용하는 교육학을 옹호한다.  자크 랑시에르. 『무지한 스승 ― 지적 해방에 대한 다섯 가지 교훈』. 양창렬 옮김. 궁리, 2016. 이는 무지를 결핍이나 약점이 아니라 지적 성장과 비판적 사고의 촉매제로 보는 관점이다. 무지를 포용함으로써 지적 자율성을 발전시킬 수 있다는 말이다. 이 방식은 학생들이 학습 과정에 적극적으로 참여하고, 의문을 제기하며, 독립적으로 지식을 추구하는 과정을 통해 더 깊은 이해에 도달할 수 있다는 것이다.

  관찰하고, 되풀이하고, 검증하고, 더듬어 간다. 마치 수수께끼를 풀듯이. 그리고 랑시에르는 이렇게 더듬어 가는 과정이야말로 참된 지능의 운동이자 지적 모험이 아닐지 묻는다. ‘무지를 모르는’ 상태에 파열을 일으키는 모델이야말로 ‘무지의 모델’이라고 부를 수 있지 않을까?


 

23)

‘무지한 스승’의 개념에 기반한 AI를 개발한다는 생각은 반직관적이면서도 매우 필요하다. 이러한 ‘무지의 모델’은 정보로 포화된 현시대에서 역설적으로 지식의 등대가 될 수도 있다. 공백과 간극을 받아들임으로써, 더 깊고 총체적인 형태의 학습을 가능하게 할지도 모른다. 이는 음악에서 음표만큼이나 중요한 침묵이 지식의 선율에 깊이와 울림을 더해 주는 것과도 같다.

  GPT의 정보 중심적 접근법과 ‘무지의 모델’을 병치해 보면 독특한 관점이 드러난다. 이를 통해 우리가 지능을 이해하는 방식을 재고해 볼 수가 있다. 핵심은 정답을 얻는 것이 아니라, 질문하고 의심하며 우리가 아직 이해하지 못하는 수많은 것들을 향한 열린 자세를 유지하는 용기일 테다.

  누구는 이러한 ‘무지의 모델’을 AI에 적용하는 것이 퇴행적이라고 하겠지만, 실제로는 지식을 향한 여정이 멈추는 법이 없는 미래로 나아가게끔 해 주는 원동력이 된다. AI가 모든 문제의 답을 제공해 줄지도 모르는 세상에서, 우리는 무엇을 진정으로 추구하는지를 자문해 봐야 한다. 단순한 생산성인가, 아니면 보다 깊숙한 이해인가? 생산성은 본질적으로 양날의 검과도 같다. AI를 비롯한 기술 덕분에 우리는 더 짧은 시간 안에 더 많은 일을 성취할 수 있게 됐지만, 이해의 깊이가 그 속도를 따라가고 있는지 자문해 봐야만 한다.

  속도와 깊이 사이에 내재하는 긴장감은 근현대적 수수께끼의 핵심이다. 오늘날 정보의 접근성은 그 언제보다도 높지만, 깊이 있는 이해는 점점 더 어려워진다. 이제는 지식의 양에서 이해의 미묘함으로 초점을 옮겨, 지적 성취의 지표를 재평가해야 할 때인듯하다. ‘무지의 모델’을 받아들이는 것은 현대 기술의 편리함을 거부하는 것이 아니라, 모호성의 사이 공간을 긍정하고, 이해를 추구함으로써 이를 보완하는 것일 테다.


 

24)

다시 매스터먼의 이야기로 돌아가서, 그녀의 또 다른 주장 하나를 살펴보자. “언어는 적어도 부분적으로는 상당히 규칙적인 간격으로 호흡하는 생물에 의해 만들어졌기 때문에 지금의 형태를 띠고 있다”는 것인데, 여기에는 매스터먼의 논지를 거칠게 축약한 것이라는 설명이 붙어 있다.  Wikipedia contributors. “Margaret Masterman.” Wikipedia, The Free Encyclopedia. https://en.wikipedia.org/w/index.php?title=Margaret_Masterman&oldid=1154803664  매스터먼이 더 확장적이고 깊이 있게 이 논지를 전개해 나가지 않았기 때문에 아마도 다음의 문장들은 개인적 가설에 가까울 것이다.

  그녀의 주장을 조금 더 조작적으로 이야기해 보자면, 언어는 어떠한 생물체의 물리적, 생물학적 제약에 의해 형성되는 복잡한 체계다. 호흡의 리듬, 성대의 한계, 두뇌의 구조, 심지어 음성 언어를 수신하는 청각 기관과 공기의 파동 마저도 언어의 형성과 사용방식에 기여할 것이다. 이러한 물리적 한계는 언어를 이해할 때 빼놓을 수 없는 것들이다. 그렇다면 음성 언어는 어떠한 유기체와 그 주변의 물리적 특성의 산물이고, 문자 언어도 어느 정도는 마찬가지일 테다.

이는 우리가 어떠한 실재의 조건 속에 존재하고 있는가에 대한 생각을 상기시킨다. 이 생각은 다시 시간은 실제로 멈추지 않는다는 로댕의 말을 다시 되새기게 하며, 모형화와 모형화 되지 못할 공백 사이에서 진동하며 대규모 언어 모델을 바라보게 한다. 

  매스터먼은 “마음을 위한 망원경”이라는 비유 혹은 모형을 통해 컴퓨팅을 이해하고자 했다. 마치 17세기의 망원경이 인간의 인식과 세계가 맺는 관계를 재검토하게 했듯이, 오늘날에는 컴퓨팅과 인공지능이 우리의 인식을 또 한 번 재고하게끔 한다.

  자연과학이 망원경에 의해 재발명되었다면, 인공지능은 인식 체계의 재발명과 연관될 것이다. 단순히 통계적으로 추출-합성된 결과물로 인한 스테로이드적 생산성 증강이 아닌, 또 다른 인식 체계와 관련된 무언가로 말이다. 이런 맥락에서, 인식의 가설을 수립해 볼 수 있는 블랙박스 혹은 무지의 모델로 대규모 언어 모델을 바라보는 관점은 언어, 인식, 그리고 인간과 기계의 관계에 대한 관습적 사고를 가로질러 새로운 인식의 모형을 생성해 낼 가능성을 생각해 보게 한다.


 

25)

“마음을 위한 망원경”이라는 비유는 흥미로운 생각을 불러일으킨다. 망원경은 멀리에 있는 별을 가까이로 끌어다 주지만, 그 별에 대해 어떻게 생각해야 하는지는 알려 주지 않는다. 마찬가지로, AI는 엄청난 잠재력을 지니지만, 온전한 지식의 원천이라기보다는 지식을 가까이하고 탐색하게 해 주는 매개체로 봐야 한다. 따라서 ‘무지의 모델’이라는 개념의 핵심은 AI의 지식수준을 낮추는 것이 아니라, AI의 잠재력을 활용하여 질문하고 탐구하는 역량과 호기심을 촉진하는 것일 테다.

  AI를 단순한 도구가 아닌 매개체로 바라보면, 문학이나 미술과도 유사한 폭넓은 문화적 역할이 부여된다. 이러한 미학적 공간에서, 모호성은 사색과 성찰을 효과적으로 유도한다. 그렇다면 다음과 같은 질문이 가능해진다. AI라는 매개체는 ‘무지의 모델’로서 이러한 미학적 공간들을 촉발할 수 있을까? 호기심을 자극하는 소설이나 음악처럼, 불확실성을 억제하는 대신 이를 깊숙하고 성찰적인 이해의 통로로 활용할 수 있을까?

  여기서 살펴본 모든 작품과 개념들은 방대한 디지털 생물군계를 새로운 시각으로 바라보게 해 줄 잠재력을 지닌다. 그 속에서 디지털 예술의 역동성, 모형화될 수 있는 것과 없는 것 사이의 진동, 그리고 언어의 풍부한 미묘함이 모두 교차한다. 여기서 우리의 과제는 미지의 영역이나 모호성을 회피하지 않고 긍정하며, ‘무지의 모델’을 활용하여 더 깊은 탐구를 촉진하는 일이 아닐까?

-

이 글은 2023년 포킹룸에서 열린 토크에서 발표한 <생산성과 생성성 - 취한 시인으로의 GPT> (이계성 & 최빛나)에서 출발해 확장된 글이다.

이계성은 번역과 저술을 통해 대규모 언어 모델과 컴퓨터 생성 텍스트의 능률적이기보다는 시적인 측면들을 고찰하고자 한다 . 『파르마코 - AI』 (작업실유령 , 2022), 『태양과의 대화』 (미디어버스 , 2023) 등의 책을 옮겼고 『맥락과 우연 —GPT와 추출적 언어학』 (미디어버스 , 2023)의 저술에 참여했다

최빛나는 언메이크랩에서 활동하며 포킹룸의 리서처로 참여하고 있다.  발전주의 역사와 기계 학습의 추출주의를 서로 겹쳐 현재의 사회문화 , 생태적 상황을 드러내는 것에 관심이 있다 . 최근에는 데이터셋 , 컴퓨터 비전 , 생성 AI의 예측성을 ‘일반자연 ’이라는 개념과 함께 놓고 , 그 사이에서 드러나는 인간중심적 문화와 신식민성 , 재난의 문제를 이야기 하고 있다 .

bottom of page