포킹룸 리서치랩은 동일 주제로 2020년 11월 19일- 12월 16일까지 4회에 걸쳐 온오프라인으로 진행된 예술 연구 프로그램입니다. '데이터셋을 채굴하기 - 데이터셋 내외부를 굴착하기 - 데이터 셋팅하기'의 과정으로 진행된 리서치랩은, <부재하는 데이터셋>이라는 큰 주제 아래 각자의 리서치를 진행/발표하고 공통의 주제를 논의하는 시간을 가졌습니다. 리서치랩 아카이브에 전시되는 Zine은 참여자들이 진행한 리서치를 정리한 것이며, 각자가 데이터셋을 바라보는 고유한 관점이 담겨 있습니다. 

 

개인정보 격자 매트릭스(Privacy Grid Matrix)

정재훈

1.나의 동의를 구하고 채굴되는 나의 시공간 데이터는 나로부터 부재하다.

2.나의 동의를 구하고 채굴되는 나의 시공간 데이터는 나에게 부재하다.

3.나의 동의를 구하고 채굴되는 나의 시공간 데이터에 나는 부재하다.

 

부재하는 데이터셋을 고민하는 장소에서, 굳이 존재하는 데이터를 논의하는 것이 무슨 의미가 있을까 고민한다. 개인정보 보호라는 명목 아래 광범위하게 이뤄지고 있는 시공간 데이터의 생산-보관-가공 과정, 그러기에 나와는 유리된 나의 데이터에 대한 질문을 던져보고자 한다. 나의 동의를 통해 생산되고, 수집되고, 보관되는 데이터를 통해 만들어진 기업의 전략, 정부의 정책 속에 과연 나는 존재할까?

모델링, '데이터 - 사람 - 소프트웨어'

​이재옥

박제술, 박물관 디오라마, 컴퓨터 그래픽, 3D 모델링, 공장 자동화 시스템 소프트웨어 등으로 이어지는 '모델링(modelling)' 기술의 발전 양상을 콜라주 하듯이 살펴보았다. 그 안에서 '데이터 - 사람 -소프트웨어'가 관계를 맺는 방식이나 관습을 가늠해 보면서, 더 크게는 미적, 문화적, 기술-사회학적 관점으로 디지털 미디어와 소프트웨어를 이해해 보거나 상상해 보고자 하는 과정이기도 하다.

유쾌한 골짜기

​장영민

이미지와 텍스트가 결합한 짤방 또는 동시대 프로파간다를 위한 데이터셋과 범죄 예방을 위해 제작되는 이상행동 CCTV 영상, 시위 채증 AI 학습 데이터셋을 들여다보며 확증편향이 강화되는 탈진실 시대의 모호한 괴리감을 쫓아 리서치를 시도해보았다.

​산은 산이며 물은 물이다

​이정빈

인공지능이든 사람이든 어떤 사물을 바라볼 때 우리가 가장 먼저 하게 되는 일은 일차적 인지를 하는 것이다. 산은 산이며 물은 물인 것이다. 이때의 개념적 인지는 산과 물을 구별 짓기 위한 것이다. 사물에 대한 개념적 인지가 끝나면 인공지능은 멈추지만 인간은 그 순간부터 그 사물 너머의 것들을 읽어내기 시작한다. 자신의 경험과 기억, 감정 등을 투영하여 사물 그 자체나 사물이 처한 환경까지 읽어낸다. 한 사물을 무수히 많은 다른 것들과 연결 지으며 학습하는 경험의 축적은 역설적으로 인간을 (혹은 언젠간 인공지능도) 다시 '산은 산이며 물은 물이다'라고 인지하는 지점에 도달시키기도 한다. 그러나 이는 사물 그 자체의 본질을 바라보게 된 경지에 이른 것이지 산과 물을 구별 짓는 것이 목적이던 일차적 인지와는 다르다. 리서치는 이처럼 겉보기엔 비슷해 보일 수 있는 일차적 인지와 성찰적 인지에 대한 비교, 특정 사물에 관해 직접 실행해본 연상적 학습 과정에 대한 기록, 그리고 개념으로부터 본질에 도달해가는 과정에 대해 리서치 등으로 이루어져 있다. 

쓰레기에 관한 데이터셋 탐구 (+ 전자쓰레기 데이터셋-팅)

​김민아

주변기억

​최영금

디지털 기술 발전의 산물 중 하나인 전자쓰레기(e-waste)에 대한 관심을 바탕으로, 물리적인 전자폐기물과 이것을 데이터화하는 것이 가능할까? 필요할까? 의미 있을까? 등의 다소 넓은 질문들을 던지며, 쓰레기에 대한 데이터셋 혹은 전자쓰레기에 관한 이미지 데이터셋이 존재하는지 찾아보고 들여다보았다. 그리고 현재까지는 부재해 보이는 '전자쓰레기에 대한 이미지 데이터셋'을 직접 모아둔 이미지로 새롭게 구축해보려고 시도해보았다.

 

이번 데이터 리서치는 도심 속 전자음악을 생산 및 유통하던 지역에 대한 데이터 채집이다. 지역 공간의 특성을 재조명하기 위한 과정에서, 시각과 청각으로 특성을 분절하여 지역 정보를 읽을 수 있는 관련 데이터를 수집한다. 우리가 기억하는 지역에 대한 잔상은 시각뿐 아니라 청각으로도 기억할(떠올릴) 수 있을까.

초월번역

​강민형

번역, 통역에서 사용되는 언어의 데이터셋은 비교적 학습이 쉬워 보이며, 사전이라는 절대적인 데이터셋이 존재하는 것 같다. 그러나 초월 번역이라는 밈처럼 데이터에게 정확성과 의미의 초월을 동시에 요구하는 경우, 결국 자신의 데이터셋을 뛰어넘어야 한다.

 

카무플라주: 머신과 숨바꼭질하기

​조성현

기계가 세상을 인식하는 방식은 인간의 시각체계와는 확연히 다르다.

이들을 이해하기 위해서는 더 이상 인간의 방식을 취해서는 안 될 것이다.

기계는 그 자신의 눈으로 목표 대상을 찾아내는 일련의 과정을 쉼 없이 반복한다.

기계들의 시각 체계에 도전하는 행위들은 알고리즘을 다시 훈련시키는 트레이닝 셋(training set)에

통합될 뿐이다. 우리는 인간의 시각 체계를 버려야 하는 것일까?

연구자는 숨어있는 혹은 가려진 데이터셋(dataset)을 채굴하고,

선순환인지 악순환인지 모를 고리에 대해 고민하며,

조금 거리를 두고 알고리즘과 데이터셋의 말랑말랑한 측면을 살핀다.