데이터리뷰

[데이터리뷰] 데이터에 관한 엉뚱한 횡설수설

CP_NET 2020. 3. 6. 12:57

정보화란 말이 한창이던 시절 정보가 곧 돈이다라는 말이 유행했다. 단지 유행을 넘어서 정보화를 해야 하는 근거처럼 쓰이기도 했다. 요즘은 데이터가 비즈니스고, 혁신이다라는 말이 유행이고 사회적 환경을 재편해야 하는 필요성을 제기하고 있다. 이에 화답하듯 공공데이터 개방의 가속화, 데이터 관련 제도개선 등이 진행되고 있다. 개인이 원하던 원하지 않던 커다란 사회적 물결이 몰려오고, 아니 이미 몰려온 것만 같다. 그럼 이러한 데이터 물결에서 개인은 데이터와 어떤 관계일까?

 

데이터를 어떤 기준으로 규정하느냐에 따라 포괄하는 폭이 넓을 수도 있겠으나 데이터 3법에서 대상으로 하는 것은 개인 정보와 관련한 것이라고 하겠다. 개인 정보는 기본적으로 개인으로부터 발생한다. 여기에는 개인을 특정할 수 있는 정보와 특정할 수 없는 정보가 있다. 특정할 수 있는 것은 주민정보가 가장 대표적이다. 이는 다른 정보와의 연계 없이 독립적으로 개인을 특정할 수 있다. 주소, 직장 등과 같은 정보도 상당부분 개인을 특정할 수 있다. 이런 특정화 정보는 보호가 기본이다. 이와 달리 일상생활에서 행하는 다양한 활동에 따라 생성되는 정보가 있다. 이는 개인을 특정할 수 없지만 유사한 활동 정보가 집단화될 경우 어떤 특성이 고려될 수 있다. 데이터의 활용은 이런 정보의 축적에 근거한다. 그런데 이러한 일상 활동으로부터 발생하는 정보는 개인의 선택적 행위에 따른 것이기 때문에 가변성을 내재하고 있다. 즉 어떤 특성으로 고려될 수 있는 것이 항상 그러하지 않을 수 있다는 것이다.

 

어쨌거나 개인이 일상생활에서 행하는 활동이 어떤 방식으로든 처리가 되면 이는 데이터가 된다. 대부분의 기업들이 데이터가 비즈니스고 혁신이라고 하는 것은 개인의 일상성을 데이터화하고, 이를 토대로 무엇인가를 할 수 있다는 것을 말하는 것이라고 하겠다. 여기서 무엇을 한다는 것은 특정한 고객에게 특정함을 제공한다는 것이고, 이를 통해 이전보다 부가적인 또는 안정적인 경제적 가치를 획득할 수 있다는 것이다. 즉 특정한 고객의 과거 일상적 활동으로부터 축적된 데이터를 토대로 특정한 (또는 특정할 수 있는) 고객의 미래 활동을 제공하는 것이다.

 

문제는 과거의 일상적 행동이 선택적이고 가변적일 수 있다는 점은 안정적인 특정함을 담보하기 어렵다는 것이다. 이를 해결하기 위해서는 상당 기간의 과거 활동 또는 상당 규모의 과거 활동이 축적된 데이터가 필요하다. 선택적 행위의 가변 오차를 가능한 최소화할 수 있다고 믿기 때문이다. 그런데 개별 행위 데이터만으로는 특정함을 보여주기에 한계가 있다. 데이터 간의 관계를 만들어야 하고, 관계 지점을 무엇으로 할 것인가에 따라 다른 행동 모형을 만들 수 있다. 다양한 유사한 행위 집단을 데이터 간 관계 지점을 설정하면 특정한 개인에게 특정함을 보여줄 수 있다. 개인의 존재를 특정하는 정보 선택적 일상 행위 데이터화 특정화 행위 모형 이라는 과정이 발생한다. 특정화를 보완하고 강화하기 위해 개인 존재와 행위의 초연결이 필요하다. 그래야 다양한 데이터 간 관계가 무한으로 확장할 수 있다. 데이터 기반 혁신은 이러한 환경 구축을 전제로 새롭다는 무엇을 창출하는 것이다. 정보로부터 모형의 과정은 다시 개인으로 가는 순환적인데, 지속적인 행위와 데이터화가 이루어져 모형을 강화하거나 혁신하면서 개인을 포괄한다.

 

개인의 존재와 행위로부터 생성되는 개별적인 정보가 개인에게는 그저 일상성으로 내화되지만, 데이터로 외화되면서 데이터는 하나의 자원이 된다. 만약 개인이 일상적 활동을 하지 않는다면 아무런 데이터도 생성되지 않을 것이다. 그렇지만 이는 현실적으로 불가능하다. 그럼 나의 선택적 행위를 데이터화 하는 것에 제공하지 않는다면? 나를 지점으로 하는 데이터를 생성되지 않을 것이다. 나 한 명으로 한정되면 그 역시 나의 선택적 행위로 그칠 것이지만, 사회 구성원 모두가 그런다면 사회적으로 데이터는 생성되지 않을 것이다. 그러나 이 역시 현실적으로 불가능하다. 나의 선택적 행위 역시 나의 의도와 별개로 흔적이 남겨지는 환경이다. 디지털 기술의 고도화는 이를 더욱 세밀하게 하는 환경 조성에 기여 한다. 이는 데이터는 무한하다는 것이다.

 

데이터가 이전과는 다른 의미로 경제적 가치를 창출하는데 필연적인 소스라고 한다면 이제 데이터는 자본이라 할 것이다. 그런데 데이터 자본에서 창출되는 가치는 누가 소유하는가? 데이터의 활용으로 획득하는 앵벌이식가치를 넘어 데이터 자본에 의해 발생하는 총가치는 나와 무관한 것일까? 데이터는 개인의 선택적 행위, 즉 노동하고, 이동하고, 소비하는 데에서 생성된다. 나는 매일매일 데이터를 생성하고 있는데, 데이터 자본에 대한 나의 지분과 권리는 얼마이고 무엇인가. 나는 권리 없는 데이터 생성자일 뿐인가.

 

 

-------

김민규

 

() 한국문화정책연구소 이사. 아주대학교 문화콘텐츠학과 교수. 대학 시절 연극이 좋아 여기저기 돌아다니다 문화운동과 조우하였다. 90년대 초반 석사 과정 시절 국내 최초로 노동자를 대상으로 하는 문화생활실태조사를 했다. 2000년대 초 인디문화 관련 논문으로 박사학위를 받고 게임산업 진흥기관에서 정책, 기획 업무를 총괄하고 문화산업과 예술 분야 정책 및 법제도 개선에 참여했다. 지금의 관심은 예술과 문화산업에서의 공정 환경, 문화예술 분야의 노동 환경, 디지털시대의 문화운동은 무엇일까 이다.