지금 내 연봉이나 적금은 괜찮은 수준일까? [데이터뉴스]

shutterstock_211835152

32세 직장인 김경민씨.

책 읽기 좋은 선선한 날씨에 서점에 갔다가 재테크 책을 집어 들었다. 책 표지에 광고하기를 나이 스물다섯에 1억을 모았단다. 스물다섯에 1억이라… 대충 책을 훑어보니 아르바이트를 해서 130만원을 벌었는데 그 중에서 매달 100만원씩 적금을 들었단다. 경민씨는 현재 세전 연봉 3,200만원을 받고 있는데, 사치스럽게 쓰지도 않음에도 모을 돈이 없었다. 문득 자신이 너무 적게 벌고 있는 것인지 아니면 소비를 잘 못 하고 있는 것인지 궁금해졌다.


이 때 쉬운 방법 중 하나는 통계를 찾아보는 것이다.

또래 신입사원들은 얼마 정도 받는지 살펴보니 2017년 전체 평균이 3,300만원 정도였다. 그냥 딱 평균 정도 받는 것 같다. 대기업 평균 연봉은 3,800만원, 공기업 평균 연봉은 3,500만원 정도라서 다시 이직 준비를 해야 하나 하는 생각도 스쳤다. 어쨌거나 통계를 보면 수입이 남들에 비해 부족한 것은 아닌 것 같았다. 그러면 돈을 너무 많이 쓰는걸까?

신한은행에서 제공한 통계를 보면, 30대 평균 월소득이 450만 원 정도에, 저축액이 100만원이란다. 앞의 통계를 보았을 때는 나쁘지 않다고 생각했다가, 신한은행의 통계를 보니 우울해졌다. 20대와 비교해 보니, 20대 월 평균 소득이 284만원에 저축이 80만 원 정도다. 경민씨만 돈을 못 벌고 못 모으고 있는 것 같다. 아니면 신한은행 이용자들 통계이고, 30대라고 하면 경민씨처럼 사회초년생도 있지만 30대 후반도 포함이 되어 평균이 올라간 것은 아닐까 하는 생각이 들었다. 분명 동시대를 살아가는 사람들의 통계이지만 조금 멀게 느껴졌다.

여러 사람에게 조사한 통계지만 공감이 덜 가면, 주변 친구들에게 물어볼 수 있다. 너희들은 얼마 정도 받느냐고. 하지만 같은 회사 내에서도 서로의 연봉을 쉬쉬하다보니, 친구들 사이에 얼마 받는지 묻는 것이 꺼려졌다. 즉시 비교가 되는 것이 불편하기도 하고.

이런 상황에서 만약 경민씨가 커뮤니티 유저라면 활동하는 커뮤니티에 가서 물어볼 것이다.

“횽아들, 나 지금 32, 세전 3200받는데 이 정도면 괜찮은 거임? 적금은 하나도 못 넣고 있음.”

횽아들은 친절하게 알려줄 것이다. 네 나이에 그 정도 받으면 한심하다는 사람도 있을 터이고, 난 너보다 나이 훨씬 많은데 그것도 못 받는다며 넌 괜찮다는 사람도 있을 것이다. 어느 순간 경민씨는 안중에 없이 나이 대에 맞는 적정 수입이 얼마냐를 두고 갑론을박이 벌어질 수도 있다. 안타깝게 댓글이 단 하나도 없을 수도 있고.

만약 운 좋게 경민씨의 질문에 댓글이 여러 개 달렸다면, 경민씨는 이를 토대로 ‘해석’을 할 것이다.

만약 댓글이 2~30개라면 경민씨는 해석을 하면서도 조금은 찝찝할 것이다. ‘일부’의 이야기일 수 있으니까. 그러나 댓글이 1~200개가 넘는다면 이 정도면 평균이 어느 정도인 것 같다는 ‘감’이 올 것이다. 만약 댓글이 1,000개가 넘는다면 상당히 확신이 설 것이다. 만약 댓글이 10,000개가 넘게 달렸다면?

일 만 명 정도의 응답을 토대로 통계를 낸다면, 상당히 믿음직스럽게 느껴질 것이다. 이 정도라면 한국 보통사람 평균이라 할 수 있을 것이라고 믿을 것이다. 단, 일 만개의 댓글을 일일이 읽는 것이 너무 힘들다는 것이 문제다. 경민씨가 의지를 가지고 댓글의 내용을 평균을 내 보려고 해도 엑셀로 옮기는 (코딩하는) 과정에서 포기할 지도 모른다.

만 명 정도가 응답한 소득 평균과 소비 평균을 분석해 보면 정말 흥미로운 결과가 나올 것 같지만, 할 수가 없었다.

하지만 어느 순간 그것이 가능해졌다. 댓글을 긁어 데이터화 하고 그것을 분석할 수 있게 된 것이다. 댓글 1만개나 되니 빅데이터 분석이라 할 수 있을까? 보통 설문조사에 사용되는 자료가 몇 백~ 몇 천개인데 1만개나 되니까 ‘빅’데이터라고 볼 수도 있으나, 빅데이터라고 하려면 몇 개 이상이라는 기준은 없다. 예전에는 큰 데이터를 처리하려면 힘들었는데 요즘은 쉽게 분석할 수 있게 되었다는 것 보다 빅데이터가 의미있는 점은 이전에는 분석할 수 없었던 자료를 분석할 수 있게 되었다는 것이다. 그래서 빅데이터를 ‘이전 방식으로는 처리가 어려운 새로운 규모, 종류, 속도의 데이터’라고 정의 한다(물론 정의는 학자에 따라 다르다).

단순히 예전보다 ‘양이 많은’ 데이터를 분석하는데 그친다면, 빅데이터가 뭐 크게 다르지 않다는 생각이 든다. 빅데이터가 더 흥미로운 점은 생각이나 감정도 어느 정도 분석할 수 있다는 것이다. 만약 경민씨가 “횽아들, 나 지금 32세이고 여자친구는 동갑임. 여친이 내년 쯤 결혼하자고 하는데 어떻게 하는게 좋을까?” 라고 물었다면, 역시 댓글이 여러 개 남겨졌을 수 있다. “네가 좋으면 하는거지. 그건 여기서 물을 것이 아닌 듯.” “도망쳐!” “결혼은 꼭 해.” 등등. 이러한 내용도 빅데이터 분석이 가능해졌다. 비단 댓글뿐 아니라, 여러 형태의 데이터를 분석할 수 있고, 감정도 알아볼 수 있다.

데이터의 양이 많기에 ‘이 정도면 믿을 수 있겠어’라는 안심도 주거니와, 이전에는 분석하지 못했던 정보까지 알려주니 참으로 흥미로울 수 밖에 없다.

그런데 한 가지 의문이 남는다. 경민씨는 왜 자신의 연봉이나 적금을 굳이 다른 사람들과 비교해 보는걸까? 남이 얼마를 벌든, 얼마를 모으든 경민씨와 무슨 상관이라고.

사실 경민씨 뿐 아니라 많은 사람들이 다른 사람들의 소득과 재테크 등에 관심을 갖는다. 나쁘게 말하면 ‘남의 시선을 신경쓰는 행위’라고 할 수도 있으나, 이런 사회적 비교는 ‘자신을 객관적으로 보고 싶은 동기’에서 비롯되는 것이다. 자신이 현재 상황을 좀 더 객관적으로 알기 위해서 남과 비교를 해 보는 것이고, 이 때 비교 대상은 가능한 비슷한 사람이어야 좀 더 객관적인 비교가 된다. 앞서 경민씨가 신한은행의 30대 통계를 보고 갸우뚱 했던 것은, 경민씨 같은 32세가 평균 450만원을 벌 것 같지 않았기 때문일 수 있다. 30대로 묶으니 또래 이야기 같지 않았던 것이다. 좀 더 많은 데이터를 찾아보려고 온라인 게시판에 묻거나 더 검색을 해보는 것도 가능한 자신과 비슷한 사람에 대한 정보를 찾아서 보다 ‘객관적인 자신의 위치’를 파악하고 싶은 것이다.

빅데이터는 좀 더 자신에 대해 객관적으로 보고 싶은 사람의 심리와 기술이 합쳐져 더 빠르게 발전하고 있는 것 아닐까.

* 본 기사의 데이터시각화는 데이터플래닛(http://www.dataplanet.co.kr)의 차트가 사용되었습니다.

비주얼다이브 칼럼니스트 최미정 작가|editor@visualdive.co.kr

공유