독서노트를 보니 이 책은 거의 1년 만에 다시 읽는다. 시간이 참 빠르다. 기억을 잠시 더듬어보자면 그당시 《데이터를 부탁해》라는 책을 읽고 데이터 분야에 관심이 생겨서 다음에 읽을 책으로 다짜고짜 시작했었는데, 어찌하다보니 다른 책들을 다양하게 읽게 되면서 우선순위에서 좀 밀려났던 것 같다.
요 근래에는 데이터 분야와 관련하여《문과생, 데이터 사이언티스트 되다》라는 책을 읽었었는데, 그 책을 통해 데이터 사이언티스트에게 필요한 역량 및 데이터를 활용해서 문제를 해결하는 프로젝트가 어떤 식으로 진행되는지 살펴봤던 기억이 있다.
이 얘기를 하는 이유는 1년 만에 다시 집어든 이《데이터 문해력》에서도 조금은 비슷한 취지의 내용들이 나왔기 때문이다.
보통 데이터 분석이라고 하면 무슨 통계분석 기법 등을 동원하여 자료를 단순히 해석하는 것으로 생각하기 쉽다. 하지만 저자는 본문을 통해 이러한 것은 데이터 분석 단계에서 지극히 도구적인 것일 뿐 본질적인 게 아니라고 반복적으로 말한다.
1년 전 포스팅의 기록을 잠시 살펴보면, 데이터 분석이라는 것은 앞서 언급한 통계적 기법 같은 것을 사용하기에 앞서 분석 전에 자신이 해결하고자하는 문제 및 프로젝트의 목적을 정의하고 가설을 구축하는 것이 선행되어야 한다고 저자는 말한다. 일단 이것을 명확하게 하고나서 자신에게 필요한 데이터를 수집하고 분석한 뒤 마지막 단계로 분석 결과를 해석하고 문제에 대한 해결책을 제시하거나 프로젝트의 목적에 맞게 상대방을 설득할 수 있는 스토리를 구축한 뒤 그 결과물이 필요한 곳에 적용하는 것 까지가 궁극적인 데이터 분석의 목적이라는 게 저자가 이 책에서 반복적으로 강조하는 것이다.
오늘은 이 3단계 중에서 마지막 단계인 해결책 제시와 관련된 내용부터 시작한다. 다만 이를 위한 선행 단계로 문제를 명확히 정의하고 그 원인이 무엇인지를 파악하는 게 우선되어야 한다.

애당초 ‘해결 방안‘이란 것은 겉으로 드러난 문제를 비근원적으로 대처하는 것이 아니라, 문제를 일으키는 ‘원인‘을 규명해서 이에 대한 ‘방안‘을 적절하게 마련하는 것입니다. - P45
|