패턴 찾기의 기본은 데이터 확보다. 수작업으로 입력하든, 남이 만들어놓은 자료를 활용하든 로또숫자 데이터가 있어야 한다.


로또 공부는 소위 가공 이전의 로(raw)데이터를 확보한 뒤 시작된다. 그런데 의외로 로데이터에 관심을 두는 경우는 드물다. 전세계 로또사이트를 돌아다니다 보면 로데이터의 관심도에 문제가 많아 놀라곤 한다.

사실 이 모든 작업은 ‘데이터 리터러시’(Literacy)에서 출발해야 한다. 로또를 어떻게 보느냐에 따라 접근법이 달라지기 때문이다. 로또를 랜덤으로 보거나 단순하게 확률게임으로만 본다면 데이터는 필요치 않거나 관심을 둘 필요가 없다.


/사진=이미지투데이
/사진=이미지투데이
러나 로또의 숫자체계를 심로또에서 생각하듯 ‘자연과학의 일부 현상’으로 보고 접근한다면 데이터를 보는 시각은 완전히 달라져야 한다.
지난해 여름 미국에서 로또숫자 조작사건으로 시끄러운 적이 있었다. 미국 아이오와주의 로또관리협회 보안담당자인 에디 팁톤이 지난 2010년 12월쯤 로또당첨번호를 조작, 당첨금 1400만달러를 친구를 통해 취득한 사실이 밝혀진 것. 이를 두고 우리나라에서도 로또숫자 조작논란이 벌어졌고 한국로또를 관리하는 나눔로또가 해명한 적이 있다.

‘로또조작’ 여부는 로데이터의 접근법에 따라 판정할 수 있다. 한국을 비롯해 일본, 영국, 독일 등 선진국은 로또숫자를 뽑아낼 때 ‘비너스’라는 기계를 이용해 공이 떨어지는 아날로그방식을 사용한다. 사용하는 공의 무게와 둘레도 오차범위 내에서 작동된다.

한마디로 한국로또에서 숫자 조작은 불가능하다. 그렇다면 미국에서는 왜 그런 일이 벌어졌을까. 총 100여개의 로또상품이 있는 미국은 비너스를 사용하는 방식과 컴퓨터로 숫자를 뽑는 방식 두가지로 운영한다. 로또숫자 조작은 모두 컴퓨터추첨방식의 로또상품에서 발생한다.


만일 로또를 랜덤이라고 판단하고 매주 ‘자동선택’으로 상품을 구매하는 사람이라면 숫자를 뽑아내는 방식에 관심이 없어도 무방하다. 어차피 1등에 당첨되든 아니든 그냥 운명에 맡긴다고 생각하기 때문이다.

그러나 로데이터를 가공하고 분석해 패턴을 추적하는 사람이라면 데이터의 효용성이 매우 중요한 변수가 된다. 컴퓨터로 뽑아낸 숫자는 사실상 의미가 전혀 없는 데이터가 된다. 컴퓨터 추첨방식은 절대로 랜덤이 될 수 없다.

물론 프로그래머가 랜덤에 가깝게 프로그래밍을 하지만 실제로 로데이터를 들여다보면 조금 왜곡됐음을 알 수 있다. 이는 최소한 1~2년간 매주 숫자를 업데이트하면 누구든 느낌으로도 알 수 있는 사실이다.

중요한 건 인터넷에서 로또관련 데이터를 수집하다 보면 그 구분이 쉽지 않다는 점이다. 한국처럼 국가가 관리하는 곳의 사이트 중에는 TV에서 추첨하는 동영상을 올리는 사이트도 있다. 이런 상품의 데이터는 믿을 수 있다. 그러나 그렇지 않다면 컴퓨터 추첨을 의심해야 한다.

컴퓨터로 만들어낸 숫자의 순도는 확실히 떨어진다. 아예 로또분석에서 의미가 없을 수도 있다. 로또 데이터에도 순도가 있다. 꼭 따져야 할 중요변수다.


☞ 본 기사는 <머니위크>(www.moneyweek.co.kr) 제418호에 실린 기사입니다.