2015년 7월 15일 수요일

구글 애낼리틱스(Google Analytics)에서 나쁜데이터 분리하기

필자의 블로거 “소스/매체”를 확인 해보니, 80%이상 트래픽을 차지하는 referral 사이트들이 스팸으로 확인된다.

착각속에서 약간의 근소한 행복을 누릴 것인가? 아니면, 빨간약을 먹고 현실의 아픔과 마주할 것인가?
실제로 영화처럼 그렇게 아프지 않으니, 진실과 마주해 보자.


1,3,5,7 번이 스팸으로 확인 될때, 다음과 같이 정규식 패턴을 만들어, 필터를 걸어 주면 된다.
floating-share-buttons\.com|event-tracking\.com|Get-Free-Traffic-Now\.com|free-social-buttons\.com

"관리/보기"에서 필터링 하기.

“관리(admin) -> 보기(view) -> 필터 -> 추가”에서 “캠페인 소스”에 위의 정규식 패턴을 넣고 저장하자.
등록된 패턴의 사이트들에서 발생하는 트래픽은 더이상 저장되지 않는다.

하지만, 기존에 수집된 히스토리 데이터들은 변경 할 수가 없다.
이부분이 GA인증 과정에서도 강조되는 부분이다.

데이터 변경은 안되지만, 리포팅 할때 필터링 하면된다.

"리포트/세그먼트"에서 필터링 하기.

“리포트(report) -> 세그먼트(segment) -> 추가 -> 새 세그먼트”에서 “조건”의 필터링에서 제외부분에 위의 정규식 패턴을 넣고 저장하자.
만들어진 세그먼트는 겔리리에 등록해서, 사람들과 공유해서 사용할 수도 있다.

이제는, 새로만든 세그먼트를 통해서 진실과 마주하자.


80% 이상이 필터링된 초라한 모습이지만, 괜찮다. 괜찮다. 괜찮다.

“관리/설정 보기”에서 로봇 필터링 하기.

“관리(admin) -> 설정 보기”에서 “봇 필터링” ON하고 저장하자.
알려진 봇들을 자동으로 필터링 시켜주는 기능인데, GA의 용도에 따라서 검토해서 사용하면 되겠다.

이번 글은 개별적인 방안을 담았지만, 향후 스팸 사이트 공동 대응에 대한 조사를 할 예정이다.

0 개의 댓글:

댓글 쓰기