Contents

FreeTalk
2018.03.19 17:49

후니넷에 접속하는 검색 키워드

조회 수 1439 댓글 0
Atachment
첨부 '1'
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

또 하나의 잉여짓..


3월 부터 후니넷(hooni.net) 평일 기준 일일 방문자가 천 명이 넘었다.

크롤링하는 봇인지 실제 사용자인지.. 그리고 실제 사용자라면 어떤 경로로 접속을 하는지..

그 유입 경로를 확인해보려고 PHP로 프로그램을 간단한 만들어서 HTTP Referer 로그를 쌓고 그 데이터를 살펴봤다.

굳이 왜 직접 만들었냐면..? 처음엔 XE의 플러그인을 적용했더니 사이트 속도가 현저히 떨어졌고 이후로 몇 가지 외부 Tool을 사용해 봤지만 데이터를 실시간으로 확인할 수 없거나 일부 데이터만 일시적으로 제공하는 등.. 내 입맛에 맞는 것을 찾지 못했기 때문이다.

(혹시 제가 만든 것과 비슷한게 이미 있었다면.. 추천 좀 ㅠㅠ;)


유입 경로와 검색 키워드에 대한 히스토리는 아래 링크를 통해 접속할 수 있고,

관리자가 아니라도 모든 데이터를 열람할 수 있다.




parsed01.png


몇 주 동안 데이터를 모아 확인해보니 주로 실제로 Google, Naver, Daum, Nate 등의 검색엔진을 통해서 유입되고 있었다. 크롤링 봇(Crawling Bot)도 꽤 있었지만 그들이 실제 사용자를 물어오고 있다는 것이니 나쁘지 않았다. 처음엔 단순히 Raw 데이터를 저장하고 원시적으로 확인하는 정도였지만 데이터가 쌓이니 검색어만 추출하고 관리해보고 싶다는 생각이 들었다. 그래서 Raw 데이터를 수집하는 부분만 분리해서 더 빠르게 실행될 수 있도록 했고, Referer 정보를 가공하고 필요한 정보를 추출하는 등의 기능에 대한 DB 스킴과 로직을 단계별로 추가했다.


다행히(?) 국내 검색엔진들을 통해서 검색 키워드를 추출해서 저장하는데 어려움이 없었다. 하지만 Google은 더 이상 Referer에 검색 키워드 정보를 제공하지 않는다.

Google은 개인정보와 보안 이라는 그럴 듯한 핑계로 제공하지 않는다고 하지만 사실 자체 서비스(구글 웹마스터; Google Analytics)에서 통계 정보를 독점하려고 제공하지 않는 듯 하다. 실제로 검색 결과에서 해당 링크로 이동하기 전에 Referer 정보와 그 해시를 자체적으로 저장한 후, 이동 시 Referer 정보를 없애버리는 것 같다.


Naver도 언젠가는 Google처럼 Referer의 정보를 없애버릴 것 같지만, 아직까지는 친절하게 이전의 검색어 정보까지 oquery라는 파라미터로 얻어낼 수 있었다.

그리고 Daum 쪽의 쿼리를 보면서 좀 특이한 부분을 발견했다. Nate가 Daum의 검색엔진을 쓰고 있는 듯 했다. 싸이월드가 한참 잘나갈 때 SK커뮤니케이션즈에서 일했던 나로써는 Nate의 약한 모습이 안쓰러울 뿐이다. 실제 사업적으로 어떤 관련이 있는지는 모르지만 단지 데이터만 가지고 확인할 수 있었던 것은 daum.net/search? 일 때는 실제 Daum 데이터를 검색하는 것이고 daum.net/nate? 일 때는 Nate 데이터를 검색하는 것 같다.

그 밖에 Zum을 통해서 유입되는 경우도 간간히 있다는게 신기하다.


키워드는 대부분 프로그래밍 관련 단어들인데 그 중 좀 억울하고 부끄럽고 특이한 단어는..

"일본야동" 관련..

모두 이 컨텐츠로 연결되고 있었다. (실제로.. 야동은 없다!! ㅋㅋ)

일본야동 스샷 hooni.net/67319


어찌됐든...

악의적이거나 의미 없는 봇의 접속이 아니라 실제로 검색엔진을 통해서 유입된다는 경우가 많았다는 사실을 확인했고 최근 몇 주 동안 그 검색 키워드와 관련 컨텐츠를 다시 보는 재미가 있었다.

이 후 주기적으로 통계를 작성하는 스크립트도 만들고 그 결과 시각화하는 기능을 추가해 볼 예정이다.




?

  1. 후니넷에 접속하는 검색 키워드

    또 하나의 잉여짓.. 3월 부터 후니넷(hooni.net) 평일 기준 일일 방문자가 천 명이 넘었다. 크롤링하는 봇인지 실제 사용자인지.. 그리고 실제 사용자라면 어떤 경로로 접속을 하는지.. 그 유입 경로를 확인해보려고 PHP로 프로그램을 간단한 만들어서 HTTP Re...
    Date2018.03.19 CategoryFreeTalk Byhooni Views1439
    Read More
  2. 집중하는데 말걸 때

    뭔가에 집중하고 있을 때 말 걸면 이렇게 됨 ㅋㄷ [참고] IT 엔지니어가 일할 때는 방해하지 말라 https://hooni.net/93734 <!-- Focus Hey! Do you have 1 sec? Poof Never mind What was I doing?
    Date2018.03.14 CategoryFreeTalk Byhooni Views1342
    Read More
  3. 이름을 불렀더니 아이들이 달라졌다.

    ▲ 사진 찍는거 알고 일부러 다른데 쳐다보고 있는 하은이 ㅠㅠ 작년 9월부터 목요일 아침마다 딸 아이 반에서 Volunteer를 하고 있다. 반 전체 28명의 학생이 4그룹으로 나뉘어서, 그룹마다 나와 함께 20~30분 정도씩 수학(?) 놀이를 한다. 놀이는 간단하지만...
    Date2018.03.02 CategoryFreeTalk Byhooni Views1399
    Read More
  4. 기회의 신 카이로스(Kairos)

    기회의 신 카이로스의 뒷머리가 대머리인 이유 "기회의 신 카이로스(Kairos)" 그리스 신화에 나오는 제우스의 아들 카이로스의 모습은 무척이나 독특하다. 앞머리는 숱이 무성한 대신 뒷머리는 대머리이며, 어깨와 양발 뒤꿈치에는 날개가 달려있을 뿐만 아니...
    Date2018.02.17 CategoryFreeTalk Byhooni Views2138
    Read More
  5. 사운드포지 MP3-Plugin 시리얼

    그대로 따라하면 됨 ㅋㅋ #1 #2 #3 #4 #5 #6 #7 #8
    Date2018.02.15 CategoryHogoo Byhooni Views1423
    Read More
  6. No Image

    강의 자료 아젠다 등.

    기본은 CRUD 임시저장, 레지스트리, 유저디폴츠, 쉐어드프리퍼런스, 파일, 데이터베이스 사용자 측면 디자인과 UI - 편리함, 정보력 (한눈에 잘 보이고 안보이고, 잘 눌러지고 아니고, 불편한 볼륨조절) 개발자 측면 개발방법론 - 효율, 유지보수, 속도, 가독...
    Date2018.02.14 CategoryHogoo Byhooni Views939
    Read More
  7. 아마존 물류창고의 찰리 채플린

    아마존이 물류센터 직원들을 통제하는 방식 최신 기술로 만든 웨어러블 팔찌가 손목에 채워졌다. 첨단 장치는 직원의 근무 중 생길 수 있는 빈틈을 효율적으로 통제했다. 마치 100년 전 포드처럼. [출처] http://www.ttimes.co.kr/view.html?no=20180208170577...
    Date2018.02.14 CategoryFreeTalk Byhooni Views729
    Read More
  8. 한국 음식 영문 이름 (LA 공항에서 유용함)

    한국 음식물 관련 영문 이름 LAX 공항에서 써먹을거 ㅋㄷ 01. 김 : Dried Laver 02. 김치 : Kimchi 03. 고추장 : Red Pepper Paste 04. 간장 : Soy Sauce 05. 다시마 : Kelp 06. 된장 : Bean Taste 07. 들기름 : Perilla Oil 08. 고춧가루 : Chili Pepper 09. ...
    Date2018.02.12 CategoryHogoo Byhooni Views1417
    Read More
  9. DIY 화장실문 페인트 칠하는 날

    홈디포(Home Depot) 에서 맞춘 문짝 페인트 칠하기 아침부터 삽질하면서 홈디포를 세 번이나 왔다갔다.. 1. 페인트 사러 감 2. 브러시가 굵어서 칠할 때 문에 붓자국이 남음 3. 페인트 색상이 틀림, 환불도 안되고 한통 더.. 결국 홈디포 직원에게 추천해준 스...
    Date2018.01.28 CategoryFreeTalk Byhooni Views1723
    Read More
  10. 한국 방문 일정과 할 일 ㅋㄷ

    # LAX 장기주차 정보 QuikPark LAX 9821 Vicksburg Ave. Los Angeles, CA 90045 (310) 645­7754 https://www.google.com/maps/place/9821+Vicksburg+Ave,+Los+Angeles,+CA+90045/@33.9467665,-118.3967788,17z/data=!3m1!4b1!4m5!3m4!1s0x80c2b12af550b501:0x...
    Date2018.01.25 CategoryHogoo Byhooni Views1957
    Read More
  11. No Image

    LAX 장기주차 관련 정보

    # 마일모아 관련 글 https://www.milemoa.com/bbs/board/1566314 https://www.milemoa.com/bbs/board/1132253 # 관련 사이트 http://www.airport-la.com/info/parking.html https://airportparkinglax.net/lax-airport/
    Date2018.01.23 CategoryHogoo Byhooni Views1339
    Read More
  12. 취약점, 백도어, 스파이웨어 없이 해킹할 수 있는 신개념 해킹기법 등장

    대부분의 해킹은 웹/시스템 취약점을 이용하거나 백도어, 스피아웨어를 설치하는 것으로 이루어 집니다. 하지만 이런 전통적인 방법과는 차원이 다른 해킹기법이 한 대학의 연구결과에서 공개됐는데요. 이 방법을 사용하면 네트워크 연결 없이도 원격에서 컴...
    Date2018.01.18 CategoryFreeTalk Byhooni Views789
    Read More
Board Pagination Prev 1 ... 9 10 11 12 13 14 15 16 17 18 ... 81 Next
/ 81