2010년 11월 24일 수요일

[web]무료 웹로그 분석툴 webalizer (웹분석 개념정리 포함)

무료 웹로그 분석툴 webalizer 를 적용하면서 정리한 내용입니다. 무료툴이다보니 기업환경에 적용하기에는 어려울 것 같고 부하가 많은 특정 시스템을 분석하고자 할 때 도움이 될 것 같습니다. 이미 인터넷에 설치 및 사용법에 대해 많이 올라와 있습니다. 대신 각 용어에 대해 정리해 놓은 곳이 없어서 대신 정리해서 올립니다.

■ 공식사이트
http://www.mrunix.net/webalizer/

■ 설치방법
http://blog.naver.com/rlaaudtnr8?Redirect=Log&logNo=50005506151 (windows 기준)http://blog.naver.com/battledocho?Redirect=Log&logNo=50094533781 (Linux 기준)

■ 화면 snapshot
http://webzero.tistory.com/18

■ 웹로그 분석 결과 관련 개념정리
출처 : ftp://ftp.mrunix.net/pub/webalizer/README


1. Hits
서버에 요청된 request 총 건수를 Hits이라고 한다. reqeust 는 html, 그래픽 이미지, 오디오파일, CGI 스크립트 등 모든 형태가 될 수 있다. 서버 로그 (access_log) 의 각 라인은 하나의 hit 으로 계산된다. 이 숫자는 특정 기간동안 서버에 요청된 request 의 총 수를 뜻한다.

2. Files
어떤 request 는 서버가 client 에 뭔가 다시 보내주기를 바란다. 이와 같은 파일에는 html 페이지나 그래픽 이미지가 될 수 있다. Hits 과 Files 과의 관계는 '들어오는 요청(incoming requests)' 와 '나가는 response(outgoing response)' 로 생각할 수 있다.

3. Pages
Page 란 HTML 문서를 만드는 것이라 볼 수 있다. 즉, 그래픽 이미지, 오디오클립 등은 Page에 포함되지 않는다. 이 수는 Page 의 숫자를 의미하며 페이지 내의 다른 자원은 포함하지 않는다. Page 란 것은 서버에 따라 다른데 기본적으로는 '.htm', '.html' 혹은 '.cgi' 등이며 많은 사이트에서는 '.phtml', '.php3', '.pl' 등을 포함하기도 한다. 어떤 사람들은 이 수를 '순수한' hits로 생각하기도 하며, 다른 프로그램에서는 이를 'pageview'로 표시하기도 한다.

4. Sites
서버에 요청하는 각각의 reqeust 는 특정 'site'로부터 발생되며, 이는 특정한 이름이나 IP 주소로 나타난다. 'site' 수는 얼마나 많은 각각의 IP 주소가 특정기간동안 서버로 request 를 보냈는지 나타낸다. 이것은 각각의 다른 사용자 (실제 사용자)를 나타낸 것은 아니며 단지 로그와 HTTP 프로토콜을 이용해서 이를 판단하는 것은 불가능하다.

5. Visits
특정 IP 주소에서 서버로 request 를 보내면 그 주소에서 이 전 request 로부터의 시간 총양이 계산된다. 만일 시간차가 이미 설정된 'visit timeout' 값 (default는 30분)보다 크게 되면 총값은 증가하게 된다. 만일 사용자가 오후 1시에 사이트를 방문하고 다시 3시에 방문하게 되면 값이 2로 등록된다.

6. Kbytes
Kbytes 값은 KB 형태로 특정 기간동안 서버에서 보내준 데이터의 양이다. 이 값은 로그에서 바로 추출한 것으로 웹서버에서 만든 로드에서 정확한 값을 나타낸다. 일반적으로 이 값은 서버의 outgoing traffic의 정확한 총 양을 나타낸다.

7. Top Entry and Exit Pages
Top Entry 와 Exit 테이블을 통해 사용자들이 사이트를 들어가기 위해 어떤 URL 을 사용하고 어떤 페이지를 마지막으로 보는지 추측할 수 있다. HTTP 프로토콜과 로그 rotation에 대한 제약 때문에 이 값은 실제 값에 대한 대략의 추측만을 할 수 있지만 사용자들이 어디로 들어와서 나가는지 전체적인 트렌드를 파악할 수 있다.

댓글 없음: