Statystyki ser­wi­sów WWW to temat rze­ka. Wbrew pozo­rom sta­no­wią kopal­nię infor­ma­cji o odwie­dza­ją­cych nasz ser­wis oraz o ich zacho­wa­nia. Statystyki sta­no­wią tak­że bar­dzo dobre narzę­dzie mar­ke­tin­go­we do bada­nia zain­te­re­so­wa­nia ofe­ro­wa­ny­mi przez nas pro­duk­ta­mi i usłu­ga­mi oraz narzę­dzie do bada­nia oto­cze­nia nasze­go ser­wi­su (współ­pra­cu­ją­cych innych ser­wi­sów). Niezależnie od wiel­ko­ści nasze­go ser­wi­su WWW zawsze war­to badać zacho­wa­nia odwie­dza­ją­cych go inter­nau­tów, no chy­ba że ser­wis ten zupeł­nie do nicze­go nie służy.

Do cze­go słu­ży nasz serwis 

Serwisy WWW two­rzy się w róż­nych celach jed­nak zawsze powin­ny być one jasno spre­cy­zo­wa­ne. Podstawowym jest naj­czę­ściej pre­zen­ta­cja fir­my, jej ofer­ty, pozy­cji na ryn­ku. Innym może być np. uspraw­nie­nie kon­tak­tów z klien­ta­mi, tak­że poten­cjal­ny­mi. Może to być oczy­wi­ście tak­że jakaś odmia­na e‑biznesu. Ważne jest by dokład­nie zaadre­so­wać (opi­sać dla kogo go two­rzy­my) treść ser­wi­su bo tyl­ko na tej pod­sta­wie moż­na przy­go­to­wać zawar­tość, któ­ra uczy­ni nasz ser­wis inte­re­su­ją­cym dla osób na któ­rych nam zależy.

Co moż­na badać 

Narzędzi do bada­nia ruchu na stro­nach WWW i nie tyl­ko jest dość dużo na ryn­ku. Różnią się moż­li­wo­ścia­mi, wydaj­no­ścią, jako­ścią pre­zen­to­wa­nych sta­ty­styk. Wybór zale­ży od potrzeb oraz wyma­gań same­go ser­we­ra WWW gdyż sys­tem taki nie powi­nien powo­do­wać istot­ne­go obni­że­nia wydaj­no­ści nasze­go ser­we­ra inter­ne­to­we­go. Dobrze prze­my­śla­ne śle­dze­nie ruchu na stro­nach WWW i nie tyl­ko pozwa­la bar­dzo dokład­nie moni­to­ro­wać zain­te­re­so­wa­nie poszcze­gól­ny­mi pro­duk­ta­mi, usłu­ga­mi. Wskazać klien­tów wyka­zu­ją­cych naj­więk­sze zain­te­re­so­wa­nie naszy­mi pro­duk­ta­mi a nawet kon­tro­lo­wać sku­tecz­ność reklam w pra­sie. Jak to robić?

Narzędzia do bada­nia nasze­go ser­wi­su Internetowego 

Analiza logów
Logi ser­we­ra (pli­ki z infor­ma­cja­mi o każ­dym pobra­nym pli­ku jak np.: jego nazwa, dokład­ny czas pobra­nia, jego adres URL, adres URL stro­ny z odno­śni­kiem do nie­go, i wie­le innych) sta­no­wią pod­sta­wo­we źró­dło infor­ma­cji o tym co dzie­je się na naszych stro­nach WWW. Na pod­sta­wie infor­ma­cji z logów moż­na two­rzyć sta­ty­sty­ki odwie­dzin z podzia­łem np. na godzi­ny, dni, tygo­dnie, mie­sią­ce czy lata. Analizując czas pobra­nia każ­dej stro­ny oraz adres z jakie­go odwie­dza nas inter­nau­ta moż­na śle­dzić jego zacho­wa­nia: zli­czać tzw. sesje czy­li prze­glą­da­nie naszych stron przez jed­ną oso­bę. Jest to bar­dzo istot­na infor­ma­cja gdyż licz­ba sesji w sto­sun­ku do licz­by tzw hitów (czy­li pobra­nych poje­dyn­czych pli­ków) świad­czy o fak­tycz­nym zain­te­re­so­wa­niu naszy­mi stro­na­mi. Można np. z góry zało­żyć, że oso­ba któ­ra tra­fi­ła na naszą stro­nę i nie zaj­rza­ła dalej tak na praw­dę nie zain­te­re­so­wa­ła się tym co na niej zna­la­zła dla­te­go sama licz­ba wyświe­tleń stro­ny wywo­ła­na np. rekla­mą ban­ne­ro­wą tak na praw­dę o niczym nie świad­czy (o czym trud­no usły­szeć w agen­cji reklamowej).

Analizując adre­sy sie­ci z któ­rych zaglą­da­ją do nas inter­nau­ci moż­na wychwy­ty­wać miej­sca (insty­tu­cje, fir­my) któ­rych pra­cow­ni­cy są zain­te­re­so­wa­ni tre­ścią nasze­go ser­wi­su. Jeśli są to np. stro­ny zawie­ra­ją­ce opi­sy pro­duk­tów i ich ceny moż­na się domy­ślać, że fir­my te mogą być zain­te­re­so­wa­ne naszą ofer­tą i może war­to same­mu się do nich ode­zwać i zapro­po­no­wać prze­pro­wa­dze­nie pre­zen­ta­cji handlowej.

Zlecając rekla­mę np. w pra­sie moż­na przy­go­to­wać spe­cjal­na stro­nę i nadać jej uni­kal­ny adres URL, taki do któ­re­go nie pro­wa­dzą odno­śni­ki z żad­nej innej naszej stro­ny. Wyeksponowanie tego adre­su URL w rekla­mie i śle­dze­nie oglą­dal­no­ści takiej spe­cjal­nej stro­ny WWW daje infor­ma­cje o sku­tecz­no­ści naszej rekla­my w gaze­cie. Oczywiście odno­to­wy­wa­ne są tyl­ko oso­by mają­ce dostęp do Internetu dla­te­go zawsze trze­ba te wyni­ki kory­go­wać dany­mi o popu­lar­no­ści Internetu w Polsce (dane takie są dostęp­ne np. w ser­wie pro­wa­dzo­nym przez stu­den­tów Koła Informatyki AE w Krakowie).

Logi ser­we­ra WWW pozwa­la­ją tak­że na wychwy­ce­nie adre­su URL stro­ny (lub ser­wi­su WWW), z któ­rej inter­nau­ci bar­dzo czę­sto prze­cho­dzą na nasze. Można w ten spo­sób łatwo wska­zać stro­ny WWW, na któ­rych ktoś umie­ścił odno­śnik do nasze­go ser­wi­su. W ten spo­sób może­my tak­że bar­dzo łatwo kon­tro­lo­wać sku­tecz­ność reklam ban­ne­ro­wych lub współ­pra­cu­ją­cych ser­wi­sów (np. wza­jem­na wymia­na odno­śni­ków czy nawet bannerów).

Logi mają jed­nak poważ­ne ogra­ni­cze­nie. Jest nim reje­stro­wa­nie tyl­ko ruchu przy­cho­dzą­ce­go”. Nie znaj­dzie­my tam żad­nych infor­ma­cji np. o sku­tecz­no­ści odno­śni­ków wysła­nych w listach e‑mail czy odno­śni­kach na naszych stro­nach, któ­re pro­wa­dzą już do innych ser­wi­sów (np. opis pro­duk­tu na stro­nach producenta).

Skrypty jako nie­odzow­ne wsparcie 

Do sto­sun­ko­wo pro­stych i bar­dzo sku­tecz­nych zara­zem narzę­dzi uzu­peł­nia­ją­cych bada­nie logów są skryp­ty prze­kie­ro­wu­ją­ce tzw. redi­rec­to­ry. Skrypty te słu­żą do śle­dze­nie ruchu wycho­dzą­ce­go”, gdyż nie jest on reje­stro­wa­ny w logach sys­te­mo­wych ser­we­ra WWW. Działanie takie­go skryp­tu pole­ga na pośred­ni­cze­niu w prze­kie­ro­wy­wa­niu z naszych stron na zewnątrz. Np. w tym ser­wi­sie zamiast poda­wać w odno­śni­ku adres: http://​www​.gemius​.pl/

poda­ję:

http://​www​.gemius​.pl/

W pierw­szym przy­pad­ku nie miał­bym żad­nej infor­ma­cji o licz­bie klik­nięć na ten odno­śnik. W dru­gim przy­pad­ku skrypt redir wpierw odno­tu­je to klik­nię­cie i dopie­ro po zli­cze­niu wyśle inter­nau­tę pod wska­za­ny adres URL. W ten spo­sób uzy­sku­je­my bra­ku­ją­ce dane, któ­rych nie znaj­dzie­my w logach. Skrypty redir naj­czę­ściej zli­cza­ją prze­kie­ro­wa­nie pod wska­za­ny adres nie­za­leż­nie od miej­sca (stro­ny WWW) ich uży­cia. Jest to bar­dzo wygod­ne do kon­tro­li ogól­nej popu­lar­no­ści dane­go odno­śni­ka jed­nak nie pozwa­la na uni­kal­ne bada­nia (np. poje­dyn­czej akcji mailingowej).

Innym więc przy­dat­nym narzę­dziem jest odmia­na skryp­tu redir, któ­ra sto­so­wa­na jest do śle­dze­nia odno­śni­ków wysy­ła­nych w listach e‑mail lub wybra­nych stro­nach. W tym przy­pad­ku roz­wią­zu­je­my pro­blem jak kon­tro­lo­wać przej­ścia do wybra­nej stro­ny WWW w zależ­no­ści od miej­sca poda­nia odno­śni­ka do niej. W ten spo­sób może­my kon­tro­lo­wać sku­tecz­ność każ­de­go miej­sca poda­nia odno­śni­ka nie­za­leż­nie (list e‑mail, inna wewnętrz­na stro­na, stro­na ser­wi­su part­ner­skie­go) pomi­mo tego, że bada­my jed­ną i tą samą stro­ną WWW (jeden adres URL).

Tego typu skryp­ty to tak­że redi­rec­to­ry jed­nak uży­wa­ją one spe­cjal­nych tablic, w któ­rych adre­sy URL zamie­nia­ne są np. na spe­cjal­ne kody lub nume­ry (w przy­pad­ku poprzed­nie­go skryp­tu adres URL był poda­wa­ny jaw­nie). Ta meto­da pozwa­la na zli­cza­nie klik­nięć na kon­kret­ny odno­śnik zależ­nie od tego jaką dro­gą do nas dotarł i co naj­waż­niej­sze jest to jedy­ny spo­sób na zli­cza­nie odno­śni­ków wysy­ła­nych pocz­tą elek­tro­nicz­ną. Przykładem takie­go skryp­tu jest uży­wa­ny w IT-Consulting skrypt zli­cza­ją­cy odno­śni­ki wysy­ła­ne w listach do sub­skry­ben­tów tego ser­wi­su. Poniższy odno­śnik pro­wa­dzi do adre­su tej wła­śnie strony:

Jak widać łatwo osią­gnąć tu uni­kal­ność. W ten spo­sób może­my utwo­rzyć róż­ne kody dla tej samej stro­ny. Umieszczając je na róż­nych stro­nach, w róż­nych ser­wi­sach, wysy­ła­jąc pocz­tą może­my je śle­dzić nie­za­leż­nie. Dzięki tym narzę­dziom mam infor­ma­cje, któ­rych nie da się uzy­skać z logów sys­te­mo­wych ser­we­ra WWW.

Wysłany w liście 9 Stycznia 2001 odno­śnik do jed­nej ze stron klik­nę­ło 31% sub­skry­ben­tów ser­wi­su czy­li pra­wie co trze­ci czy­tel­nik. Jest to bar­dzo dobry wynik co bar­dzo dobrze świad­czy o zain­te­re­so­wa­niu danym tema­tem. Bez tych narzę­dzi zdo­by­cie tych infor­ma­cji było­by nie możliwe.

Inne bar­dziej wyra­fi­no­wa­ne narzędzia 

Opisane powy­żej narzę­dzia mają dwa pod­sta­wo­we ogra­ni­cze­nia: są mało wydaj­ne oraz nale­zą do tzw. metod pasyw­nych. Wydajność ma duże zna­cze­nie dla ser­wi­sów o bar­dzo dużych oglą­dal­no­ściach. Proste skryp­ty dość moc­no obcią­ża­ją ser­wer trze­ba by więc użyć szyb­sze­go ser­we­ra. Pasywność pole­ga na tym, że skrypt tyl­ko zli­cza klik­nię­cia, nie pobie­ra żad­nych dodat­ko­wych informacji.

Analizy aktyw­ne

Kolejnym kro­kiem w zdo­by­wa­niu infor­ma­cji jest ana­li­za nie tyl­ko zacho­wań inter­nau­tów i popu­lar­no­ści naszych stron WWW. Możliwa jest bar­dziej zaawan­so­wa­na ana­li­za np. poło­że­nia geo­gra­ficz­ne­go, odset­ka inter­nau­tów powra­ca­ją­cych do nas czy nawet każ­de­go inter­nau­ty nie­za­leż­nie (w rozu­mie­niu uży­tej prze­glą­dar­ki czy kom­pu­te­ra PC). Tego typu ana­li­zy wyma­ga­ją już bar­dziej wyra­fi­no­wa­nych narzę­dzi jaki­mi są spe­cjal­ne skryp­ty posłu­gu­ją­ce się np. spe­cjal­ny­mi znacz­ni­ka­mi zapi­sy­wa­ny­mi w pli­kach tym­cza­so­wych prze­glą­dar­ki inter­ne­to­wej tzw. cookies. To narzę­dzie pozwa­la już na iden­ty­fi­ka­cję miej­sca (prze­glą­dar­ki) z któ­re­go nastą­pi­ły odwie­dzi­ny. Bardzo czę­sto z domnie­ma­nia przyj­mu­je się, że jest to ta sama oso­ba (nie wia­do­mo kto, użyt­kow­nik jest nadal ano­ni­mo­wy ale iden­ty­fi­ka­cja, że to ta sama oso­ba w tym przy­pad­ku zupeł­nie wystar­czy). W tym przy­pad­ku infor­ma­cje dostar­cza­ne przez taki sys­tem są znacz­nie dokład­niej­sze. Możliwa jest już dokład­na ana­li­za ilu inter­nau­tów powra­ca na nasze stro­ny, po jakim cza­sie, na któ­re stro­ny itp. Systemy tego typu o dużej wydaj­no­ści są bar­dzo dro­gie. Na ich zakup nie zawsze mogą sobie pozwo­lić nawet duże fir­my dla­te­go bar­dzo czę­sto są one przed­mio­tem usług typu ASP. Firmy (czę­sto ISP ale nie tyl­ko) na spe­cjal­nych zasa­dach (np. odpłat­nie) udo­stęp­nia­ją takie sys­te­my innym ser­wi­som. Proste sys­te­my tego typu dostęp­ne są tak­że bez­płat­nie. Często są to okro­jo­ne wer­sje sys­te­mów komer­cyj­nych. Korzystanie z nich pole­ga na umiesz­cze­niu na swo­ich bada­nych stro­nach spe­cjal­ne­go kodu html, skryp­tu java lub tyl­ko spe­cjal­ne­go odno­śni­ka. Skrypt zli­cza­ją­cy wyko­nu­je się na ser­we­rze usłu­go­daw­cy, gdzie użyt­kow­nik takie­go ser­wi­su może np. śle­dzić swo­je sta­ty­sty­ki. Może je tak­że otrzy­my­wać np. pocz­tą e‑mail. Tego typu usłu­gi są coraz popu­lar­niej­sze. Powodem jest trend do szcze­gó­ło­we­go kon­tro­lo­wa­nia nakła­dów na ser­wi­sy WWW a te meto­dy to jedy­ne sku­tecz­ne narzę­dzia do jej oce­ny. Dodatkową zale­tą danych otrzy­ma­nych tymi meto­da­mi to moż­li­wość sta­łe­go ulep­sza­nia wła­sne­go ser­wi­su gdyż otrzy­mu­je­my infor­ma­cje cze­go poszu­ku­ją na naszych stro­nach inter­nau­ci, jak czę­sto a cze­go nie ocze­ku­ją w ogó­le. Dla twór­ców stron WWW lub sprze­daw­ców pery­fe­riów kom­pu­te­ro­wych bar­dzo przy­dat­ne są takie sta­ty­sty­ki obra­zu­ją­ce takie dane jak: Systemy Operacyjne, Przeglądarki, Rozdzielczości, Głębia kolorów.

Zdobycie takich infor­ma­cji jest prak­tycz­nie nie moż­li­we inną meto­dą (co naj­wy­żej typ prze­glą­dar­ki moż­na badać na pod­sta­wie logów). Dane takie moż­na otrzy­mać np. z pomo­cą ser­wi­su GeMius pod adre­sem http://​www​.gemius​.pl/ fir­my GeM S.A., któ­ra ofe­ru­je część sta­ty­styk bez­płat­nie na stronach: 

Zaawansowane ana­li­zy logów 

Logi sys­te­mo­we zawie­ra­ją bar­dzo dużą licz­bą infor­ma­cji jed­nak są to suro­we dane o pobra­niach każ­dej ze stron. Same w sobie prak­tycz­nie nie nio­są żad­nych uży­tecz­nych infor­ma­cji. Użyteczne infor­ma­cje moż­na wydo­być z tych danych z pomo­cą róż­ne­go rodza­ju gene­ra­to­rów rapor­tów. Programy te w naj­prost­szej posta­ci zli­cza­ją i gru­pu­ją adre­sy poszcze­gól­nych stron, gra­fik (np. ban­ne­rów), przejść na inne stro­ny w ramach nasze­go ser­wi­su itp. Bardziej zaawan­so­wa­ne narzę­dzia potra­fią wyko­ny­wać bar­dziej skom­pli­ko­wa­ne sta­ty­sty­ki. Niektóre z pomo­cą spe­cjal­nych algo­ryt­mów kore­la­cyj­nych potra­fią nawet wychwy­ty­wać tren­dy w zacho­wa­niach inter­nau­tów. Systemy tego typu to bar­dzo dobre komer­cyj­ne narzę­dzia, nie­któ­re sto­su­ją te same meto­dy ana­li­tycz­ne, któ­re sto­so­wa­ne są w hur­tow­niach danych. Zresztą posia­da­cze hur­tow­ni danych maja w nich tak­że dosko­na­łe narzę­dzia wła­śnie do ana­li­zy logów. Do jed­nych z bar­dziej zna­nych tego typu narzę­dzi na ryn­ku zali­cza­ny jest jest pakiet opro­gra­mo­wa­nie fir­my WebTrends, któ­ry moż­na kupić tak­że w Polsce.

Na zakoń­cze­nie.

Jak już wspo­mi­na­łem na począt­ku ser­wis WWW oprócz roli repre­zen­ta­cyj­nej powi­nien byc postrze­ga­ny jako sil­ne narzę­dzie badaw­cze. Mamy dostęp do infor­ma­cji, za zdo­by­cie któ­rych inny­mi meto­da­mi musie­li­by­śmy zapła­cić znacz­ne kwo­ty. Oczywiście nigdy nie zastą­pią one tra­dy­cyj­nych mar­ke­tin­go­wych badań ankie­to­wych jed­nak w wie­lu przy­pad­kach mogą sta­no­wić źró­dło bar­dzo przy­dat­nych liczb. Rynek inter­ne­to­wy nie sta­no­wi jesz­cze zna­czą­cej czę­ści cał­ko­wi­tych obro­tów dla więk­szo­ści firm jed­nak ogrom­na licz­ba naszych klien­tów zanim cokol­wiek kupi szu­ka infor­ma­cji o pro­duk­tach i ich dostaw­cach wła­śnie w Internecie. Miejmy ich pod kon­tro­lą 8-).

Dziękuję fir­mie GeM S.A. za udo­stęp­nie­nie danych.

Notatka: J.Ż. Kwiecień 2001

Jarosław Żeliński

Jarosław Żeliński: autor, badacz i praktyk analizy systemowej organizacji: Od roku 1991 roku, nieprzerwanie, realizuje projekty z zakresu analiz i projektowania systemów, dla urzędów, firm i organizacji. Od 1998 roku prowadzi samodzielne studia i prace badawcze z obszaru analizy systemowej i modelowania (modele jako przedmiot badań: ORCID). Od 2005 roku, jako nieetatowy wykładowca akademicki, prowadzi wykłady i laboratoria (ontologie i modelowanie systemów informacyjnych, aktualnie w Wyższej Szkole Informatyki Stosowanej i Zarządzania pod auspicjami Polskiej Akademii Nauk w Warszawie.) Oświadczenia: moje badania i publikacje nie mają finansowania z zewnątrz, jako ich autor deklaruję brak konfliktu interesów. Prawa autorskie: Zgodnie z art. 25 ust. 1 pkt. 1) lit. b) ustawy o prawie autorskim i prawach pokrewnych zastrzegam, że dalsze rozpowszechnianie artykułów publikowanych w niniejszym serwisie jest zabronione bez indywidualnej zgody autora (patrz Polityki Strony).

Dodaj komentarz

Witryna wykorzystuje Akismet, aby ograniczyć spam. Dowiedz się więcej jak przetwarzane są dane komentarzy.