不完美的網(wǎng)站分析數(shù)據(jù):數(shù)據(jù)理想化和訪問者理想化
來源:網(wǎng)站推廣 2012-11-13
一、 技術(shù)理想化
每種數(shù)據(jù)收集方式都有其獨特的技術(shù)優(yōu)勢,但沒有一種收集方式能完美的捕獲到訪問者在網(wǎng)站上的所有動作,每種技術(shù)也都會由于自身的局限性導(dǎo)致你看到的數(shù)據(jù)是并不完美的數(shù)據(jù)。以計算頁面停留時間為例,下圖是一次訪問的時間記錄:(圖示中時間皆為進入頁面的時刻)
通常計算頁面停留時間的方法為:當前頁面的進入時刻與下一頁面的進入時刻差。由此得知上例中頁面的停留分別如下:
頁面A:5分鐘
頁面B:1分鐘
頁面C:4分鐘
頁面D:?
為什么頁面D的停留時間沒有?沒錯,無論哪種收集方式都無法捕捉到頁面D的準確停留時間,原因很簡單,這些數(shù)據(jù)收集方式都無法捕捉到訪問者離開的時刻(或者在退出頁停留了半天沒做任何點擊,或者直接關(guān)閉了瀏覽器)。所以不同的工具廠商對退出頁的停留時間有不同的定義,有的統(tǒng)一計算為1分鐘,有的干脆認為是0分鐘。
目前主要有下面幾種技術(shù)或限制數(shù)據(jù)的獲取,或混淆現(xiàn)有收集到的數(shù)據(jù)。
1. 緩存
這里說的緩存不是指物理芯片例如CPU的緩存,而是為了節(jié)約網(wǎng)絡(luò)資源,提高瀏覽網(wǎng)頁速度建立的瀏覽器緩存或代理服務(wù)器緩存。簡單的理解這兩種緩存就是,將曾經(jīng)訪問過的網(wǎng)頁內(nèi)容(包括圖片以及cookie文件等)存放在電腦或代理服務(wù)器里。當你調(diào)用以前閱讀過的頁面時,可以直接調(diào)出緩存中的內(nèi)容,而不需要再次從網(wǎng)站服務(wù)器上重新傳送數(shù)據(jù)。
下圖就是訪問一個網(wǎng)站后本地緩存文件夾中留下的文件記錄:
由于當訪問者通過本地緩存訪問網(wǎng)站時,并不會往網(wǎng)站服務(wù)器發(fā)送請求,服務(wù)器中自然也就不存在這次訪問的Log記錄。也就是說通過Web日志收集到的數(shù)據(jù)一定會丟失這部分流量。
2. 網(wǎng)絡(luò)爬蟲
如果想要講清搜索引擎爬蟲的原理和算法恐怕單開一個章節(jié)都不夠,而且也不是這本書關(guān)注的內(nèi)容,所以這里就不再贅述。
下面先給出一條網(wǎng)站服務(wù)器Log中的搜索引擎爬蟲記錄:
203.208.60.178 [10/Nov/2011:12:00:00 +0800] “-” “GET /index.php HTTP/1.1″ 200 30000 “-” “Mozilla/5.0 (compatible; Googlebot/2.1; +/wangzhanfenxi-shuju-buwanmei
文章編輯: 365webcall網(wǎng)上客服系統(tǒng)(www.365webcall.com)
我的評論
登錄賬號: | 密碼: | 快速注冊 | 找回密碼 | ![]() |
| 古装一级婬片有奶水 | 亚洲熟女AV一区二区 | 国产AⅤvideoXXXX实拍 | 久久久久久久人妻无码中文字幕爆 | 国产成人无码免费视频在线看芈萝 | 国内精品久久久久久久 | 亚洲精品无码乱码成人果冻传媒 | 疯狂高潮抽搐大合集91搜索 | 日韩AV毛片网站 | 肉欲啪啪A∨无码中文 | 91Pro国产在线观看入口 | 娇小搡BBBB搡BBB小说 | 一区二区三区中文字幕 | 天天干天天日夜夜吻 | 精品视频一区二区在线观看 | 亚洲一级二级无码乱片99 | 久久久7777国产AAAAA | 国产麻豆剧传媒精品国产av | 中国AV毛片内谢美女一二三区 | 国产精品午夜无码久久久久 | 日本久久免费一二三四区 | 奇米精品一区二区三区在线观看 | 中文字幕乱码AV在线 | 日韩精品无码中文视频 | 亚州色图视频在线 | 国产美女被爽到高潮免费A片软件 | 一本色道久久99精品综合蜜臀 | 搡BBBB搡BBB搡视频一级 | 特级婬片A片AAA毛片哪里有 | 国产精品一区二区免费 | 一本一道久久a久久无码 | 日本免费毛片无码无遮挡 | 精品裸体舞一区二区三区 | 精品女同一区二区三区亚亚洲洲 | 亚洲AV无码国产毛片久久春色 | 精品孕妇孕交喷水A片 | 丝袜老熟女Sonia | 对白超刺激精彩粗话AV | 精品一区二区三区四区 | 日韩精品无码高清视频看看 |