卖逼视频免费看片|狼人就干网中文字慕|成人av影院导航|人妻少妇精品无码专区二区妖婧|亚洲丝袜视频玖玖|一区二区免费中文|日本高清无码一区|国产91无码小说|国产黄片子视频91sese日韩|免费高清无码成人网站入口

基于移動(dòng)互聯(lián)網(wǎng)日志的搜索引擎用戶行為研究

基于移動(dòng)互聯(lián)網(wǎng)日志的搜索引擎用戶行為研究摘要:隨著移動(dòng)互聯(lián)網(wǎng)的迅速發(fā)展,移動(dòng)搜索用戶大規(guī)模增加,移動(dòng)搜索引擎用戶行為分析對(duì)改進(jìn)搜索引擎性能,提高用戶體驗(yàn)具有重要意義。該文選取某移動(dòng)搜索引擎2011年6

基于移動(dòng)互聯(lián)網(wǎng)日志的搜索引擎用戶行為研究

摘要:隨著移動(dòng)互聯(lián)網(wǎng)的迅速發(fā)展,移動(dòng)搜索用戶大規(guī)模增加,移動(dòng)搜索引擎用戶行為分析對(duì)改進(jìn)搜索引擎性能,提高用戶體驗(yàn)具有重要意義。該文選取某移動(dòng)搜索引擎2011年6月第一周的日志,對(duì)移動(dòng)互聯(lián)網(wǎng)用戶搜索行為進(jìn)行分析和研究。我們從查詢?cè)~分析、會(huì)話分析以及用戶點(diǎn)擊分析3個(gè)角度出發(fā),對(duì)查詢?cè)~長(zhǎng)度和頻度、問(wèn)題式查詢和網(wǎng)址查詢比例、會(huì)話內(nèi)查詢個(gè)數(shù)、查詢?cè)~修改方式以及用戶點(diǎn)擊位置進(jìn)行研究,并與互聯(lián)網(wǎng)搜索引擎相應(yīng)指標(biāo)進(jìn)行對(duì)比。相關(guān)分析結(jié)論對(duì)于移動(dòng)搜索引擎算法改進(jìn)與系統(tǒng)優(yōu)化具有一定參考意義。 關(guān)鍵詞:移動(dòng)搜索引擎;搜索引擎日志;用戶行為分析

1引言

隨著通信技術(shù)的進(jìn)步、終端設(shè)備硬件水平的提升以及三網(wǎng)融合政策的逐步推進(jìn),移動(dòng)互聯(lián)網(wǎng)得到迅速發(fā)展,網(wǎng)絡(luò)應(yīng)用內(nèi)容進(jìn)一步增加,用戶應(yīng)用體驗(yàn)不斷提高,我國(guó)由此進(jìn)入移動(dòng)互聯(lián)網(wǎng)的大時(shí)代。據(jù)C N N IC第29次中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告n]顯示,截至2011年12月底,中國(guó)手機(jī)網(wǎng)民規(guī)模達(dá)到3.56億,占整體網(wǎng)民比例的69.3,用戶規(guī)模增速已超過(guò)寬帶用戶。

鑒于如此大規(guī)模的用戶,互聯(lián)網(wǎng)應(yīng)用提供商紛紛布局移動(dòng)互聯(lián)網(wǎng),主流應(yīng)用提供商均推出了相應(yīng)的W A P版本或客戶端,為客戶提供移動(dòng)互聯(lián)網(wǎng)服務(wù),以移動(dòng)搜索為代表的信息獲取已發(fā)展為移動(dòng)互聯(lián)網(wǎng)的主流應(yīng)用。當(dāng)前,移動(dòng)搜索引擎用戶數(shù)量眾多,應(yīng)用門檻較低,適用范圍較廣。在未來(lái)競(jìng)爭(zhēng)中,搜索結(jié)果的精確程度與個(gè)性化服務(wù)將會(huì)成為保持用戶黏性的重要因素。為提高搜索準(zhǔn)確性,移動(dòng)搜索服務(wù)提供商需要挖掘用戶特點(diǎn)和行為習(xí)慣,預(yù)測(cè)用戶潛在需求,以應(yīng)對(duì)市場(chǎng)競(jìng)爭(zhēng)。

移動(dòng)互聯(lián)網(wǎng)搜索服務(wù)提供商每天記錄大量的用戶搜索數(shù)據(jù),比如訪問(wèn)者唯一標(biāo)志符、檢索詞、點(diǎn)擊頁(yè)面、訪問(wèn)時(shí)間等,這些數(shù)據(jù)構(gòu)成了搜索引擎日志。搜索引擎日志包含很多對(duì)服務(wù)商非常有用的信息,可以反映出用戶的興趣及其行為特點(diǎn),是研究搜索引擎用戶行為的重要載體。本文將通過(guò)對(duì)一周內(nèi)中文移動(dòng)搜索引擎日志的分析,研究真實(shí)環(huán)境下移動(dòng)搜索引擎用戶的行為特點(diǎn)。

本文安排如下:第2節(jié)總結(jié)目前搜索引擎用戶行為的研究現(xiàn)狀;第3節(jié)介紹本文使用的移動(dòng)互聯(lián)網(wǎng)搜索引擎日志數(shù)據(jù);第4節(jié)根據(jù)上述日志數(shù)據(jù)進(jìn)行實(shí)證分析,分別研究移動(dòng)互聯(lián)網(wǎng)環(huán)境下用戶查詢行為與用戶點(diǎn)擊行為;最后進(jìn)行總結(jié)和展望。

2相關(guān)工作概述

,

目前,對(duì)互聯(lián)網(wǎng)的大規(guī)模搜索引擎日志的用戶行為分析已有一些研究成果,主要集中在搜索引擎用戶獨(dú)立查詢、查詢會(huì)話分析以及用戶點(diǎn)擊行為等方面,但基于移動(dòng)互聯(lián)網(wǎng)的用戶行為分析相對(duì)極少。Si lverstein等(1998)對(duì)A ltaV ista用戶檢索行為進(jìn)行分析,提出在一個(gè)查詢會(huì)話中,用戶只進(jìn)行一次點(diǎn)擊的大約占63.8,約有35.2的用戶對(duì)于搜索詞進(jìn)行了完全的改變,12的用戶增加或減少了搜索詞的數(shù)目[1 23。Soyeon P ark等(2005)選取韓國(guó)著名搜索引擎N A V E R一周內(nèi)的日志數(shù)據(jù),經(jīng)過(guò)會(huì)話識(shí)別、查詢分類、數(shù)據(jù)預(yù)處理等操作后,對(duì)用戶檢索行為進(jìn)行分析,結(jié)果顯示同一會(huì)話中用戶輸入的查詢傾向于徹底更換查詢內(nèi)容,而不是增刪檢索詞項(xiàng)或修改檢索詞項(xiàng)。L i w ei等(2011)統(tǒng)計(jì)了同一會(huì)話中檢索詞的個(gè)數(shù),發(fā)現(xiàn)同一會(huì)話中只有一個(gè)檢索詞的會(huì)話占所有會(huì)話數(shù)的70.866 9,6。王繼民等(2004)選取北大天網(wǎng)的用戶日志,對(duì)用戶訪問(wèn)時(shí)間、用戶查詢類型、用戶查詢長(zhǎng)度、用戶點(diǎn)擊次數(shù)進(jìn)行了統(tǒng)計(jì)分析,結(jié)論表明用戶訪問(wèn)時(shí)間分布并不均等,多數(shù)用戶只輸入一個(gè)詞項(xiàng)查詢。余慧佳等(2007)選取搜狗搜索引擎一個(gè)月內(nèi)的查詢?nèi)罩?,就用戶查詢長(zhǎng)度、查詢頻度、查詢會(huì)話內(nèi)的查詢數(shù)目、查詢會(huì)話內(nèi)的查詢內(nèi)容以及用戶點(diǎn)擊行為進(jìn)行了分析,將相應(yīng)特征同英文搜索引擎用戶行為進(jìn)行對(duì)比,發(fā)現(xiàn)中文搜索引擎用戶使用高級(jí)檢索的比例遠(yuǎn)遠(yuǎn)低于英文搜索引擎,查詢重復(fù)率遠(yuǎn)高于英文搜索引擎。岑榮偉等(2OLO)在文獻(xiàn)工作的基礎(chǔ)上,對(duì)用戶搜索需求進(jìn)行區(qū)分,從查詢集合中提取了導(dǎo)航集和色情集這兩類特殊的查詢集合,針對(duì)不同檢索目的對(duì)上述統(tǒng)計(jì)特征進(jìn)行分析。針對(duì)以上工作中用戶查詢會(huì)話分析的不足,王曉春等(2011)定義了8種查詢修改,在查詢會(huì)話基礎(chǔ)上分析了查詢修改動(dòng)作、用戶點(diǎn)擊結(jié)果數(shù)同查詢修改次數(shù)之間的關(guān)系,發(fā)現(xiàn)查詢修改動(dòng)作和查詢修改次數(shù)有關(guān),而點(diǎn)擊結(jié)果數(shù)量保持穩(wěn)定。張磊等(2009)對(duì)于現(xiàn)有的網(wǎng)頁(yè)搜索引擎查詢?nèi)罩局胁樵儠?huì)話的劃分方法進(jìn)行了分析和總結(jié),提出了可以使用時(shí)間作為劃分會(huì)話的一種標(biāo)準(zhǔn)。馬少平等(2011)基于搜狗搜索引擎2006年至·2011年的搜索日志,對(duì)用戶查詢行為與用戶點(diǎn)擊行為進(jìn)行分析,分析總結(jié)了中文搜索引擎用戶行為的演化規(guī)律。

而移動(dòng)搜索引擎同桌面搜索引擎存在一定的差異,如用戶可以不受固定終端限制,隨時(shí)隨地搜索信息,具有很強(qiáng)的時(shí)效性;移動(dòng)搜索可以同定位服務(wù)相結(jié)合,為用戶提供更具針對(duì)性以及精確的服務(wù);移動(dòng)搜索屏幕有限,每頁(yè)顯示結(jié)果數(shù)量有限。這些差異在搜索引擎的使用上造成了一些不同,因此有必要對(duì)移動(dòng)搜索引擎的用戶行為進(jìn)行分析,幫助移動(dòng)搜索算法的改進(jìn),更好地為用戶服務(wù)。

3實(shí)驗(yàn)數(shù)據(jù)

本文實(shí)驗(yàn)數(shù)據(jù)取自于某無(wú)線搜索服務(wù)提供商2011年6月1日至2011年6月7日共一周的日志記錄。其中日志中每條查詢記錄的格式如表1所示。

,

為正確把握基于移動(dòng)搜索引擎的用戶行為特征,本文首先進(jìn)行了數(shù)據(jù)處理,其中有以下幾個(gè)問(wèn)題需要說(shuō)明。

(1)cookie問(wèn)題。由于該無(wú)線搜索服務(wù)提供商采用cookie 技術(shù)標(biāo)識(shí)用戶,本文假定用戶不主動(dòng)刪除cooki e,則同一用戶僅擁有一個(gè)cooki e,不同用戶擁有不同cookie ,cookie 作為用戶唯一標(biāo)志;

(2)數(shù)據(jù)格式問(wèn)題??紤]到用戶的異常操作,日志文件中存在極少量異常數(shù)據(jù),如用戶cookie 格式錯(cuò)誤等,在數(shù)據(jù)處理時(shí),本文將cookie 格式有誤,檢索詞長(zhǎng)度大于100以及U R L長(zhǎng)度大于600的記錄予以刪除。

4基于日志的用戶行為研究

經(jīng)過(guò)數(shù)據(jù)處理之后,我們共得到4 997 416條查詢記錄,其中含用戶1 751 612個(gè),非重復(fù)查詢971 197個(gè),非重復(fù)網(wǎng)頁(yè)1 613 762個(gè),查詢會(huì)話2 317 215個(gè)。

4.1查詢?cè)~分析

4.1.1查詢?cè)~長(zhǎng)度

查詢?cè)~長(zhǎng)度在本文中定義為用戶查詢?cè)~中被空格所隔開(kāi)的詞語(yǔ)或字的個(gè)數(shù)。本文從兩個(gè)層面分析查詢?cè)~長(zhǎng)度:一為分詞之前,即用戶自主輸入的用空格分開(kāi)的查詢?cè)~長(zhǎng)度;二為分詞之后詞語(yǔ)個(gè)數(shù)。本文在進(jìn)行用戶查詢?cè)~分詞操作時(shí),充分考慮了用戶查詢需求以及這一時(shí)間段內(nèi)的熱點(diǎn)話題,將常用名詞如人名、流行詞、導(dǎo)航網(wǎng)址以及游戲名稱等導(dǎo)入分詞詞典,提高分詞準(zhǔn)確率。分析結(jié)果表明,分詞之前查詢?cè)~平均長(zhǎng)度為1.10個(gè)詞,分詞之后查詢?cè)~長(zhǎng)度為3.45個(gè)詞,這與文獻(xiàn)中關(guān)于互聯(lián)網(wǎng)搜索引擎平均查詢長(zhǎng)度的分析相一致。圖1顯示了查詢?cè)~長(zhǎng)度和相應(yīng)查詢數(shù)量之間的變化情況。

,

通過(guò)對(duì)圖1進(jìn)行分析,分詞之前,用戶查詢?cè)~長(zhǎng)度多為1個(gè)詞,占總數(shù)的91.91 9,6;而分詞之后查詢?cè)~長(zhǎng)度為2和3的檢索數(shù)目相對(duì)較多,查詢?cè)~長(zhǎng)度為1和4的檢索數(shù)目相對(duì)較少,但其差距不是很大。查詢?cè)~長(zhǎng)度在5以及5以上的檢索數(shù)目在分詞之前數(shù)量極少,但在分詞之后占了總數(shù)的23。通過(guò)上述對(duì)比可以看到,用戶往往習(xí)慣直接輸入一個(gè)短語(yǔ)或短句進(jìn)行搜索,沒(méi)有自主分詞行為,這一點(diǎn)與互聯(lián)網(wǎng)搜索是一致的。但是,就查詢?cè)~長(zhǎng)度分布而言,查詢?cè)~長(zhǎng)度在分詞之前集中在1個(gè)詞,分詞之后查詢?cè)~長(zhǎng)度分布比較均勻,這與互聯(lián)網(wǎng)搜索中查詢?cè)~長(zhǎng)度同用戶數(shù)目呈指數(shù)分布這一點(diǎn)是截然不同的。

4.1.2查詢?cè)~頻度

查詢?cè)~頻度指的是在這一段時(shí)間內(nèi),該查詢?cè)~一共被提交的次數(shù)。本文對(duì)查詢次數(shù)排名前200的查詢?cè)~,將其檢索次數(shù)與排名繪成圖2。

通過(guò)圖2可以看到,查詢頻度排名與檢索次數(shù)之間呈冪律分布分布關(guān)系,隨著查詢頻度排名的增加,檢索次數(shù)迅速下降,少數(shù)查詢出現(xiàn)的次數(shù)很多。這說(shuō)明在搜索引擎每天處理的大量查詢中,存在大量重復(fù)查詢。這與文獻(xiàn)中互聯(lián)網(wǎng)搜索引擎的查詢頻度分析是一致的。對(duì)相應(yīng)用戶查詢?cè)~內(nèi)容進(jìn)行分析,發(fā)現(xiàn)用戶需求集中在導(dǎo)航網(wǎng)址、生活信息、手機(jī)閱讀以及應(yīng)

,

用程序下載這幾個(gè)領(lǐng)域,且與每一時(shí)段熱點(diǎn)密切相關(guān)。這說(shuō)明移動(dòng)搜索引擎服務(wù)與桌面搜索引擎相比更具有便利性,更貼近生活。

4.1.3問(wèn)題式查詢

用戶使用搜索引擎時(shí)存在多種檢索方式,問(wèn)題式查詢則是用戶提出問(wèn)題時(shí)最直接、最簡(jiǎn)單的方式,我們統(tǒng)計(jì)了這部分查詢的比例。按照現(xiàn)代漢語(yǔ)語(yǔ)言習(xí)慣以及英語(yǔ)語(yǔ)言習(xí)慣,我們收集了44個(gè)疑問(wèn)詞,比如“哪”、“什么”、“怎么”、“如何”等,如果用戶提交的查詢中使用到了某個(gè)疑問(wèn)詞,就認(rèn)為此查詢?yōu)閱?wèn)題式查詢。統(tǒng)計(jì)之后,我們共得到255 375條問(wèn)題式查詢,占總查詢數(shù)的5.11 0A,遠(yuǎn)遠(yuǎn)大于文獻(xiàn)[7]中互聯(lián)網(wǎng)搜索引擎問(wèn)題式查詢比例2.96,這說(shuō)明了移動(dòng)搜索引擎用戶檢索習(xí)慣落后,檢索行為相對(duì)不成熟。

4.1.4直接輸入U(xiǎn) R L作為查詢?cè)~的比例

在使用移動(dòng)搜索引擎時(shí),存在一部分用戶直接輸入網(wǎng)址或網(wǎng)址的一部分進(jìn)行檢索的情況。我們綜合考慮了各種手機(jī)網(wǎng)站域名情況,如手機(jī)域名“.m obi”,商業(yè)域名“.bi z”、“.cc”等,同時(shí)考慮用戶只輸人U R L一部分的情況,統(tǒng)計(jì)發(fā)現(xiàn)有50 590條記錄是以U R L作為檢索詞的,占總檢索數(shù)目的1.O1,遠(yuǎn)遠(yuǎn)低于文獻(xiàn)[6]中相應(yīng)比例。分析其原因,我們認(rèn)為由于移動(dòng)設(shè)備輸入法限制,英文輸入較困難,而由于U R L往往字符較多,增加了用戶輸入的難度,所以用戶更傾向于輸入網(wǎng)站名稱進(jìn)行檢索,輸入U(xiǎn) R L的情況相對(duì)較少。

4.2查詢時(shí)間分析

在分析用戶檢索與時(shí)間的分布關(guān)系時(shí),考慮到工作日與節(jié)假日對(duì)用戶搜索引擎使用次數(shù)存在影響,我們分別統(tǒng)計(jì)了每天每小時(shí)內(nèi)用戶檢索次數(shù),結(jié)果如圖3所示。

,

圖3顯示,不論工作日或節(jié)假日,每天21時(shí)、22時(shí)或23時(shí)是全天的最高峰,4時(shí)是全天的低谷。一天內(nèi),用戶檢索次數(shù)自4時(shí)開(kāi)始增長(zhǎng),在上午10時(shí)達(dá)到第一個(gè)高峰,之后略有下降,后又緩慢增長(zhǎng),在12時(shí)或l3時(shí)達(dá)到第二個(gè)高峰,21時(shí)、22時(shí)或23時(shí)達(dá)到全天最高峰。這同人們的生活?yuàn)蕵?lè)習(xí)慣是一致的,工作日內(nèi)10時(shí)是進(jìn)行工作、學(xué)習(xí)的時(shí)段,節(jié)假日內(nèi)10時(shí)則是人們計(jì)劃娛樂(lè)的時(shí)段,這段時(shí)間人們需要檢索相關(guān)信息;12時(shí)或13時(shí)是午休時(shí)段,晚21時(shí)以后為睡前休閑娛樂(lè)時(shí)段,在娛樂(lè)時(shí)間往往會(huì)需要檢索相關(guān)信息。與文獻(xiàn)中互聯(lián)網(wǎng)搜索引擎用戶檢索時(shí)間進(jìn)行對(duì)比,發(fā)現(xiàn)移動(dòng)搜索引擎用戶訪問(wèn)時(shí)間集中在休閑娛樂(lè)時(shí)段。

4.3查詢會(huì)話分析

查詢會(huì)話(以下簡(jiǎn)稱會(huì)話) 可以理解為用戶在較短時(shí)間段內(nèi),針對(duì)某一特定話題而進(jìn)行的有目的的查詢。會(huì)話能夠更集中地反映出用戶在有特定目標(biāo)情況下的搜索、點(diǎn)擊行為,為研究用戶行為模式提供了更為準(zhǔn)確集中的數(shù)據(jù)基礎(chǔ)。我們參考文獻(xiàn)關(guān)于會(huì)話劃分方法的總結(jié),結(jié)合對(duì)于數(shù)據(jù)的觀察,將每一個(gè)用戶30分鐘內(nèi)的查詢定義為一個(gè)會(huì)話,認(rèn)為在每一個(gè)會(huì)話中,用戶圍繞特定目標(biāo)進(jìn)行連續(xù)的操作。經(jīng)過(guò)處理,除去日志中點(diǎn)擊時(shí)間格式有錯(cuò)誤的8 593條數(shù)據(jù),共區(qū)分出會(huì)話2 317 215個(gè)。

4.3.1查詢數(shù)目分析

本文統(tǒng)計(jì)了一個(gè)會(huì)話中用戶的查詢次數(shù),發(fā)現(xiàn)在每個(gè)會(huì)話中用戶平均進(jìn)行2.15次查詢。

圖4顯示,有58%的用戶在一個(gè)會(huì)話中只進(jìn)行過(guò)一次查詢,這與文獻(xiàn)中63.7的數(shù)字接近。這可能是用戶通過(guò)一次查詢就已經(jīng)找到了令自己滿意的結(jié)果,所以不再進(jìn)行后續(xù)的查詢。也有可能是由于用戶發(fā)現(xiàn)使用手機(jī)的搜索并不能滿足自己的需求而使用其他工具(如電腦) 進(jìn)行搜索。其中查詢數(shù)目小于3個(gè)的占到86 9/6。由此可以看出,大部分用戶在3次

,

查詢以內(nèi)找到了自己需要的結(jié)果,搜索引擎提供的結(jié)果是比較令用戶滿意的。同時(shí)我們發(fā)現(xiàn),有1的用戶進(jìn)行了10次以上的查詢,說(shuō)明用戶對(duì)于找到自己需要的結(jié)果是比較有耐心的。

4.3.2查詢?cè)~修改方式分析

如果用戶對(duì)于現(xiàn)有的查詢?cè)~查詢結(jié)果不滿意,就有可能修改查詢?cè)~,從而找到最適合的結(jié)果。本文中我們對(duì)于一個(gè)查詢會(huì)話中用戶修改查詢?cè)~的方式進(jìn)行了統(tǒng)計(jì),如表2所示。其中,A dding方式指后一個(gè)查詢?cè)~在前一個(gè)查詢?cè)~的基礎(chǔ)上增加了新的詞語(yǔ);D eleti ng方式指后一個(gè)查詢?cè)~在前一個(gè)查詢?cè)~的基礎(chǔ)上減少了搜索詞;O rder Change方式是指后一個(gè)查詢?cè)~只是改變了前一個(gè)查詢?cè)~的詞語(yǔ)排列順序;Partly C hange方式指后一個(gè)查詢?cè)~語(yǔ)對(duì)前一個(gè)查詢?cè)~中的一部分進(jìn)行了改動(dòng),其余部分不變;T otally C hange方式指后一個(gè)查詢?cè)~較前一個(gè)查詢?cè)~完全不同。

我們可以看到,增加和減少搜索詞的用戶大約占25,這與文獻(xiàn)中的12有較大的差距,有0.3的用戶只是把原來(lái)的查詢?cè)~順序進(jìn)行了調(diào)整,35.7%的用戶選擇更換掉原有搜索詞的一部分再進(jìn)行搜索,即共有61左右的用戶會(huì)在原有的查詢?cè)~基礎(chǔ)上進(jìn)行一定的修改再搜索,而不是完全更換為新的查詢?cè)~。我們認(rèn)為這可能是移動(dòng)互聯(lián)網(wǎng)用戶修改搜索內(nèi)容較固定終端用戶更為困難的緣故(手機(jī)輸入檢索詞成本更高) 。而完全修改查詢?cè)~的用戶約有38.7

%,與文獻(xiàn)中的英文搜索引擎結(jié)果相近,但與文獻(xiàn)中文搜索引擎結(jié)果差距較大。

4.4用戶點(diǎn)擊行為分析

4.4.1點(diǎn)擊位置分布

當(dāng)搜索引擎返回用戶提交查詢的結(jié)果集之后,用戶會(huì)點(diǎn)擊其中可能相關(guān)的結(jié)果。本文就每天用戶點(diǎn)擊位置與點(diǎn)擊次數(shù)之間的關(guān)系進(jìn)行了分析,如圖5所示。

通過(guò)對(duì)用戶點(diǎn)擊位置的分析,我們發(fā)現(xiàn)用戶點(diǎn)擊行為與時(shí)間無(wú)關(guān),每天點(diǎn)擊位置與點(diǎn)擊次數(shù)分布基本一致。具體來(lái)說(shuō),用戶僅點(diǎn)擊了1~8、10~12、22、4O 這14個(gè)位置,說(shuō)明

,

用戶僅僅查看了返回結(jié)果的前幾頁(yè)位置。與互聯(lián)網(wǎng)搜索引擎用戶點(diǎn)擊行為進(jìn)行比較,用戶點(diǎn)擊位置與點(diǎn)擊次數(shù)之間的分布存在很大差異。其中,圖中的點(diǎn)擊位置0表示用戶并沒(méi)有在搜索引擎返回的結(jié)果集中進(jìn)行點(diǎn)擊,這里不予以考慮。文獻(xiàn)[7]中指出互聯(lián)網(wǎng)搜索引擎用戶點(diǎn)擊次數(shù)與點(diǎn)擊行為呈現(xiàn)冪律分布規(guī)律,而圖5顯示移動(dòng)搜索引擎環(huán)境下該分布沒(méi)有明顯規(guī)律。究其原因,根據(jù)移動(dòng)設(shè)備屏幕大小,搜索引擎每頁(yè)返回的檢索結(jié)果數(shù)為6個(gè)、7個(gè)或9個(gè),每頁(yè)底部顯示5個(gè)分頁(yè)結(jié)果,用戶點(diǎn)擊集中在第一頁(yè),其中搜索結(jié)果中排名第2的結(jié)果點(diǎn)擊次數(shù)最多,第二頁(yè)前幾個(gè)結(jié)果也存在少量點(diǎn)擊,這之后用戶直接點(diǎn)擊第4頁(yè)或第5頁(yè)的結(jié)果,而受網(wǎng)頁(yè)傳輸速度或操作的限制,用戶一般不會(huì)點(diǎn)擊下一組分頁(yè)結(jié)果。

4.4.2首次點(diǎn)擊位置分布

在有特定目的的搜索中,用戶通過(guò)瀏覽搜索引擎反饋回的結(jié)果列表,點(diǎn)擊瀏覽,這時(shí)用戶的首次點(diǎn)擊位置反映了用戶在結(jié)果中最感興趣的內(nèi)容。如果這時(shí)用戶無(wú)法在第一頁(yè)獲得自己滿意的結(jié)果,則搜索引擎對(duì)于結(jié)果的排列不夠優(yōu)化。

,

圖6表明,92以上的用戶的首次點(diǎn)擊位置在1—5之間,這表明搜索引擎提供的結(jié)果是比較符合用戶的期望的。

5結(jié)論

本文中通過(guò)對(duì)某移動(dòng)搜索引擎提供商2011年6月第一周日志記錄的分析,對(duì)移動(dòng)互聯(lián)網(wǎng)用戶行為和互聯(lián)網(wǎng)用戶行為進(jìn)行了對(duì)比。結(jié)果顯示,移動(dòng)互聯(lián)網(wǎng)用戶的查詢?cè)~平均長(zhǎng)度為l_1O個(gè)詞,分詞之后查詢?cè)~長(zhǎng)度為3.45個(gè)詞;查詢頻度排名與檢索次數(shù)之間呈冪律分布關(guān)系;每個(gè)會(huì)話中用戶平均進(jìn)行2.15次查詢。這些都與互聯(lián)網(wǎng)用戶的行為基本一致。

但就其他特征來(lái)說(shuō),移動(dòng)互聯(lián)網(wǎng)用戶和互聯(lián)網(wǎng)用戶的行為模式存在差異。其中在移動(dòng)互聯(lián)網(wǎng)中,問(wèn)題式查詢占總查詢數(shù)目的5.11,遠(yuǎn)大于互聯(lián)網(wǎng)的2.96;而查詢?cè)~直接使用U R L的比例為1.01%,低于互聯(lián)網(wǎng)中相應(yīng)的比例。在查詢?cè)~修改方式的研究中,我們發(fā)現(xiàn)25的用戶會(huì)通過(guò)增加或減少原有的檢索詞以得到滿意結(jié)果,這一比例遠(yuǎn)高于互聯(lián)網(wǎng)。同時(shí),移動(dòng)互聯(lián)網(wǎng)中用戶點(diǎn)擊位置與點(diǎn)擊次數(shù)之間的分布與互聯(lián)網(wǎng)存在很大差異,用戶點(diǎn)擊位置主要集中在返回結(jié)果集的前幾頁(yè)。結(jié)合以上與互聯(lián)網(wǎng)用戶行為的區(qū)別,我們總結(jié)出移動(dòng)互聯(lián)網(wǎng)用戶的一些特點(diǎn):

(1)移動(dòng)搜索引擎用戶相對(duì)于互聯(lián)網(wǎng)用戶檢索習(xí)慣比較落后,檢索行為相對(duì)不成熟;(2)移動(dòng)搜索引擎用戶更傾向于減少檢索詞的更改,同時(shí)不喜歡搜索較長(zhǎng)的U R L;(3)移動(dòng)搜索引擎用戶通常點(diǎn)擊排名靠前的搜索結(jié)果;(4)移動(dòng)互聯(lián)網(wǎng)用戶的搜索主要集中在娛樂(lè)時(shí)段,這與移動(dòng)互聯(lián)網(wǎng)設(shè)備的娛樂(lè)性有很大的關(guān)系。

用戶行為分析在網(wǎng)絡(luò)搜索領(lǐng)域有極其重要的價(jià)值,同時(shí)隨著移動(dòng)互聯(lián)網(wǎng)的迅速發(fā)展,移動(dòng)搜索用戶大規(guī)模增加,移動(dòng)搜索引擎用戶行為分析對(duì)改進(jìn)搜索引擎性能,提高用戶體驗(yàn)十分重要。在今后的工作中,我們將對(duì)數(shù)據(jù)進(jìn)行更深層次的分析,挖掘出更有效的用戶行為模式,以優(yōu)化移動(dòng)搜索引擎性能。

標(biāo)簽: