習題答案
第一章1. 填空題(1)統(tǒng)一資源定位符(2)主頁(3)tag (4)客戶提出網(wǎng)站建設申請 制訂網(wǎng)站建設方案 簽訂網(wǎng)站相關協(xié)議 網(wǎng)站建設 網(wǎng)站發(fā)布(5)60 (6)《互聯(lián)網(wǎng)站從事登載新聞業(yè)務申請
第一章
1. 填空題
(1)統(tǒng)一資源定位符(2)主頁(3)tag (4)客戶提出網(wǎng)站建設申請 制訂網(wǎng)站建設方案 簽訂網(wǎng)站相關協(xié)議 網(wǎng)站建設 網(wǎng)站發(fā)布(5)60 (6)《互聯(lián)網(wǎng)站從事登載新聞業(yè)務申請表》
2. 簡答題
(1)什么是電子公告商務?
電子公告服務,是指在互聯(lián)網(wǎng)上以電子布告牌、電子白板、電子論壇、網(wǎng)絡聊天室、留言板等交互形式為上網(wǎng)用戶提供信息發(fā)布條件的行為。
(2)什么是互聯(lián)網(wǎng)信息服務?
互聯(lián)網(wǎng)信息服務是指:通過互聯(lián)網(wǎng)向上網(wǎng)用戶提供信息的服務活動?;ヂ?lián)網(wǎng)信息服務分為經(jīng)營性互聯(lián)網(wǎng)信息服務和非經(jīng)營性互聯(lián)網(wǎng)信息服務兩類。
(3)什么是經(jīng)營性互聯(lián)信息服務?
經(jīng)營性互聯(lián)網(wǎng)信息服務:是指通過互聯(lián)網(wǎng)向上網(wǎng)用戶有償提供信息或網(wǎng)頁制作等服務的活動。
(4)什么是非經(jīng)營性互聯(lián)信息服務?
非經(jīng)營性互聯(lián)網(wǎng)信息服務:是指通過互聯(lián)網(wǎng)向上網(wǎng)用戶無償提供具有公開性、共享性信息的服務活動。
第二章
1. 填空題
(1)域名(2)IP 地址系統(tǒng) 域名地址系統(tǒng) (3)67 (4)CN (5)國際域名 國內(nèi)域名 (6)ICANN (7)頂級域名 二級域名 (8)虛擬主機空間或虛擬主機(9)Windows 2000系列 Windows2003系列 UNIX 系列主機 (10)域名解析
2. 選擇題
(1)A (2) B (3) A (4) B (5) C (6) A
3. 簡答題
(1)常見的國際域名有哪幾種?分別是什么?
國際域名(international top-level domain-names ,簡稱ITDs ),也叫國際頂級域名。這也是使用最早也最廣泛的域名,例如表示工商企業(yè)的 .com,表示網(wǎng)絡提供商的.net ,表示非盈利組織的.org 等。
(2)域名選擇的主要原則有哪些?
一個好的域名應該具備下列六個基本要素。
1) 短小
2) 容易記憶
3) 不容易與其它域名混淆
4) 不容易拼寫錯誤
5) 與公司名稱、商標或核心業(yè)務相關
6) 盡量避免文化沖突
(3)請列舉三個網(wǎng)絡域名注冊商,分別通過這些注冊商查詢域名www.baidu.com 的相關信息。
華夏名網(wǎng)、中國萬網(wǎng)、中國新網(wǎng)
,(4)網(wǎng)站空間有那些分類?網(wǎng)站空間的玄策主要原則有哪些?
1)根據(jù)操作系統(tǒng)分類
目前基本分為Windows 2000系列、Windows 2003系列和UNIX 系列主機。
2)根據(jù)網(wǎng)絡分類
單路由空間、雙路由空間、海外空間
需要考慮的因素:網(wǎng)站建成之后,要購買一個虛擬主機才能發(fā)布網(wǎng)站內(nèi)容,在選擇虛擬主機和虛擬主機服務商時,主要應考慮的因素包括:虛擬主機的網(wǎng)絡空間大小、操作系統(tǒng)、對一些特殊功能如數(shù)據(jù)庫的支持,虛擬主機的穩(wěn)定性和速度,虛擬主機服務商的專業(yè)水平等。
(5)簡述ICP 備案的流程。
根據(jù)國家法律法規(guī),ICP 備案主要由網(wǎng)站主辦者通過接入服務商企業(yè)側(cè)系統(tǒng)進行自主備案或由接入服務商代理網(wǎng)站主辦者通過企業(yè)側(cè)系統(tǒng)進行備案,由接入商進行核實網(wǎng)站主辦者信息,由省級通信管理局進行審核,全部審核通過后,將生成備案號并將網(wǎng)站主辦者數(shù)據(jù)信息同步到部級備案系統(tǒng),完成ICP 備案。ICP 備案主要流程如圖所示
第三章
1. 填空題
(1)小 精(2)抽象性 (3)與眾不同 (4)創(chuàng)意(5)大綱索引 (6)主題 (7)目錄結構 (8)Access SQLServer MySQL Oracle
2. 選擇題
(1)A (2) D (3) C (4) C (5) C (6) B (7)A
3. 簡答題
(1)請列出目前比較流行的網(wǎng)站的題材分類,并舉例說明?
目前比較流行的網(wǎng)站的題材主要包括以下十類:
第1類:網(wǎng)上求職。
第2類:網(wǎng)上聊天/即時信息/ ICQ。
第3類:網(wǎng)上社區(qū)/討論 / 郵件列表。
第4類:計算機技術。
第5類:網(wǎng)頁/ 網(wǎng)站開發(fā) 。
第6類:娛樂網(wǎng)站 。
第7類:旅行。
第8類:參考 /資訊。
第9類:家庭/教育。
第10類:生活/時尚。
每個大類都可以繼續(xù)細分,比如娛樂類再分為體育/電影/音樂大類,音樂又可以按格式分為MP3,VQF ,Ra ,按表現(xiàn)形式分古典,現(xiàn)代,搖滾等。以上都只是最常見的題材,除了以上通用題材外,還有很多專業(yè)的、比較另類的題材,比如尋醫(yī)問藥、房產(chǎn)、天氣預報等一些獨特的題材可以選擇。同時,各個題材相聯(lián)系和交叉結合可以產(chǎn)生新得題材,例如房產(chǎn)論壇(房產(chǎn) 討論),經(jīng)典入球播放(足球 影視)按這樣分下去,題材可以有成千上萬個。
(2)確定一個網(wǎng)站的主題,應該注意哪些問題?
選擇一個合適的主題,是一個網(wǎng)站成功的關鍵。一個主題的選擇應該從以下幾方面入手:1)主題定位要小,內(nèi)容要精2) 題材要根據(jù)網(wǎng)站設計者的興趣和愛好確定3)題材定位不要“太高”或者“太廣”4) 名稱要有特色
(3) 如何才能確定一個網(wǎng)站的風格?分哪幾步?
網(wǎng)站風格具有以下幾個特點:1) 網(wǎng)站風格具有抽象性,抽象性是指站點的整體形象給瀏覽者的綜合感受2)網(wǎng)站風格具有獨特性,獨特性是自己站點不同與其他網(wǎng)站的地方3)網(wǎng)站風格具有人性的。風格歸根結底就是一句話:與眾不同!樹立網(wǎng)站風格可以有以下幾個步驟:1)確定風格首先要建立有價值的內(nèi)容。2)你需要徹底搞清楚自己希望站點給人的印象是什么。3) 在明確自己的網(wǎng)站印象后,開始努力建立和加強這種印象。
(4) 一個網(wǎng)站欄目安排,需要注意哪些問題?
一般的網(wǎng)站欄目安排要注意以下幾個問題:1)網(wǎng)站欄目要緊扣主題2)至少設一個可經(jīng)常
,更新的欄目3)設定一個可以雙向交流的欄目4)設一個下載或常見問題回答欄目。至于其他的輔助內(nèi)容,如關于本站,版權信息等可以不放在主欄目里,以免沖淡主題??偨Y以上幾點,劃分欄目需要注意的是: 1)盡可能刪除與主題無關的欄目。2)盡可能將網(wǎng)站最有價值的內(nèi)容列在欄目上。3)盡可能方便訪問者的瀏覽和查詢。
(5)常用的網(wǎng)站開發(fā)語言有哪幾種?分別說明這種語言的優(yōu)點和缺點。
常用的網(wǎng)站開發(fā)語言有ASP 、PHP 、JSP 和ASP.NET 等,這四種語言各有各的特點,下面分別認識一下這四種語言。
1)ASP
優(yōu)點:
(1)簡單易學。服務器腳本用的是vbscript ,vbscript 具有簡單易學的特點。
(2)安裝使用方便。裝好一個Windows 2003,只要你安裝了IIS 那么ASP 就可以使用了,從沒有什么需要你花心思去配置的。
(3)開發(fā)工具可任意選擇。
弱點:
(1)Windows 本身的所有問題都會一成不變的也累加到了它的身上。
(2) ASP 由于使用了COM 組件所以它會變的十分強大,但是這樣的強大由于Windows NT 系統(tǒng)最初的設計問題而會引發(fā)大量的安全問題。
(3)由于ASP 還是一種Script 語言,所以除了大量使用組件外,沒有辦法提高其工作效率。
(4)無法實現(xiàn)跨操作系統(tǒng)的應用。
(5)還無法完全實現(xiàn)一些企業(yè)級的功能:完全的集群、負載均衡。
2)PHP
優(yōu)點:
(1)一種能快速學習、跨平臺、有良好數(shù)據(jù)庫交互能力的開發(fā)語言。
(2)與Apache 及其它擴展庫結合緊密。php 與Apache 可以以靜態(tài)編繹的方式結合起
(3)良好的安全性。由于php 本身的代碼開放所以它的代碼在許多工程師手中進行了
弱點:
(1)支持的數(shù)據(jù)庫變化較大。(2)安裝復雜。(3)缺少企業(yè)級的支持。(4)缺少正規(guī)的商業(yè)支持。(5)無法實現(xiàn)商品化應用的開發(fā)。
3)JSP
優(yōu)點:
(1)一次編寫,到處運行。(2)系統(tǒng)的多平臺支持。(3)強大的可伸縮性。4)多樣化和功能強大的開發(fā)工具支持。
弱點:(1)與ASP 一樣,Java 的一些優(yōu)勢正是它致命的問題所在。(2) Java 的運行速度是用class 常駐內(nèi)存來完成的,所以它在一些情況下所使用的內(nèi)存比起用戶數(shù)量來說確實是“最低性能價格比”了。
,(6)常用的網(wǎng)站后臺數(shù)據(jù)庫有哪幾種?分別說明這種數(shù)據(jù)庫的特點。
常用的數(shù)據(jù)庫一般是以下四種: Access 、SQL Server、MySQL ,Oracle 。
Access 作為Microsoft Office組件之一是在Windows 環(huán)境下很流行的桌面型數(shù)據(jù)庫管理系統(tǒng)。使用Microsoft Access無須編寫任何代碼, 只需通過直觀的可視化操作就可以完成大部分數(shù)據(jù)管理任務。不僅易于使用, 而且界面友好, 因此被用戶廣泛采用。
SQL Server是基于服務器端的中型的數(shù)據(jù)庫,可以適合大容量數(shù)據(jù)的應用,在功能上管理上也要比Access 要強得多。在處理海量數(shù)據(jù)的效率,后臺開發(fā)的靈活性,可擴展性等方面強大。
MySQL 是一個開放源碼的小型關系型數(shù)據(jù)庫管理系統(tǒng),開發(fā)者為瑞典MySQL AB公司,92HeZu 網(wǎng)免費贈送MySQL 。目前MySQL 被廣泛地應用在Internet 上的中小型網(wǎng)站中。
Oracle 是一個對象一關系數(shù)據(jù)庫管理系統(tǒng)。它提供開放的、全面的、和集成的信息管理方法。Oracle 作為一個通用的數(shù)據(jù)庫管理系統(tǒng), 不僅具有完整的數(shù)據(jù)管理功能, 且是一個分布式的數(shù)據(jù)庫系統(tǒng), 支持和種分布式功能, 特別是支持Internet 應用, 作為一個應用開發(fā)環(huán)境,Oracle 提供了一套界面友好、功能齊全的數(shù)據(jù)庫工發(fā)工具。
(7)請說出CMS 網(wǎng)站系統(tǒng)的功能,并舉例說明當前流行的CMS 的特點以及他們的不同點。 CMS 系統(tǒng)具有以下特點。
(1)簡單易學
(2)安全性較高
(3)穩(wěn)定性強
(4)網(wǎng)站運行快
(5)采集功能
(6)搜索引擎友好
(7)風格模板
(8)節(jié)約建設成本
(9)網(wǎng)站修改很靈活
常用的CMS 系統(tǒng)介紹:
(1)動易網(wǎng)絡( http://www.powereasy.net/ )動易在ASPCMS 系統(tǒng)中應用最廣。
(2)喬客 (http://www.joekoe.com/ )
這位ASPCMS 界中元老級別的系統(tǒng)在不斷的探索著CMS 新的出路,其系統(tǒng)最大的特點是整合了各類的程序模塊,有自帶論壇,博客圈,影視頻道,音樂頻道,下載頻道,新聞頻道等等,非常適合需要多種模塊而不想整合的人使用。
(3)風訊 (http://www.foosun.cn/ )
風訊也有ASP 和.NET 版本的系統(tǒng),其中ASP 版本已經(jīng)到了5.0,.NET 版本目前是1.0。開源是它最大特點,希望保持。風訊的缺點就是后臺人性化差了一點,上手有點難度,而且
,連一套默認的模板都沒有,因為自由度太高了,讓一些新手更難上手,不過綜合來說風訊也是一款非常值得關注的CMS 系統(tǒng)。
(4)科汛 (http://www.kesion.com/ )
科汛是一套新出的網(wǎng)站系統(tǒng),其功能非常強大,目前主流網(wǎng)站的功能在其系統(tǒng)內(nèi)均能實現(xiàn),具有強大的標簽(JS)管理功能,個性化的標簽(JS)參數(shù)配置功能,做一個個性的大站不再是夢想。但其網(wǎng)站的整體概念脫離不了動易風訊的影響,
(5)DEDE (http://www.dedecms.com/)
織夢內(nèi)容管理系統(tǒng)(DedeCms) 以簡單、實用、開源而聞名,是國內(nèi)最知名的PHP 開源網(wǎng)站管理系統(tǒng),也是使用戶最多的PHP 類CMS 系統(tǒng),在經(jīng)歷了二年多的發(fā)展,目前的版本
第四章
1. 填空題
(1)文件傳輸(2)基準測試 配置測試 負載測試 壓力測試(3)Netscape (4)Windows UNIX Linux (5)1024*768 800*600
2. 選擇題
(1)D (2)B (3) B (4)A
3. 簡答題
(1)請說明Web 上傳與FTP 上傳有什么區(qū)別。
WEB 上傳:即通過瀏覽器來上傳文件。1、通過瀏覽器上傳文件,按照“操作向?qū)А币徊讲讲僮魍瓿?,用戶無須培訓;2、通過分配用戶權限發(fā)布課件,簡單,安全;3、支持斷點續(xù)傳,支持大文件上傳;4、上傳文件屬性(格式,上傳時間,人員等)自動生成,方便快捷;5、上傳后的文件,配有審核機制,保證課件質(zhì)量;6、審核后的文件,自動歸類,用戶通過校園網(wǎng)瀏覽;7、WEB 上傳需要有一定的網(wǎng)頁內(nèi)容支持。
FTP 上傳:簡稱文件傳輸協(xié)議,通過FTP 上傳。1、上傳之前,需要安裝專業(yè)上傳軟件,并對軟件加以學習,用戶需要學習上傳軟件;2、需要建立FTP 服務器及配置設置,專業(yè)性強;
3、支持斷點續(xù)傳,無需重新上傳,支持大文件上傳;4、FTP 上傳后,需要從后臺手工輸入文件屬性,費時費力;5、FTP 上傳后的文件,沒有審核機制;6、FTP 上傳的文件后需要手工進行歸類,比較煩麻;7、但FTP 上傳具有WEB 上傳絕無僅有的優(yōu)勢,就是可以批量上傳、批量整理,不受太多限制。
(2)列舉出IDC 虛擬主機發(fā)布、獨享主機發(fā)布及托管主機發(fā)布的特點。
IDC 虛擬主機:虛擬主機服務提供商會在用戶購買之前提供幾天的試用期,使用電信骨干線路速度快,網(wǎng)絡環(huán)境穩(wěn)定、安全,提供的硬盤空間的類型分為獨立WEB 空間、數(shù)據(jù)庫空間、獨立郵局空間,空間的大小主要根據(jù)發(fā)布信息的多少選擇,采用windows 2003和unix 操作系統(tǒng)。
IDC 獨享主機:滿足大存儲空間、大流量等需求,客戶擁有整臺服務器的軟硬件資源,可以自行配置或通過網(wǎng)絡應用服務商主機管理工具實現(xiàn)web 、mail 、ftp 等多種網(wǎng)絡服務,提供完善的主機監(jiān)控、漏洞掃描等諸多增值服務。
IDC 托管主機:客戶自身擁有一臺服務器,并把它放置在IDC 的機房,由客戶自己進行維護,或者是由其他的簽約人進行遠程維護。主機托管的特點是投資有限,周期短,無線路擁塞之憂。
(3)為什么要對網(wǎng)站進行發(fā)布測試?發(fā)布測試主要有哪幾個方面的測試內(nèi)容?
網(wǎng)站在正式發(fā)布之前,為了確保網(wǎng)站的正確無誤,需要對網(wǎng)站進行發(fā)布前的測試,保障網(wǎng)站發(fā)布后的正常運行。主要針對以下幾個方面進行測試:功能測試、性能測試、安全性測試、兼容性測試和可用性測試。
,(4)網(wǎng)站性能測試主要有哪幾種方法?
一般性能測試中最常見的有基準測試、配置測試、負載測試和壓力測試。
第五章
1. 選擇題
(1)A (2)B (3) A (4)A
2. 填空題
(1)FAT16 FAT32 NTFS (2)每服務器模式 每設備或每用戶模式 (3)可靠性 安全性 性能的改進(4)A B C
3. 簡答題
(1)企業(yè)選擇Web 服務器方面應該考慮下面幾個問題:1)性能與價錢的平衡2)看重“支持并發(fā)用戶能力”和“事件及時響應能力”3)網(wǎng)絡線路選擇
(2)安裝前需要準備好Windows Server 2003正版安裝光盤,針對不同的廠商,建議提前準備好廠商提供的引導盤和驅(qū)動盤。如有需要,建議提前撥打服務器廠商的電話,詳細詢問安裝過程,并記錄安裝過程的注意事項。另外,在安裝之前,建議將網(wǎng)線拔掉,避免在安裝過程中感染病毒。過程中不同的廠商會要求使用專門的引導光盤進行引導安裝,如果服務器使用了RAID 技術,還需要單獨安裝RAID 的驅(qū)動。
(3)機房里有大量網(wǎng)絡設備,所有的硬件設施價格昂貴,存儲的數(shù)據(jù)非常重要,因此,對于硬件的維護和正常運行對機房的環(huán)境提出了較高的要求。為保障硬件設備正常運行,機房環(huán)境需要考慮的因素有:第一,溫度、相對濕度和空氣含塵濃度;第二,噪音、電磁干擾、振動和靜電;第三,防火、防水和疏散通道;第四,根據(jù)機房級別,制定機房規(guī)格、負荷計算、氣流組織、設備布局。機房對于網(wǎng)絡運行是一個非常關鍵的場所,安全因素非常重要,因此必須保證兩方面的安全,包括:機房物理安全、機房電氣安全。
(4)為了更好地進行網(wǎng)站服務器的數(shù)據(jù)管理要做好數(shù)據(jù)的收集、存儲和備份。網(wǎng)站中大量的數(shù)據(jù),需要及時的存儲,存儲方式有三種:直接外掛存儲(DAS )、網(wǎng)絡附加存儲(NAS )、存儲域網(wǎng)絡(SAN )。為了使網(wǎng)站在出現(xiàn)故障時,還能正常的運行,必須做好數(shù)據(jù)的備份。通常備份的方式有三種。全備份(Full Backup)、增量備份 (Incremental Backup)和差分備份 (Differential Backup) 。
第六章
1. 填空題
(1)Acess MYSQL SQL Server (2)網(wǎng)站主體信息的更新 網(wǎng)站模板信息的更新 網(wǎng)站配置信息的更新
2. 選擇題
(1)D (2)A
3. 簡答題
(1)網(wǎng)站管理的目標是讓網(wǎng)站能夠正常高效的運行,及時更新網(wǎng)站的內(nèi)容和改進網(wǎng)站的性能,并針對網(wǎng)站的評價結果對網(wǎng)站進行升級,具體有以下幾個方面:
1)網(wǎng)站的安全正常運行
,2)通過網(wǎng)站管理定期更新網(wǎng)站內(nèi)容
3)減少網(wǎng)站停止運行的時間,改進響應時間,提高設備利用率
4)采用新技術、新方法提高網(wǎng)站的運行速度和性能
(2) 網(wǎng)站管理的內(nèi)容主要包括以下幾個方面:
(1) 網(wǎng)站服務器性能的管理和維護(2) 網(wǎng)站的統(tǒng)計與分析(3) 網(wǎng)站內(nèi)容的管理和維護
(4) 網(wǎng)站模板的更新(5) 網(wǎng)站域名解析的管理和維護(6) 網(wǎng)站程序備份(7) 數(shù)據(jù)庫清理與備份(8) 網(wǎng)站用戶管理
(3)通過網(wǎng)站日志可以清楚的得知用戶在什么IP 、什么時間、用什么操作系統(tǒng)、什么瀏覽器、什么分辨率顯示器的情況下訪問了你網(wǎng)站的哪個頁面,是否訪問成功。
網(wǎng)站日志一般存放在虛擬主機的logfiles 文件夾下,可以通過FTP 工具將網(wǎng)站日志下載下來,通過txt 文檔方式查看。
對于專業(yè)從事搜索引擎優(yōu)化工作者而言,網(wǎng)站日志可以記錄各搜索引擎蜘蛛機器人爬行網(wǎng)站的詳細情況,例如:哪個IP 的百度蜘蛛機器人在哪天訪問了網(wǎng)站多少次,訪問了哪些頁面,以及訪問頁面時返回的HTTP 狀態(tài)碼。
網(wǎng)站日志還可以給管理員提供建議。比如,用Apache 來構建一個商務網(wǎng)站,在投入運行前用測試儀模擬上萬客戶端對服務器進行測試,而呈現(xiàn)的性能曲線卻令你非常失望,這時別忘了查一下網(wǎng)站日志,Apache 的錯誤日志會向你提出警告:“服務器用來處理頁面請求的線程已經(jīng)用光了,請考慮增大每個子進程下的線程數(shù)目”。依提示而行,如果同時不存在其他瓶頸,性能問題就解決了。日志提示信息的詳細程度用戶是可以通過Apache 配置文件中的LogLevel 關鍵字進行定制的,如果你有專用工具來分析網(wǎng)站日志,那么不妨讓日志提供盡可能多的信息,分析工具生成的報告可以讓你更充分地了解網(wǎng)站的工作過程。
(4)目前造成網(wǎng)絡數(shù)據(jù)破壞的原因主要有以下幾個方面:
1)自然災害,如水災、火災、雷擊、地震等造成計算機系統(tǒng)的破壞,導致存儲數(shù)據(jù)被破壞或丟失,這屬于客觀因素無能為力;
2)計算機設備故障,其中包括存儲介質(zhì)的老化、失效,這也屬于客觀原因,但可以提前預防,只需經(jīng)常做到管理,就可以及時發(fā)現(xiàn)問題,避免災難的發(fā)生;
3)系統(tǒng)管理員及管理人員的誤操作,這屬于主觀因素,雖然不可能完全避免,但至少可以盡量減少;
4)病毒感染造成的數(shù)據(jù)破壞和網(wǎng)絡上的“黑客”攻擊,這雖然也可歸屬于客觀因素,但其實還是可以做好預防的,而且還有可能完全避免這類災難的發(fā)生。
5) 1.密碼安全2. 網(wǎng)站設置安全3. 修改腳本,確保安全4. 目錄安全5. 數(shù)據(jù)庫安全6. 后臺安全7.robots.txt 文件8.SQL 注入威脅的防御9. 腳本木馬查殺10. 日常注意與管理
第七章
1. 填空題
(1)互聯(lián)網(wǎng)頁面 網(wǎng)頁 銷售能力 宣傳效果 (2)網(wǎng)站結構 網(wǎng)站內(nèi)容 網(wǎng)站營銷價值
(3)全文搜索引擎 目錄索引 (4)網(wǎng)站域名 網(wǎng)站結構 關鍵字 內(nèi)鏈接 (5)關鍵字密度
,2. 選擇題
(1)A (2)C (3) A (4) B (5)B
3. 簡答題
(1)搜索引擎一般的工作過程是:首先對互聯(lián)網(wǎng)上的網(wǎng)頁進行搜集,然后對搜集來的網(wǎng)頁進行預處理,建立網(wǎng)頁索引庫,實時響應用戶的查詢請求,并對查找到的結果按某種規(guī)則進行排序后返回給用戶。搜索引擎的重要功能是能夠?qū)ヂ?lián)網(wǎng)上的文本信息提供全文檢索。 搜索引擎詳細工作過程主要分為以下五步完成:
1)搜索引擎釋放網(wǎng)絡蜘蛛spider ,spider 先檢查開放目錄DMOZ 上登錄網(wǎng)站網(wǎng)址進行訪問,并根據(jù)收錄的網(wǎng)站的外部鏈接找到更多的網(wǎng)站。根據(jù)網(wǎng)站的更新頻率及權重級別,安排spider 的搜索頻率。對于新站,Google 進入sandbox 處理。
對于站內(nèi)連接(內(nèi)連接),Google 根據(jù)網(wǎng)站的PR 值,計算出搜索深度,檢查收錄的頁面中獲取的網(wǎng)址是否更新:有,則收錄新的網(wǎng)址;沒有,則關閉Spider 。Baidut Yahoo則根據(jù)自己的算法,收錄訪問深度內(nèi)的網(wǎng)址。
2)搜索引擎讀取spider 收集的網(wǎng)址庫,按照網(wǎng)址收錄優(yōu)先規(guī)則,調(diào)試反爬蟲crawler 。Google 對于提交了sitemap 的網(wǎng)站,抓取深層次的頁面。
3)搜索引擎釋放crawler 抓取網(wǎng)址頁面。
4)收錄網(wǎng)站為中文網(wǎng)站根據(jù)健忘技術進行關鍵字索引,按照頁面的權重進行排位
5)進行反作弊spam kill和dance(Google)
(2)SEO 主要是指優(yōu)化網(wǎng)站域名、網(wǎng)絡結構、關鍵字、內(nèi)鏈接、外鏈接和圖片及FLASH 等方面。
(3)以百度為例提交網(wǎng)站的步驟:
1)百度采用的自由申請,人工審核的方式。首先,登錄到百度“新站登錄”頁面,地址為http://site.baidu.com/login.htm,然后根據(jù)提示進入“百度site 吧”,按照要求的格式進行發(fā)帖,等待管理員的審核。請一定按要求的格式認真填寫真實的資料,并且要耐心等待。如圖7.28和7.29所示。
,圖7.28 百度“新站登錄”頁面
圖7.29 “百度site 吧”頁面
另外,百度還提供一種免費自動收錄的方式,但效果不能保證,登陸頁面