域名趣味分析
因為正好需要測試某個低端硬件的性能(SQLServer2005新特性的測試和演示),想找一些真實世界的數(shù)據(jù),其數(shù)據(jù)量中等。但它們應該是公開的,也就是說不可以是商業(yè)數(shù)據(jù),另外我并不想用人造數(shù)據(jù)。恰好當時
因為正好需要測試某個低端硬件的性能(SQLServer2005新特性的測試和演示),想找一些真實世界的數(shù)據(jù),其數(shù)據(jù)量中等。但它們應該是公開的,也就是說不可以是商業(yè)數(shù)據(jù),另外我并不想用人造數(shù)據(jù)。恰好當時我正需要獲取.COM/.NET和.EDU 的頂級域名(TLD: Top Level Domain--譯注)信息,于是就向Verisign 申請獲取了這些數(shù)據(jù)(任何人可以免費向verisign 索取頂級域名數(shù)據(jù)庫 -- 譯注)。
很快我就得到了3.5GB 的.COM 域名數(shù)據(jù),以及650MB 的.NET 域名數(shù)據(jù),然后統(tǒng)統(tǒng)裝入了數(shù)據(jù)庫(后面的分析結(jié)果全部基于.COM 域名的,截止到2006年3月28日)。這些數(shù)據(jù)很好的滿足了我測試和演示的需要。但是因為好奇我也順便做了些簡單的分析,想看看被注冊的都是哪些域名,注冊量如何。
備注一下,這些數(shù)據(jù)來源于Verisign 的zone 文件,不包含那些沒有進行域名解析(即被注冊,但無法解析為IP 地址的域名 --譯注)的或者被保留的域名。盡管那些域名其實數(shù)量很少,但會對結(jié)果的準確性產(chǎn)生影響。為了提高準確度,對于比較小的樣本集我都會通過WHOIS 系統(tǒng)進行驗證(比如一些2字母和3字母的域名,表面上可以注冊,但其實并沒有設定DNS 服務器做IP 解析,也就是說處于保留狀態(tài))。除此之外,我還做了一些過濾,比如去除了國際化域名(IDN: InternationalDomain Name,即非ascii 編碼的域名,比如中文域名 -- 譯注)。
搜索域名
如果你正巧想到了一個絕妙的Web2.0應用,或者正要發(fā)布一個尚未出名的“殺手級”應用。你首先要做的就是尋找一個完美的域名來做準備(事實上,目前的流行趨勢是根據(jù)你找到的域名來命名你的公司)。
你打開GoDaddy (著名的域名注冊代理商--譯注),開始敲入一些有創(chuàng)意的名字,或者是稍做些變動,但是你發(fā)現(xiàn)所有的域名都已經(jīng)被注冊掉了。
“這怎么可能!”,你喊道,“難道每個域名都被注冊掉了么?”
事實上,已經(jīng)注冊的.COM 域名已經(jīng)有5000萬個,那些容易想到的域名絕對已經(jīng)被別人搶先了,找到一個未被關注的3字母頂級域名的可能性也幾乎為零,所能做的恐怕只有尋求域名黃牛的幫助了。
縮寫字做域名?
如果你取2字母序列組合的676中的一種,作為一種縮寫,那你注定不會走運。它們都已經(jīng)名花有主了。即便允許其中出現(xiàn)數(shù)字,也僅有1296種組合,也統(tǒng)統(tǒng)沒有了。
當然,實際情況是.COM 注冊機構還要求域名長度至少有3個字符,所以,死了這條心吧。 3字母序列的可能性有17576種,很不幸,也都沒有了。如果加上數(shù)字的組合(不考慮連接號/減號,即便你可以這樣做,但是這么短的域名加上這個也不會有意義)共有46656種變化,算上大量的“垃圾”域名(即被域名商保留的、贖回或者沒有設定解析服務器),也只能得到228個看似可用的域名,而實際上它們是不能被注冊到的。
如果你的確很想要一個像8VZ.com 或者Q6X.com 這樣的域名,你可以等一個月,總會等到幾個可用的。盡管看起來大量的黃牛一直在伺機而動,爭搶無主的域名,但它們不會一直獨自買斷手頭的域名。
來看看4個字符組合的域名,一共456976種可能,這么多的數(shù)量,或許黃牛們也不能全部覆蓋吧 ----有97786個看起來可以用。不過檢查一遍以后其實大部分都是理論上可用而已。那種AGJV.com ,EIYK.com ,GZVW.com 和QFEV.com 恐怕也不怎么有實際用處。算上數(shù)字組合的話有大約116萬個未注冊域名,比如7RG8.com 或者U3JZ.com ,如果你打算用這樣的域名,那么你得把這縮寫的含義先想好,如何向別人解釋這究竟是什么東西的縮寫呢。
,最后是5字符的組合(YAFLA? (作者的網(wǎng)站域名 -- 譯注)),當然現(xiàn)在組合可能性已經(jīng)非常多了,你可以很容易注冊到,但問題仍然是你需要對那些縮寫做出恰當?shù)慕忉尅H帜傅慕M合共有11881376種可能,其中11015028種尚未被注冊。
下圖為2-5個字符長度域名的注冊率
大多數(shù)域名有多長?
大多數(shù)域名都很少被訪問,即便有也是因為有人訪問注冊者待價而沽的廣告頁面。所以不考慮實際流量而直接分析域名長度會有失偏頗,不過其結(jié)果還是有點意思的。
如前所述,所有的2字符、3字符域名都已經(jīng)被注冊了,但一直到最大63字符長度的域名范圍內(nèi)還有很多的名字有待選取。注冊數(shù)量最多的是11
字符長的域名?;境收龖B(tài)分布。
故事到31字符長還沒有結(jié)束,有253000多個純英語域名長度超過32字符,有538個是
,63字符長的。
比如這幾個:
ZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZ.c om
EBWEBWEBWEBWEBWEBWEBWEBWEBWEBWEBWEBWEBWEBWEBWEBWEBWE BWEBWEBWEB.com
DIDYOUKNOWTHATYOUCANONLYHAVESIXTY-THREECHARACTERSINADOMAIN-N AME.com
姓名來做域名?
美國人口普查司提供了這個公開文件,這讓我很想了解人們是否還能把自己的姓名注冊為域名。
如果你對男性名字域名感興趣,你會很失望的發(fā)現(xiàn)1219個男性名字都已經(jīng)被注冊了。如果是女性名字域名,人口普查司共給出了2841個名字,你依然可以選擇Erlinda.com 或者Shanita.com 來注冊,不過當你看到本文時恐怕也已經(jīng)晚了。
姓氏部分,10000個姓氏統(tǒng)統(tǒng)沒有了。
,將300個男性名字和300個家族姓氏組合起來,90000種組合中有10112種沒有被注冊,比如Antonio Hughes 和Lawrence Torres !類似的,300女性名字和300個姓氏組合起來有約14103個可以成功。
有“愛”的域名
來關注愛(Love )吧,形如ILOVE 的前綴加上女性名字(2841個)作為域名,有1958個(約68.9)尚未注冊。而ILOVE 前綴加上男性名字的1219個域名中有665(54.5)個未被注冊。
,順著這個思路,我們發(fā)現(xiàn)互聯(lián)網(wǎng)的丑陋面暴露無疑。DNS 再次證明了這一點。有268971個域名含有SEX (其中11333個還同時含有FREE 字樣),而含有LOVE 的域名只有143683。
其他小細節(jié)
最常見的域名首字母是S ,最少出現(xiàn)的首字母則是Q ,X ,Y 和Z 。
,作為首字符出現(xiàn)在域名中的數(shù)字是毫無懸念的"1" 。
每個成功的公司都有不少競爭對手或者擁躉,所以研究一下以著名公司域名作為后綴的域名也不錯。其中一部分域名為原公司所擁有,大多數(shù)都是愛好者或者批評者所注冊的。
,比如 GOOGLE-AMERICA ,GOOGLE-BUDDY ,MICROSOFT-EBOOKS ,SLASHDOTREVIEW ,SLASHDOTSLASH 和YAHOO2007。
結(jié)論
希望這些結(jié)論你會喜歡,或許也還能對你有點用處。我還在做更多細致龐大的分析(這是一個演示SQLServer 2005新功能的好機會)