NatureDNS--一種自然語(yǔ)言式域名尋址系統(tǒng).cas.201208.v4.from.cas
計(jì)算機(jī)應(yīng)用與軟件 Computer Applications and SoftwareNatureDNS: 一種自然語(yǔ)言式域名尋址系統(tǒng)劉振興11(人民網(wǎng)股份有限公司 人民網(wǎng)研究院, 北京 中國(guó) 100
計(jì)算機(jī)應(yīng)用與軟件 Computer Applications and Software
NatureDNS: 一種自然語(yǔ)言式域名尋址系統(tǒng)
劉振興
11(人民網(wǎng)股份有限公司 人民網(wǎng)研究院, 北京 中國(guó) 100733)
摘 要 本文探討一種使用自然語(yǔ)言進(jìn)行域名注冊(cè)登記、解析和尋址的方法。現(xiàn)行的域名系統(tǒng)(Domain Name System ,DNS )采用層級(jí)式的命名空間,點(diǎn)分多段表達(dá)式,域名與IP 的對(duì)應(yīng)關(guān)系維護(hù)在一個(gè)分布式的數(shù)據(jù)庫(kù)系統(tǒng)中。隨著網(wǎng)絡(luò)發(fā)展這種體系面臨:1)越來(lái)越多的人們被迫接受一種點(diǎn)分字符串作為訪問(wèn)對(duì)象的標(biāo)記,2)隨著新頂級(jí)域名的增多和國(guó)際化域名的啟用,點(diǎn)分字符串的域名變得進(jìn)一步復(fù)雜多變。在深入分析這一體系及其他相關(guān)改進(jìn)型探索的基礎(chǔ)上,本文提出一種以“-”(hyphen )為起始和分級(jí)標(biāo)記使用自然語(yǔ)言式字符串進(jìn)行網(wǎng)絡(luò)尋址的新方法(“-xxxx ”),取名為NatureDNS ,即“自然語(yǔ)言式DNS 系統(tǒng)”。 關(guān)鍵詞 網(wǎng)絡(luò)地址;域名;域名系統(tǒng);網(wǎng)絡(luò)尋址;自然語(yǔ)言;國(guó)際化域名
中圖分類(lèi)號(hào) TP3 文獻(xiàn)標(biāo)識(shí)碼 A
DOI:
NatureDNS: an Approach to DNS Using Natural Languages
Liu Zhenxing1
1(Institute of People Daily Online, People Daily Online, Beijing 100733, China)
Abstract This paper proposes a new approach to rebuilding the DNS using natural languages to register and resolve a domain name. The current DNS is a hierarchical naming system where a domain is expressed by a dot-delimited string and the mapping of domain names and IP addresses are stored in a distributed database system. With the development of Internet, the DNS encounters: 1) more people are compelled to remember the ever-growing dot-delimited strings as resources addresses; 2) with new gTLD and the IDN are introduced, domain names become more complex than ever. Based on a deep investigation with the DNS and other refining works, the article presents a new method (“-xxxx”) that expresses a domain name with natural languages starting/separating with a hyphen (-) tag, named as “NatureDNS”, i.e., “express domain names in natural languages”.
Keywords Network Addresses; Domain Name; Domain Name System (DNS); IP Addresses Lookup; Natural Languages; Internationalized Domain Names 0 研究背景
域名系統(tǒng)(Domain Name System, DNS)是互聯(lián)網(wǎng)關(guān)鍵性基
礎(chǔ)服務(wù)之一,解決的問(wèn)題是減省了人們需要記住數(shù)字IP 地址的
負(fù)擔(dān),避免了因?yàn)镮P 地址變化導(dǎo)致域名所代表服務(wù)不可用,提
供了多地址對(duì)應(yīng)一個(gè)主機(jī)的可能 [1] 。
IPv6作為IPv4的繼承者和替代者,正逐漸向人們走來(lái)。IPv6
顯著的、首要的功能就是解決了IPv4地址短缺的問(wèn)題 [2] 。地
址空間的增大,也帶來(lái)了地址表達(dá)式長(zhǎng)度的增長(zhǎng),現(xiàn)行的IPv6
地址的表達(dá)式為分號(hào)間隔16進(jìn)制法,是IPv4的點(diǎn)分十進(jìn)制表
達(dá)式長(zhǎng)度的39/15 =2.6倍。
IP 地址表達(dá)式的復(fù)雜,導(dǎo)致在應(yīng)用中直接引用IP 地址變得
更加困難。因此,在可見(jiàn)的未來(lái),直接使用IP 地址的地方越來(lái)
越少,取而代之的是使用易于理解和記憶的域名作為IP 尋址手
段,這會(huì)引起人們對(duì)域名系統(tǒng)更加依賴和重視。
另一方面,域名系統(tǒng)也在不斷的發(fā)展,根據(jù)ICANN 的數(shù)
據(jù) [3] ,目前已經(jīng)有頂級(jí)域名326個(gè),主要分為三類(lèi):通用頂
級(jí)域名(gTLD )、國(guó)家代碼頂級(jí)域名(ccTLD )和贊助類(lèi)頂級(jí)域名(sponsored )。2012年1月,經(jīng)過(guò) ICANN 第41屆新加坡會(huì)議確定開(kāi)放新頂級(jí)域名的申請(qǐng),任何法人組織可以申請(qǐng)任意未被搶注的新頂級(jí)域名。根據(jù)2012年6月披露的首批新頂級(jí)域名的申請(qǐng)情況,共1930個(gè)新頂級(jí)域名申請(qǐng)通過(guò)初步審查 [4] 。 與此同時(shí),國(guó)際化域名從另一個(gè)視角來(lái)延展域名表達(dá)的豐富性——在域名中引入非ASCII 語(yǔ)言符號(hào),也即國(guó)際化域名(Internationalized Domain Name, IDN)。多種頂級(jí)域名極大的豐富了域名的表達(dá)形式,但也可能會(huì)商標(biāo)或者品牌保護(hù)帶來(lái)不利。更多的頂級(jí)域名意味著品牌擁有者需要注冊(cè)更多的域名來(lái)求得全面保護(hù)所持有品牌。 以上兩個(gè)方面反映出,隨著IPv6的臨近,域名系統(tǒng)正變得日益重要;隨著新頂級(jí)域名和國(guó)際化域名的推行,域名的表達(dá)變得豐富而“雜亂”。這些舉措會(huì)給域名系統(tǒng)帶來(lái)哪些變化,這些變化對(duì)于人們使用互聯(lián)網(wǎng)有哪些影響?有沒(méi)有一種更好的方法來(lái)解決這些問(wèn)題?帶著這些思考和想法,本文深入分析了
2
計(jì)算機(jī)應(yīng)用與軟件
現(xiàn)有的域名系統(tǒng)以及與之相關(guān)的其他研究,提出一種使用自然語(yǔ)言來(lái)直接表達(dá)域名的新方法,并取名為“NatureDNS ”。
下面的章節(jié)內(nèi)容順序?yàn)椋涸诘?章論述了現(xiàn)有DNS 面臨的問(wèn)題;第2章列舉和分析了目前對(duì)上述問(wèn)題進(jìn)行改進(jìn)和補(bǔ)充的方式方法;第3章詳細(xì)闡述了NatureDNS 域名系統(tǒng),分定義、注冊(cè)與解析過(guò)程、實(shí)例與應(yīng)用場(chǎng)景、對(duì)比分析等小節(jié);第4章提出由現(xiàn)行DNS 系統(tǒng)向NatureDNS 過(guò)渡的方法;第5章進(jìn)行總結(jié);第6章補(bǔ)充了進(jìn)一步的研究工作。
1 DNS 系統(tǒng)面臨的問(wèn)題
1.1 DNS 系統(tǒng)自身
現(xiàn)行的DNS 系統(tǒng)是1983年由美國(guó)兩位計(jì)算機(jī)科學(xué)家發(fā)明,起初的目標(biāo)是取代維護(hù)在單機(jī)上的“主機(jī)表(host table)”[5] 。近30年后的今天看來(lái)這個(gè)系統(tǒng)仍在可靠地運(yùn)行中,并可能將繼續(xù)為互聯(lián)網(wǎng)的發(fā)展作出貢獻(xiàn)。然而,今天的互聯(lián)網(wǎng)技術(shù)水平和發(fā)展規(guī)模,與幾十年前畢竟有很大不同,若以現(xiàn)在的條件來(lái)審視這一域名系統(tǒng),并結(jié)合該域名面臨的一些改革,有如下幾點(diǎn)不足可供改進(jìn)。
(1) 點(diǎn)分多級(jí)不均等域 DNS 要表達(dá)“域”的概念,將一個(gè)整體的互聯(lián)網(wǎng)劃分成.COM 域,.NET 域等,然后有了地區(qū)的.US 域,.CN 域等,之后才是每個(gè)域上的二級(jí)域。這種分法在理論是可靠的,也是可行的,但卻不是最優(yōu)的,一個(gè)明顯的地方是,這種設(shè)計(jì)不是從人的角度去認(rèn)識(shí)和區(qū)分互聯(lián)網(wǎng)。最早將網(wǎng)絡(luò)簡(jiǎn)單的劃分為.COM/NET/ORG等有限的幾個(gè)域,顯然是過(guò)于簡(jiǎn)略了,后期啟用了國(guó)家代碼頂級(jí)域名緩解了一下,目前的任意字符的頂級(jí)域名才更接近人的思維。
不均等的.COM/NET/ORG等域帶來(lái)的問(wèn)題是,域的擁有者都想擁有一個(gè).COM 的二級(jí)域,而網(wǎng)絡(luò)使用者則會(huì)首選.COM 域去訪問(wèn)(Figure 1)。研究 [6] 發(fā)現(xiàn)大部分網(wǎng)絡(luò)用戶只用了很少一小部分DNS 服務(wù)器。
Figure 1 前五通用頂級(jí)域名的注冊(cè)量及百分比 [7]
如果大多數(shù)二級(jí)域都在一個(gè)域里,那么這個(gè)域的分法就值得商榷,最大的域就非常擁擠,資源也相對(duì)稀缺,有進(jìn)一步細(xì)分的必要。DNS 首要使命是解決人們難以記住IP 數(shù)字地址,采用點(diǎn)分多級(jí)表達(dá)法降低了記憶難度,而沒(méi)有真正的解決這個(gè)問(wèn)題。
(2) 非自然語(yǔ)言
點(diǎn)分多級(jí)的表達(dá)式強(qiáng)加給了人們另外一種語(yǔ)法,為了使用互聯(lián)網(wǎng),人們不得不像學(xué)習(xí)信件地址格式一樣再學(xué)習(xí)一種“網(wǎng)絡(luò)地址格式”。如果有可能,改成人們似乎用的自然語(yǔ)言來(lái)表
達(dá)網(wǎng)址,就像信件的地址一樣,無(wú)疑會(huì)減省人們學(xué)習(xí)的網(wǎng)絡(luò)地址格式的繁瑣。
(3) 受限的LDH 表達(dá)式
技術(shù)上看,DNS 的域名可以使用任何八進(jìn)制的字符,但實(shí)際被允許使用的字符集只是ASCII 字符集的一個(gè)子集,也即字母a-z, A-Z 、數(shù)字0-9和連字符“-”,又由于域名不區(qū)分大小寫(xiě),所以實(shí)際使用的字符只有26個(gè)字母,10個(gè)數(shù)字,1個(gè)連字符共37個(gè)符號(hào),這就是LDH 規(guī)則(Letters, Digits and Hyphen)。
就連使用其他ASCII 符號(hào)做域名都不被允許,這從根本上否定了使用其他語(yǔ)言來(lái)注冊(cè)域名的可能性。如此小的字符集合,全世界的網(wǎng)絡(luò)使用者來(lái)?yè)屪⒂蛎?,這可能也是ICANN 不斷探索新的域名表達(dá)式的原因之一。
(4) 過(guò)度設(shè)計(jì)的127-253
與現(xiàn)行的DNS 狹小的表達(dá)空間相比,對(duì)域名長(zhǎng)度的設(shè)計(jì)可謂綽綽有余。DNS 設(shè)計(jì)成每個(gè)Label (每級(jí)域的名稱)的長(zhǎng)度可以有63個(gè)字符,可以劃分成127級(jí),總長(zhǎng)度可以允許253個(gè)字符。
統(tǒng)計(jì)數(shù)據(jù)顯示,目前注冊(cè)登記的域名,平均長(zhǎng)度只有11個(gè)字符(Figure 2)。
Figure 2 已注冊(cè)域名的長(zhǎng)度分布 [8]
如果在網(wǎng)絡(luò)上檢索,也能發(fā)現(xiàn)發(fā)現(xiàn)超長(zhǎng)至63字符的域名,但多數(shù)是驗(yàn)證域名的這條規(guī)則或者是另外一種噱頭,如http://www.abcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijk.com/ 等超長(zhǎng)域名 [9] 。與IP 地址的預(yù)留空間越大越好,設(shè)計(jì)給人類(lèi)使用的域名,是越簡(jiǎn)單越好,試圖挑戰(zhàn)人類(lèi)的臨時(shí)記憶極限的方法可以再改進(jìn)。
(5) 其他問(wèn)題
也有其他學(xué)者指出 [10],現(xiàn)行的DNS 系統(tǒng)除了上述域名設(shè)計(jì)上的不足之外,還存在著記錄更新速度慢、服務(wù)模式單一、資源描述能力不夠強(qiáng)、配置易出錯(cuò)等缺點(diǎn)。
1.2 IPv6帶來(lái)的新需求
如在“研究背景”一節(jié)所述,IPv6正向我們走來(lái),其中的一個(gè)顯著的變化是IPv6地址表達(dá)式長(zhǎng)度增長(zhǎng)到39字節(jié) [11],如,
2001:0DB8:0000:2F3B:02AA:00FF:FE28:9C5A
如果說(shuō)在IPv4時(shí)代,還能夠?qū)⑿稳纭?.2.3.4”直接應(yīng)用在程序中,那么在IPv6時(shí)代這種可能性變得更小。取而代之的,越來(lái)越多的應(yīng)用選擇比以往更加頻繁地使用DNS 系統(tǒng)進(jìn)行尋址。隨著而來(lái)的還有互聯(lián)網(wǎng)的進(jìn)一步滲透發(fā)展——物聯(lián)網(wǎng),更
,計(jì)算機(jī)應(yīng)用與軟件
3
多智能終端設(shè)備接入互聯(lián)網(wǎng)絡(luò)。
這一方面會(huì)加重DNS 服務(wù)器的負(fù)擔(dān),另一方面會(huì)迫使用戶不得不在短域名之外尋找相對(duì)復(fù)雜難記的長(zhǎng)域名來(lái)用,只要這個(gè)域名看起來(lái)比IPv6地址稍微好些就可以。
谷歌2012年2月份宣稱其提供的Public DNS 成為世界上最大的DNS 服務(wù)提供商,每天處理超過(guò)700億次查詢 [12]。
這也帶來(lái)了一個(gè)新的契機(jī),或籍此解決互聯(lián)網(wǎng)發(fā)展中的IP 地址語(yǔ)義過(guò)載的問(wèn)題 [10],由于IPv6地址的復(fù)雜化,迫使應(yīng)用層不再試圖使用網(wǎng)絡(luò)層的標(biāo)識(shí),把設(shè)備的身份標(biāo)志和位置標(biāo)志分離開(kāi)來(lái)。
2 DNS 改進(jìn)的方式方法
2.1 關(guān)鍵詞尋址技術(shù)
網(wǎng)絡(luò)技術(shù)從實(shí)驗(yàn)室走出來(lái)之后,其絕大多數(shù)多用戶就由科研技術(shù)人員變成了普通民眾。人們?cè)谑褂没ヂ?lián)網(wǎng)的時(shí)候更希望是使用已知的語(yǔ)言和方式進(jìn)行相關(guān)操作,這催生了一種新的尋址方式的產(chǎn)生——網(wǎng)絡(luò)關(guān)鍵詞(Internet Keyword)技術(shù) [13]。
網(wǎng)絡(luò)關(guān)鍵詞技術(shù)通過(guò)建立關(guān)鍵詞與網(wǎng)絡(luò)資源地址對(duì)應(yīng)關(guān)系,來(lái)實(shí)現(xiàn)通過(guò)輸入某一特定關(guān)鍵詞直達(dá)對(duì)應(yīng)網(wǎng)絡(luò)資源地址的實(shí)現(xiàn)方式。網(wǎng)絡(luò)關(guān)鍵詞允許用戶直接使用企事業(yè)單位名稱、簡(jiǎn)稱,商品、產(chǎn)品的全稱或者簡(jiǎn)稱,網(wǎng)站的中文名稱等直接到達(dá)網(wǎng)站,對(duì)本地用戶來(lái)說(shuō),是非常接近自然語(yǔ)言的一種網(wǎng)絡(luò)資源定位方式,符合用戶的使用習(xí)慣。比如去清華大學(xué)的網(wǎng)站,使用“-清華大學(xué)”比“TSINGHUA.EDU.CN ”更容易。
然而,這種方式本質(zhì)不是域名到IP 地址的轉(zhuǎn)換,而是關(guān)鍵詞到URL 地址的映射,因此不是真正意義上的域名系統(tǒng),而且域名系統(tǒng)相關(guān)的問(wèn)題都沒(méi)有觸及。盡管十分好用,但需要單獨(dú)安裝額外的客戶端和沒(méi)有分層級(jí)的扁平結(jié)構(gòu)阻礙了其進(jìn)一步的發(fā)展。
2.2 國(guó)際化/多語(yǔ)種域名
與關(guān)鍵詞尋址技術(shù)不同,國(guó)際化域名(Internationalized Domain Name, IDN)是實(shí)實(shí)在在的要在域名中引入非ASCII 字符,也即向使用本地語(yǔ)言來(lái)表達(dá)域名的方向努力。
如前所述,之前的DNS 中,受LDH 規(guī)則限制,域名的表達(dá)方式只有37個(gè)ASCII 字符,IDN 將使用Unicode 字符集內(nèi)的絕大多數(shù)字符,通過(guò)NamePrep (Name Preparation ),ACE(ASCII-Compatible Encoding)等處理方式,把非ASCII 字符轉(zhuǎn)換成ASCII 的表達(dá)形式 [14]。
Figure 3 中文域名
如在已經(jīng)支持IDN 技術(shù)的瀏覽器里輸入“導(dǎo)航. 中國(guó)” ,瀏覽器將地址轉(zhuǎn)換為“http://xn--fet810g.xn--fiqs8s/”,同時(shí)加載“中文域名網(wǎng)址大全”的頁(yè)面,如Figure 3所示。
這是最接近自然語(yǔ)言的一種方式,如果去掉了中間的點(diǎn)號(hào)分隔符的話。
它的不足在于只是對(duì)DNS 改良,將非ASCII 字符處理成ASCII 字符,因?yàn)檫@個(gè)提供了其與現(xiàn)行DNS 兼容的可行性,也
因?yàn)檫@一點(diǎn)導(dǎo)致其無(wú)法再往前一步。另外,地址欄內(nèi)的Punycode 代碼 [15] 對(duì)用戶也顯得不友好。如Figure 4所示。
Figure 4 地址欄內(nèi)的Punycode
2.3 新頂級(jí)域名
國(guó)際化域名解決的問(wèn)題是使用非ASCII 來(lái)表達(dá)域名,這一問(wèn)題對(duì)英語(yǔ)國(guó)家來(lái)說(shuō)是不存在的,可能也因?yàn)檫@一點(diǎn),以說(shuō)英語(yǔ)國(guó)家為主的互聯(lián)網(wǎng)管理協(xié)調(diào)機(jī)構(gòu)解決域名稀缺的問(wèn)題角度也就不同。與非英語(yǔ)國(guó)家積極探索使用本地語(yǔ)言來(lái)表達(dá)域名的解決辦法不同,互聯(lián)網(wǎng)協(xié)調(diào)與管理機(jī)構(gòu)ICANN 最近幾年運(yùn)作的對(duì)頂級(jí)域名擴(kuò)增的部分日益加快 [16]。
Figure 5 新頂級(jí)域名 [17]
國(guó)際化域名與新頂級(jí)域名不是對(duì)立的舉措,在新頂級(jí)域名的申請(qǐng)中,也可以遞交非LDH 的字符作為新頂級(jí)域名。根據(jù)ICANN 的描述,ICANN 理事會(huì)于 2011 年 6 月通過(guò)決議,決定實(shí)施新 gTLD 計(jì)劃。2012年6月第一批1930個(gè) “新頂級(jí)域名”通過(guò)初步審查,在此之前,已經(jīng)有22個(gè)“通用頂級(jí)域名 (gTLD)”和280個(gè)“國(guó)家頂級(jí)域名 (ccTLD)”。
這一舉措緩解了DNS 設(shè)計(jì)之初簡(jiǎn)單的.COM 域劃分導(dǎo)致的域名稀缺,并且形成一套規(guī)則,隨著以后逐步推進(jìn)頂級(jí)域可以無(wú)限多。
然而,新頂級(jí)域名也為域名系統(tǒng)帶來(lái)負(fù)面影響,其中之一就是不利于企事業(yè)單位的品牌保護(hù)。理論上,設(shè)若有N 種頂級(jí)域名,M 種國(guó)家代碼頂級(jí)域名和K 種國(guó)際化語(yǔ)言,那么一個(gè)公司要保全所有的注冊(cè)商標(biāo),需要注冊(cè)的域名個(gè)數(shù)為:
T (域名總數(shù))= N(頂級(jí)域名)× M (國(guó)家代碼頂級(jí)域名)× K (國(guó)際化語(yǔ)言)
根據(jù)已知的數(shù)據(jù)N=22, M=280,國(guó)際化語(yǔ)言版本在IDN 實(shí)踐[18]中顯示,有98種.COM 的語(yǔ)言版本,因此,以保護(hù)ufqi.com 這個(gè)品牌UFQI 為例,需要注冊(cè)的全部域名為:
T = 22 × 280 × 98 = 603,680 (個(gè)域名)
若以每域名每年費(fèi)用100元人民幣計(jì),則企事業(yè)單位年度域名注冊(cè)費(fèi)為:
603,680 × 100 = 60,368,000 (元人民幣)
如果再加上申請(qǐng)中的1930個(gè)“新頂級(jí)域名”,則是一筆更大的開(kāi)支。有統(tǒng)計(jì)數(shù)據(jù)顯示[19] ,截至2011年8月Google 已
,4
計(jì)算機(jī)應(yīng)用與軟件
經(jīng)注冊(cè)了9591個(gè)域名。
其次,從另外一個(gè)角度來(lái)看,如果“域”可以隨意劃分和定義,那么“域”就沒(méi)有存在的意義了。
再次,如此多的頂級(jí)域名,對(duì)普通用戶來(lái)說(shuō)會(huì)因?yàn)檫x擇太多而顯得雜亂和無(wú)所適從,適得其反地使用戶對(duì)新頂級(jí)域名有抵觸感情。從而導(dǎo)致對(duì)用戶、對(duì)企業(yè)雙輸?shù)木置妗?/p>
2.4 通用搜索引擎
搜索引擎是廣義上的“關(guān)鍵詞尋址技術(shù)”,解決了“關(guān)鍵詞”到網(wǎng)絡(luò)資源的定位,所不同的是,關(guān)鍵詞定位技術(shù)提供了直接跳轉(zhuǎn),而搜索引擎提供的是與之相關(guān)的網(wǎng)絡(luò)資源列表。相比較之下,對(duì)普通用戶而言,搜索引擎對(duì)“找東西”的人來(lái)說(shuō),有更大的選擇和更友好的用戶體驗(yàn)。
和關(guān)鍵詞尋址技術(shù)一樣,搜索引擎也沒(méi)有解決DNS 的核心任務(wù)——解析域名到數(shù)字IP 地址,隔離應(yīng)用層和網(wǎng)絡(luò)層。也許普通用戶可以忘記DNS 的存在,但應(yīng)用層卻不能。
2.5 其他對(duì)DNS 的補(bǔ)充和改進(jìn)
如上所述,在域名設(shè)計(jì)層面對(duì)DNS 系統(tǒng)做了一些改進(jìn)的嘗試。除此之外,在其他層面上,對(duì)IP 地址與域名的混用,對(duì)DNS 的一些缺陷也做了許多補(bǔ)充,主要有HIP (Host Identity Protocol ),PeerNet ,URN (Uniform Resource Names ),INS (International Naming System)和CoDoNS (Cooperative Domain Name System)等[10]。
3 NatureDNS
3.1 NatureDNS
(1) NatureDNS 的定義
NatureDNS 是一種以自然語(yǔ)言為域名表達(dá)形式,通過(guò)將自然語(yǔ)言編碼后的字符串與IP 數(shù)字地址建立對(duì)應(yīng)關(guān)系,實(shí)現(xiàn)網(wǎng)絡(luò)域名尋址的技術(shù)系統(tǒng)。它采用通過(guò)語(yǔ)義本身來(lái)隱式地定義域,使用符合本地語(yǔ)言語(yǔ)法的詞組或者句子的表達(dá)方式來(lái)定位網(wǎng)絡(luò)資源。
NatureDNS 域名由連續(xù)的實(shí)義字符組成,定義連字符“-”(hyphen )作為下一級(jí)子域的開(kāi)始,或者稱之為NatureDNS 的根域 (“-”) 。NatureDNS 的域名必須以連字符開(kāi)始,而不能以連字符結(jié)尾,可以有多個(gè)子級(jí)域,其正則表達(dá)式為:
^-([^-] )([-])([^-] )$
連字符(hyphen )“-”在這里可以理解為“連接/前往(Connect/to)”某個(gè)主機(jī)/域,或者理解成就是一根可以連接任何網(wǎng)絡(luò)的網(wǎng)線,與在電話號(hào)碼前加“ ”類(lèi)似。下列NatureDNS 域名表達(dá)式是合法的:
Table 1 NatureDNS域名樣例
下列NatureDNS 域名是不合法的:
中國(guó)導(dǎo)航 -People-
其中兩個(gè)以上連續(xù)的連字符會(huì)被等同視為一個(gè)。
域從大到小從左至右排列,域級(jí)之間使用連接符隔開(kāi),如: -live-mail-bay146-bay146w (by146w.bay146.mail.live.com )
上面的域名可以理解成從當(dāng)前連接到live 域的子域mail ,再?gòu)膍ail 的子域bay146中查找bay146w 所代表的主機(jī)IP 地址。
由于“-人民網(wǎng)財(cái)經(jīng)”比“-人民網(wǎng)-財(cái)經(jīng)”更符合人們使用習(xí)慣,因此前者可以單獨(dú)注冊(cè)一個(gè)獨(dú)立域名以區(qū)別于后者“-財(cái)經(jīng)”作為“-人民網(wǎng)”的子域。
(2) 注冊(cè)與解析
NatureDNS 與現(xiàn)行的DNS 結(jié)構(gòu) [2] 相似,由4個(gè)部分構(gòu)成:1)客戶端解析器,2)本地DNS 服務(wù)器,3)授權(quán)DNS 服務(wù)器,4)根和頂級(jí)域DNS 服務(wù)器。如Figure 6所示,其中的gTLD 可能包含多層。
Figure 6 DNS組成部分 [6]
Figure 7 NatureDNS解析流程
NatureDNS 解析過(guò)程除了在客戶端做編碼外,其余的與現(xiàn)有的DNS 解析處理過(guò)程 [20] 一致,主要步驟如Figure 7所示。
NatureDNS 域名的注冊(cè)過(guò)程與現(xiàn)有DNS 注冊(cè)基本一致,除了在注冊(cè)時(shí),生成域名的Punycode 并同時(shí)以Punycode 為索引來(lái)存儲(chǔ)和管理。
為正確顯示和處理國(guó)際化語(yǔ)言,注冊(cè)系統(tǒng)要支持UTF-8等國(guó)際化語(yǔ)言顯示字符編碼。
(3) NatureDNS 輪詢系統(tǒng)
,計(jì)算機(jī)應(yīng)用與軟件
5
Figure 8 NatureDNS層級(jí)查詢樹(shù)
NatureDNS 的輪詢結(jié)構(gòu)采用分層樹(shù)狀結(jié)構(gòu)(如Figure 8)。
在最頂層根服務(wù)器(Root-A, B, C等)。每個(gè)Root 后面對(duì)應(yīng)著
一組頂級(jí)域查詢服務(wù)器群,標(biāo)記為“a ?”的負(fù)責(zé)進(jìn)一步的解析
NatureDNS 域名Punycode 編碼以字母a 開(kāi)頭的頂級(jí)域名,以
“b ?”處理以字母b 開(kāi)頭的Punycode 編碼的域名,循此直到
z 開(kāi)頭、0-9開(kāi)頭的頂級(jí)域名。
頂級(jí)數(shù)據(jù)表中,視所查詢域名的情況,如果存在以連字符
連接的二級(jí)域,則進(jìn)一步按此形如“9a ?”, “9b ?”, “9c ?”
開(kāi)頭的形式做進(jìn)一步的查找;如果只有此一頂級(jí)域名,則從
“a ?”獲得該域名的授權(quán)DNS 服務(wù)器IP ,請(qǐng)求被進(jìn)一步的前
轉(zhuǎn)到所查詢域名的授權(quán)DNS 服務(wù)器,在那里獲知當(dāng)前域名對(duì)應(yīng)
的IP 數(shù)字地址。
(4) 分析比較與評(píng)估
NatureDNS 系統(tǒng)使用一些新方法來(lái)實(shí)現(xiàn)使用自然語(yǔ)言進(jìn)行
扁平化的方式來(lái)表達(dá)域名地址。
Unicode ,是國(guó)際組織制定的試圖包括世界上所有文字和符
號(hào)的字符編碼方案,目標(biāo)定位于滿足用戶在計(jì)算機(jī)輸入的任何
字符都能夠使用Unicode 表示出來(lái)。盡管Unicode 本身也在發(fā)
展進(jìn)化中,但比起使用某一種語(yǔ)言的某個(gè)字符集而言,其穩(wěn)定
性相對(duì)較好。Unicode 的實(shí)現(xiàn)方式之一UTF-8在互聯(lián)網(wǎng)上得到
廣泛的使用。
ACE Punycode,這種算法滿足了將Unicode 表示的多語(yǔ)種
域名編碼成ASCII 表示的域名,如此一來(lái)可以在不改變現(xiàn)有
ASCII 域名協(xié)議的情況下,實(shí)現(xiàn)對(duì)國(guó)際化域名的支持,同時(shí)可
以兼容舊的不支持Unicode 的主機(jī)系統(tǒng),為并行和過(guò)渡系統(tǒng)提
供了可能。Punycode 提供了較好的Unicode 與ASCII 互轉(zhuǎn)的算
法,除此,還可以考慮使用Base62x ,實(shí)現(xiàn)類(lèi)似功能 [21] 。
層級(jí)式,與現(xiàn)行DNS 系統(tǒng)一樣,NatureDNS 繼承了這一優(yōu)
點(diǎn),發(fā)展和運(yùn)行經(jīng)驗(yàn)表明,這是一個(gè)穩(wěn)定的結(jié)構(gòu),在負(fù)載分發(fā)、
可用性和部署方式上都表現(xiàn)不錯(cuò) [6]。
另外一點(diǎn)需要考量的是性能。NatureDNS 對(duì)比現(xiàn)行DNS 系
統(tǒng),在客戶端增加了將非ASCII 字符轉(zhuǎn)為Punycode 代碼的開(kāi)銷(xiāo),
在服務(wù)器端增加對(duì)非ASCII 字符的存儲(chǔ)空間。在客戶端進(jìn)行字符串進(jìn)行轉(zhuǎn)碼的操作是運(yùn)行在每個(gè)獨(dú)立的終端上,多一個(gè)轉(zhuǎn)碼步驟不會(huì)對(duì)DNS 系統(tǒng)造成任何性能影響,一是運(yùn)算處理是分布式地在每一臺(tái)終端進(jìn)行,二是Punycode 代碼是經(jīng)過(guò)優(yōu)選的算法,經(jīng)過(guò)這一轉(zhuǎn)碼操作之后進(jìn)入DNS 輪詢系統(tǒng)的只有Punycode 。在NatureDNS 的服務(wù)器端,在DNS 記錄集上,多增加一個(gè)數(shù)據(jù)字段,這對(duì)于目前的計(jì)算處理能力和存儲(chǔ)空間來(lái)說(shuō),都是可以實(shí)現(xiàn)的。后期,在下文中會(huì)提到過(guò)渡方案,待到全部系統(tǒng)都支持Unicode (UTF-8)之后,Punycode 轉(zhuǎn)碼就可以省略,服務(wù)器端的DNS 記錄也可以減去一個(gè)字段,整個(gè)DNS 系統(tǒng)恢復(fù)到NatureDNS 變更以前的狀態(tài)。因此在NatureDNS 開(kāi)始部署及從DNS 向NatureDNS 過(guò)渡期間,客戶端和服務(wù)器端可能會(huì)輕微地增加一些運(yùn)算和存儲(chǔ),理論上推算增加一步Punycode 轉(zhuǎn)碼或增加一列字段,都不會(huì)對(duì)系統(tǒng)造成嚴(yán)重影響。 3.2 實(shí)例及應(yīng)用場(chǎng)景 (1) 實(shí)例域名注冊(cè)與解析過(guò)程 如下以“-有福氣網(wǎng)-科技”(tech.ufqi.com )的為例說(shuō)明NatureDNS 注冊(cè)與解析流程的運(yùn)行機(jī)制。 在注冊(cè)前端系統(tǒng)收集數(shù)據(jù),獲得“有福氣網(wǎng)”和“科技”的Punycode 為“8ov35i1wnrsf ”和“2qux23c ” ,則在生成的DNS 數(shù)據(jù)文件(“8ov35i1wnrsf.zone ”和“有福氣網(wǎng).zone ”)里形成的對(duì)應(yīng)記錄為: 科技 2qux23c IN A 1.2.3.4 記錄格式為: UTF-8字符串 Punycode 碼 Class RRType Data
,6
計(jì)算機(jī)應(yīng)用與軟件
Figure 9 實(shí)例域名解析過(guò)程
該域名的解析過(guò)程如Figure 9所示,每個(gè)步驟執(zhí)行內(nèi)容: S1. 客戶機(jī)發(fā)出“-有福氣網(wǎng)-科技”(8ov35i1wnrsf )的域名解析請(qǐng)求;
S2. 本地DNS 在本地緩存找到則直接返回給客戶機(jī),如果沒(méi)有找到,則向根域“-”發(fā)出“-有福氣網(wǎng)-科技”(8ov35i1wnrsf )地址的請(qǐng)求;
S3. 根域“-”根據(jù)其Punycode 碼獲知是以“8”開(kāi)頭的,遂將“8?”子域的參考信息(IP 地址)返回給本地DNS ;
S4. 本地DNS 訪問(wèn)“8?”DNS, 請(qǐng)求8ov35i1wnrsf 域名的IP 地址;
S5. “8?”DNS 根據(jù)自己的記錄,將8ov35i1wnrsf 對(duì)應(yīng)的該域名的參考信息(授權(quán)DNS 的IP 地址)返回給本地DNS ;
S6. 本地DNS 根據(jù)收到的IP 地址,向授權(quán)DNS 發(fā)出請(qǐng)求解析8ov35i1wnrsf 域名的IP 地址;
S7. 8ov35i1wnrsf 域名的授權(quán)DNS 根據(jù)自己的記錄信息,返回8ov35i1wnrsf 域名對(duì)應(yīng)的IP 地址給本地DNS ;
S8. 本地DNS 將該域名和IP 對(duì)應(yīng)關(guān)系緩存后,將IP 地址傳給客戶機(jī)。
(2) 應(yīng)用場(chǎng)景HTTP, Email
NatureDNS 在實(shí)際應(yīng)用場(chǎng)景中的情形如下, 如用NatureDNS 域名在瀏覽器里訪問(wèn)一個(gè)網(wǎng)站,有如下例子網(wǎng)址:
如用在Email 地址里,則用NatureDNS 域名的email 地址形如:
張三@-中國(guó)計(jì)算機(jī)學(xué)會(huì) JohnWang@-NewYorkTimes 在已知的語(yǔ)境下,如果當(dāng)前位置期望的是一個(gè)主機(jī)IP 或者域名,則根域(“-”) 可以省略,變成
如用在命令行下,因?yàn)榕c參數(shù)標(biāo)志符沖突,需要轉(zhuǎn)義操作,如:
Shell> telnet -有福氣網(wǎng) 22
3.3 NatureDNS 的優(yōu)點(diǎn)
與現(xiàn)行的DNS 系統(tǒng)相比,NatureDNS 有如下幾點(diǎn)優(yōu)勢(shì)。 (1) 使用本地化自然語(yǔ)言標(biāo)記,易懂易記易用
使用本地化自然語(yǔ)言既有利于品牌保護(hù),將訪問(wèn)域名設(shè)置
成與商標(biāo)、商品名稱相一致;也避開(kāi)了非英文國(guó)家的人們?cè)谄占盎ヂ?lián)網(wǎng)過(guò)程中遇到的障礙,本地化語(yǔ)言或能加速互聯(lián)網(wǎng)在非英語(yǔ)國(guó)家的推廣和普及,改進(jìn)人們使用互聯(lián)網(wǎng)的方式。
比如在中文環(huán)境中,每一個(gè)網(wǎng)站有個(gè)英文的網(wǎng)址,然后推廣的時(shí)候又需要取一個(gè)符合中文文化的名稱,使用NatureDNS 就可以合二為一。無(wú)需去記憶“新華網(wǎng)”、“凱迪網(wǎng)”對(duì)應(yīng)的域名“xinhuanet.com ”和“kdnet.net ”,當(dāng)然也不會(huì)有兩個(gè)開(kāi)心網(wǎng)——“kaixin.com ”和“kaixin001.com ”[22] 。
(2) 自由的表達(dá)格式,寬松的表達(dá)空間
以“. ”為根域,然后依次擴(kuò)展頂級(jí)域,二級(jí)域等表達(dá)方式,以及僅用LDH 字符等,不符合常規(guī)的英語(yǔ)語(yǔ)法,更不符合非英語(yǔ)國(guó)家的人們語(yǔ)言習(xí)慣。NatureDNS 域名除了“-”字符外,不限定表達(dá)方式。與之相比,極大的豐富了表達(dá)式多樣性,從一個(gè)極小的37個(gè)字符的集合,擴(kuò)大到所有Unicode 字符,而且對(duì)語(yǔ)法也不作過(guò)多限制。
(3) 避免過(guò)多頂級(jí)域名帶來(lái)的混亂
現(xiàn)行DNS 最早只劃分少數(shù)幾個(gè).COM/NET/ORG頂級(jí)域,導(dǎo)致域名資源緊缺,現(xiàn)在推行任意頂級(jí)域名和國(guó)際化域名,或?qū)⒁l(fā)域名注冊(cè)的混亂,使域名保護(hù)變得困難。如此前所述,在沒(méi)有推行新頂級(jí)域名之前,一個(gè)域名品牌要注冊(cè)603,680個(gè)域名才能保全所有頂級(jí)域和二級(jí)域,新增1930個(gè)頂級(jí)域名之后,域名品牌保護(hù)將變得更加困難。
NatureDNS 沒(méi)有類(lèi)別頂級(jí)域和地區(qū)頂級(jí)域,而是從語(yǔ)義上區(qū)分歸屬和類(lèi)別,避免了這種可能的混亂局面。
(4) 繼承并改進(jìn)了層級(jí)結(jié)構(gòu)
NatureDNS 繼承了現(xiàn)行DNS 的層級(jí)樹(shù)狀輪詢系統(tǒng),并對(duì)其進(jìn)行了改進(jìn)。而且使用域名本身的特征碼,如首位字符將查詢量均分到所有服務(wù)器群。
(5) 推進(jìn)解決IP 地址語(yǔ)義過(guò)載問(wèn)題
IP 地址語(yǔ)義過(guò)載是IPv4時(shí)代就有的問(wèn)題,如果沒(méi)有解決好域名緊缺和域名混亂相交互的局面,這個(gè)問(wèn)題可能也要帶入到IPv6時(shí)代。NatureDNS 域名因其易用性將有助于推進(jìn)在應(yīng)用層盡可能少地使用網(wǎng)絡(luò)層的設(shè)備標(biāo)志——IP 地址。
4 過(guò)渡方案
過(guò)渡方案遵循的原則是與現(xiàn)有DNS 系統(tǒng)并行,同時(shí)使用UTF-8和Punycode 記錄域名,對(duì)只支持ASCII 的系統(tǒng),只使用Punycode 定位;待所有DNS 系統(tǒng)都支持UTF-8之后,減去Punycode 編碼環(huán)節(jié)。
在現(xiàn)行的DNS 中并列運(yùn)行一套新的NatureDNS 系統(tǒng),根據(jù)先后順序并行情況可分為三期:i) 前向兼容:在現(xiàn)行DNS 中建立“.-”頂級(jí)域;ii) 反轉(zhuǎn)切換:使用根域“-”替代現(xiàn)行的DNS 中的“. ”根域;iii) 后向兼容:在NatureDNS 頂級(jí)域中建立“-. ”頂級(jí)域。
4.1 前向兼容
NatureDNS 的切入點(diǎn)分DNS 客戶端端升級(jí)和服務(wù)器升級(jí)。在客戶端,允許所有“-xxxx ”命名的域名,并轉(zhuǎn)換成形如“xxxx.-”的現(xiàn)行DNS 系統(tǒng)格式,進(jìn)入現(xiàn)行DNS 解析系統(tǒng)。在服務(wù)器端,現(xiàn)行的DNS 中寫(xiě)入一個(gè)“.-”(dot hyphen)頂級(jí)域,接管發(fā)向現(xiàn)行DNS 系統(tǒng)根DNS 對(duì)“-xxxx ”的解析請(qǐng)求。由新運(yùn)行的“.-”域負(fù)責(zé)對(duì)NatureDNS 新域名的解析,如Figure 10所示。
,計(jì)算機(jī)應(yīng)用與軟件
7
Figure 10 增加新頂級(jí)域hyphen
4.2 反轉(zhuǎn)切換
啟用前向兼容后,引導(dǎo)企事業(yè)單位和個(gè)人將現(xiàn)行的DNS 域名轉(zhuǎn)換為新的NatureDNS 域名,待“.-”頂級(jí)域的使用量超過(guò)50或更高占比之后,將現(xiàn)行DNS 頂級(jí)的根域由“. ”切換成“-”。此前這一時(shí)期之前是兩個(gè)DNS 系統(tǒng)并行,實(shí)際上是在現(xiàn)行DNS 系統(tǒng)模擬運(yùn)行NatureDNS 系統(tǒng);此后全面啟用NatureDNS 系統(tǒng),如Figure 11所示。
Figure 11 切換成hyphen 為根域
4.3 后向兼容
在全面啟用NatureDNS 系統(tǒng)的同時(shí),在“-”根域中寫(xiě)入“-. ”(hyphen dot) 頂級(jí)域,負(fù)責(zé)解析現(xiàn)行DNS 的原域名如“a.b.com ”。與此同時(shí)升級(jí)客戶端解析,增加功能將“a.b.com ”的域名轉(zhuǎn)為“-.a.b.com ”發(fā)給在NatureDNS 中頂級(jí)域“-. ”負(fù)責(zé)解析,也即在NatureDNS 中模擬運(yùn)行原DNS 系統(tǒng),如Figure 12所示。
Figure 12 在hyphen 根域中增加dot 頂級(jí)域
此時(shí),在“-”根域中模擬解析“. ”根域的域名,待到“a.b.com ”的歷史DNS 域名流量逐漸減少到一個(gè)極小的量級(jí)后,設(shè)定一個(gè)緩沖期,然后永久性關(guān)閉“-. ”頂級(jí)域,DNS 系統(tǒng)全面地、單一地使用全新的NatureDNS 系統(tǒng)。
5 結(jié) 論
本文提出了一種新的域名系統(tǒng)方法,由使用以hyphen 為起始和分級(jí)標(biāo)記的域名表示方法(“-xxxx ”)和基于這種域名的注冊(cè)、解析系統(tǒng)組成,被命名為NatureDNS ,即“自然語(yǔ)言式域名尋址系統(tǒng)”。
現(xiàn)行DNS 在域名設(shè)計(jì)層面存在一些問(wèn)題,如點(diǎn)分多級(jí)不均等域、只有LDH 表達(dá)字符等,這些問(wèn)題阻礙了DNS 系統(tǒng)進(jìn)一步發(fā)展。針對(duì)這些問(wèn)題技術(shù)專家們從未停止探索的腳步,提出各種改進(jìn)和補(bǔ)充的方式方法,如上文所列舉的關(guān)鍵詞尋址、國(guó)
際化域名、新頂級(jí)域名,以及其他學(xué)者提出相關(guān)改進(jìn)措施。由于域名系統(tǒng)的基礎(chǔ)性與關(guān)鍵性,雖有改進(jìn)但主要問(wèn)題依然存在。
本文提出一種新的方法,將域名重新定義為以hyphen 開(kāi)頭任意實(shí)義字符組成的連續(xù)字符串格式(“-xxxx ”),極大地?cái)U(kuò)展了域名表達(dá)的多樣性和豐富性。并在上文章節(jié)中給出了詳細(xì)的闡述,對(duì)其注冊(cè)與解析過(guò)程、實(shí)例與應(yīng)用場(chǎng)景、過(guò)渡方案等環(huán)節(jié)做了詳細(xì)分析。
相比較而言,NatureDNS 優(yōu)勢(shì)在于: 使用本地化自然語(yǔ)言標(biāo)記,易懂易記易用 自由的表達(dá)格式,寬松的表達(dá)空間 避免過(guò)多頂級(jí)域名帶來(lái)的混亂 繼承并改進(jìn)了層級(jí)結(jié)構(gòu) 推進(jìn)解決IP 地址語(yǔ)義過(guò)載問(wèn)題
對(duì)NatureDNS 這個(gè)新事物而言,還有一些研究工作要做,隨后一章列舉了二點(diǎn):一個(gè)實(shí)體名的多個(gè)變體和Unicode 的進(jìn)化對(duì)NatureDNS 的影響。
我們相信NatureDNS 域名系統(tǒng)會(huì)給全球網(wǎng)絡(luò)系統(tǒng)帶來(lái)一些思考和改進(jìn),使得DNS 系統(tǒng)不再是阻礙互聯(lián)網(wǎng)發(fā)展的因素,而是促進(jìn)互聯(lián)網(wǎng)更快更好地惠及全球,讓人類(lèi)的生活變得更加美好。
6 進(jìn)一步的研究
6.1 一個(gè)實(shí)體名的多個(gè)變體
使用自然語(yǔ)言來(lái)表示域名為域名的表達(dá)提供了極大的豐富性和多樣性。NatureDNS 除了占用了“-”(hyphen )作為標(biāo)志符和分節(jié)符,其余所有的語(yǔ)法形式和可打印的字符形式都是被允許的。這可能面臨一個(gè)問(wèn)題是,具體到一個(gè)實(shí)體名,可能有多種表達(dá)方式,如同一個(gè)人有全名、昵稱、俗稱、簡(jiǎn)稱一樣,到底使用哪個(gè)來(lái)注冊(cè),還是全部都要注冊(cè)需要制定的相應(yīng)的規(guī)則。
6.2 Unicode 進(jìn)化帶來(lái)的影響
由于兼容國(guó)際化語(yǔ)言,經(jīng)過(guò)權(quán)衡我們選擇了Unicode 統(tǒng)一編碼字符集,并推薦了Punycode 和Base62x 兩個(gè)將Unicode 字符ASCII 化的編碼方案。
然而,Unicode 本身也在進(jìn)化中,這種進(jìn)化盡管幅度很小、步子很慢,但可能因此影響到NatureDNS 的穩(wěn)定性——作為互聯(lián)網(wǎng)基礎(chǔ)核心服務(wù),DNS 對(duì)穩(wěn)定性的要求無(wú)論多么苛刻都不為過(guò)。對(duì)此,隨著Unicode 的日趨成熟,其變化頻次逐漸減少;另外只要NatureDNS 有相應(yīng)的更新修正機(jī)制即可應(yīng)對(duì)。
參 考 文 獻(xiàn)
[1] J. Klensin. IETF RFC3467, http://tools.ietf.org/html/rfc3467, 2012.06.15. [2] Z. Liu., L. Liu., et al, "Dot-base62x: A Compact Textual Representation
of IPv6 Address for Clouds," in UCC '11 Proceedings of the 2011 Fourth IEEE International Conference on Utility and Cloud Computing, Melbourne, 2011.
[3] Root Zone Database, http://www.iana.org/domains/root/db/, 2012.06.15. [4] New
gTLD
Reveal
Day
-
Applied-for
Strings,
,8
計(jì)算機(jī)應(yīng)用與軟件
[5] P.
Mockapetris.
IETF
RFC882,
2012.06.15.
[6] J. Pang., J. Hendricks. and et. al, "Availability, usage, and deployment
characteristics of the domain name system," in IMC '04 Proceedings of the 4th ACM SIGCOMM conference on Internet measurement, Sicily, Italy, 2004.
[7] Global Domain Registry Statistics, http://www.webhosting.info/registries/,
2012.06.15. [8] Domain Name Length Allocation,
World ’s
Longest
Domain
Name,
[10] D. Liu., Y. Chen., K. Xie. and J. Wu, "Research on the Structures and
Resolutions of Internet Namespaces," Journal of Software, vol. 16, no. 8, pp. 1445-1455, 2005.
[11] B. Stockbrand, IPv6 in Practice -- A Unixer's Guide to the Next
Generation Internet, Verlag Berlin Heidelberg: Springer, 2007, pp. 22-29. [12] Google
Public
DNS:
world’s
largest
DNS
service ,
[13] W. Mao.;Y. Wang., F. Wang., "The New Generation Technologies of
Internet Resources Naming and Addressing," Application Research of Computers, vol. 21(4), pp. 233-235,250, 2004.
[14] H. Zhang., X. Deng. and H. Qian., "Analysis of Internationalized Domain
Name System," Journal of Computer Applications, vol. 22(10), pp. 9-11, 2002.
[15] IETF RFC 3492, “Punycode: A Bootstring encoding of Unicode for
IDNA”, http://tools.ietf.org/html/rfc3492, 2012.06.15 [16] ICANN, “New
Generic Top-Level
Domains ”, http://newgtlds.icann.org/en/about, 2012.06.15
[17] NetC,
“New
gTLD ”, http://www.net-chinese.com.tw/new_gtld/new_gtld.asp, 2012.06.15 [18] IANA,
“Repository
of
IDN Practices”,
[19] Tuwang, “Google 一共有多少個(gè)域名”, http://www.tuwang.org/394.html,
2012.06.20
[20] J. Gan. and L. Huang., "The Research on Translating of Domain name and
Practice of Server Configuration," JOURNAL OF YULIN NORMAL UNIVERSITY (Natural Science), vol. 28, no. 5, pp. 136-141, 2007. [21] Z. Liu, L. Liu, R. Hill and Y. Zhan, "Base62x: An alternative approach to
Base64 for non-alphanumeric characters," in Fuzzy Systems and Knowledge Discovery (FSKD), 2011 Eighth International Conference, Shanghai, 2011. [22] 人
民
網(wǎng)
,
“
兩
個(gè)
開(kāi)
心
網(wǎng)
之
爭(zhēng)
”
,
,計(jì)算機(jī)應(yīng)用與軟件
9
--作者簡(jiǎn)介及聯(lián)系方式--
第一作者:劉振興 電話:8610-65363472 手機(jī):139 1190 1921
Email :
作者簡(jiǎn)介:劉振興,人民網(wǎng)研究院網(wǎng)絡(luò)技術(shù)研究員,碩士研究生學(xué)位,主要研究領(lǐng)域?yàn)镮P 網(wǎng)絡(luò)通信協(xié)議、互聯(lián)網(wǎng)后臺(tái)支撐技術(shù)、網(wǎng)絡(luò)安全與架構(gòu)等,在上述領(lǐng)域發(fā)表過(guò)一些中英文論文。
本文研究背景:
This paper makes a deep investigation into the Domain Name System (DNS). DNS is regarded as one of the core and critical infrastructures of Internet. It transfers human-readable names into IP addresses under the networks, and vice versa.
Due to its design of domain names which only allow LDH (letters, digits and hyphen) characters to be used in, the DNS cannot cope with the increasing demand for more domain names arising by more devices are connected to Internet, especially to mobile Internet. Another reason to encourage scholars to look for improvements to the DNS is IP overload in semantics. Some other issues are also found with the DNS, e.g. unique service model, slow update speed and weak capacity in resource description.
Thus, lots of efforts have made to improve the DNS. The list may include IKA (Internet Keyword Addressing), IDN (Internationalized Domain Name), new gTLD, HIP (Host Identity Protocol), PeerNet, URN (Uniform Resource Names) and INS (International Naming System). The second group is from IETF where there is a
long list of RFC amendments for the DNS. More or less, they have matured the DNS in some way or bring new features to it. However, the DNS still has a few issues which hold back the progress of Internet to a certain extent.
This paper proposes a new method to rebuild the DNS with NatureDNS. Natu reDNS comes from “express domain names in natural languages”. It consists of two parts: the design of domain name, and the system of its registration and resolving.
It designates a pattern of “-xxxx” as the new domain name syntax where a domain name must start with a hyphen and except that any other real-meaningful character is allowed in composing a domain name.
NatureDNS employs a similar mechanical lookup system like the DNS where a hyphen root answers all DNS queries and distributes the queries to a hierarchical system to look for the IP addresses mapping with the domain names. It may likely solve most of the DNS issues discussed above.
Furthermore, this paper also introduces a route to deploy NatureDNS with the DNS running in parallel mode. Following the three-step method described in this paper, the DNS could migrate into NatureDNS gradually and smoothly.
The Institute of People Daily Online is a newly-created researching unit in People Daily Online. The Institute is young but it has a luxury academic advisory team which consists of Prof. Wu Jianping from Tsinghua University, Prof. Fang Binxing from Beijing University of Posts and Telecommunications, Prof. Liu Runjie, Fellow of China Academy of Engineering and some other distinguishing experts and scholars.
,10
計(jì)算機(jī)應(yīng)用與軟件
--修改說(shuō)明—
感謝評(píng)審專家對(duì)本論文給予了綜合好評(píng)和一個(gè)不錯(cuò)的評(píng)分,因此才有現(xiàn)在修改和發(fā)表的機(jī)會(huì)。
本論文在CNCC2012征文活動(dòng)中收到的專家評(píng)審意見(jiàn)為:“評(píng)語(yǔ)_1:論文提出了一種基于自然語(yǔ)言的域名解析系統(tǒng),研究很有新意,提出的方案也有一定的可行性。 存在的主要問(wèn)題是沒(méi)有進(jìn)行細(xì)致的性能方面的評(píng)估來(lái)體現(xiàn)大規(guī)模部署后方案的實(shí)際可用性?!?/p>
收到評(píng)審意見(jiàn)后,我們認(rèn)真分析了論文中所提議的設(shè)計(jì)方案,反復(fù)就專家意見(jiàn)中提到的性能方面的評(píng)估問(wèn)題進(jìn)行討論,并征詢?nèi)嗣窬W(wǎng)研究院的其他同事和領(lǐng)導(dǎo)對(duì)此方案性能方面的看法。由于DNS 服務(wù)是一項(xiàng)系統(tǒng)工程,無(wú)法在較短時(shí)間內(nèi)在較封閉的空間以相對(duì)低廉的成本構(gòu)建出來(lái),因此通過(guò)實(shí)驗(yàn)環(huán)節(jié)來(lái)驗(yàn)證和回答專家的疑問(wèn)暫時(shí)不具有可行性。
于是,我們將思路調(diào)整到理論推演上來(lái)論證NatureDNS 與現(xiàn)行DNS 在實(shí)際運(yùn)行中中可能遇到的性能問(wèn)題會(huì)有哪些??jī)烧邇杀葧?huì)有哪些異同。從這一角度出發(fā),經(jīng)過(guò)分析對(duì)比,發(fā)現(xiàn)NatureDNS 運(yùn)行時(shí)的性能問(wèn)題較小,不會(huì)對(duì)方案的推行構(gòu)成障礙。
有鑒于此,我們?cè)谛薷恼撐牡臅r(shí)候增加了一個(gè)節(jié)關(guān)于性能問(wèn)題進(jìn)行評(píng)估的闡述,詳細(xì)內(nèi)容在3.1.(4)“分析比較與評(píng)估”。其主要觀點(diǎn)認(rèn)為,與現(xiàn)行DNS 系統(tǒng)相比,NatureDNS 增加了在客戶端對(duì)字符串進(jìn)行Punycode 轉(zhuǎn)碼,在服務(wù)器端多增加一列存儲(chǔ),這兩個(gè)方面不會(huì)對(duì)實(shí)際運(yùn)行的DNS 輪詢環(huán)節(jié)產(chǎn)生影響。
請(qǐng)?jiān)賹忛?,謝謝。