正則匹配固定漢字 如何用正則表達(dá)式提取字符串中的漢字?
如何用正則表達(dá)式提取字符串中的漢字?Python re正則匹配中文其實(shí)很簡單。您可以將中文Unicode字符串轉(zhuǎn)換為UTF-8格式,然后可以隨意調(diào)用Unicode中的中文編碼為/u4e00-/u9fa
如何用正則表達(dá)式提取字符串中的漢字?
Python re正則匹配中文其實(shí)很簡單。您可以將中文Unicode字符串轉(zhuǎn)換為UTF-8格式,然后可以隨意調(diào)用Unicode中的中文編碼為/u4e00-/u9fa5。因此,正則表達(dá)式U“[-龥]”可以表示一個(gè)或多個(gè)漢字>>>>> import re>>> S=“Chinese:123456aa ha BBCC”。解碼(“utf8”)>>> Su“-中文:123456aa哈哈BBCC”>>>打印s中文:123456aa哈哈BBCC>>>重新匹配(U“[(I-龥]”,s)<Usre.sre匹配對象位于0xb77742c0>>> pat=“Chinese”。解碼(“utf8”)>>>檢索(帕特,s)<usre.sreMatch object at 0x16a16df0>>>>> newpat=“這里是中文內(nèi)容”。解碼(“utf8”)>>>新聞=回復(fù)sub(pat,newpat,s)>>>打印新聞