敏感詞過濾 面試遇難題,問:游戲中的敏感詞過濾是如何實現(xiàn)的,該怎么回答?
面試遇難題,問:游戲中的敏感詞過濾是如何實現(xiàn)的,該怎么回答?你好,你應(yīng)該像我一樣是個程序員。涉及Java和web。有一個replace()方法,后跟兩個參數(shù),用于“set and replace”和用
面試遇難題,問:游戲中的敏感詞過濾是如何實現(xiàn)的,該怎么回答?
你好,你應(yīng)該像我一樣是個程序員。涉及Java和web。有一個replace()方法,后跟兩個參數(shù),用于“set and replace”和用“*”替換一些“敏感詞”。具體技術(shù)可以關(guān)注我,我?guī)闳W(xué)技術(shù)!@很難找到新的高質(zhì)量數(shù)據(jù)。關(guān)注它們并重新發(fā)布它們是不好的
首先,為敏感詞建立一個同義詞庫。它可以是XML或DB存儲。其次,對頁面信息進行抓取,并用敏感詞進行過濾。(如果你想人性化,你需要一個語義庫來進行分詞檢索)同樣,你可以在抓取頁面時得到頁面的最后修改時間和大小,并保存在dB中。最后,再次爬網(wǎng)時,比較“上次修改”和“頁面內(nèi)容”以確定頁面是否已被修改。(頁面大小和修改時間可以通過獲取頁面頭文件信息獲得)1000萬和1億之間沒有差別。通過服務(wù)器組件壓力計算,測試單個服務(wù)器的軟硬件性能,合理配置軟硬件。