引用:
badcat寫到:
缺點 3:無法搜尋少於 3 個字元的檔案,因為英文才26個字母,且需搭配子母音,所以 3 個字元算合理 (重複機率才不會很高,以減輕搜尋負擔。Ex: Cat, Dog)。但對非英語系的國家很需要啊!請至少限定 2 個字元吧! (Ex: 張宇、游泳、阿妹、...)
最好是能針對使用「Unicode 的字元集」可限定一個字元就能搜尋。(Ex: 非英語的多國語系) 因為像中文的常用字最少就有 6000 多個字,會重複到的機會不會很大,且可搭配下列「夢想範例 2」的情況,的確有可能需要一個字元的搜尋情況。(2007-10-14 二增修)
關於缺點3的部份, AndCycle 兄在 KadGetWords 網頁裡有提到...
引用:
只接受三個byte以上的詞, 以utf-8編碼為準(中文一個字在utf-8下編碼就有3bytes, 一般英數及半形符號一個1byte)
所以我試著只用 張宇、游泳 做關鍵字去搜尋,結果是可以搜尋的.