引用:
x13寫到:
但是一牽扯到中文這真的很痛
我前兩天為了轉一支23mb的.sql檔案
從舊資料庫系統dump出來的
character_set是latin1
但是我確定裡面是中文內容
而我想把它轉成utf8
如果事情有 iconv -f big5 -t utf-8 xxxxx.sql > xxxxxutf8.sql 這麼簡單就好了
我osx裡面的所有文字編輯器都拿出來crash過一輪,甚至macvim也當掉了,真的很糗
這時候我就好羨慕windows上面的notepad++ 或 MADEDIT
開檔快,中文支援佳,轉碼方便
這種東西我以前都用 php 寫個小程式去轉.
先抓前幾行出來,秀在網頁上看看 source 編碼設得對不對.
然後每次抓幾百行出來轉,while loop 轉到完,記憶體都用不到幾 k...
而且資料庫的裡面,一定摻雜很多非標準 big5、甚至 big5-hkscs 以外的東西
當初網路上的 unicode 補完計畫顧前不顧後,留一堆坑讓後人跳
Mac 上所有的編輯器,一遇上這種字元就死..
還好 php iconv 也有 //IGNORE 可以 skip 這些莫名其妙的文字.