RSS   



  可打印版本 | 推薦給朋友 | 訂閱主題 | 收藏主題 | 純文字版  


 


 
主題: [Discuz] [討論]論壇由Big5轉UTF-8   字型大小:||| 
ithinkurdumb
開墾隊隊員
等級: 11等級: 11等級: 11等級: 11
(見下圖)

 . 積分: 326
 . 文章: 574
 . 收花: 2842 支
 . 送花: 381 支
 . 比例: 0.13
 . 在線: 495 小時
 . 瀏覽: 4740 頁
 . 註冊: 7245
 . 失蹤: 715
 . Taipei
#1 : 2007-3-17 12:42 PM     全部回覆 引言回覆

I have done this a long long time ago (who uses Big5 now? ) to convert web-bbs systems, but I think there's a better way to do this nowadays. I think this might be faster than the method provided by lch2003 because the coversion is done in the database (not sure though).

We read every row from the database on a Big5 box, and store them into a new database with UTF8 settings (nchar / nvarchar datatype).

I think to move the forum to UTF-8 is a great thing. Cheer Vic!



[如果你喜歡本文章,就按本文章之鮮花~送花給作者吧,你的支持就是別人的動力來源]
本文連接  
檢閱個人資料  發私人訊息  Blog  快速回覆 新增/修改 爬文標記
ithinkurdumb
開墾隊隊員
等級: 11等級: 11等級: 11等級: 11
(見下圖)

 . 積分: 326
 . 文章: 574
 . 收花: 2842 支
 . 送花: 381 支
 . 比例: 0.13
 . 在線: 495 小時
 . 瀏覽: 4740 頁
 . 註冊: 7245
 . 失蹤: 715
 . Taipei
#2 : 2007-3-18 09:47 AM     全部回覆 引言回覆

db裡面應該有很多文章內容是有用Unicode補完計畫這類產生的假日文吧?
這個轉起來就真的麻煩了...
因為好像每種implenment對應的Big5都不一樣?
所以要對照著轉回日文也很麻煩.
其實被移走 (還是補空白?) 也還ok吧?
畢竟數量不多.



[如果你喜歡本文章,就按本文章之鮮花~送花給作者吧,你的支持就是別人的動力來源]
本文連接  
檢閱個人資料  發私人訊息  Blog  快速回覆 新增/修改 爬文標記
ithinkurdumb
開墾隊隊員
等級: 11等級: 11等級: 11等級: 11
(見下圖)

 . 積分: 326
 . 文章: 574
 . 收花: 2842 支
 . 送花: 381 支
 . 比例: 0.13
 . 在線: 495 小時
 . 瀏覽: 4740 頁
 . 註冊: 7245
 . 失蹤: 715
 . Taipei
#3 : 2007-3-19 10:42 PM     全部回覆 引言回覆

Shift-JIS要轉UTF-8是一定沒問題.
我覺得麻煩的還是如何把各種亂七八糟的假日文轉成真日文.
因為像Unicode-at-on和其他的假日文用的Big5又是不同的...



[如果你喜歡本文章,就按本文章之鮮花~送花給作者吧,你的支持就是別人的動力來源]
本文連接  
檢閱個人資料  發私人訊息  Blog  快速回覆 新增/修改 爬文標記

   

快速回覆
表情符號

更多 Smilies

字型大小 : |||      [完成後可按 Ctrl+Enter 發佈]        

溫馨提示:本區開放遊客瀏覽。
選項:
關閉 URL 識別    關閉 表情符號    關閉 Discuz! 代碼    使用個人簽名    接收新回覆信件通知
發表時自動複製內容   [立即複製] (IE only)


 



所在時區為 GMT+8, 現在時間是 2024-11-25 12:18 AM
清除 Cookies - 連絡我們 - TWed2k © 2001-2046 - 純文字版 - 說明
Discuz! 0.1 | Processed in 0.021549 second(s), 7 queries , Qzip disabled