RSS   



  可打印版本 | 推薦給朋友 | 訂閱主題 | 收藏主題 | 純文字版  


 


 
主題: [求助] [求助]尋找能將 "網頁資料"轉成 "EXECL的 TXT 格式" 的軟體   字型大小:||| 
quickcccc
鐵驢友〔初級〕
等級: 4


 . 積分: 35
 . 文章: 223
 . 收花: 270 支
 . 送花: 159 支
 . 比例: 0.59
 . 在線: 733 小時
 . 瀏覽: 780 頁
 . 註冊: 6778
 . 失蹤: 59
#1 : 2006-9-3 12:19 AM     全部回覆 引言回覆

您好
我想找一種能夠將  "網頁資料" 轉換成 "EXECL格式" 或者  轉換成  "EXECL匯出的.txt 格式" 軟體

小弟手邊有 3500 多個網頁檔案 (html)
想把檔案裡面的"表格內的資料" 抽取出來
也就是不要有那些網頁標籤 <table>,<td> .... 之類的
只要把表格儲存格的內容抽取出來
原先我是一個檔案, 一個檔案用 EXCEl 開然後再匯出成 .txt 檔 ( 主要是要匯成 txt 檔)
但是實在太多了
而且速度很慢

===

謝謝 ~

[quickcccc 在  2006-9-3 12:22 AM 作了最後編輯]



[如果你喜歡本文章,就按本文章之鮮花~送花給作者吧,你的支持就是別人的動力來源]
本文連接  
檢閱個人資料  發私人訊息  Blog  快速回覆 新增/修改 爬文標記
quickcccc
鐵驢友〔初級〕
等級: 4


 . 積分: 35
 . 文章: 223
 . 收花: 270 支
 . 送花: 159 支
 . 比例: 0.59
 . 在線: 733 小時
 . 瀏覽: 780 頁
 . 註冊: 6778
 . 失蹤: 59
#2 : 2006-9-3 02:21 PM     全部回覆 引言回覆


引用:
wugen寫到:
如果最終目的是TXT檔的話, 應由html直接轉檔比較方便.  要由Excel輸出的TXT檔, 大概指的是CSV或是TSV的格式吧?

原則上您說的沒錯
但是我的 html 直接檔轉成 txt 檔時   
會出現沒斷行的情形
全部連在一行
所以必須先轉成 EXCEL 再轉成 txt
因為 EXCEL 強 , 他知道哪裡要斷行



[如果你喜歡本文章,就按本文章之鮮花~送花給作者吧,你的支持就是別人的動力來源]
本文連接  
檢閱個人資料  發私人訊息  Blog  快速回覆 新增/修改 爬文標記
quickcccc
鐵驢友〔初級〕
等級: 4


 . 積分: 35
 . 文章: 223
 . 收花: 270 支
 . 送花: 159 支
 . 比例: 0.59
 . 在線: 733 小時
 . 瀏覽: 780 頁
 . 註冊: 6778
 . 失蹤: 59
#3 : 2006-9-9 02:25 PM     全部回覆 引言回覆


引用:

如果是問有哪些軟體可以做到某項功能, 那還算是軟體求助區的問題,
但一提到要人供檔, 那就變成求檔區的問題了...

瞭解



[如果你喜歡本文章,就按本文章之鮮花~送花給作者吧,你的支持就是別人的動力來源]
本文連接  
檢閱個人資料  發私人訊息  Blog  快速回覆 新增/修改 爬文標記
quickcccc
鐵驢友〔初級〕
等級: 4


 . 積分: 35
 . 文章: 223
 . 收花: 270 支
 . 送花: 159 支
 . 比例: 0.59
 . 在線: 733 小時
 . 瀏覽: 780 頁
 . 註冊: 6778
 . 失蹤: 59
#4 : 2006-9-9 02:25 PM     全部回覆 引言回覆


引用:
wugen寫到:
試試這個免費的程式:

http://www.nirsoft.net/utils/htmlastext.html

對於table有多種轉法, 也可以一次轉多檔.  但是因為是整個html檔全轉, 你可能還是要去修改txt檔, 但是和Excel比大概還是快了不少

謝謝
送花一隻
超好用

[quickcccc 在  2006-9-9 03:57 PM 作了最後編輯]



[如果你喜歡本文章,就按本文章之鮮花~送花給作者吧,你的支持就是別人的動力來源]
本文連接  
檢閱個人資料  發私人訊息  Blog  快速回覆 新增/修改 爬文標記

   

快速回覆
表情符號

更多 Smilies

字型大小 : |||      [完成後可按 Ctrl+Enter 發佈]        

溫馨提示:本區開放遊客瀏覽。
選項:
關閉 URL 識別    關閉 表情符號    關閉 Discuz! 代碼    使用個人簽名    接收新回覆信件通知
發表時自動複製內容   [立即複製] (IE only)


 



所在時區為 GMT+8, 現在時間是 2024-9-29 04:54 AM
清除 Cookies - 連絡我們 - TWed2k © 2001-2046 - 純文字版 - 說明
Discuz! 0.1 | Processed in 1.736534 second(s), 7 queries , Qzip disabled