※ 本文轉寄自 ptt.cc, 文章原始頁面
看板Soft_Job
標題

[請益] 備份網站的技術?

時間
最新2022-02-09 12:49:00
留言74則留言,49人參與討論
推噓27 ( 28145 )
花了很多P幣,跟時間再研究google跟備份網站 備份網站不是用多線程爬蟲技術嗎? 但是好像發現了,沒有這麼簡單 好像每個版,測試過,被備份的方式不同.... 說簡單,但也不簡單 這類網站所依賴的技術,其實滿簡單的 但是PTT只要發文權限跟方式不改,永遠都一定會被備份 發文的那個瞬間,因為很多地方不能改變,只能發文後再改 所以,第一次的文章標題,還有發文者一定會被紀錄 本文可以修改,所以必須等第二次才能解決 想問一下,PTT備份網站,像是PTTWEB 所仰賴的技術..... 謝謝! 損失好多P幣跟時間,血淚,才得到這種結論..... 人腦真的比不上電腦QQ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.137.62.1 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1633743659.A.19F.html

74 則留言

gasbomb, 1F
……有人看得懂這篇嗎?

yinxuanh, 2F
伸手文啊

loadingN, 3F
為什麼會損失p幣

Raymond0710, 4F

PttLite, 5F
看標題進來因為是DB backup或snapshot結果是爬蟲...我快

PttLite, 6F
跟不上時代了..

qrtt1, 7F
看不懂想要幹麻

wahaha279, 8F
看不懂在說什麼

yougigun, 9F
我也跟不上你的腦

brianhsu, 10F
請先閱讀「提問的智慧」,謝謝。

chocopie, 11F
先定義你要備份的內容是甚麼。

chocopie, 12F
是原本的內容一模一樣?還是只爬文章文字內容?

JimRoid, 13F
看標題我以為你是要問快照之類的

utdsml, 14F
原 po 應該是想問備份 PTT 裡面所有發推文紀錄的網站

moom50302, 15F
ctrl+S…?

eduishappy, 16F
我覺得PTT備份文章的網站真的好厲害喔!全都可以記錄

stupid0319, 17F
偷取別人網站內容叫備份¿¿¿

geroge0820, 18F
這就是工程師和客戶之間的思維差異

kyoe, 19F
只要格式固定,都可以被解析

flypaper, 20F
我程度太差看不懂 QQ

roccqqck, 21F
爬蟲作業自己寫欸 本來每個網站爬蟲都不一樣

roccqqck, 22F
都要修改

Olwen, 23F
明明是中文,我確聽不懂

PttLite, 24F
要用眼看

ChungLi5566, 25F
看不懂的都沒有成為PM的資質

ChungLi5566, 26F
客戶說的備份 要跟工程師說逆向工程才聽得懂

wave1et, 27F
ptt有個allpost版吧

PttLite, 28F
為什麼要對自己的網站做逆向工程

RINPE, 29F
沒有什麼是複製貼上解決不了的

sniper2824, 30F
2012做到現在發文發問還像完全不懂程式的外行著實厲害

bill0205, 31F
對不起我還真的看不懂

aidansky0989, 32F
這個表達能力不愧是工程師

OrzOGC, 33F
我看得懂,有人可以撿我去當PM嗎?QQ

viper9709, 34F
看不懂想問什麼+1

pilor, 35F
我看得懂中文看不懂這篇文

boy70263, 36F
Ctrl+A+C+P

ChungLi5566, 37F
偷別人網站內容 然後做出相似的東西放出來 他想知道

ChungLi5566, 38F
那些網站怎麼辦到的

wulouise, 39F
沒講解決要解決什麼,一百遍都猜不透吧

mathrew, 65F
不是你要砍就砍

Apache, 66F
你可以用GDPR去要求刪除

TakiDog, 67F
支離破碎的發言

realbout, 68F
這篇是三小....

andrew5106, 69F
啊不就爬蟲

andrew5106, 70F
之前試過在文章開頭加個HTML註解,有些備份網站就抓不

andrew5106, 71F
到內文

andrew5106, 72F
嘗試更改你的內文阿,或是故意加一些語法讓爬蟲程式錯

andrew5106, 73F
亂認不出來

andrew5106, 74F
爬蟲只能抓固定Pattern的東西吧

uglykidjoe, 75F
怎麼這麼多會通靈的人,真是太厲害了

cathychg, 76F
程式碼,資料庫 系統環境安裝啊

cathychg, 77F
資料庫比較麻煩 動態客戶資料要利用閒置時間備份。否則

cathychg, 78F
資料會漏的