※ 本文轉寄自 ptt.cc, 文章原始頁面
標題

[問題] 關於模型訓練時的影像輸入大小

最新2024-04-30 15:30:00
留言33則留言,4人參與討論
推噓4 ( 4029 )
最近在做些影響辨識的實作想到的一個問題 一般影像辨識網路像是ResNet的架構都有固定的輸入尺寸,常見的影像大小大概就256*256 這種等級的尺寸 但是現今的圖片大小應該不太可能這麼小吧? 如果以真實世界的影像來說,要輸入這類的網路勢必就要做resize的動作 但是將圖片任意resize不是相對的也可能會遺失一些資訊嗎? 如果是1024*1024調整成256*256,這就直接小了16倍欸 一般的貓狗辨識可能不會有太大問題,但如果今天是醫學影像的話,這些遺失資訊搞不好就 是對疾病很重要的特徵 還是說這種情況可以直接把輸入尺寸打掉重練,按照原始架構重新手刻一個網路然後調整每 層的維度以適應新的輸入? 目前有想到另一個方法,使用像Unet那種多尺度的方式來做,不知道這可不可行? 有爬了一些文但好像都沒有看到類似的應用或文章,所以上來請教大家 感謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.82.188.41 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1714054023.A.736.html

33 則留言

chang1248w, 1F
我不知道你有多寬,先假設你胸腔是100cmx50cm的巨無

chang1248w, 2F
霸尺寸好了

chang1248w, 3F
0.1cm的解析度掃出來的圖像也才1000x500而已喔

chang1248w, 4F
比起解析度,患者呼吸或顯影劑的影響更大一些,一般

chang1248w, 5F
比一公分小的腫瘤醫生要認出來就要憑運氣了

chang1248w, 6F
至於模型,主流的大小是384或224,但是上至512或768

chang1248w, 7F
的也大有人在,另外transformer 是不受輸入大小影響

chang1248w, 8F

chang1248w, 9F
受限的只有你的荷包

chang1248w, 10F
文獻的話

chang1248w, 11F

chang1248w, 12F
這篇探討解析度對判症的影響

chang1248w, 13F
如果你說分類任務不夠好啦,那也有做結核病輔助圈選

chang1248w, 14F
啊 野雞刊

chang1248w, 15F

chang1248w, 16F
分類確實有保持在原始尺寸,在512做的傾向

chang1248w, 17F
你與其擔心單張圖片的解析度,不如擔心第三個維度帶

chang1248w, 18F
來的尺寸問題

chang1248w, 19F
這篇survey 做在vit剛問世後幾個月,所以沒有包含相

chang1248w, 20F
關技術

chang1248w, 21F
超高解析度收受的只有高頻紋理和比較小的物件,這部

chang1248w, 22F
分分割比較常出現

chang1248w, 23F
你想找input size free的模型,現在就是transformer

chang1248w, 24F
之前continuous kernel之類的工作多半和他們本身一樣

chang1248w, 25F
冷僻

fragmentwing, 26F
之前也有想過這個問題 但是看到模型裡一大堆的maxpo

fragmentwing, 27F
ol層之後就覺得 應該沒想像中嚴重

fragmentwing, 28F
另外一樓好專業

truehero, 29F
用crop保持元解析度預測,再把每個slice結果組合回來就

truehero, 30F

fragmentwing, 31F
樓上這樣要不要再加一組resize縮小的方便捕捉較大的

fragmentwing, 32F
物體?

wuyiulin, 33F
樓上如果分類任務的話可以做多尺度特徵

retest75 作者的近期文章

[菜單] 30k內 深度學習機(不含顯卡)
已買/未買/已付訂金(元):未買 預算/用途:30k內(不含顯卡) 白機 顯卡已有3090 主要用途就寫寫程式以及練習跑一些深度學習的模型跟做些小實驗,其餘就日常使用 上台電腦是筆電也買蠻久了 想說生日也快到了乾脆升級自己組一台香香白化機當
更多 retest75 作者的文章...