※ 本文轉寄自 ptt.cc, 文章原始頁面

標題

[問題] 關於模型訓練時的影像輸入大小

時間2024-04-25 22:07:01

最新2024-04-30 15:30:00

留言33則留言，4人參與討論

推噓4 ( 4推0噓29→ )

最近在做些影響辨識的實作想到的一個問題一般影像辨識網路像是ResNet的架構都有固定的輸入尺寸，常見的影像大小大概就256*256 這種等級的尺寸但是現今的圖片大小應該不太可能這麼小吧？如果以真實世界的影像來說，要輸入這類的網路勢必就要做resize的動作但是將圖片任意resize不是相對的也可能會遺失一些資訊嗎？如果是1024*1024調整成256*256，這就直接小了16倍欸一般的貓狗辨識可能不會有太大問題，但如果今天是醫學影像的話，這些遺失資訊搞不好就是對疾病很重要的特徵還是說這種情況可以直接把輸入尺寸打掉重練，按照原始架構重新手刻一個網路然後調整每層的維度以適應新的輸入？目前有想到另一個方法，使用像Unet那種多尺度的方式來做，不知道這可不可行？有爬了一些文但好像都沒有看到類似的應用或文章，所以上來請教大家感謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.82.188.41 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1714054023.A.736.html

33 則留言

推

chang1248w04/26 02:12, 1F

我不知道你有多寬，先假設你胸腔是100cmx50cm的巨無

→

chang1248w04/26 02:12, 2F

霸尺寸好了

→

chang1248w04/26 02:15, 3F

0.1cm的解析度掃出來的圖像也才1000x500而已喔

→

chang1248w04/26 02:21, 4F

比起解析度，患者呼吸或顯影劑的影響更大一些，一般

→

chang1248w04/26 02:21, 5F

比一公分小的腫瘤醫生要認出來就要憑運氣了

→

chang1248w04/26 02:26, 6F

至於模型，主流的大小是384或224，但是上至512或768

→

chang1248w04/26 02:26, 7F

的也大有人在，另外transformer 是不受輸入大小影響

→

chang1248w04/26 02:26, 8F

的

→

chang1248w04/26 02:27, 9F

受限的只有你的荷包

→

chang1248w04/26 02:46, 10F

文獻的話

→

chang1248w04/26 02:46, 11F

https://bit.ly/3wk16Qe

→

chang1248w04/26 02:46, 12F

這篇探討解析度對判症的影響

→

chang1248w04/26 02:50, 13F

如果你說分類任務不夠好啦，那也有做結核病輔助圈選

→

chang1248w04/26 02:55, 14F

啊野雞刊

推

chang1248w04/26 03:04, 15F

https://bit.ly/3w8UsfL

→

chang1248w04/26 03:10, 16F

分類確實有保持在原始尺寸，在512做的傾向

→

chang1248w04/26 03:12, 17F

你與其擔心單張圖片的解析度，不如擔心第三個維度帶

→

chang1248w04/26 03:12, 18F

來的尺寸問題

→

chang1248w04/26 03:14, 19F

這篇survey 做在vit剛問世後幾個月，所以沒有包含相

→

chang1248w04/26 03:14, 20F

關技術

→

chang1248w04/26 03:26, 21F

超高解析度收受的只有高頻紋理和比較小的物件，這部

→

chang1248w04/26 03:26, 22F

分分割比較常出現

→

chang1248w04/26 03:29, 23F

你想找input size free的模型，現在就是transformer

→

chang1248w04/26 03:29, 24F

之前continuous kernel之類的工作多半和他們本身一樣

→

chang1248w04/26 03:29, 25F

冷僻

推

fragmentwing04/26 15:14, 26F

之前也有想過這個問題但是看到模型裡一大堆的maxpo

→

fragmentwing04/26 15:14, 27F

ol層之後就覺得應該沒想像中嚴重

→

fragmentwing04/26 15:15, 28F

另外一樓好專業

→

truehero04/28 07:50, 29F

用crop保持元解析度預測，再把每個slice結果組合回來就

→

truehero04/28 07:50, 30F

好

推

fragmentwing04/28 18:36, 31F

樓上這樣要不要再加一組resize縮小的方便捕捉較大的

→

fragmentwing04/28 18:36, 32F

物體？

→

wuyiulin04/30 15:30, 33F

樓上如果分類任務的話可以做多尺度特徵

retest75 作者的近期文章

1Gossiping

Re: [問卦] Tiny跑去日本拍AV了！！

已買/未買/已付訂金（元）：未買預算/用途：30k內(不含顯卡) 白機顯卡已有3090 主要用途就寫寫程式以及練習跑一些深度學習的模型跟做些小實驗，其餘就日常使用上台電腦是筆電也買蠻久了想說生日也快到了乾脆升級自己組一台香香白化機當

更多 retest75 作者的文章...