※ 本文轉寄自 ptt.cc, 文章原始頁面
[討論] VGG16和adam
ctrl + y 可以刪除一整行,請將不需要的內容刪除
文章分類提示:
- 問題: 當你想要問問題時,請使用這個類別。
- 討論: 當你自己已經有答案,但是也想聽聽版友意見時。
- 情報: 當你看到消息時,請使用這個類別。
根據板規規定,做適當的轉換,以及摘錄重要文意。
- 心得: 當你自己想要分享經驗時,請使用這個類別。
[關鍵字]:VGG
[重點摘要]:
這是之前版上那篇驗證accuarcy完全沒變的回文,但是因為問題已經解決而且有新疑問所以發新文章並改用討論作為分類
主要想討論的問題是,VGG真的和ADAM處不好?我是在網上看到有人講這件事改用SGD後loss才有在明顯變動
他的說法是ADAM遇到VGG等參數大的模型就會失常,他還說是常識但我是第一次看到QAQ
(板友chang1248w指這是錯誤資訊)
一方面我自己改成SGD後總算是能開始訓練,另一方面卻也看到有人用使用ADAM的VGG去做cifar10
我也有在猜這次的分類任務是二分法這點會不會也有影響
而這次訓練的資訊如下:
pastebin:https://pastebin.com/H3MeGvht
模型:VGG16
目的:參照https://youtu.be/2xMLlm_VDJE,訓練出能區分究竟是不是pizza的神經網路
資料:food-101,其中pizza的部分請參考該影片以剃除被錯誤分進pizza資料集的圖片
這次我使用的是1000張pizza(刪除後不足的用自己寫的爬蟲抓圖片進來補)
而作為對照組的非pizza資料則從food-101的其他食物圖片中各選10張,總計1000張
結果:收斂過程對於valid資料集滿不穩定的,最終大概收在accuracy 81~82%
設定的收斂條件為當valid_loss不再下降5次時學習率*0.2,不再下降超過10次停止
loss: https://imgur.com/yBcU0G3
accuracy: https://imgur.com/e6w1xM4
precision: https://imgur.com/Xmd8fdA
--
https://i.imgur.com/h4Q0F04.jpg
9月23日 發生大事了
因為就在這天,加藤惠誕生了
https://i.imgur.com/H3RhXfJ.jpg
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.77.97.142 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1682761290.A.175.html
28 則留言
fragmentwing 作者的近期文章
[問題] torch的backward是怎麼管理的?
考慮一個類似STN(Spatial Transform Network)搭配一個用上CNN層的Classfier的架構 只是STN這次是靠不同於Classifier,獨立的loss function去評價並產生loss餵給STN自己 這樣的
Re: [問題] 新手每次跑模型時都是CPU滿載
※ 引述《matrixx (matrix)》之銘言: : 各位前輩好 小弟是程式(機器學習)新手 : 我在用vs code 跑程式中的模型時都會非常卡 : 開了工作管理員才發現都是CPU滿載 : 想讓vs code用gpu幫忙跑模型 : 但
[問題] 圖片形變相關的模型?
如題 在想是不是有對同一地點航空照進行矯正的現成模型 比如說要研究地層下陷或地形變化 但又不能保證這次和上次拍的照片角度和光線一樣 所以在做比較前要先用之前的照片當基準做照片的修復 不知道有沒有這種模型 先謝謝各位先進了
→
推
推
→
→
→
→
→
→
→
→
→
→
→
→
→
→
→
→
→
→
→
→
→
推
推
→
推