※ 本文轉寄自 ptt.cc, 文章原始頁面
[討論] 關於 Dcard ML 實習作業
看到下面有篇大神有討論到這次 Dcard ML 實習作業,因為沒有收到團隊的具體反饋
想和大家討論作業的狀況
題目是用結構資料,包含標題、看板資訊以及1-6小時的愛心數和評論數等等
來預測發文後 24 小時的愛心數
因為當時是期中,我只大概花了五天約二十個小時來做
我的作法大致如下
首先先用 XGBoost LightGBM 把量化資料做出 baseline
但沒辦法處理最重要的標題資訊
所以就直接拿 Huggingface BERT 來做
直接把資料餵進去的訓練是無法收斂的
後來也嘗試一些 Emsemble 和 training tricks
但也都沒辦法收斂,甚至達不到 baseline 的效果
認為是資料量的問題
到這邊沒什麼特別想法就直接寫報告了
我一直都主要是做 CV ,碩論跑去做 3D
對 NLP 非常不熟悉,不知道是否有漏掉關鍵操作
想請同有拿到作業的大神指點
謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.171.131.209 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1683998999.A.DBB.html
Re: 回文串
1349
> [討論] 關於 Dcard ML 實習作業
Soft_Job05/14 01:29
739
Re: [討論] 關於 Dcard ML 實習作業
Soft_Job05/15 21:35
49 則留言
Sixigma 作者的近期文章
34Stock
Re: [新聞] 美監管機構調查:特斯拉自駕系統存在「好了啦 cost down 星人 都 2024 年了還不承認純視覺不足以滿足自駕功能 明明所有的電腦視覺的論文和資料集和 benchmark 無論在 3D Object Detection 或是 Planning 都是融合方案屌打 前者有用
12Stock
Re: [新聞] 台股慘到破紀錄 收盤重挫774.08點 創史上: 台積電法說會未釋出利多,即使台積電強調今年自身營運健康成長,營收年增21%至26%的 : 目標不變,並看好AI的營收貢獻比提升,但台積電法說會下修今年全球半導體、全球晶圓 : 代工,以及全球車用市場等三大領域的展望,震撼市場。 : 加上
90Stock
[新聞] 台積電獲拜登政府「116億美元補助」! 原文標題: 台積電獲拜登政府「116億美元補助」!將在亞利桑那州蓋第三廠 原文連結: https://www.ettoday.net/news/20240408/2715562.htm 發布時間: 2024年04月08日 17:28 記者署
19Stock
Re: [新聞] 謝金河指蘋果好日子不多了 全因庫克我不同意蘋果估值過低,基本上它面臨的問題和特斯拉簡直一模一樣 投資人覺得特斯拉不應該只是一間電動車公司,就像蘋果也不應該只是手機公司 特斯拉深陷中國價格戰泥潦,蘋果又何嘗不是 華為這兩年突然崛起,可能是多年鉅額補貼發揮效果 從問界到麒麟 9
15Stock
Re: [標的] 特斯拉 多看了仰望 u8 後覺得現在跟中國車廠拚自駕技術是很不划算的 仰望 u8 那個根本是小測繪車等級的用料 3 LIDAR, 5 mmwave radars, 14 sonar radars, 16 camera 雖然我們無從得知他各項裝置的精度
33Stock
Re: [新聞] 日媒揭中GDP造假 籲投資人快逃我是真的好奇,可能總經知識貧乏 一個依靠推動內需和基礎建設、依靠大開槓桿推動經濟成長的國家 在內債大增、投資信心不足 以及股債房匯全部崩跌 (資產崩盤,高槓桿最怕) 導致通貨緊縮(消費信心不足) 的同時 出口總額不增不減 GDP 成長 5.
推
推
推
推
→
→
推
→
→
→
→
→
→
→
→
→
→
→
→
→
推
→
→
→
→
→
推
→
→
→
推
→
→
→
→
噓
推
推
推
→
→
→
推
→
→
推
→
→
推