※ 本文轉寄自 ptt.cc, 文章原始頁面
看板Soft_Job
標題

Re: [請益] 想從零開始轉行當AI軟體工程師

時間
最新2021-12-09 12:39:00
留言173則留言,51人參與討論
推噓51 ( 532118 )
來用自己的例子勸退一些想跳機器學習的人 首先是數學程度, 我是數學系的,什麼線代,微積分,機率,統計的都很熟其實工作也會用到, 描述一些比較有印象的工作用過的數學, 比較有趣關於微積分的經驗: 老闆把問題用一個式子 exp(-rx)*((1/delta)*sqrt(A))*exp(-x^2/(A))來解釋, 並要對x積整個實數範圍。 在場大家都面面相覷我就被要求積了。 但這其實不難積,就高斯積分,有背整理一下秒解, 沒背也不難推。我大學微積分沒在背的所以是當場直接推,然後才繼續那場會議。 機率統計就那些常見的像是: 在一堆數據中給一些想法假設然後檢定, 或是想辦法對一直變動pattern的資料去建對應的機率模型。 但我具體數學程度到哪,舉兩個例子一個是深度學習WGAN一個是經典的random forest。 https://arxiv.org/pdf/1701.07875.pdf 這是WGAN。 https://link.springer.com/article/10.1023/A:1010933404324 這是RF。 基本上裡面的純數推導我幾乎都理解, WGAN用到實分析跟線性規劃, RF則是機率。 以上大概描述一下我的數學程度。 接著是我的電腦技能, 我熟悉的語言有C++跟PYTHON,基本上各有兩年以上的工作實務經驗。 python就絕大部份公司機器學習用的語言不解釋。 C++曾被公司要求所有演算法都要自己刻,這之中還包刮神經網路, 連 backpropagation 都要自己刻, 然後資料結構演算法,計算機組織,作業系統都讀過。 至於程度到哪我也不好說,我自知去參加程式比賽會被電死,但基本程度應該是有。 資料結構的程度至少是在刷題的時候不會卡在"天啊這個是什麼資料結構", 跟曾經在工作被要求刻了一個紅黑樹,雖然我現在忘了而且skip list太好用。 演算法就刷題的時候不會無止境一直設條件, 會嘗試用一些演算法想法比如 divide and conquer or dp 來解題。 計組作業系統就是那些什麼cpu pipeline 記憶體管理緩存設計都懂。 資料庫則是公司用什麼我就學什麼。 機器學習的部分就是幾乎現在大家喊得出名字的我都可以實作, 有要證明的模型我都可以證明,不過需要回憶準備一下哈哈因為模型太多沒全記。 大致用書來表示一下我懂得大概範圍好了。 https://www.deeplearningbook.org/ deep learning 的經典不解釋。 http://www.cs.cmu.edu/~tom/mlbook.html machine learning 也算經典但很老的一本了。 https://www.tenlong.com.tw/products/9787302275954 各種經典的機器學習模型的推導書,雖然這個作者幾乎只是翻譯論文,但翻的還滿好的。 新技術太多我就不提了我都有在追。 以上大致描述一下我的程度,目前的結果是我近半年完全找不到工作XD 不管國內國外,丟履歷都沒回覆,基本上連面試機會都沒有。 搞得現在只能送foodpanda, 真的是能力不足阿... 希望這慘痛的經歷能拯救還想再跳AI的人阿。 ================================================== 發現太多人執著實作的部分,其實要求手刻的只有一家公司,雖然我也在那邊做很久 除了那間公司其他的我也是用包啦,Tensorflow,cntk 之類的都會用。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.137.88.3 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1636524507.A.D68.html

173 則留言

※ 編輯: stmilk (223.137.88.3 臺灣), 11/10/2021 14:12:47
※ 編輯: stmilk (223.137.88.3 臺灣), 11/10/2021 14:23:19

jobintan, 1F
大佬可以考慮下轉SDE了………………………………………

billchen123, 2F
祝原PO找到工作

longlyeagle, 3F
是不是CV寫太爛了?
問過獵頭獵頭說還行,所以我也不知道哈哈哈

qwe70302, 4F
比起外送,不如先找個web後端蹲一下,雖然月薪七八萬可

qwe70302, 5F
能比不上資料處理十幾萬~
對阿所以我現在在補 distribution system 的東西了哈哈哈看能不能去撈個資料庫相關的?
※ 編輯: stmilk (223.137.88.3 臺灣), 11/10/2021 14:31:53

j0958322080, 6F
那個積分做配方後還是高司積分,不過面面相覷也太慘
對阿,更有趣的是其中一個人的同職務薪水還是我的三倍....
※ 編輯: stmilk (223.137.88.3 臺灣), 11/10/2021 14:42:43

devilkool, 7F
咦...原本的公司是倒了嗎?
想去國外,還有存款就辭了唸英文跟丟履歷,然後國外都沒回覆, 改丟國內的國內也都沒回覆,慘
※ 編輯: stmilk (223.137.88.3 臺灣), 11/10/2021 14:54:17

GameGyu, 8F
比較好奇 你台灣投那些公司?

stmilk, 9F
沒有只投百萬的啦,雖然我最後一份工作是有破百

stmilk, 10F
基本上看到覺得符合就丟了

empliu, 11F
冒昧問一下原po學歷?

empliu, 12F
據我所了解的台灣有招比較多AI的 內部幾乎都是台清交

stmilk, 13F
只有數學學士還不是四大哈哈,所以上述的東西全部都是自修

DrTech, 14F
不懷疑能力,但方法很沒效率吧,手刻技術演算法或數學很厲

DrTech, 15F
害,實務上根本沒必要。

empliu, 16F
或者有相關會議 publication
對阿,我最後一間就是被推薦去面試的,一面試就上了。但我之前自己丟根本也沒鳥我XD

DrTech, 17F
而且實務上,你數學再強也輸給爛資料。
你說的沒錯XD但是主要還是看你怎麼處理,再爛都有辦法處理, 爛的資料神經網路無法處理因為神經網路是強逼近,就垃圾進垃圾出 但數學反倒可以找到很好的方向, 比如說我處理過那種雜訊很多就算了,哪些是雜訊還都不知道的數據。 方法就把資料換個方便我弄成隨機過程的樣子, 然後抽特徵的時候隨機,根據大數法則我可以期待他會逼近一個我要的值, 且也可以淡化雜訊的影響畢竟是隨機取,最終效果很好這樣
※ 編輯: stmilk (223.137.88.3 臺灣), 11/10/2021 15:16:24

isaacting, 18F
要自己刻bp?! 是在gpu上實作嗎

isaacting, 19F
如果是要在cpu上刻BP, 為何不用現成library ?!
我怎麼知道XD 是公司要求阿

DrTech, 20F
"要證明的模型我都可以證明,不過需要回憶準備一下",這句

DrTech, 21F
話看起來很強,實際上面試大廠也是不合格的。

DrTech, 22F
李航那本書很多人在背喔,某些職缺的基本功而已。
其實我不想跟你爭辯這個啦.... 我只是想表示這麼基本的東西我都有公司也是不要阿 真的要說的話不然你試著準備一下那個WGAN的中為什麼Wasserstein比原本的GAN的cost function 還要好的證明然後試試?

stmilk, 23F
痾.....我沒說這些東西很難啊= =
※ 編輯: stmilk (223.137.88.3 臺灣), 11/10/2021 15:22:36

DrTech, 24F
原文這種做法,真的不如好好學 TF或 keras範例,還比較好

DrTech, 25F
找工作。

empliu, 26F
D的意思不是這些東西難易度的問題

empliu, 27F
是在跟你說面試就是不太能有"回憶準備一下"這種情況

DrTech, 28F
這跟能力無關而是市場選擇問題。

empliu, 29F
面試當下我也只能根據你講出來的東西去判斷

empliu, 30F
所以你如果當場表現不太流暢熟練的話對我來說就是負面訊號

empliu, 31F
這就跟考試一樣 我真的都會阿 只是考試時間不夠

empliu, 32F
或者太久沒用忘記 這樣還是沒分
我說的要準備的當然不是面試時,我到恨不得面試時他們都問我這些推導問題咧 最好還要問李航那本書沒有的,像是PCA為什麼是用特徵值,還有上面說的RF為什麼可行 L1 L2 為什麼會有那些效果怎麼用數學分析,BLABLABLA的 哀我真的只是想勸退還想進AI的人啦 這個東西真的水很深而且缺很少啦

DrTech, 33F
非懷疑我原文能力,只是原文選擇的技術展示方式,是台灣工

DrTech, 34F
作的小量市場。
※ 編輯: stmilk (223.137.88.3 臺灣), 11/10/2021 15:37:11

yoshonabee, 35F
感覺可以找想進的公司,然後去LinkedIn找員工內推,

yoshonabee, 36F
這樣到面試關的機會應該會大一點

stmilk, 37F
疑這招我沒想過耶,我來試試感謝你~~

DiscreteMath, 38F
完全可以理解手刻c++甚至bp的需求xD

DiscreteMath, 39F
其實現有套件很多c++ backend還是太慢 尤其只能用cp