※ 本文轉寄自 ptt.cc, 文章原始頁面
看板Gossiping
作者perceval
標題

Re: [爆卦] Redmango已經卸任

時間
留言61則留言,20人參與討論
推噓15 ( 16144 )
※ 引述《pponywong (pony)》之銘言: : 這篇吵到現在 稍微給大家科普一下 : 要怎麼做人工AI篩選演算法 : 要把大量數據歸納成 簡單的指標 有幾個方法 : 一個是 PCA (principal component analysis) 主成分分析 : 一個是 FA (factor analysis) 因素分析 : 兩個方法很類似 一個是歸納(PCA) 一個是推導(FA) : PCA 數學上來講就是 找出資料(關聯矩陣)的本徵值 本徵向量(eigenvalue, eigenvector) 對AI不熟,不過你講的內容應該只是資料分析 還是你指的是人工(Manual) AI(Artificial Intelligence)? 另外eigenvalue我們一般翻譯成特徵值 基本上如果要用AI來抓網軍 除了用爬蟲程式把ptt的文抓下來分析特徵(關鍵字,推發文時間等等) 標記(label)發推文特徵,還有紀錄登入ip、時間等等外 還有一個很重要的工作: 標註網軍(或是疑似網軍) 抓文爬蟲可以用程式,但是 標記(label)文章特徵則需要人去閱讀標記 不是少數一兩個人可以完成的工作 另一方面,如果是用檢查登入ip時間來找網軍作為訓練data還好 如果紅芒果是用人工來選出網軍(或是疑似網軍)的訓練data 那他們訓練出來的AI也不過是紅芒果二號罷了 -- The whole problem with the world is that fools and fanatics are always so certain of themselves, but wiser people so full of doubts. – Bertrand Russell -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.116.21.9 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1568805388.A.466.html

61 則留言

RD5566, 1F
有疑問怎麼不自己做一隻來掃114.136.172.122

lavarslaker, 2F
就是人工標記啊101.9.227.158

lavarslaker, 3F
factor analysis的分群定義是人為的101.9.227.158

yjjia, 4F
我們做不到阿,紅芒果用的事什麼黑科技?36.234.27.106

yjjia, 5F
開放程式碼讓高手檢定一下阿36.234.27.106

squallhung, 6F
工人演算法,真人工、智慧223.136.70.27

lavarslaker, 7F
資料分析只是分群 但群的命名時人工101.9.227.158

lavarslaker, 8F
101.9.227.158

eterbless, 9F
標記也自動化就好 只有一開始要人工分59.120.184.171

eterbless, 10F
析出幾個確定異常的ID然後以這些ID為種59.120.184.171

coffee112, 11F
另一邊是科技被耽誤了二十年嗎?=_=27.242.35.9

eterbless, 12F
子找出有相同特徵的一整串出來59.120.184.171

lavarslaker, 13F
標記都是事後的 PCA FA只能進行分群101.9.227.158

tony121010, 14F
他又不是真的要抓,只是當作鬥爭工具36.225.76.30

lavarslaker, 15F
事後針對群的特質再下分組101.9.227.158

tony121010, 16F
當然要訓練紅芒果二號,不然抓到自己36.225.76.30

yjjia, 17F
沒辦法解釋相同條件為什麼我標誌它沒有標誌36.234.27.106

tony121010, 18F
人怎麼玩36.225.76.30

lavarslaker, 19F
命名群也沒有一定標準101.9.227.158

lavarslaker, 20F
不同人去命名 會有不同得結論101.9.227.158

yjjia, 21F
紅芒果1號就是沒有任何規律的標誌36.234.27.106

dorydoze, 22F
有種把標籤的都送檢舉180.204.98.252

geordie, 23F
這不就是類似美國的自動指標分享系統的114.47.219.130

geordie, 24F
低階版?114.47.219.130

Gaujing, 25F
代PO那邊有講了114.25.184.166
看起來的演算法就是人工(Manual) AI 找幾個"自認為重要的特徵",然後造一個函數產生一個數值(社會信用評分?) 權重調整到可以抓到我認為的網軍就 PERFECT 如果發現某個id網軍分數高,但是掃ip記錄抓不到把柄不能處理 就是因為這些網軍很狡猾,列入神奇id

yjjia, 26F
這不是說明用人工嗎? 還扯什麼文字雲36.234.27.106

lavarslaker, 27F
有學過多變量的 都知道這種分析不適101.9.227.158

lavarslaker, 28F
合當黃金標準 只能進行有限度的歸納101.9.227.158

siyaoran, 29F
特徵值 資料是人工餵的114.136.131.101

lavarslaker, 30F
a板説他用文字雲 R自己說他用算的101.9.227.158

alans, 31F
資料處理出來的還是資料 還是看人怎麼解讀/118.167.44.219

alans, 32F
利用118.167.44.219

siyaoran, 33F
要不特徵是選過的 要不程式有bug 老實說114.136.131.101

siyaoran, 34F
有bug機率實在不低114.136.131.101

siyaoran, 35F
而且特徵分析有誤判也是常見 把抓出來的114.136.131.101

lavarslaker, 36F
資料是保守推論用的 不是拿來鬥人的101.9.227.158

dslite, 37F
我出差或出國玩罵柯文哲就變跳板幫了 白癡1.171.7.72

alans, 38F
然後這種沒公開的程式又有輸入帳密的 要小118.167.44.219

alans, 39F
心使用 更尤其不是從原作者地方下載的 說不118.167.44.219

greedypeople, 52F
個人認為是比較針對性的像柯學啦218.166.23.198

demitri, 53F
已經先入為主認為反柯的都是網軍才這樣搞104.32.182.180

demitri, 54F
我自己避免啥屎尿糞的字眼 他們大概手動104.32.182.180

demitri, 55F
放我 或是那奇怪的刪舊文搜尋吧104.32.182.180

woods0598, 56F
要中立就raw data train個幾次來看114.137.91.83

Doralice, 57F
罵綠營的文字雲都是難聽子眼還重複IP倒101.9.26.130

Doralice, 58F
是連一點標記都沒有101.9.26.130

kouta, 59F
手動的啦 在手機板惹到他就被標智障了220.133.14.178

Windcws9Z, 60F
我覺得alans說的u可能59.127.190.36

Windcws9Z, 61F
因為帳號頻繁去Q別人會被踢下線Ban IP59.127.190.36

RD5566, 62F
拜託各位去抓網軍 不要讓紅芒果獨領風騷1.171.66.55
我們現在就在抓紅芒果這個網軍啊 你為甚麼要坦護他,你是不是他團隊的一個
※ 編輯: perceval (140.116.21.9 臺灣), 09/19/2019 03:25:24

perceval 作者的近期文章

Re: [新聞] 何美鄉指出米酵菌酸可能來自中國 ! 吳
※ 引述《g6m3kimo5566 (灑花國國王)》之銘言: : 我覺得八卦版應該快完蛋了,幾乎成為謠言的產地. : 「農業部農試所研究人員指出,台灣環境中早就有該菌,該細菌有許多病原型,但可產生 : 致命毒素『米酵菌酸』的唐菖蒲伯克氏菌,
更多 perceval 作者的文章...