※ 本文轉寄自 ptt.cc, 文章原始頁面
看板C_Chat
標題

Re: [情報]祖克柏推出AI口譯 閩南語無文字也可翻譯

時間
最新2022-10-20 14:23:00
留言79則留言,19人參與討論
推噓21 ( 23254 )
https://huggingface.co/spaces/facebook/Hokkien_Translation 已經可以在上面網站玩台英語音對譯了,需要等幾秒鐘。 效果很不錯,台語語音可以拿來玩。 模型用兩種不同技術(unitY和s2ut)做的,成果略有差異。 台譯英:hk-en (hokkien to english) 英譯台:en-hk(english to hokkien) 想要讓ai講台語還要先練英文( ------ 補一些資訊,期待神人大大講解: github頁面: https://github.com/facebookresearch/fairseq/tree/ust 影片中的工程師是台灣人,可參考本篇臉書貼文 https://tinyurl.com/23azb2uf 或長版介紹影片:(還有出現簡體字筆記,團隊應該包含各地來的) https://www.youtube.com/watch?v=6bca6M6uEz4
在展示即時台翻英的畫面有加註是後製成果: Translation are generated by Meta AI's open source model and integrated into the video for illustrative purposes. Not representative of a final product. Meta AI部落格冒出一篇中文文章: Meta 發佈第一個全新 AI 技術支援的非書寫語音翻譯系統 https://ai.facebook.com/blog/ai-translation-hokkien/ 我不懂深度學習,抓一些看熱鬧的東西: 1.跟元宇宙計畫有關 「我們相信口語溝通有助於打破隔閡,拉近人們之間的距離,無論身在何處,甚至在元宇 中也不例外。」 2.使用的是台灣的語料庫 「我們也根據名為 Taiwanese Across Taiwan 的閩南語語音語料庫,建立第一個閩南語與 英語雙向的語音翻譯基準資料集。」 3.使用華語做標注,但也使用台羅來評價成果 4.仍在開發中,目前每次只能翻譯一個完整句子 5.相關研究論文請點進去看 另一篇較親民的英文文章: AI translates Hokkien, an unwritten language, for the first time https://tinyurl.com/ytczzmbr 節錄渣翻: 1.主角 Meta 研究員 Peng-Jen Chen 在台灣長大,他爸是南部的退休技師,用華語講複雜 的事情常不太順,他單純的心願就是老爸可以跟任何人用他最熟悉的台語交流。 2.Meta想做一個可以即時翻譯的萬用語音翻譯器(Universal Speech Translator) 3.祖刻薄:「AI將會在我們的有生之年帶給我們用任何語言跟任何人交流的能力」 4.網路空間對於非書寫(或沒有書寫傳統、以口語使用為主)語言的使用者來說障礙重重 ,若讓這些人都能在網路上使用他們的語言,將使他們更舒適且有自信。 ---- 其他台語語音生成系統: 意傳科技的line聊天機器人: https://page.line.me/241byfcj 陽交大語音實驗室台語語音合成 http://tts001.iptcloud.net:8804/ //再補充,發布的模型用哪些資料訓練的? 根據 Speech-to-speech translation for a real-world unwritten language,個案研究 的對象是Taiwanese Hokkien(台語)。 pdf網址: https://tinyurl.com/3bt4yk4w 雖然看不懂但抓一下關鍵字,訓練中用到有關閩南語或台語的資料: 1.有華語字幕的閩南語戲劇(跟台大拿的,應該都是台語?) 2.前面提到的Taiwanese across Taiwan語料庫,再找人將台語翻成英語。 3.MUST-C,英文TED影片轉成其他語言的語料庫。找人將英語翻成台羅+漢字。 4.SpeechOcean北京海天瑞聲的600小時台語以外的閩南語,算佔相對少數 可能是以下這幾個語音資料庫 https://www.speechocean.com/?m=index&c=index&a=searchset&keyword=%E9%97%BD 有誤或需補充請告知! ※ 引述《medama ( )》之銘言: : 之前因「元宇宙」遊戲人數不如預期而虧損的meta : https://i.imgur.com/gCXvLX7.png
Re: [情報]祖克柏推出AI口譯 閩南語無文字也可翻譯
: 今天祖克柏宣布將推出AI口譯系統 : 即使是沒有統一標準書寫系統的閩南語(HOKKIEN) : 雖然難以利用文字翻譯軟體, : 但透過AI技術,也能讓閩南語即時跟英語進行雙向口語對譯 : 展示影片: : https://reurl.cc/KQZbGM : 等AI技術更加精進後 : 想必之後在meta的「元宇宙」遊戲中 : 各國玩家可突破語言藩籬,彼此聊天 : 創造出一個嶄新的宇宙 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.170.86.176 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1666210168.A.67E.html

Re: 回文串

2179
> Re: [情報]祖克柏推出AI口譯 閩南語無文字也可翻譯
C_Chat10/20 04:09

79 則留言

BITMajo, 1F
有人能成功翻譯"幹你娘"嗎?認真

BITMajo, 2F
我怎麼試都是 Only you 或 You're the only one 之類的

BITMajo, 3F
OK "你家死人" 翻譯正確

BITMajo, 4F
苗可麗的去死啦也能正確翻譯

BITMajo, 5F
還是有些怪怪的,大概五成吧,雖然我試的都是髒話就是了

BITMajo, 6F
對他唱"家後"前兩句,有翻譯出來
※ 編輯: robertchun (1.170.86.176 臺灣), 10/20/2022 04:47:21

BITMajo, 7F
感覺翻譯正經台語還是可以啦,不過發音要正確

BITMajo, 8F
我試著念"酒干倘賣無"結果第一次沒念對,瓶子被翻成橘子

BITMajo, 9F
OK,來玩玩英文髒話轉台語嘿嘿嘿嘿

aegis123321, 10F
幹這個字好像翻不了

BITMajo, 11F
真的,換模型試也翻不了

BITMajo, 12F
我覺得開發的人很明白

BITMajo, 13F
試了英文翻台語,我覺得是國罵辭彙都沒有收錄進去
不知道是不是語料庫裡沒有 不然即時翻譯裡沒有辨識髒話功能感覺蠻困擾的
※ 編輯: robertchun (1.170.86.176 臺灣), 10/20/2022 04:55:05
※ 編輯: robertchun (1.170.86.176 臺灣), 10/20/2022 04:55:36

trywish, 14F
沒有收錄(X),被排除(O),為了怕被玩壞,應該會排除一些

trywish, 15F
字,所以沒有很正常。你說去死可以?單純就還沒排除而已

BITMajo, 16F
不管有沒有做,應該是沒有放進去

trywish, 17F
要是一直玩一直亂用,改天可能就禁了。

rockmanx52, 18F
看到這些很怕未來會有政治力介入亂搞...

BITMajo, 19F
我覺得台翻英都蠻順的,英翻台比較難

BITMajo, 20F
英文感覺要刻意字正腔圓一個字一個字念對才翻得好

BITMajo, 21F
反而台語感覺可以講得比較順,英翻台的結果也念得蠻順的

BITMajo, 22F
平偉的"你在大聲什麼"翻英文很簡單

bluejark, 23F
叫福建話有些人可能會不同意
其實都是拿台語的語料和標準玩的,東南亞和其他海外閩裔比較會用福建話稱呼。

BITMajo, 24F
但要把英文翻回"你在大聲什麼"就沒那麼順利了
※ 編輯: robertchun (1.170.86.176 臺灣), 10/20/2022 05:02:08

BITMajo, 25F
不過有可能是我先入為主預設要翻怎樣才對吧

rockmanx52, 26F
平偉那句其實英文口語就「What do you want?」啊

BITMajo, 27F
不,我翻譯出來是 What are you yelling/shouting at

rockmanx52, 28F
@bluejark:Wikipedia是用「台灣福建話」 因為福建話

BITMajo, 29F
我覺得這句兩個模型翻譯都蠻精確的

rockmanx52, 30F
實在太多種...

BITMajo, 31F
"死"字我覺得沒辦法排除吧...畢竟他是必要的詞彙

rockmanx52, 32F
@BITMajo:一般吵架不會用這麼文謅謅的用詞啦

rockmanx52, 33F
吵架會用的其中一種就是我說的

rockmanx52, 34F
英文口語What do you want還可以作「看三洨」解

rockmanx52, 35F
是非常不禮貌但用途很多的粗話

BITMajo, 36F
平偉那句哩喜咧ㄉㄨㄚˇ蝦呷不就是吵架的時候說的嗎XD

rockmanx52, 37F
對啊 所以以平偉那個情境翻成What are you yelling/

rockmanx52, 38F
shouting at太過文雅啊

BITMajo, 39F
是沒錯,不過英文翻譯蠻正確的

misscodfish, 74F
哩欸表情金變態很完美的翻成英文了哈哈哈哈

Lb1916, 75F
宜蘭腔、鹿港腔、海口腔、內埔腔、混合腔都上去試試看

Lb1916, 76F
泉州話、漳州話、廈門話會得或許能試試

Lb1916, 77F
還有新馬華人的福建話(可參考新加坡電影)

b160160, 78F

leviathan36, 79F
流氓土話,禍延子孫。
※ 編輯: robertchun (1.170.86.176 臺灣), 10/20/2022 10:21:27

harryzx0, 80F

robertchun 作者的近期文章

[討論] 是否請賴清德陣營公布倒讚數字
幹一個尷尬廣告 也可以釣出一堆在那邊刷說倒讚很多的狂柯粉 那是用擴充程式自己用戶數據拿來加乘算的小學數學 https://github.com/Anarios/return-youtube-dislike/blob/main/Docs/FA
17MAC
[軟體] 穩定的外接鍵鼠驅動及藍牙連接問題
各位好,目前用的是 M1 Macbook Air ,其實蠻習慣原廠鍵盤和觸控板,但因為外接螢幕 的關係,也想購入其他外接輸入設備。 前兩年用過水貨的 elecom Deft 軌跡球,可能是正值剛轉換成 Apple Silicon 的時期 ,
[問卦] 這八年來你的廚餘減了多少
有些人吃飯都吃的很乾淨 有些人常常都會吃不完留下一堆東西 其實我是覺得吃不完給肥宅吃就好啦 丟掉還要處理這麼麻煩 如今社會環保意識抬頭 地方政府大力推動廚餘減量 請問各位 八年來你的廚餘還在嗎
Re: [新聞] 柯文哲主張推「內閣制」 高階文官、國營
說到要遴選 各位還記得 2014 深綠台獨的新台北市長柯文哲 說局處首長要用 ivoting 來決定嗎? 可能是我記性不好 請問一下台北市局處首長除了賴香伶之外還有誰是投票出來的 啊後來當了八年,怎麼不玩網路投票選首長了 失敗了嗎@@
更多 robertchun 作者的文章...