※ 本文轉寄自 ptt.cc, 文章原始頁面
[LLMs] 使用AI工具整理逐字稿?
不知道有沒有版友願意討論一下這部分的心得,原本我以為很簡單實際上意外的困難。
目前做法:
使用Word聽寫功能得到Word版的逐字稿(準確率大概7成)
然後用GPT4-8k Model下以下的Prompt:
{"role":"system", "content": "你是位專業的逐字稿整理師"},
{"role":"user", "content": "我會給你一份(主題說明)的講座紀錄,
請你幫我整理逐字稿,除了修正錯字贅字外盡可能保留原本的用詞。"},
實際問題:
1.GPT4目前只有8k,最多只能進4000tokens(約2500中文字)回4000tokens,
GPT3.5有16K,但幻覺很嚴重。
等於一次大概只能處理15分鐘左右的逐字稿。
(不然就是等GPT4-32K開放)
2.目前我怎麼調Prompt都很容易進4000tokens回1500tokens,把逐字稿內容刪減的太過頭
其他選擇:
OpenAI Whisper AI
好像無法區分講者,所以我沒試
有沒有人專案上做過相關嘗試或研究的?感謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 59.124.87.90 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/AI_Art/M.1692861690.A.A46.html
推
→
推
→
→
→
→
推
→
→
推
→
→
→
→
→
→
推
→
→
→
→
→
推
→
→
→
推
→
→
→
→
→
→
推
→
→
推
→