※ 本文轉寄自 ptt.cc, 文章原始頁面
看板Headphone
標題

Re: [閒聊] HTPC/CAT建構的自身經驗

時間
留言91則留言,16人參與討論
推噓32 ( 32059 )
WASAPI (push) 是較新的 WaveRT Port Driver、使用 cyclic buffers,Audio device 需要支援 DMA。有人不推是因為部分 Audio device 相容性不佳,為了省麻煩就叫你別 用,不用就不會有機會有問題。話說什麼年代了硬體還不支援 DMA(笑)、硬體相容性 、支援度不佳並不是這個模式的問題。用 WASAPI (push) 有問題該吐草的是兩光硬體 或其不良驅動程式。但你知道的做 Audio 設備的很多在這塊通常都.... WASAPI (event) 是舊式的 "ping-pong" buffers。 工作正常 Buffer 大小能滿足傳輸的話兩者沒有不同。不管是 WASAPI or ASIO 其功能 都只是在程式與 Audio interface 間傳遞 Audio data 並不決定聲音品質。 Buffer 是拿來緩衝的,夠大傳輸就不容易出包不易有 Pops、Clicks and Cracks 這些 音頻故障。只是聽個音樂而不是二、三十個音軌在混音*n個 plug-in 在 DSP,除非 硬體或驅動有問題啦... in foobar【讀檔>解碼>ReplayGain>DSP chain>Output】=>Audio Device 一連串的 Audio playback stream,在其中一個地方強迫資料流變得零碎並不會讓它 變實時只是形成瓶頸,更容易發生音頻故障。 Audio interface 都有硬體最小 buffer size 限制與實際最大 buffer size。 一般常見的最小 size 是 30000 hundred-nanosecond、也就是 3 ms。但這不代表這硬 體在 3ms 一定能完美工作就是了,畢竟能不能操極限是要看整台設備的軟硬體。 而 foobar2000 的 foo_out_wasapi 寫的很陽春,它沒有互動也沒有防呆雖然功能上是 沒有問題啦。 在設定中向 WASAPI 提出的是 buffer size 的【請求】,實際上 WASAPI 會依據 audio frame 的大小(ch 數 * bit-depth * Sample rate)來回應一個可行 buffer size。 零是不可能的、也不能比硬體的最小 buffer size 要小。以上面的例子 3ms 會回給一 個能放 3.xx ms audio大小的 buffer。而 audio 的位元深與採樣率會影響實際大小。 太小的 buffer size 對 WASAPI (push) 的 cyclic buffers 不利。Cyclic buffers 是你追我跑的環形緩衝區,設太小=跑道太短會很容易撞車。cyclic buffers 是先進 先出(FIFO)其延遲是看硬體自發性的讀取。foobar 是 music player 所以 audio data 都是已知的,buffer size 設大點沒什負面問題但最好不要設的太小。 WASAPI (event) 的 "乒乓" buffers 則不能設太大,如上述沒有防呆。如果在此 設定了超過硬體的最大值,多出來的部分則會丟失。 極端例子如硬體最大 buffer size 只有 250ms 如果設了 500ms,foobar 每次會傳送 500ms 的 audio 但硬體只能實收 250ms 然後播放、多出來的 250ms audio 會被放生 。然後 foobar 會再送下一個 500ms...250ms 被播放 250ms 被放生。會聽到很嚴重的 輟音,然後進度條跑的飛快。以此例五分鐘的音樂會跳針成二分半就播完。 但如果只設成大了點,只丟失幾個 samples 輟音不夠嚴重,如不知原因可能只會聽出 比較不好聽。但根源上的問題是設定已經錯誤了,但 foo_out_wasapi 並沒有防呆也 沒有任何互動告知使用者的 buffer size 出問題。 應該些人聽信 push mode 不可用,用 event mode 設大有問題所以得出小=好的結論 另如上述如果硬體的 buffer size 最小值是 3ms,這代表設成 0~3ms 之間的任何值 WASAPI 所回應的 buffer size 大小都會是相同的,所以聽起來不可能會有不同。 但如果使用者覺得設成 0ms 最棒,那有什麼理由不能說 3ms、5ms、10ms、50ms 到超 過最大值前聽起來都跟設成 0ms 一樣好?有人能挑戰用聽的聽出硬體的最小 buffer size 值?如果小真的好音質真有差、盲測應該能分辨出最小 buffer size 這個界線才 是。 聽出硬體最大 buffer size 大致上的大小應該不難,基本上這就是嚴重的音頻故障。 因為就算每次只最小丟失一個 sample 也會因為定時定頻率重複發生而顯得明顯。參考 出問題/正常的分界適中的設定 event mode 的 buffer size 應該是不錯的選擇。 在這部分應只有 audio interface 耗盡 audio data 而後面的 audio data 來不及備 妥產生的音頻故障,而沒有正常備妥&傳輸但影響音質的問題。 另外這的 32-bit 指的是 32-bit float?不論是整數或浮點,在 source audio data 一般最高只有 24-bit 的 playback 的狀況下這應該沒有什好處。只會增加無謂的資料 傳輸量,這會讓低延遲的設定環境更容易撞車。除非有進行 DSP 不然看不出會有好處 就是了。 -- 人間五十年、化天のうちを比ぶれば、夢幻の如くなり ^,,,^ 一度生を享け、滅せぬもののあるべきか (ω)\m/ NOBUMETAL DEATH!!('ω') -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.45.253.183 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Headphone/M.1584296563.A.A8F.html

91 則留言

max8201, 1F
怎麼我感覺看了很多,但又不知道結論是什麼,我的問題嗎?

alanswill, 2F
看不懂QQ,不過我在網路上查到的都是說event比push還要

alanswill, 3F
新?

louis0407, 4F
hi 感謝你的解釋,我其實沒能力知道driver底層的機制,

louis0407, 5F
所以建議壓低buffer只是沿用過去CAT玩家的原則,在不出

louis0407, 6F
事的情況下壓低各種buffer與latency

louis0407, 7F
至於這樣對聽感的影響,就像我之前推文提到的,我只能

louis0407, 8F
解釋到低延遲對SI有好處,然後音頻裝置吃到高品質數位

louis0407, 9F
訊號對聽感有助益,至於是讓receiver工作的更好還是這

louis0407, 10F
樣的SI品質會一路串到da線路影響解出來的類比訊號品質

louis0407, 11F
就非我能解釋的了

louis0407, 12F
然後32bit云云,就data層面確實就是補0,是不是真的有

louis0407, 13F
差我也不確定,當心理作也可以
但以 32-bit 傳輸 24-bit 的資訊表示 data payload 無謂的增加 更耗時耗功、事實上也增加了系統 DPC Latency DPC Latency 不佳最常見的狀況就是有問題的硬體或驅動佔了茅坑不拉屎 卡住了後面排隊的,今天 24-bit 精度的 Audio 以 32-bit 傳送就表示 3秒能傳完的要花4秒,多佔用了1/4的時間,然後只是沒用的零 而且耗的點是直接加諸在 Audio interface & controller 所以說有沒有差也不確定,這跟原原PO 你把 WASAPI 兩個 mode 的 buffer 都設成了零一樣。既然不能確定就照不知道有什麼原理的經驗法則 這不都只是心理用而已了嗎 能真心肯定的說出設成 0ms 真的比 10ms 好,因為是 ABX 盲測出來的確定結 果,而不是因為過去CAT玩家的原則所影響的?

ultimatevic, 14F
感謝資訊 真複雜...

djboy, 15F
感謝,專業推!!

djboy, 16F
O大文,每次都讀的好開心

clioneurise, 17F
推好文

yamatai, 18F
可惜音響上面偏偏就是buffer小聲音比較真,buffer大聲音

yamatai, 19F
會變滑順浮腫

breadf, 20F
我想文章意思是,小有個極限,大的話event也是有極限

breadf, 21F
在軟體UI上看到的設定值不一定是實際值

louis0407, 22F
底層機制一定是這樣,看願意開放多少彈性給應用層
其實在 Audio 的相關 Latency 出現在很多地方,也有不同的意義 個人感想是可能很多玩家搞混了這些不同的 Latency 像合成樂器的 Latency About Latency / VST Instruments | Steinberg.help https://bit.ly/3b2KOez 這的 Latency 就只是延遲,譬如樂創作者接到電腦的 Keyboard 琴鍵按下去 要 400ms 後聲音才發出來。這延遲會讓人感到不舒適但不會影響音質 同樣的在現場進行 RT監聽的狀況設備的 Latency 也會是重要的關鍵 DAC digital filters 的兩個主要分類 IIR & FIR 的重要參數 Latency https://imgur.com/ZN6kYvy Latency 較低的 IIR 系因較沒有 "pre-ringing" 受部分人士的喜好 但這的 Latency 也只是 digital filters 的特性所表現出來的結果 而不是因為低 Latency 所以聲音好 但傳輸過程中的 Buffer 造成的 Latency... 我要說的是不管是 WASAPI or ASIO 都只是整個傳輸過程中的其中一段 這就像用卡車在送貨,你可以只裝一、二箱就出車,也以裝幾十箱再出車 但收貨方的需求如果是持續且定時定量的話,你就必需一直出貨 每次送的少你就必需發更多車 一次裝的多就可以少出點車次,但等貨裝貨的時間就=Latency 為什麼車在跑的時間沒什麼人在計算 Latency?因為以現在的電腦來說這個時 間太短了,有部分 DAW 如 PEAPER 有 Performance Monitor 計算實際時間 但在路上每台車都會碰上各種交通狀況,這就是 DPC Latency 所反應給你的 每次送的少、收貨方的備貨就少,容錯值就低。貨架空了就是音頻故障 每次送的少=Latency 低、是比較新鮮啦,但就如上述除了有互動需求的話 早個幾 ms 聽到的音樂是會比較鮮啦、但 Audio data 又不是生鮮 跟 SI 又有什麼關係就實在讓人搞不清楚了 另外車次多、排放就高,所需要的總 CPU 時間也會更多產生的熱能也更多 這方面的負面影響又要如何考量? 這就又回到跟上面討論的 24-bit vs 32-bit 類似的狀況,一個感覺問題而已

ang728, 23F
精闢解析

louis0407, 24F
嘿,針對32bit,我思考的角度是,wasapi會不會統一吃32

louis0407, 25F
bit data也就是我說的預設格式,傳24給他,他還要再補0

louis0407, 26F
,跟你舉例的情形剛好相反,但我也說了只是我猜的,我

louis0407, 27F
也不排除是心理作用

louis0407, 28F
另外感謝你解釋了DPC latency的含義,至於buffer大小,

louis0407, 29F
我最早也不信,現在自己跟著用。但確實也不可能每個buf

louis0407, 30F
fer設定都給他測試看看,你要這樣質疑我也無法反駁,

louis0407, 31F
頂多爭辯一句這不是只有我自己在心裡感覺。實際上不管

louis0407, 32F
是中文 英文 甚至是日文資訊,全世界在討論CAT的社群在

louis0407, 33F
這幾部分的看法幾乎都是相似的,但要說誰有辦法解釋的

louis0407, 34F
很嚴謹完整,我也沒見過就是

louis0407, 35F
跟SI關係,看來我比較多是用dpc latency在想,單純buff

louis0407, 36F
er大小部分,看來又是塊我是無法解釋的東西

goldie, 37F
系統在處理 audio data 幾乎都是以浮點數在處理,因為整數沒效率 foobar 也是、不管你的來源檔是什麼解碼後放到記憶體中都是浮點格式 foobar DSP chain 也是浮點,我想 WASAPI 也是 但這跟【傳送】是兩碼子事,如上述 CPU & RAM 的速度不是 interface 可比 為什麼現在 ITB 混音後製可以二三十個音軌*N個 plug-in 進行大量的 DSP 計算後還來得及以幾百 ms 的 Latency 輸出?當然這些都是以浮點在計算 但算完必然有量化的問題,會有抖動或噪聲整形的需求 可如果沒進行任何會改變數據的 DSP 處理,USB & S/PDIF 都是 serial bus 這 8-bit 就是多出來的,多傳送沒必要的資訊有何益處? 另外我也覺得沒可能也沒必要每個值都去設定試聽 但 0ms、1ms、3ms 有沒有不同?10ms 真有比較差? 還是根本無法肯定就只是隨波逐流? 人耳的精度有限、尤其聲音是變動的不像視覺可以同時比較兩個畫面 除非差異足夠大不然聽覺要分辨不同的難度很高不是嗎

louis0407, 38F
提出一個猜想,buffer拉大,表示要等更多資料湊齊一個

louis0407, 39F
標準單位,這時可能會讓送出的時間變得更不規律,也就

louis0407, 88F
的時間域,NOS反倒表現的很好,而人耳比起頻響域,對

louis0407, 89F
時間域反而更敏感
但 NOS 完全沒法重建原始 Audio 帶有大量的噪聲與失真及混疊,除了整體響度會下降且越往高頻越失真與衰減 但有些人就喜歡失真跟討厭高頻啦XD Nyquist frequency 之所以能以離散數據重建 Audio 就是因為需要以正弦補值 沒有 OS 以單單的 PCM 點所重建的階梯並不能說是完成了 DAC

justagame, 90F
ABX只能測聽不聽得出OS/NOS的差異阿

justagame, 91F
不能處理個體覺得哪一種好聽/哪個失真較高 這類的問題
你熟的音樂不用 ABX 多半就能分辨 NOS 的聲音很特殊

breadf, 92F
應該用sync補吧XD
sinusoid 用 sinc 是因為計算問題啊 如果有其它算法能補正弦波、沒震鈴又效能好那就發財了啊

justagame, 93F
OS跟NOS已經吵了很久啦 我自己的DAC兩種都能切換
肥環燕瘦各有人愛啦 但我舉 NOS 只是為了表示就訊號重建的角度 NOS 完全 OUT 以 Nyquist frequency 採樣的數據並沒有遵照 Nyquist frequency 重建
※ 編輯: Oswyn (220.129.177.54 臺灣), 03/17/2020 23:33:49

Oswyn 作者的近期文章

Re: [問題] 國人跟家臣的差別在哪?
日本近代以前的歷史有很多怪東西,其中項是一個詞依使用人的立場會有不同解釋 以下心得不見得非常精確 殿上人公家認為非殿上人的公家是地下人 地下人公家認為地方官與在地領主等是地下人 地方官與在地領主等認為鄉民等是地下人 一個地下人各自表述。所以
Re: [心得] Shogun 幕府將軍 E07 (雷)
43 雷 佐伯真辰在 D+日文官網中第七集的人物介紹裏標注為虎永之義弟 日文義弟=義理之弟。丈夫或妻子的弟弟,或妹夫 親之養子,親再婚所生或拖油瓶的弟弟 或無血緣關係的結義之弟 但義弟又可以直接稱為弟(おとうと) FX官網的人物介紹中稱 S
Re: [討論] 幕府將軍S01E06 花柳界的女子
當然雷 鞠子跟人對練薙刀的回憶場景中 雖然一開始在景深外畫面模糊,但還是隱約可見文太郎的目光一直盯著鞠子 然後鏡頭從光秀看著女兒,帶到旁邊的虎永轉頭跟戸田廣松接耳 鏡頭再從落葉之方看到虎永、戸田對談後帶回場中 比試完鞠子的眼光與文太郎對視到
Re: [請益]室町政權大族之中 最成功的倖存者?
先來段我個人最喜歡的室町期小故事(誤 出自塵塚物語,奧書天文21年(1552) 藤原某作,序文稱永禄12年(1569) 付印 反正就差不多在這段時期成立,內容為鎌倉・室町時代重要人物們的逸話等歷史故事集 書中的記述作為史料的可信度低 但在傳
Re: [閒聊] 赤穗事件 吉良家也太衰小了吧??
提供一些其它觀點 武士階級興起的成因之一也就是為了自力救濟,為了守護或爭奪領地權利等而進行私戰 平安時代日本朝廷明面上是禁止私戰,實際上主要採漠視與不干涉 只要你不是反抗朝廷,上層公家貴族才不鳥下面粗人打打殺殺 像平將門在關東已經私戰作亂多
更多 Oswyn 作者的文章...