2024-12-29 13:17
AI 代理與宣告式程式設計
因為下週新年公司整週放假,在出去玩之前趁週末開始錄一些 E+ 的線上課程。試錄了一支後發現背景有一些聲音,發現原來即使麥克風是指向收音的,還是收到了暖氣機的運轉聲。
一開始想說該不會要關暖氣錄製,但想想現在 AI 模型沒道理不能去除背景雜音。上網搜尋一下,果然不少 AI SaaS 服務在做,但幾乎都是在每十分鐘音檔處理要 1 到 2.5 美元的收費區間。
再想想沒道理這個技術沒有開源的模型可以用,於是上 HuggingFace 找了一下,看到一個 DeepFilterNet 的 demo,試了一下效果非常好,完全去除了背景的所有雜音。
決定使用後,開啟 Windsurf IDE,把這個開源專案的 GitHub 網址,貼到 Cascade 當中,然後下提示詞說要用這個開源專案來去除背景雜音。按下送出後,Cascade 就自動把該裝的依賴都裝完,然後提供可以跑這個背景雜音去除程式的腳本。
整個過程簡單到我連該開源專案的 README 都沒看,做的事情就只有下最開始的提示詞,然後就能輕鬆使用這個開源的背景雜音去除功能。
(留言續)