在 macOS 上安裝並使用 mlx-whisper 的指南:語音轉文字全指南

在 macOS 上,您可以使用 mlx-whisper,這是一個基於 Apple 的 MLX 框架的工具,可高效地在 Apple Silicon 上運行 OpenAI 的 Whisper 模型。以下是安裝和使用 mlx-whisper 的步驟:

步驟一:安裝 Homebrew

Homebrew 是 macOS 的套件管理器,可簡化軟體安裝。

1. 打開「終端機」(Terminal)。

2. 輸入以下指令安裝 Homebrew:

   /bin/bash -c “$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)”

3. 安裝完成後,更新 Homebrew:

   brew update

步驟二:安裝 FFmpeg

FFmpeg 是一個多媒體處理工具,mlx-whisper 依賴它來處理音頻文件。

brew install ffmpeg

步驟三:安裝 Python 和 Pip

mlx-whisper 需要 Python 3.7.1 或更新版本。

1. 檢查系統是否已安裝 Python:

   python3 –version

2. 如果未安裝,使用 Homebrew 安裝 Python:

   brew install python

步驟四:安裝 mlx-whisper

使用 pip 安裝 mlx-whisper:

pip install mlx-whisper

步驟五:使用 mlx-whisper 進行轉錄

1. 在終端機中,使用以下指令對音頻文件進行轉錄:

   mlx_whisper audio_file.mp3

   此命令將生成一個名為 audio_file.txt 的文本文件,包含轉錄結果。

2. 您可以使用 -f 參數指定輸出格式,使用 –model 參數指定模型。

   mlx_whisper audio_file.mp3 -f srt –model large

   這將生成一個 SRT 格式的字幕文件,使用大型模型進行轉錄。

注意事項

mlx-whisper 依賴 FFmpeg 來加載音頻文件,確保 FFmpeg 已正確安裝並在系統路徑中。

mlx-whisper 支持多種音頻格式,具體取決於 FFmpeg 的支持範圍。

– 根據您的硬體配置和所選模型,轉錄過程可能需要一定時間。

通過上述步驟,您可以在 macOS 上使用 mlx-whisper 高效地進行音頻轉錄。

蔡正信-數位教練

我是一位專精於數位轉型與AI應用的教練,致力於協助中高齡族群與企業主有效運用科技工具提升生產力。

蔡教練聯繫方式:https://rdcoach.pse.is/62uqz2

手機:0988-515-413

Line官方帳號2.0 : @rd.coach https://lin.ee/n4T9CGA
群英企業管理顧問股份有限公司
資訊顧問電子郵件:hi@rd.coach

跨代際溝通 × AI賦能教學:
結合AI應用、數位工具教學與熟齡學習經驗,專注於中高齡與中小企業的數位轉型輔導,擅長從0到1建構數位素養。

實戰導向 × 客製培訓:
15年數位教學經驗,服務鴻海、1111人力銀行、台南大學、瓦城集團等,設計實用導向的教學模組,強調易學、可複製。

工具整合 × 工作流設計:
善用Evernote、Heptabase、Telegram等多款工具,打造AI第二大腦與一元筆記系統,協助學員從資訊收集到知識轉化。

行動導向 × 教學有感:
500+場講座與工作坊,專注學員實作與成果回報,推動「數位生活力」與「AI生活實驗室」教學風格。

預見未來 × 實踐智慧:
關注生成式AI與數位倫理發展,推動AI工具於科研、商業、教育場域的實作應用,擘劃AI助理與智慧工作未來藍圖。

Share:

More Posts