[AI教學影片]使用OPEN AI-whisper自動上字幕

教學影片:

背後技術原理:

OpenAI : Whisper,近期 OpenAI 釋出的一個 “通用型語音識別模型” (General-purpose speech recognition model)。

Approach
上圖取自 Whisper 的 Github 存放庫的 Readme 介紹

簡單的說 OpenAI : Whisper 能完成兩大目標:

  1. 各種語音的語音識別成文字。
  2. 各種語言的語音翻譯成英文。

有興趣的朋友可以到 OpenAI 的網站上查閱相關的研究資料:
https://openai.com/research/whisper

當然,如果想直接試用的朋友,可以到 OpenAI 放在 Github 上的 Whisper 存放庫查看:
https://github.com/openai/whisper

Buzz是已經有大神包裝好,我們只要下載來使用即可。

BUZZ下載網址

語音轉文字步驟:

1.錄音

2.語音轉文字:

把錄音檔傳到電腦上,如果是影片檔,需要用QuickTime Player轉成聲音檔

打開Buzz

1.按下+

2.選聲音檔

3.點Tiny,選到Medium

4.Language:選Chinese

5.按Run

跑完後,在完成的檔案名稱,點兩下

Export,可以選TXT(純文字檔)、SRT(字幕檔)

按下Save

SRT字幕檔

蔡正信-數位教練

我是一位專精於數位轉型與AI應用的教練,致力於協助中高齡族群與企業主有效運用科技工具提升生產力。

蔡教練聯繫方式:https://rdcoach.pse.is/62uqz2

手機:0988-515-413

Line官方帳號2.0 : @rd.coach https://lin.ee/n4T9CGA
群英企業管理顧問股份有限公司
資訊顧問電子郵件:hi@rd.coach

跨代際溝通 × AI賦能教學:
結合AI應用、數位工具教學與熟齡學習經驗,專注於中高齡與中小企業的數位轉型輔導,擅長從0到1建構數位素養。

實戰導向 × 客製培訓:
15年數位教學經驗,服務鴻海、1111人力銀行、台南大學、瓦城集團等,設計實用導向的教學模組,強調易學、可複製。

工具整合 × 工作流設計:
善用Evernote、Heptabase、Telegram等多款工具,打造AI第二大腦與一元筆記系統,協助學員從資訊收集到知識轉化。

行動導向 × 教學有感:
500+場講座與工作坊,專注學員實作與成果回報,推動「數位生活力」與「AI生活實驗室」教學風格。

預見未來 × 實踐智慧:
關注生成式AI與數位倫理發展,推動AI工具於科研、商業、教育場域的實作應用,擘劃AI助理與智慧工作未來藍圖。

Share:

More Posts