
會議記錄神器,搞定你所有溝通記錄需求
DuduRow介紹
這是一個可以把錄音檔轉成逐字稿,再幫你整理內容的工具
市面上有不少類似的解決方案,主要可以分為軟體和硬體兩種,但都有一些無法滿足我的點
- 軟體:網路搜尋「語音轉文字」有一堆,語音輸入法也算
- 硬體:PLAUDA募資頁面、HiDock募資頁面
市面軟體無法處理大檔案
基本上目前市面上語音轉錄功能的軟體,背後都是採用各家不同的 AI 模型處理語音轉文字,但各家語音識別服務有些限制,像 OpenAI 有限制處理的聲音檔案大小,大部分找到的轉錄軟體都會有語音長度不能超過15分鐘,或是檔案不能超過25MB之類的限制
不過我一開始的需求就是想讓 AI 幫我做公司的會議記錄,會議錄音長度都半小時起跳,很容易超過一小時,檔案都超過100MB,找到的語音轉錄軟體都不能處理這麼大的檔案。我一開始是把錄音檔切成好幾段,再丟給軟體處理,可行!就是很煩......
硬體很棒,但很貴
錄音設備產品就不用還要把檔案切小段,但他們最大的問題是都要五千塊以上,後續使用轉錄服務還會額外收取使用費(以分計費)
但是硬體有一個優點,就是可以通話錄音, iPhone 本身是沒有開放通話錄音的功能,我 google 說什麼開啟螢幕錄影,再把麥克風錄音打開,就能把通話錄下來。幹勒!都是騙人的,這些作者都沒有親自試看看
Apple 就是不讓你有通話錄音的功能,Android 似乎可以,所以如果有通話錄音的需求(怕老闆交代重要事項忘記),Android 沒問題,iPhone 要馬通話時開擴音用另一個設備錄下來,要馬就買上面的硬體來幫你做通話錄音。
我不太有通話錄音需求,對我來說手機就已經是很好的錄音設備了,所以不考慮硬體解決方案
只好自己搞一個
兩大訴求:不限制錄音長度、成本低
使用流程就看你是要上傳錄音檔,還是直接開啟錄音功能,之後就等系統處理你的語音。我實測1小時的會議錄音,上傳完成後,大約等待2~3分鐘左右有結果
處理完成後,會把錄音檔內容以三種形式呈現:
- AI 整理記錄
- 逐字稿全文
- 時間軸格式的逐字稿
可搭配 ChatGPT-4
如果你有買ChatGPT Plus,你可以把逐字稿全文複製下來,用現在最屌的 GPT-4 幫你整理,你可以自己定義你的 prompt 指令,實測 GPT-4 確實整理得更好
GPT-4 API 使用成本是 GPT-3.5 的 20 倍,整理的成果我肉身評估,GPT-4 沒有比 GPT-3.5 好 20 倍,所以沒有要給你用,目前系統是使用更便宜的 Gemini 1.0 Pro 給你參考(感謝 Google)
未來我會提供更多 AI 整理的樣式,目前規劃有:上課筆記、訪談記錄、靈感速記,也會讓使用者可以自訂 Prompt
如果你覺得摘要很爛
AI 整理的結果很大程度跟逐字稿判讀品質有關,如果你的會議很多專有名詞,或是客戶的名字,逐字稿很容易錯誤
逐字稿有錯誤, AI 整理出來的東西就會不正確,你就會覺得這什麼爛東西,但好在逐字稿轉譯錯誤,通常都會一路錯到底,且錯字也都會一樣,接下來我會開發一個可以快速標出錯字,一次全部修改的功能,讓工人智慧輔助人工智慧(在4/22 開發好了)
你可以修正逐字稿專有名詞或錯字後,再重新讓 AI 整理一次,要是這樣你還是覺得很爛,那你來找我,我看看是有多爛
DuduRow 目前免費
歡迎贊助,等到哪天呼叫 AI 服務的帳單小弟承受不起後,我再跟大家報告
接下來請期待這些功能
- 更多 Prompt 樣式:上課筆記、訪談記錄、靈感速記、自訂 prompt
快速修改逐字稿專有名詞或錯字完成手機版頁面(目前只有桌機版的頁面,用手機看會很擠)完成- 下載錄音檔