文字起こしさんで文字起こしがうまくいかない音声ファイル【実例を紹介】
2024年8月20日
文字起こしさんはAIが文字起こしをするAI文字起こしです。AIはGoogleやAmiVoice(日本の音声認識システム提供会社)のものを利用しています。
AI文字起こしは文字起こしをする音声ファイルに得意・不得意があります。
この記事ではAI文字起こしが不得意・苦手な音声ファイル、その実例と理由を紹介していきます。
実例や理由を知っておくことで「AI文字起こしを使って文字起こししやすい音声ファイル」を作ることができるので、ぜひ参考にしてください。
AI文字起こしが不得意な音声ファイル
- 音声が小さい、マイクが遠く聞き取りづらいもの
- ノイズが激しく音声がかき消されているもの
- 室内の反響音で音声がぼやけているもの
- 歌の歌詞など音楽が入ったもの
- 音声がないもの
- 方言がきついもの
- 複数の言語が混在するもの
- 人が聞いて声が聞こえづらいもの
このような音声ファイルは正確な文字起こしができないため、文字起こしさんを使うことを推奨しません。
関連記事>>高精度な文字起こしをするための録音の6つのポイント
AI文字起こしが不得意な音声ファイルをエラー報告しても非承認となり、時間数の返還などもできません。
特に、エラー報告で多いのがファイルの中身に問題があるものです。実際の例を見てみましょう。
ファイルの中に声が収録されていない(ノイズが続く時間がある、無音である)
音声ファイルの中身を確認せずに、アップロードすると、
収録に失敗していて「録音にしっぱいして無音」「録音途中でマイクが切れていて途中がノイズしか聞こえず、音声が入っていない」ということがあります。
上の画像はノイズしか聞こえないようなファイルをアップロードし、文字起こしをした結果です。
文字起こしさんはAIで文字起こしをしています。AIはノイズ部分であってもできる限り文字起こしをしようと努力します。
特にPerfectVoiceを利用し、冒頭に雑音や無音時間が1分以上あるファイルの場合この問題が発生しやすくなります。
「あああああああ」「んんんんんん」など、その他、同じフレーズを何度も繰り返して文字起こしされている、よくわからない文字起こし結果になった場合は、ファイルの中身を確認してください。
冒頭の雑音や無音をカットすることで、この問題の発生を防ぐことができます。
上記のようなファイルを文字起こしし、時間数を消費しても、時間数を返還することはできません。
1.音声が小さい、マイクが遠く聞き取りづらいもの
エラーになった音声を確認していると、最もよくあるのがこの事例です。
文字起こしができたとしても、精度が低くなってしまうので、話者の音量が小さかったり、マイク入力が遠く音声がきちんと拾えていないものはAI文字起こしでの文字起こしをおすすめしません。
例:講義を講義室の後ろの方の席でスマホで録音
2.ノイズが激しく音声がかき消されているもの
雑音はAI文字起こしにとって、強敵です!
ノイズがのっている音声は話者の声がかきけされている事が多く、「人間が聞いても聞きづらい」ことが多いです。
録音している時に見逃しがちですが、風切り音も強敵です。
「人間が聞いても聞きづらい」ものをAIが精度良く文字起こしできるはずがありません。
例:外出先のカフェなど人が多い環境、食器音や音楽(BGM)がある中で録音
口とマイクの距離が近く、呼吸の風切り音がする
3.室内の反響音で音声がぼやけているもの
普段、自分の耳で聞いていると意外と気が付きにくいのが、室内の反響音です。
録音した音声になると、反響音はこもった音に聞こえたり、声が遠くに聞こえるような音声になりやすいです。
特に、四角い部屋、ものが少ない部屋などだと反響音が発生しやすいです。
例:会議室で1つのICレコーダーで様々な場所に座った複数人の会話を録音
プレゼンを会議室で行ったが、室内の反響音で音がぼやけているものを収録
4.歌の歌詞など音楽が入ったもの
AI文字起こしは歌を文字起こしできません。
YouTubeなどで歌詞のない歌をダウンロードし、文字起こししよう!と考える方がいます。
ですが、AI文字起こしはあくまでも会話を文字起こしするためのもの。
歌の文字起こしはできません。
例:Youtubeの歌をダウンロードして文字起こし
5.音声がないもの
無音の音声ファイルは、文字起こしできません。
音声がないものはもちろん文字起こしすることができません。
おそらく、マイク入力が0になっていたのを知らずに文字起こししようとしたのかな。
文字起こしを試す前に、音声ファイルを手元で確認し、「音声がきちんと入力できているか」確認してからAI文字起こしを試してください。
例:マイク入力ができていないのに気がついていない
6.方言がきついもの
AI文字起こしは方言が不得意です。
AI文字起こしはその名の通り、「AI」が文字起こしします。AIは標準語をベースに文字起こしができるように学習をしています。そのため、方言の文字起こしは不得意です。
AIで文字起こしができないことはないですが、どんなに録音環境がよくて、ハキハキとゆっくりした話し方だったとしても、
歯抜け状態の文字起こしや、ほんの一部のみの文字起こしになる場合もあります。
例:地方の会議の議事録用に音声を録音→話者の方言がきつめ
例:日本語の方言の場合
発音のいいアナウンサーが、テレビという録音環境のいい場所で収録した音声でも、方言は文字起こしがうまくいきません。
7.人が聞いて声が聞こえづらいもの
人にとって聞きづらいものはAIにはもっと聞きづらいものなんです。
「AI」と聞くととても万能で、人間よりも優秀な仕事をしてくれそうに思います。
ですが、AIはまだまだ人間にはおよびません。
臨機応変さが求められると、AIでの仕事の精度は一気に落ちてしまいます。
AI文字起こしの場合、人間が聞いて「聞こえづらいな」と思うものはAI文字起こしでは文字起こしの精度がとても下がります。
人が文字起こしをする場合は、多少聞こえずらくても、会話の脈絡や前後の流れなどで「きっとこうだろう」と予想することができます。
ですが、AI文字起こしは「聞いたまま」にしか文字起こしすることができません。人のように補ったり予想したりすることはできないのです。
AI文字起こしで高精度な文字起こしをするためには?
高精度なAI文字起こしを行うためには、録音時にいくつかのテクニックを取り入れることが重要です。
この記事では、AIで文字起こしする時に最適な録音のポイントを紹介します。
AIで文字起こしする時に最適な録音の6つのポイント
- 高品質なマイク
- マイクは適切な位置
- 静かな録音環境を整える
- 話者の発声を明瞭にする
- 一人ずつ話す
- 録音テストを行う
詳しくは>>高精度な文字起こしをするための録音の6つのポイント
AI文字起こしと人の文字起こしをうまく活用しよう
AI文字起こしと人による文字起こしを比較すると、AI文字起こしは圧倒的に費用が安いです。
特に、AI文字起こしの中でも「文字起こしさん」は格安でおそらく業界最安値です。
でも、AI文字起こしでは文字起こしがうまくいかない音声ファイルはやっぱり、人による文字起こしを依頼するほうが確実です。
でも、人に文字起こしを依頼すると高いんじゃないの?
と気になったらこちらの記事もどうぞ。
関連記事>>音声文字起こしの外注相場はいくら?【安く依頼するコツも解説】
今回紹介したとおりAI文字起こしにも得意、不得意があります。
AI文字起こしが得意な音声ファイルは「AI文字起こし」で。
不得意な音声ファイルは
- AIによる文字起こしで文字起こしを試す
→だめだったら「人による文字起こし」で文字起こし
がオススメです。
AI文字起こしはコストが安いので、AI文字起こしが不得意そうな音声ファイルでも、「ダメでももともと。できればラッキー」くらいのつもりで試してみるとうまく文字起こしできることもあります。
AI文字起こしの文字起こしさんは冒頭1分を無料で文字起こしすることができます。文字起こしの精度を確認することができます。一度試してみてくださいね。
■ AI文字起こしサービス『文字起こしさん』
『文字起こしさん』は初期費用ゼロ&月額1,000円から利用できる(※無料版あり)オンライン文字起こしツールです。
- 音声・動画・画像など20以上のファイル形式に対応
- パソコン・スマホどちらからも利用可能
- 医療・IT・介護などの専門用語にも対応
- 字幕ファイルの作成や、話者分離にも対応
- 英語、中国語、日本語、韓国語、ドイツ語、フランス語、イタリア語など約100言語の文字起こしに対応
利用方法はサイトから音声ファイルをアップロードするだけ。数秒〜数十分であっという間に文字起こしテキストが手に入ります。
10分までの文字起こしなら無料で利用できますので、まずは一度お試しください。
Email: mojiokoshi3.com@gmail.com