無料あり:AI文字起こしアプリ・サービスおすすめ9選【比較まとめ】
2021年9月13日


AIとかよく分からないけど、自動文字起こしツールが便利そう。
そんなふうに、「一度は試してみたい!」と考えている方は多いのでは?
「AIツール」と聞くと、
プログラミング知識がないと上手く使えないんでしょう・・・?

そう考えて躊躇している人も、きっとたくさんいるはず。
自分で調べてみても、文字起こし専用のAIはGoogleやIBM、Microsoftなどさまざまな会社がそれぞれ独自のシステムを開発していて違いがよくわからず、ますます敬遠してしまう・・・なんてことも。
安心してください。AIは、仕組みがさっぱりわからない人でも手軽に扱えます。
今回は、そんなAI初心者でも利用できるおすすめの文字起こしツールをまとめてみました。
AI文字起こしツールや音声認識エンジンについての簡単な解説もあるので、AIやプログラミングに詳しくない人でも、いますぐに便利な自動文字起こしツールが利用できるようになるはず。ぜひ最後までご覧ください。
AI文字起こしアプリ・サービスおすすめ9選(無料あり)
Googleドキュメント
超メジャーアプリですが、意外に知られていないのが文字起こしの機能です。
なんと、かの高性能なGoogleの音声認識エンジンをアプリ内で無料利用できちゃいます。
ただし、基本的にはリアルタイムの音声入力が主で、あらかじめ用意した音声データをテキスト変換するには、マイクを通すかパソコンの「ステレオミキサー機能」などを利用する必要があります。
音声入力以外の用途なら、他のサービスを選ぶのがおすすめですね。
- AI(音声認識エンジン):Google
- 対応メディア:音声
- 無料でできること:すべて
文字起こしさん
対応するファイル形式が非常に豊富なAI文字起こしツール。音声や動画ファイル以外に、画像データやPDFからテキストを抽出することも可能です。
多言語対応も約30種類となかなか多いのもポイント。医療・ITなどの専門用語にも強く、辞書機能でさらに精度を上げることもできちゃいます。
料金プランも複数用意されているので、用途や利用頻度に合わせて最適なコスト負担が選べますよ。
- AI(音声認識エンジン):Google、AmiVoice
- 対応メディア:音声、画像、動画
- 無料でできること:音声10分/日(1ファイル1分まで)、画像10枚/日
Ai PLANET-Voice Convert
比較的手軽に利用できるツールとしては珍しく、音声認識エンジンにIBMのWatsonを使用した文字起こしサービスがこちら。
音声ファイル以外に動画データの音声文字起こしに対応しているだけでなく、共通・個別の辞書を独自に作成して精度を上げることが可能です。
料金は割安な「ASP(サブスク)」のほか、専用環境である「クラウド」や「オンプレミス」も選べるので、ニーズに幅広く対応してくれそうですね。
- AI(音声認識エンジン):Watson
- 対応メディア:音声、動画
- 無料でできること:なし(※1ヶ月・30時間の無料トライアルあり)
スマート書記
株式会社メディアドゥと徳島県庁が2017年から行っていた実証実験を元に生まれた議事録サービスがこちら。
利用はChromeブラウザ。iPhoneアプリも用意されています。
料金がそこそこするので、個人利用にはあまり向いていませんが、セキュリティ対策をより強化した専用プランなどが用意されているので、安全性を重視する企業におすすめですね。
※大手企業や自治体など1,200社以上の導入実績があるとのこと。
- AI(音声認識エンジン):Google
- 対応メディア:音声、動画
- 無料でできること:なし(※14日間の無料トライアルあり)
Texta
こちらも議事録向けの文字起こしサービス。リアルタイムの文字起こしなら無料でも無制限で利用できるのがポイントです。
使い方はログインして「議事録開始」ボタンをクリックするだけと非常に簡単。
ただしこの状態だと自分の声しか文字起こしされないので、相手の音声も同時に文字起こししたい場合は「仮想ミキサー」と呼ばれるソフトウェアが必要です。
※Windowsユーザーは『VoiceMeeter Banana』がおすすめです。
録音データもダウンロードできるので、万が一リアルタイムで上手く文字起こしできなかった場合も安心ですね。
- AI(音声認識エンジン):Google
- 対応メディア:音声、動画
- 無料でできること:リアルタイムのみ(無制限)
AI文字起こし
Google・Azure・AmiVoiceの3つのAIエンジンが使える文字起こしツールがこちら。
会員登録不要で冒頭60秒の文字起こしが試せるので、サンプル結果を見てから料金が支払える仕組みになっています。
音声データ以外に、動画ファイルのテキスト化も可能。Web会議の録画データなどから議事録を作成するのに便利ですね。
- AI(音声認識エンジン):Google、Azure、AmiVoice
- 対応メディア:音声、動画
- 無料でできること:冒頭60秒
Otter
英語に特化したAI文字起こしサービスがこちら。
声紋を判別し発言者を聞き分ける機能を持っているのが大きな特徴。一般的な文字起こしツールは利用者がそれぞれ別の端末からアクセスすることで話者を区別していることが多いですが、Otterは同一の音声データ内でもしっかり判別してくれます。
ほかにもキーワード検索やテキストと録音音声の自動同期(ハイライト表示)など、文字起こししたデータを確認・編集する際に便利な機能も搭載していますよ。
- AI(音声認識エンジン):独自
- 対応メディア:音声、動画
- 無料でできること:600分/月
Notta
とにかく機能が豊富で、ツールとしての使い勝手もいいアプリがこちら。
多言語(104言語)対応もポイント。言語ごとに最適な音声認識エンジンを使っており(※利用者は選べない仕組み)、精度もなかなか高いようです。
Chrome拡張もあり。ブラウザで利用できるツール(YouTubeなど)の文字起こしも手軽にできちゃいます。
さらにZoom連携機能も搭載。Notta Botを会議メンバーに追加することでWeb版Nottaが自動でミーティング内容を文字起こししてくれる、という仕組みが面白いですね。
- AI(音声認識エンジン):Google、Azure、Amazon、AmiVoiceほか
- 対応メディア:音声、動画
- 無料でできること:120分/月(リアルタイムのみ)
Voice Rep PRO
いまではあまり見かけなくなったインストール型のWindows文字起こしソフトがこちら。
AI自動文字起こしツールと高機能エディタがセットになっており、タイムライン(タイムスタンプ)や句読点の自動挿入、数値表記変換や文章校正ツールなど、文字起こしエディタとしてもそこそこ優秀なのが大きな特徴です。
文章の読み上げ機能も搭載。耳で聞いたほうが目視よりも間違いを発見しやすかったりしますよ。
- AI(音声認識エンジン):Google
- 対応メディア:音声
- 無料でできること:なし(※3分間の体験版あり)
AI文字起こしツールとは?
https://unsplash.com/photos/qDG7XKJLKbs
最初に書いたように、AIについて詳しくない人でもツールを活用できますが、基本的な仕組みを知っていたほうがAI文字起こしツールの強みを効果的に活かすことが可能です。
というわけで、ここからは初心者向けに簡単なAI文字起こしツールの仕組みについて解説していきます。
AI文字起こしの仕組み
音声認識エンジンと呼ばれるシステムでコンピューターに人間の声を認識させ、文字列に変換する。というのが主な仕組みになっています。
中には音声の特徴(声紋など)を分析して話者を識別することで、会議の議事録などに活用できるツールもあります。
古くは1970年代から開発が続けられてきましたが、近年ディープラーニング技術の進化等により精度が著しく向上し、個人でも手軽に利用できるまでになりました。
とは言っても、認識率は完璧と言えないのが現状。特に同音異義語が多い日本語はまだまだ高い壁があるため、人力(手動)文字起こしを完全にリプレイスするには至っていません。
AI(音声認識エンジン)の種類
代表的な音声認識エンジンは以下の5つ。
- Google Cloud Speech-to-Text
- Microsoft Azure Speech to Text
- IBM Watson Speech to Text
- Advanced Media AmiVoice
- Nuance Communications Dragon
他にもAppleのSiriやAmazon Alexaなどがあり、日本でもNTTやNECが独自の音声認識エンジンを開発しているようですが、今回はAI文字起こしツールでよく使われる上記5種について、それぞれ簡単に解説していきます。
Google Cloud Speech-to-Text
多くのAI文字起こしサービスで採用されているのが、こちらのGoogle製音声認識エンジン。
他のAIと比べて精度が高いのが特徴。多言語対応もしており、方言などもしっかりカバーしています。
無料で使えるのは60分/月とそれほど多くないので、あくまでお試しといった感じですね。
IBM Watson Speech to Text
汎用会話の文字起こしにおいては、Googleに負けず劣らず精度が高いのがこちらのAI。
専門分野も追加学習によって精度を向上させることが可能なので、カスタマイズ前提での利用がおすすめです。
一般個人向けというより、大企業のコールセンター等によく採用されている印象ですね。
Microsoft Azure Speech to Text
全体的にGoogleやIBMに一歩劣る印象ですが、医療・ITジャンルなどではそこそこ精度が高いもよう。
最近、Microsoftが音声認識大手のNuanceを買収したようなので、今後は精度向上や機能追加が期待できそうですね。
Microsoft Azure Speech to Text
Advanced Media AmiVoice
かつてのメジャー文字起こしソフト『AmiVoice SP2』が、現代の環境・ニーズに合わせて進化。
長年実績のある高性能な音声認識技術は、日本語専用文字起こしツールとして抜群の性能を誇ります。
日本語に関してだけ言えば、Googleよりも認識率(文字起こし精度)が高い印象ですね。
Nuance Communications Dragon
Apple Siriの開発元としても知られる、この分野の老舗企業NuanceによるAIがこちら。
※日本でも『AmiVoice SP2』の競合ソフト『ドラゴンスピーチ』として一世を風靡しました。
前述したように、2021年4月にMicrosoftが192億ドルで買収合意。今後はAzureにも機能が取り込まれていくかもしれませんね。
Nuance Dragon Speech Recognition
AI文字起こしツールのメリット・デメリット
AI文字起こしツールを使うメリットとしては、
- 文字起こし作業が短縮化・半自動化できる
- 追加学習で精度を上げられる(※一部ツールのみ)
- 人力の文字起こし代行サービスよりも安く利用できる
主にこれらが挙げられます。
デメリットとしては、
- 手作業での修正が必須
- AI(音声認識エンジン)と音声データの相性が分かりづらい
- 料金プランも分かりづらい
こんなところでしょうか。
慣れてしまえば文字起こし作業を劇的に効率化できる超便利ツールであり、今後もますますの進化を期待できるジャンルではありますが、まだまだ取っ付きづらい印象なのは否めませんね。
逆を言えば、いち早く導入して他者をリードするチャンスとも言えるかも?
まとめ
今回は、AI(音声認識エンジン)を活用した自動文字起こしツールについて解説しました。
最後にもう一度、記事内で紹介したAI文字起こしツール9種をおさらいしておきます。

AIとか難しそうでよくわからない・・・。
そんなふうに食わず嫌いでいると、あなたは大きなチャンスを逃しているかもしれません。
今回紹介したツールを利用すれば、AIやプログラミングの知識がなくても簡単に自動文字起こしができます。
こういった便利ツールを上手に活用できるか否か?は、自身がラクをするというだけでなく、ライバルに差をつける意味でも重要な要素になります。ぜひお早めの行動を。
■ AI文字起こしサービス『文字起こしさん』
『文字起こしさん』は初期費用ゼロ&月額1,000円から利用できる(※無料版あり)オンライン文字起こしツールです。
- 音声・動画・画像など20以上のファイル形式に対応
- パソコン・スマホどちらからも利用可能
- 日本語・英語・中国語をはじめ約30言語に対応
- 医療・IT・介護などの専門用語にも対応
- カスタマイズ辞書機能あり
利用方法はサイトから音声ファイルをアップロードするだけ。数秒〜数十分であっという間に文字起こしテキストが手に入ります。
10分までの文字起こしなら無料で利用できますので、まずは一度お試しください。
Email: mojiokoshi3.com@gmail.com
音声・動画・画像の文字起こしなら文字起こしさん。インストール不要で誰でも無料で利用できる文字起こしサービスです。