文字起こし

音声から文字起こしする方法を解説!無料ツールも紹介

音声から文字起こしする方法

スマート書記の14日間無料トライアルor資料請求はこちら

インタビューや会議の音声ファイルから、簡単に文字起こしができたらいいな、と思うことはありませんか?この記事は、音声ファイルから単純なタイピング勝負でアナログに文字起こしするのではなく、ツールを用いて簡単・効率的に文字起こしをしたい人へ向けた記事となっています。

インタビューや会議の音声は数10分から長いと2,3時間に及ぶこともあります。それだけの長さがある音声ファイルを流しながらタイピング入力で文字起こし作業をするのは、どれだけタイピングスピードに自信がある人でも少し気が遠くなるものです。

そんなちょっと面倒に思える文字起こし作業を効率化してくれるツールを、無料で気軽に使えるものから、今話題のAIを搭載した文字起こし以外の作業も自動化してくれる豊富な機能を持ったものまで一挙にまとめました。

本記事では

  • 文字起こしとは?
  • 音声を文字起こしする2つの方法
  • 文字起こしツールの主な機能
  • 文字起こしツールの選び方
  • 利用シーン別の最適な文字起こしツール

をご紹介します。

高精度な文字起こしができる「スマート書記」を試してみませんか?

無料で使える文字起こしには精度や使い勝手にどうしても欠点があることが多いです。もし少しでも不満を感じるようなら、一度有料のツールも試してみませんか?

  • 文字起こし結果を自動要約や要点抽出で、全ての入力作業を自動化
  • Zoom、Microsoft teamsなど全てのWeb会議ツールに対応
  • 累計利用社数3,000社以上

無料トライアルを実施中のため、ぜひ一度、スマート書記をお試しください!

文字起こしとは

文字起こしとは、ボイスレコーダーやスマートフォンなどで録音された、インタビューや会議などの音声をテキスト化する作業のことを言います。一言で文字起こし、といっても主に3つの種類があります。

  • 素起こし:言い間違いや意味を持たない言葉も含めて、録音された内容を一言一句そのまま文章に書き起こすこと。
  • ケバ取り:「あー」「ええと」「あのー」といった意味を持たない不要な部分は取り除いて書き起こすこと。
  • 整文:ケバ取りに加え、話し言葉を書き言葉に直したり、文体を「ですます調」に整えること。

それぞれの文字起こし方法は用途によって使い分けます。「素起こし」は、正確に記録をつける場面で使用され、例えばカウンセリングや裁判証拠などで必要とされます。「ケバ取り」は、インタビューや会議の音声ファイルから文字起こしをする際によく用いられます。「整文」は、ウェブ上に公開される記事であったり、資料など読みやすさを求められるケースで用いられる方法です。

文字起こしツールには、単純に素起こしだけを行うツールもあれば、ケバ取りまでしてくれるツールもありますので、ツールを選ぶ際の選択肢のひとつとして考えると良いでしょう。

次は、文字起こしツールを用いて、音声を文字起こしする2つの方法についてご説明します。

音声を文字起こしする2つの方法

音声を文字起こしする方法は、大きく分けて2つあります。ひとつは、タイピングの代わりに発言内容をリアルタイムで文字起こしをする方法、もうひとつは、録音済みの音声ファイルをアップロードして文字起こしする方法です。

ここでは前者を「リアルタイム型」、後者を「アップロード型」と分類します。それでは、この2つの方法について詳しく見ていきましょう。

タイピングの代わりに発言内容をリアルタイムで文字起こしする

リアルタイム型文字起こしツールは、音声を取得して、その場ですぐにツール上でテキストに変換します。リアルタイムで自動文字起こしされた内容を確認できるため、

  • 仮に誤った文字情報で変換されても、その場で修正できる
  • 文字起こしの精度を確認しながらメモを取る、もしくは取らないの選択ができる
  • 会議後に文字起こし結果を確認しながら、振り返りができる
  • 字幕のかわりとして活用でき、音声が聞き取りにくい場所でも話の内容が分かる

といったメリットがあります。

例えば、会議に参加する際に、参加した会議の議事録作成を頼まれた、というシーンで考えていきましょう。もし文字起こしツールを使用しなかった場合、タイピングでひたすら会議の進行や発言内容を書き起こしていくことになります。

議事録を作成するだけでよいのであればまだしも、他と同じように会議にも参加して議事録も取って、となると、タイピングでひたすら議事録のためのメモを取るリソースと、会議内容を理解・把握するリソースで、だいぶオーバーワークになるのが想像できると思います。

そんなときに、リアルタイムで発言内容を文字起こししてくれるツールを使用すれば、全部が全部タイピングで発言内容を書き起こす必要がなくなり、文字起こし内容が誤っている場合の修正程度で済むので、だいぶ作業が効率化されます。

リアルタイム型文字起こしツールのデメリットとしては、オフラインではなくオンライン環境で使用するツールの場合、通信環境が悪い場所で利用してしまうと、文字起こしの精度が著しく低くなってしまい、文字起こし結果が使えない可能性、または修正が大幅に発生してしまう可能があることです。そのため、導入前にツールの使用環境を確認しておくことをおすすめします。

音声ファイルをアップロードして文字起こしをする

アップロード型は、音声ファイルをツールにアップロードしてテキストに変換します。そのため、リアルタイム型のように、通信環境が悪くて文字起こし自体が上手くできなかった、という事態にはならない点がメリットです。

アップロード型の文字起こしツールには、音声ファイル(mp3やwavなど)はもちろんのこと、ツールによっては動画の音声や画像から自動で文字起こししてくれる便利な機能を持ったツールまであります。

両方の文字起こし方法で、自動文字起こしすることが可能なソフトも多いため、具体的な利用イメージがついていない場合は、リアルタイム型かアップロード型か、の二者択一の選択ではなく、両方の文字起こし方法ができるソフトを基本的に選べば問題ないでしょう。

文字起こしツールの主な機能

ここまで、文字起こしの種類から、音声を文字起こしする2つの方法について説明しました。一言で「文字起こしツール」と言っても、一体どういった機能があるのか、ここからは、文字起こしツールの主な機能を詳しくご紹介します。

ツールによって搭載される機能は様々です。文字起こしツールの持つ機能を理解して、どんな機能を持った文字起こしツールが自分の用途に合っているのか、ぜひ参考にしてみてください。

1. 自動文字起こし機能

基本的にはどのツールにもこの自動文字起こし機能は当たり前ですが備わっています。自動文字起こしの精度を高めるために、以下の機能が実装されているツールも多く存在します。ツールを機能比較して選ぶ際には、下記の機能が備わっているかどうかをチェックするようにしましょう。

1-1. 用語登録機能(固有名詞や専門用語を変換する)

固有名詞や専門用語を正しく認識できるかは、自動文字起こしの精度に大きく関わります。例えば会議中に「KPI」と発言したとして、「ケーピーアイ」と変換されてしまっては、とても読みづらいものになってしまいます。

この状態を防ぐために、事前にツール上に固有名詞や、専門用語を登録することで、正しい文字に自動で変換してくれる機能が存在します。ただし、全ての固有名詞や専門用語が自動で変換されないわけではなく、実際にどの単語を登録する必要があるのかは一度利用してみて、変換されなかったときに登録するようにしましょう。

1-2. フィラー除去(無駄な音声を削除)

人が会話をしているときに発せられる「あー」「ええと」「えー」「あのー」などといった、それ自体では意味をなさない短い言葉を除去する機能です。

文字起こしの種類を説明した際に「ケバ取り」と表現しましたが、「ケバ取り」と「フィラー除去」は同じ意味で使われています。使用するツールによって言い方が若干異なるため、注意が必要です。

この機能があることで、より分かりやすい・見やすい状態で、文字起こし結果を確認することが可能です。

3. 話者識別機能

発言者の声色や話し方の癖をAIが自動で認識して、話者を振り分ける機能です。

誰がどういう発言をしたかが重要視される経営会議などでは、ただただ自動で文字起こしされた状態であっても、その発言が誰の発言なのかを明確にする必要があるため、自動文字起こし機能だけでは不十分です。

この機能がなければ、文字起こし結果を確認しても、それが結局誰の発言なのか、録音や録画データを遡るなどといった作業が必要になってしまいますが、この話者識別機能があることで、ひと目で発言者を確認することが可能になります。

4. 要約機能

文字起こしした結果を、AIが自動で要約してくれる機能です。論点をまとめたり、要点を箇条書きにしたりするなどの作業が自動化できます。

ただし要約機能といっても、ツールによって定義が異なるケースがあります。

  • 決定事項やタスクなどをまとめること
  • 話し言葉を書き言葉に変換すること
  • 第三者が理解できるように詳細情報を含んだ上でまとめること

と定義が広いため、自分にあった内容で文字起こしされた情報を要約してくれるかどうかは、一度ツールを利用した上で、チェックすることをおすすめします。有料のツールでも、大体は無料で試すことが可能なので、ツールを選ぶ際は実際に触ってみることをおすすめします。

5. 翻訳機能

文字起こしを会話内容の言語のみならず、設定された言語に自動翻訳する機能です。

中にはリアルタイムで自動翻訳された文字起こし結果を確認することができるソフトもあるため、コミュニケーションツールとして活用することもできます。

文字起こしツールの選び方

文字起こしツールの種類は豊富で、またそれぞれで特徴や機能も異なります。どれを選んでよいのか、迷った際は、次の4点を意識して、必要なツールを比較・検討していきましょう。

デバイス

まず選択肢のひとつとして考えられるのは、手軽にスマホで完結したいのか、もしくは豊富な機能を使いこなすためにPCで作業したいのか、文字起こし作業をしたいデバイスです。

スマホだと無料で使用できるものも多く手軽に使いやすい反面、機能面を求めだすとスマホ版だと限界がある可能性もあります。

またツールによって、スマホだけで完結するもの、PCのみで完結するもの、さらには機能が豊富なツールだとスマホとPCどちらにも対応しているものもあります。スマホとPC両方に対応しているツールでは、録音はスマホでやって、文字起こしした内容の修正やデータの共有はPCで、といった使い分けをすることもできます。

音声認識の精度

音声認識の精度が低いと、結局手直しをする工程が増えるので、音声認識の精度もツールを選ぶ上で大切なポイントです。

どの程度の文字起こし精度を求めるかにもよりますが、さきほどご紹介した「用語登録機能」「フィラー除去機能」が備わっていると、専門用語の多い文字起こしも精度があがり、またケバ取り・整文する工程を減らすことができます。

もちろん音声認識の精度は、ツールだけではなく収録時の環境、機材にも大きく影響するので注意が必要です。例えば、話者が複数人いるのにマイクが1本しかない環境で音声録音すると、マイクに近い人の音声認識の精度は高くなり、マイクから遠い人の精度は低くなる傾向があります。

ツールごとの音声認識の精度は、実際にツールを触ってみて、音声を読み込ませてみて確かめるのが一番です。有料ツールでも大体のものは無料で試せるので、実際に触って確かめてみましょう。

機能の豊富さ

上記で紹介した機能のほか、単純な文字起こし機能だけでなく、WEB会議ツールと連携ができるか、議事録作成にも役立つ要約機能があるか、また、取り扱うデータによってはセキュリティ対策が万全かどうかも選ぶポイントになります。

文字起こしツールをどういった用途で使いたいかによって、どんな機能があると良いか、確認しながらツールを比較してみると良いでしょう。

予算

ツールで使える機能が豊富になればなるほど、比例してツールの値段・利用料も上がります。

個人利用の範囲内であれば無料から月数千円程度、会社で利用するならセキュリティ対策が万全のものでないといけないので、そういった場合は月数万(年単位で契約のものもあります)かかることもあります。

大切なことは、文字起こしツールを使って、何をどこまでやりたいのかを明確にすることです。そうすることで、数多くある文字起こしツールの中から、ある程度利用用途に適したツールを絞ることができるでしょう。

ここまで、文字起こしツールとはなにか、そして、文字起こしツールの選び方をご紹介してきました。ここからは、利用シーン別に文字起こしツールを紹介します。

【無料】まずは気軽にスマホで文字起こしをしたい人向け

利用シーン別のツール紹介として、まずは、スマホで文字起こしを完結したい人向けの、文字起こしツールをご紹介していきます。

1. Group Transcribe

Group Transcribeサービスサイトイメージ

※引用:Group Transcribe

Microsoftの無料iPhoneアプリGroup Transcribeはリアルタイム文字起こしが可能で、日本語・英語を含む80の国と地域で使われている言語に対応しています。会議参加者に招待コードを送ることで、複数人を同じ会議に招待し、会話内容を文字起こしすることが可能です。

対面での会議や会話のリアルタイム文字起こしと翻訳ができる反面、例えば録音した音声を取り込んで文字起こしすることはできない点と、Androidには対応していない点は注意が必要です。

Group Transcribeの特徴

  • リアルタイム文字起こし・翻訳機能
  • 80以上の言語に対応
  • 文字起こしを自動保存

APP Store

2. Speechy Lite

Speechy Lite image

※引用:Speechy Lite

Speechy Liteも無料のiPhoneアプリです。翻訳機能があり、対応言語も88以上と多く、外国語学習の発音練習であったり、グローバルなシーンでも活用することができます。音声を録音しつつリアルタイムで文字起こしをすることが可能です。また話者を識別する機能もあるため、声の聞き分けが非常に楽になるアプリです。

有料プランであれば時間制限無しで音声認識機能を使えます。音声ファイルのインポートにも対応しているようですが、PCで使うような文字起こしツールと比べると、長い音声ファイルの文字起こし機能は少し物足りない印象で、どちらかといえばリアルタイムの文字起こしが向いているツールです。

Speechy Liteの特徴

  • リアルタイム文字起こし・翻訳機能
  • 80以上の言語に対応
  • 音声認識されたテキストとオーディオファイルを、共有機能から様々なアプリに共有できる(Evernote、Dropbox、Googleドライブ、OneDrive、Facebook、Twitter、Snapchat、whatsapp、Lineなど)

APP Store

3. Texter

texterアプリトップイメージ

※引用:Texter

TexterはiOSとAndroidどちらにも対応しています。画像や動画からも文字起こしすることができ、Slackへの自動投稿機能も搭載されていて、手軽に文字起こしの作成と共有までを実施することができます。音声ファイルを文字起こしするだけではなく、その場で録音し、それを文字起こしすることが可能です。

無料版だとリアルタイム文字起こしは1分、録音音声や動画からの文字起こしは短時間しかできません。無料版で物足りない場合は、利用時間によってサブスクを契約して使用すると良いでしょう。

Texterの特徴
  • 専門用語の文字起こしの精度が高い。
  • 音声ファイルだけでなく画像や動画からも文字起こしができる
  • 翻訳機能、文字起こし結果の要約、リスト管理、SNS共有など機能が豊富

APP Store

PCユーザー向け文字起こしツール6選

上記では、スマホで手軽に文字起こしできるツールを3つご紹介しました。無料で使えるものは、気軽に使いやすい反面、機能面でどうしても制約があります。

便利に豊富な機能を使いこなしたい場合は、スマホの有料版を使用しても良いですし、もしくはPCで使用できる有料版の文字起こしツールを検討してみても良いでしょう。ここからは、主にPCで使用する有料版の文字起こしツールを6つご紹介します。

音声ファイルから文字起こしをしたい人向け

リアルタイムでの文字起こしではなく、録音済みの音声ファイルから文字起こししたい人向けの文字起こしツールを3つご紹介します。

1.「MicrosoftWord」トランスクリプト機能

Microsoft Wordサービスサイトイメージ

※引用:Microsoft Word

MicrosoftWordのトランスクリプト機能は、Microsoft 365に申し込むことで使用するブラウザ版で利用できる機能です。トランスクリプト機能を使うと、音声ファイルをアップロードして文字起こしすることができます。アップロードできる音声ファイルは2024年1月時点で、wav、mp4、m4a、mp3となっています。

下記の参考記事では、画像付きで詳しく使い方を解説しているので、トランスクリプト機能を使用してみたい方、具体的な手順や解説が知りたい方はこちらをご覧ください。

参考記事:【画像で解説】Wordで文字起こしする2つの方法!おすすめの文字起こしソフトもご紹介

Wordで文字起こしする際に注意点を上げるとすれば、音声データのアップロードは最大300分/月の制限があることです。ひと月あたりの文字起こし量が300分には収まらない、という場合は、Word以外の文字起こしソフトを検討すると良いでしょう。

MicrosoftWordトランスクリプト機能の特徴
  • 自動で話者が識別される
  • 発言した時間が文章に反映され、タイムスタンプ機能(該当時間をクリックするとその部分から聞き直せる機能)もある
  • 録音した音声を保存できる

サービスサイトURL

2. 文字起こしさん

文字起こしさんサービスサイトイメージ

※引用:文字起こしさん

文字起こしさんは音声ファイル・動画や画像から文字起こしができるサービスです。音声・動画ファイルをアップロードすると、自動で文字起こしをしてくれて、テキスト形式や動画字幕用の形式のファイルをダウンロードすることができます。ブラウザ上で使えて、無料お試しで1分の長さの文字起こしができます。

料金体系もシンプルでわかりやすく、音声や動画ファイルから文字起こしすることをメインで使用したい人には、まずは気軽に使用できるソフトです。

文字起こしさんの特徴
  • 有料版もプランはシンプルで、月毎にアップロードするデータ量によってプランが¥1,100/¥2,200/¥3,300と分かれている。
  • 辞書機能で音声認識精度の向上
  • ブラウザ上でファイルをアップロードして文字起こしできる(リアルタイムでの文字起こしには対応していない)

サービスサイトURL

3. writer.app

writer.appサービスサイトイメージ

※引用:writer.app

writer.appの一番の特徴としては、「文章校正」機能です。敬体(ですます調)と常体(である調)が混在している場合や、同じ助詞や接続詞が連続で使用されている場合などを検出してくれます。20項目検出してくれる文章校正機能を利用することで、より良い文章作成をサポートしてくれるツールです。

writer.appの特徴
  • 料金がお手頃で、無料プランに加えて、Proプランの料金は¥500/月と試しやすい(自動文字起こしは従量課金制)
  • 精度の高い文章校正機能があり、リアルタイムで読みやすい文章に整えてくれる。
  • 音声ファイル以外に、画像や動画からも自動で文字起こしができる。

サービスサイトURL

豊富な機能で文字起こし以外も自動化したい人向け

文字起こしツールには、自動文字起こし機能だけでなく、豊富な機能が搭載されたツールもあります。ここからは、文字起こし以外の作業も自動化したい人向けのツールを3つご紹介します。

1. スマート書記

スマート書記サービスサイトイメージ

※引用:スマート書記

スマート書記は累計利用社数3,000社を突破している文字起こしソフトです。文字起こしを活用して議事録作成の工数削減を目的としています。

プランは基本使用料+AIパックから構成されており、全ての機能が利用可能となっています。

また、Web会議・対面会議に対応できるのはもちろんのこと、Webと対面のハイブリッド型会議にも対応できるのが特徴です。Web会議ツールも選ばないので、ほとんどの会議シーンで文字起こしが利用できます。

スマート書記の特徴
  • フィラー除去や用語登録で高精度な文字起こしを実現
  • 文字起こし結果を自動要約や要点抽出で、全ての入力作業を自動化
  • Zoom、Microsoft teamsなど全てのWeb会議ツールに対応

14日間の無料トライアルor資料請求はこちら

2. toruno

torunoサービスサイトイメージ

※引用:toruno

torunoは文字起こし、録音、画面キャプチャを同時に記録できるツールです。会議中、リアルタイムで発言をブックマークすることもできるので、重要な箇所を素早く振り返ることができます。

ボイスメモなどで録音した音声ファイルや、WEB会議を録画した動画ファイルをアップロードすることで文字起こしすることができます。プランとしては、記録時間3時間分無料で試せる個人向けプランから、法人向けのプランまであります。

torunoの特徴
  • 記録時間3時間まで無料で試せるプランあり(アプリ版)
  • Web会議ツールと連携不要
  • ​​ユーザー辞書登録に学習機能を搭載

サービスサイトURL

3. Rimo Voice

Rimo Voiceサービスサイトイメージ

※引用:Rimo Voice

Rimo Voiceは、利用企業100社以上の、日本語に特化した文字起こしエンジンを採用している文字起こしソフトです。5つのプランに分かれており、自分の利用時間に合わせて適切なプランを選択することが可能です。

ICレコーダーの録音データやWeb会議の録画データを読み込ませて文字起こしできるだけでなく、会議中の音声をリアルタイムで文字起こしすることもできます。

Rimo Voiceの特徴
  • 日本語に特化したAIで自動文字起こし
  • テキストと音声がシンクするスライダー機能
  • AIが10秒で要約も作成

サービスサイトURL

【番外編】英語に特化した文字起こしツール

文字起こしツールの中には、英語の利用シーンを主な想定とした、英語の文字起こしに特化したツールもあります。英語での文字起こしをメインでお考えの方はこちらも検討してみても良いかもしれません。

Otter

Otterサービスサイトイメージ

※引用:Otter

Otterは、英語に特化した文字起こしツールです。マルチデバイスに対応していて、同じアカウントでログインすることで、スマートフォンで録音をしながら、同時にPCからテキストを確認するということも可能です。

リアルタイムの文字起こしに特化しており、会議、インタビュー、講義など、様々な場面で活用できる

Otterの特徴
  • Basicプランでも毎月600分まで無料で使える
  • 録音した内容をキーワードで検索することができる
  • さまざまな国の人が話す英語に対応している

サービスサイトURL

【まとめ】自分にあった方法で音声から文字起こしをしよう

本記事では、

  • 文字起こしとは?
  • 音声を文字起こしする2つの方法
  • 文字起こしツールの主な機能
  • 文字起こしツールの選び方
  • 利用シーン別の最適な文字起こしツール

をご紹介しました。

「文字起こしツール」と一口で言っても、ツールによってそれぞれ別々の特徴を持っていることがわかったかと思います。

単純に「素起こし」だけできたらいいのか、「ケバ取り」「整文」まで簡単・効率化したいのか、専門用語や外国語に対応したツールが良いのか、WEB会議に簡単に連携できて、要約機能なども搭載した議事録作成に特化したツールが良いのか、それぞれの目的に応じて最適なツールを選びましょう。

高精度な文字起こしができる「スマート書記」を試してみませんか?

無料で使える文字起こしには精度や使い勝手にどうしても欠点があることが多いです。もし少しでも不満を感じるようなら、一度有料のツールも試してみませんか?

  • 文字起こし結果を自動要約や要点抽出で、全ての入力作業を自動化
  • Zoom、Microsoft teamsなど全てのWeb会議ツールに対応
  • 累計利用社数3,000社以上

無料トライアルを実施中のため、ぜひ一度、スマート書記をお試しください!

この記事を書いた人
スマート書記ブログチーム

端末1台で録音や文字起こしを実現、全てのWeb会議ツールに対応。発言録も、まとめ型の議事録もスマート書記でカンタン作成

関連記事

14日間無料トライアル
または資料請求

料金や導入に関する疑問やご相談など
お気軽にお問い合わせください。

※トライアルは法人または団体として商用のご契約を検討いただける
お客様を対象としております