音声ツール一覧
声を文字に、文字を声に
音声まわりの作業には、大きく分けて2つの方向があります。文字を声に変える方向と、声を文字に変える方向です。前者は、原稿を耳で聞いて推敲したい、動画にナレーションを乗せたい、外国語の発音を確かめたいといった場面。後者は、会議や面談の録音から議事録を起こしたい、講演を聞きながらメモを残したいといった場面。このカテゴリは、その両方向の作業を無料・登録不要でまかなえるよう、読み上げ・発音確認・文字起こし・ナレーション生成のツールを揃えています。文字起こしや発音確認のように音声をその場で扱うものは、ブラウザに備わったWeb Speech APIで端末内で認識が走るため、録音ファイル自体を外部へアップロードする必要がありません。会議の録音や面談記録のように、外に出したくない音声を扱うときも、この点が安心材料になります。語学学習者にも、動画を作る人にも、毎日会議に出るビジネスパーソンにも、それぞれの「音声の困りごと」に届く構成です。
「音から文字か、文字から音か」で選ぶ
「声を出したい」のか「声を文字にしたい」のか、まずその向きを決めると一気に絞れます。声を出す方向なら——外国語の言い回しを耳で確かめたいときは多言語発音ツール、スピーチ原稿を音にして練習したいときはテキスト読み上げツール、動画に乗せる語りを作りたいときはナレーション作成ツール。文字にする方向なら——会議や面談の録音を議事録にしたいときは音声→文字起こしツール、手元の音声ファイルをまとめてテキスト化したいときは音声テキスト変換ツール。語学・プレゼン準備・コンテンツ制作のどの場面にいるかではなく、「音から文字か、文字から音か」で考えると迷いません。
音声・読み上げツールのよくある質問
読み上げの声は、機械っぽく聞こえませんか?
ブラウザ標準のWeb Speech APIを使っており、最近のEdgeやChromeの音声合成は抑揚もなめらかで、原稿確認や練習用なら十分自然に聞こえます。日本語は男女それぞれ1〜2種類、英語は5種類以上の声から選べます。ただし商品やCMに使う本格的なナレーションには、専用の有料サービスのほうが向いています。
文字起こしは、どんな録音でも正確に変換できますか?
音がクリアな日本語なら90%以上の精度が出ますが、周囲の雑音が大きい、方言が強い、複数人が同時に話している、といった録音では70〜80%程度に下がります。会議録音はノイズ除去で前処理してから入力すると精度が上がります。完璧を期待せず、出てきた文字を読みながら直す前提で使うと実用的です。
会議や面談の録音を文字起こしして、情報が漏れませんか?
漏れません。文字起こしはブラウザのWeb Speech APIによる端末内処理で、録音ファイルそのものをサーバーへ送る工程がありません。秘匿性の高い会議や面談の音声でも、ファイルが外部に出ない状態で文字化できます。
対応している音声ファイルの形式を教えてください。
MP3 / WAV / WebM / OGG / M4Aの5形式に対応しています(新しいブラウザではさらに多くの形式が扱えます)。スマホのボイスメモで録音したm4aも、変換せずそのまま読み込めるので、録ってすぐ文字起こしに回せます。
会議中にその場で文字起こしすることはできますか?
できます。マイクから入る音声をリアルタイムで文字にしていくので、会議中のメモ取りや講演を聞きながらの記録に使えます。リアルタイム認識にはインターネット接続が必要なので、オフライン環境では事前録音した音声を後から変換する形になります。