文字起こしとは?
文字起こしとは、議事録やインタビューを文字に書き起こすことを指します。
音声はその時のテンションや重要な部分が分かりやすいメリットがある一方、全体の文脈を参照するべく聞き返すのに時間がかかるというデメリットがあります。それに対して文字起こしは、瞬時に全体も該当箇所も参照できるので、自分で振り返るときだけではなく、他者と共有しやすいというメリットがあります。
かつては文字起こしをする手法として音声を聞き返すという作業があり、大変時間がかかっていました。しかし近年、様々な「自動文字起こし」サービスが登場しました。
自動文字起こしとは、音声を人が聞き取って文字に起こすのではなく、システムなど機械に自動で文字起こししてもらえるサービスです。
自動文字起こしサービスは、当初精度の低いものが多かったです。現在は精度も高くなり、多くの人に利用されるようになりました。今後自動文字起こしの技術は、AIの発展などにより、さらに精度が高くなっていくでしょう。
文字起こしは何より精度の高さが大切
音声を文字に起こすという作業は、その概念自体は至ってシンプルです。シンプルだからこそ、重視したいのは精度の高さ。
ここで言う「文字起こしの精度」というのは、主に以下の項目になります。
・録音した音声通りに文章が成立しているか
・句読点は入っているか
・漢字は正確に変換されているか
共通するのは、「文章として読みやすいかどうか」という点です。一見「当たり前じゃないか」と言われるかもしれません。ですが、自動で文字を起こすという技術はまだ発展途上で、各種サービスによって精度はまちまちです。自動で文字を起こす精度を見極めることは大切だと言えます。
自動文字起こしができる様々なサービス
録音した音声を自動で文字に起こすには、様々なサービスがあります。
この章では、よく紹介・利用されている自動文字起こしのサービスを紹介します。ある程度紹介・利用されているということは、クオリティが一定まで達しているので、多くの人に紹介できると言えるでしょう。
この記事ではアプリ、サービス、Googleに項目分けをしています。比較内容として、特徴、対応、料金体系、無料で使える時間をピックアップしました。
「対応」では「リアルタイム認識」と「音声ファイル認識」に対応しているかどうかをお知らせします。
無料で使える時間に試してみることで、文字起こしの精度を確認することができます。
文字起こしアプリ5選
自動で文字起こしをしてくれるアプリを5つ厳選してご紹介します。
1.Notta
AIで音声認識を行う「Notta」は日本語・英語など104言語に対応、AIによる音声の自動テキスト化を提供しています。
Chrome拡張機能で利用できます。
・特徴
スピーディかつ正確
スピーディかつ正確にテキスト化を行うことができ、リアルタイムで実行します。会議中必死にメモを取る手間が省け、大事な話に集中できます。レコーディングした音声ファイルの文字起こしも可能。
聞き直したいところがすぐ分かる
音声またはテキストデータの任意箇所をマーキングすれば、重要な部分や聞き取れなかった部分をすぐに頭出しでき、聞き直しが一層便利に。長い会議のレコーディングも、大事なところだけ聞き直せるので、議事録を簡単に作成できます。
データの共有
録音中の文字起こしを他の人とリアルタイムで共有でき、スマホ・パソコンなど複数の端末で同期し、同時閲覧できます。文字起こししたデータやオリジナルの音声データを共有またはエクスポートも可能。
Chrome拡張機能
「Notta Audio Clipper」はYouTubeやポッドキャスト等の音声コンテンツをワンクリックで録音・テキスト化できる便利なChrome拡張ツールです。
・対応
リアルタイム認識…対応
音声ファイル認識…対応
・料金体系
無料 (文字起こしは120分/月)
プレミアム 【一括年払い 】$8.25/月 【月払い】$13.99/月 1800分/月
・無料で使える時間
120分/月
2.Speechnotes
https://play.google.com/store/apps/details?id=co.speechnotes.speechnotes&hl=ja&gl=US
スピーチノートは強力なスピーチ機能付きのノートパッドです。
アイデアや創造性を高めるようにデザインされました。
・特徴
スピーディで効率的
句読点マークは、ボイスコマンドまたは、1クリックで入力できる特許申請中の技術で句読点キーボードで口述させることができます。全ての作業を中断することなく入力しながら口述することができます。
継続性
他のアプリと異なり、長い文章を口述する際に、何度もマイクをクリックするのではなく、文の間に長い休止を取っても、中断しません。
クリーン
クリーンで優雅なデザインと、継続的な音声認識やその他の機能がついているため、リラックスして、アイデアやコンテンツに集中できます。
自動修正、自動保存
自動的に文字間を開け、大文字に変換してくれます。変更の度に自動保存。
1クリックで文字起こしを他のグループと共有します。
・対応
リアルタイム認識…対応
音声ファイル認識…非対応
・料金体系
無料版 0円(広告表示あり)
有料版 500円(広告なし)
・無料で使える時間
無制限
3.Texter
Texter【テキスター】は最新のAI音声認識でレコーディング音声をテキストに変換し、直ぐに確認できます。
画像・音声・動画などのメディアファイルもテキスト化をして、管理できます。
・特徴
音声から文字起こし
音声認識で文字起こしからすぐにシェアできます。
(iOSでサポートしているすべての言語に対応)
録音と音声認識(長い文章の書き起こし、句読点、疑問符への変換もサポート)、ノート詳細画面にて再生・エクスポートにも対応。
画像・動画から文字起こし
画像からテキスト変換が可能。
(iOSでサポートしているすべての言語に対応)
動画音声からテキストに変換・抽出できます。音声のみの抽出にも対応。
画像のテキスト一括変換機能、他のアプリやiCloud Driveからのファイルインポート機能(音声、動画、画像(PDF含む))、複数ページのPDFから文字を起こすのも対応します。
iPad + AppleWatchをサポート
iPadでのマルチタスクに対応(Split View/Slide Over)、他のアプリを使用しながらTexterを常駐できます。
AppleWatchにて録音を再生、iPhone, iPadアプリとの音声ノートの共有にも対応。
リアルタイム翻訳
翻訳サービスは3つから選択可能です。
- DeepL(デフォルト)
- Google オンライン翻訳
- Googleオフライン翻訳
設定画面の翻訳設定より選択できます。
・対応
リアルタイム認識…対応
音声ファイル認識…対応
・料金体系
Free ¥0
Premium M 月額1,000円 リアルタイム文字起こし(3時間 / 月) 録音音声、動画文字起こし(3時間 / 月)
・無料で使える時間
リアルタイムのテキスト化 1分
録音音声、動画文字起こし 短時間
4.Speechy Lite
Speechyは、最新の人工知能と強力な音声認識エンジンをベースにした使いやすいリアルタイム音声入力アプリケーションです。
・特徴
無制限の保存
バックグラウンド音声認識機能
文字数カウントと単語数カウント機能
テキスト翻訳と音声翻訳
語彙の追加機能
音声ファイルによる文字起こし
・対応
リアルタイム認識…対応
音声ファイル認識…対応
・料金体系
Proバージョン 月額4.49ドル (無時間制限音声認識)
・無料で使える時間
無制限(音声認識など機能制限あり)
5.TORUNO
TORUNOは、1クリックで、会議を文字起こし。同時に、録音&PC画面も記録。議事録作成や会議・セミナーの記録に使用できます。
・特徴
かんたん記録
オンライン会議ソフトとの連携不要。1クリックで音声を文字起こしして記録。
まるごと記録
文字起こしされたテキスト、会議音声、PCに映る画面をまるごと保存。
充実した確認機能
音声の再生速度の変更や大事な部分からの頭出し再生。聞きながらの議事録編集も可能。
かんたん共有
記録した会議のURLをコピペでメールやチャット。音声・画面もかんたん共有できます。
・対応
リアルタイム認識…対応
音声ファイル認識…対応
・料金体系
月額1,650円 (無制限)
・無料で使える時間
3時間/月
文字起こしサービス4選
自動文字起こしのサービスをご紹介します。スマートフォンやPCのアプリではなく、クラウド上で文字起こしを行うWebサービスやソフトウェアをピックアップしました。
1.Amivoice® MinutesWriter
「AmiVoice MinutesWriter(アミボイス ミニッツライター)」は、独自開発のAI音声認識エンジンAmiVoiceにより、会議・講演会・インタビュー等の発言を高精度で自動テキスト化。面倒な業務を機械に任せる事で議事録作成・テキスト化業務の負担軽減・コスト削減・スピードアップします。
・特徴
豊富な導入実績と確かなノウハウ
音声認識市場シェアNo.1を誇る実績とノウハウを生かし、導入から運用までサポート。
高い認識精度を実現する辞書
音声認識エンジンをユーザー専用にカスタマイズ。または専門分野の音声認識エンジンを提供。使用開始時から高精度な認識処理が可能です。
発話内容を耳で聞きながら認識結果を編集
編集ソフト「AmiVoice Rewriter」で音声を聞きながら編集ができるため、効率よく音声認識誤りの修正が可能です。
・対応
リアルタイム認識…対応
音声ファイル認識…対応
・料金体系
お問い合わせ
・無料で使える時間
お問い合わせ
2.AI GIJIROKU
導入企業数3,000社突破の文字起こしサービスです。
・特徴
Zoom連携をするだけで発言を字幕表示
国内唯一のZoom連携で、会議やウェビナーでの会話をリアルタイムで画面にテキスト化し、通話終了後は議事録を自動保存します。会話が可視化されるので理解が深まり、リモートワークでも生産性を高めます。
リアルタイム翻訳30か国語対応。外国語を交えた会議に最適
30ヶ国語に対応したリアルタイム翻訳機能で、外国人メンバーとの会話が母国語で記録されます。AIに、翻訳テキストを発話してもらうこともでき、コミュニケーションが取りやすくなります。
・対応
リアルタイム認識…対応
音声ファイル認識…対応
・料金体系
無料
議事録のチュートリアルと閲覧が可能。
スタンダード
1500円/月 個人でご利用いただくのに向いたプラン。
ビジネス
29800円/月 小規模チームでの利用が可能。
プレミアム
200000円/月 大規模なチームでも利用可能な企業向けプラン。
・無料で使える時間
議事録のチュートリアルと閲覧ができる。(議事録の収録はできません)
3.スマート書記
編集しやすいUI(ユーザーインターフェイス)と共同編集で作成時間の削減を実現します。
・特徴
UIが直感的で使いやすい
わかりやすい設計で初めてでも安心して利用可能。
セキュリティも強固で導入も安心
重要な会議でもご利用いただけるようセキュリティはもちろん、社内のセキュリティ体制も万全に対策しており、ユーザーの情報を守ります。
利用定着に向けて説明会によるサポートを充実
専任の担当による導入後の責任者様の展開サポートから、継続的な定着支援まで行います。
・対応
リアルタイム認識…非対応
音声ファイル認識…対応
・料金体系
スタンダード 10万円/月(税別) 契約期間 1年間(自動更新) 200時間/月の利用枠
セキュリティ 12万円/月(税別) 契約期間 1年間(自動更新)
・無料で使える時間
問い合わせ
4.SACSCRIBE
音声をアップロードするだけで自動で文字起こし。音声の管理や校正も全てこれ1つで。
・特徴
音声データ・文字起こしデータを一元管理
今まで個々で管理していた音声データを全てSACSCRIBEに集約可能。あらゆる音声データ・文字データはチャンネルで管理され、優れた検索機能ですぐに抽出可能。また、長期保管も可能です。
直感的に使えるUI
音声をアップロードしてからテキスト化をするまでの操作など、1つ1つの操作が直感的かつ分かりやすいように設計されています。また、編集・校正画面の音声コントロールパネルは、自由に設置場所を移動できるようになっており、編集作業がしやすいです。
いつでも校正・いつでもダウンロード
文字起こしした後も自分で編集・校正ができ、好きなタイミングで編集したテキストのダウンロードが可能です。
・対応
リアルタイム認識…非対応
音声ファイル認識…対応
・料金体系
ベーシックプラン
月額0円 1分35円
定額プラン
月額19,800円(税抜) ※10時間超過時は1分35円
・無料で使える時間
1時間
Googleが提供しているツール2選
Googleの提供しているツールを使ってテキスト化をする手法です。
文字起こしのためのツールと言っているわけではありませんが、文字起こしツールとして活用されている例もあるので、紹介します。
1.Google音声認識
公式:https://www.google.com/intl/ja_jp/docs/about/
Googleドキュメントの音声認識を活用することで、議事録を作成することができます。
使い方はこちらの記事が参考になります。(無料で使えますが、技術者向けです)
参考記事:https://ferret-plus.com/19935
・対応
リアルタイム認識…対応
音声ファイル認識…非対応
・料金体系
無料
・無料で使える時間
無制限
2.Google Cloud Speech-to-Text
公式:https://cloud.google.com/speech-to-text?hl=ja
Googleの音声認識アプリ「Cloud Speech-to-Text」を使ったテキスト化の手法です。
使い方はこちらの記事が参考になります。(無料トライアルがありますが、技術者向けです)
参考記事:https://www.techceed-inc.com/engineer_blog/5670
・対応
リアルタイム認識…対応
音声ファイル認識…非対応
・料金体系
音声認識(データロギングなし – デフォルト) $0.006/15 秒
音声認識(データロギングあり) $0.004/15 秒
・無料で使える時間
60分
自動文字起こしが今後普及する5つの理由
自動文字起こしは、以前に比べると随分精度が上がりました。
しかし、自動文字起こしはさらに普及することが予想されます。
日本の社会情勢も踏まえて、その理由を5つ説明します。
1.人手が足りない
日本は人口が毎年減少しています。生産年齢も減少して、さらに人手が足りなくなっているのが現状です。ですので従業員は、本来の業務に集中することが求められます。
文字起こしを自動化することで、この問題が解消される可能性があります。
2.生産性の低下
日本は年々生産性が低下しています。
時間当たりの労働生産性は世界で21位(2019年)で、生産力を高めることが求められています。
その手段として代行できるものはどんどん代行していこうという企業は多くなるでしょう。
文字起こしの自動化もその一つの手段に含まれます。
3.AIの発達
AIの発達により、近年加速度的に文字起こしの精度が上がりました。
AI技術の成長は日進月歩ですので、今後も文字起こしの精度はどんどん向上します。
4.ビデオ会議が増えた
ビデオ会議が増えたことにより、会議の内容を録画することが多くなりました。録画した映像・音声を文字起こしサービスに登録することが容易になりました。
将来的には文字起こししたデータも一緒に渡すようになるかもしれません。そうすれば取引相手に好感を持たれます。
5.業務時間を短縮できる
人力による文字起こしは時間がかかります。文字起こしをシステムに代行させることで、従業員の業務時間を短縮し、コストカットになります。従業員の立場からは、早く仕事が終わるに越したことはないでしょう。余った時間で生産的な業務に取り組むもよし、早く帰ってプライベートを大切にするもよしと選択肢が広がります。
企業側だけではなく、従業員側にもメリットがあるのが自動文字起こしの技術です。
まとめ:自動文字起こしでコストカットができます。
文字起こしのアプリやサービス、今後普及する理由を紹介しました。
今後さらに自動文字起こしの技術は浸透していくでしょう。
自動文字起こしを活用することで、コストカットができて本来の業務に集中できます。
SACSCRIBEは株式会社サックルが提供する、自動文字起こしサービスです。
SACSCRIBEは、文字起こしの精度はもちろん、編集・校正のUIもわかりやすいので、文字起こしの一連の作業で時短できます。
また文字起こしデータは様々な検索条件で抽出可能。キーワード単位でも検索できるので、ネガティブキーワードや重要キーワードが入っている文字起こしデータもすぐに発見できます。
豊富な検索機能は、チームで共有しやすく便利です。内容を共有しやすいため、あらゆる文字起こしのシーンで活躍します。社内打ち合わせ、インタビューや講演会、カスタマーサポートなど、用途は様々です。
初回1時間の文字起こしが無料なので、ぜひ一度ご検討ください。