日頃より、SACSCRIBEをご利用いただき誠にありがとうございます。
この度、皆様のお声を参考にシステムをアップデートいたしましたのでお知らせいたします。
文字起こし精度の向上
今回のアップデートはこの1点のみになります。自動文字起こしサービスにおいて、「文字起こしの精度」はサービスの根幹ともいえる最重要な部分です。
日頃から継続してご利用いただく人がいる一方で、精度が低いから…ということでご利用をやめられる方もいらっしゃいます。
精度の高い文字起こしを実現するためには次の2つが必要です。
1.文字起こしシステムの品質
2.質の高い音声データ
2については、文字起こしサービスを利用されるユーザー様で対策が可能です(例えば、集音環境を整える、話者の近くで録音をするなど)が、1については我々サービス提供側の問題です。
そこで今回のアップデートでは文字起こしの精度・品質の部分を重点的にアップデートしました。
具体的には次の2つです。
①全体的な精度の向上
②句読点の挿入
特に②は、長文を文字起こしする際に非常に重要な要素と考えています。1,000文字や2000文字がひと繋がりになっていたら校正をする気力もなくなってしまいますよね。
今回のアップデートで自然な位置に句読点が付与されるようになっていますので是非、お試し下さい。
アップデート前との精度の比較
実際に文字起こししたデータを比較してみます。
例文(校正済み)
定刻前ですが、只今から建設水道常任委員会を開会致します。この際、諸般の報告を申し上げます。傍聴はあらかじめ許可してあります。以上で諸般の報告を終わります。
アップデート前(校正前)
帝国前ですがただ今から建設水道常任委員会を開会致しますこの際諸般の報告を申し上げます膨張はあらかじめ許可してあります以上で諸般の報告を終わります
アップデート後(校正前)
定刻前ですが、只今から建設水道常任委員会を開会致します。この際、初版の報告を申し上げます。傍聴は予め許可しております。以上で、初版の報告を終わります。
アップデート前においては、漢字の誤変換に加えて、句読点がないため非常に読みづらい文章になっています。
アップデート後においては、漢字の誤変換が一部あるものの句読点がついていて読みやすい文章になっています。今回の文章では校正は漢字の修正だけで済みます。
長文の文字起こしも読みやすくなっていますので、ぜひ進化したSACSCRIBEをお試しください。
注意点
今回のアップデートでmp4形式のファイルアップロードができなくなっています(近々、アップデートで対応予定です)
mp4動画形式のファイルを文字起こししたい方は下記を参考にmp3などの音声ファイルに変換してご利用下さい。
追記:10月29日 アップデートを行いmp4形式にも対応いたしました。
10月29日現在
現在対応している拡張子:mp3, mp4, wav, m4a, ogg, aac, amr