high_accuracy_ribbon
speech-accuracy-badgeretention-rate-badge
securememo-cloud-lp-catch

導入社数

1200+

累計文字起こし時間

380000+

世界最高水準96.2%の音声認識率で音声を文字起こし

SecureMemoCloudは、世界最高水準96.2%の高精度な音声認識AIで、素早く文字起こしができます。ノイズが混ざっていたり、さほど明瞭でない音声でも高い精度を誇ります。
また、文字起こしで終わることなく、ほぼ完成版の議事録をAIが作成してくれる「ほぼ完議事録」機能まで提供します。
対面/Web会議での議事録作成、インタビューの文字起こし等で幅広く活用できる業務効率改善ツールです。

OpenAI Whisperを上回る精度!
リアルな会議音声の認識精度を向上させた
独自AI「shirushi」

サービス提供開始から、数百社の企業様にご利用いただく中で、リアルな会議音声データを収集させていただき、弊社が独自に策定したアノテーションルールに基づき訓練データ化し、OpenAI Whisperについてファインチューニングを行いました。
その結果、リアルなビジネス会議音声について、既存サービスに対してだけでなく、オリジナルWhisperに対しても格段に性能の高いAIモデル開発に成功いたしました。
この音声認識AIを「shirushi」と名付け、SecureMemoCloudに搭載しております。 通常の音声認識精度を測る方法として、読み上げ音声に対する認識率を表示されることが多いですが、shirushiでは、リアルな会議音声について音声認識精度を向上させることが最も重要であると捉え訓練を行い、リアルな会議音声の認識率についても自信を持って提供しております。

solution-shirushi-1

上記評価に使用した音声例

solution-shirushi-2

上記評価に使用した音声例

ほぼ完成版の議事録「ほぼ完議事録」機能の提供

タイトル、日時、参加者、決定事項、議事要旨を備えた、「ほぼ完成」版の議事録をAIが作成してくれる、強力な機能です。

solution-hobokan

元の文字起こし結果が正確で具体的でなければ、一見して体裁が整っているだけで、実用的な議事録にはなり得ません。

圧倒的に精度の高い文字起こしと、生成AIを高度に組み合わせることで初めて実現した、唯一無二の議事録作成機能です。

※日本語・英語のみ対応

SecureMemoCloudを導入した効果

section-result

想定1:年間1000時間の会議について、1会議につき3時間の作業時間で会議録作成をしている

想定2:年収600万円の従業員が会議録作成を行っている

※弊社独自の調査により算出

節約できる時間とコストのシュミレーション

文字起こししたい会議時間は?

時間

section-result-1

時間の削減

section-result-1

円の削減

1会議の会議録作成にかかっていた3時間が30分まで短縮。年収600万円の従業員が会議録作成を行っているとする。

ツール使用料をビジネスプラン(200時間)にて試算

【業界初・特許出願中】End-to-End型の音声認識AIと
大規模言語モデルを組み合わせた専門用語・社内用語の認識機能

世の中では一般的ではない社内用語や専門用語なども、このように単語登録をすることで文字起こし精度をさらに高めることが可能です。単語を1つずつ登録することはもちろんのこと、CSVによる一括アップロードで登録することも可能です。

<単語登録前後の精度比較>

単語登録前後での音声認識・文字起こし精度は以下のようになります。登録された単語に対する文字起こし結果の改善が見られます。

事例:物流業界

単語登録前後の文字起こし結果:

section-proofreading-diff-logistics

単語登録方法:

section-proofreading-dict-logistics

使用した音源:

事例:医療業界

単語登録前後の文字起こし結果:

section-proofreading-diff-medical

単語登録方法:

section-proofreading-dict-medical

使用した音源:

【23業界の特化型AI搭載】業界ごとの特有の用語に対する認識率を向上させる、これまで以上の高精度な文字起こしAI

汎用的な文字起こしに適した通常パターン以外にも、業界ごとの特有の用語に対する認識率を向上させ、これまで以上に高精度な文字起こしを実現する業界特化型AIを選択することが可能です。

<対応業界>
建築業界、医療業界、製薬業界、銀行業界、証券業界、保険業界、法律業界、化学業界、IT業界、不動産業界、物流業界、飲食業界、コンサルティング業界、消費者調査、製造業、人事労務、会計監査、情報セキュリティ、マーケティング、自治体、国会、学校、農業

▼建設業界

section-sector-proofreading-diff-logistics

▼医療業界

section-sector-proofreading-diff-medical

圧倒的な音声認識精度でこんなお悩みを解決!

solution-1

議事録作成に時間が取られている

議事録は「決定事項が決まった経緯を知る」「後で言った言わないの問題を避ける」などの目的で重要ですが、会議で発言しながら記録するのは難しく、また会議後に音声を聞きながら文字起こしするのは会議時間以上に時間がかかってしまいます。SecureMemoCloudはそのお悩みを一挙に解決します。

solution-2

従来の音声認識ソフトでは手直しが大変

従来の音声認識ソフトでは、文字起こしの精度の問題に加えて「えっと」「あのー」といった、発言はあるが議事録では削除したい文言(フィラー)が含まれてしまい、結局議事録作成の手間が変わらない問題がありました。SecureMemoCloudは、高い認識精度とフィラー除去を兼ね備えたAIを搭載しており、手直しが少なく済みます。

solution-3

会議のデータ化を進め会社の新しい資産にしたい

そもそも、会議の会話を手間なくデータに残せるなら、もっとたくさんの会議をデータ化したいニーズもあるのではないでしょうか。SecureMemoCloudであれば、これまでデータ化できず消えてしまっていたものを新たにデータ化し、会社の新しい資産にすることができます。

SecureMemoCloud ができること

①世界最高水準の精度を誇る音声認識で正確に文字起こし

ChatGPTで著名なOpenAI社提供のWhisperというAI音声認識モデルを、リアルな会議録の文字起こしを目的に独自にチューニングして活用しており、日本語の音声認識率96.2%で文字起こしが可能です。ノイズが混ざっていたり、さほど明瞭でない音声でも高い認識精度を誇る点が強みです。文字起こしした後の手直しが少なく、作業負担が軽減できます。

section3/2.png

②60分の音声を4分で文字起こし

AIの動作に特化した音声認識環境を独自に構築しており、60分の音声ファイルを最短4分で文字起こしすることができます。 会議が終わって自席に移動している間に文字起こしが完了するので効率的に作業を進めることができます。

section3/3.png

③生成AIを活用し、人間が書いたような要約作成が可能

生成AIを使った会議録特化の要約機能を搭載しており、議事録作成の作業時間をさらに短縮することができます。全体の流れが掴める要約、トピック別にToDo等をまとめる要約など、必要な形式の要約を短時間で作成することが可能です。

section3/voiceprint.png

④事前の声紋登録が不要な、完全自動での話者識別

声区間検出・話者⾳声からの特徴量抽出の2点について、個別に最適化したニューラルネットワークを適⽤しています。

section3/languages.png

⑤約100言語の音声の文字起こし・翻訳に対応

日本語だけでなく、英語、中国語、タイ語などを含む約100言語の音声文字起こしと翻訳が可能です。

その他の便利な機能

※一部機能は開発中のものがあります

フィラー除去

単語登録

音声再生パターン変更

テキスト編集

音声・テキストDL

ワークスペース共有

料金プラン

フリープラン登録後、法人様限定でチームプランと同等の機能(データ非学習機能を除く)を2週間無料でお試しいただけます。

※料金は内税表記となります

フリー

一度試してみたい方

0円/月

0円(月払いの場合)

パーソナル

個人で定期的に使いたい方

1,080円/月

1,080円(月払いの場合)

チーム

1部署で使いたい方

\ 年払いで4ヶ月分お得!! /

19,500円/月

29,000円(月払いの場合)

ビジネス

複数部署で使いたい方

\ 年払いで4ヶ月分お得!! /

99,000円/月

149,000円(月払いの場合)

文字起こし可能時間/月1時間3時間25時間200時間
アカウント数1名1名10名100名
文字起こし時間
超過時料金
超過不可900円/時間780円/時間(年契約)
1,160円/時間(月契約)
495円/時間(年契約)
745円/時間(月契約)
アカウント数
超過時料金
--500円/アカウント500円/アカウント
AI議事録作成料金0円300円/音声1時間300円/音声1時間300円/音声1時間
ファイルインポート音声認識
多言語音声認識
約100言語
多言語翻訳(ベータ版)
約100言語
完全自動話者認識
AI議事録作成
テキスト編集
テキストデータダウンロード
音声データダウンロード
キーワード検索
データ共有--
単語登録
リアルタイム音声認識
※近日リリース予定
Web会議ツール連携
※近日リリース予定
カスタマーサポート-メール/オンライン面談メール/オンライン面談メール/オンライン面談
データ学習利用学習しない学習しない
対応OSWindows,MacOSWindows,MacOSWindows,MacOSWindows,MacOS
対応ブラウザChrome,Safari,EdgeChrome,Safari,EdgeChrome,Safari,EdgeChrome,Safari,Edge

よくある質問

文字起こしの精度はどの程度ですか?

世界最高水準96.2%の精度となります。
対面会議のように、ノイズが混ざっていたりさほど明瞭ではない音声でも高い認識精度を誇る点が強みです。

文字起こし結果の手直しの手間はどうですか?

SecureMemoCloudでは、「えっと」「あのー」等のフィラーがほぼ除かれるため、文字起こし結果の手直しの手間が少ないのが特徴です。
また、単語登録機能や、生成AIを活用した自動校正機能も搭載予定で、手直しをほとんど不要とすることも可能です。

話者の特定は自動でできますか?

事前の声紋登録が不要な、完全自動の話者特定AIを搭載しています。数名の音声であれば高い識別精度を実現します。

議事録も作ってくれますか?

文字起こしにとどまらず、タイトル、日時、参加者、決定事項、議事要旨を備えた、「ほぼ完成」版の議事録をAIが作成する機能を提供しています。

文字起こしにはどのくらい時間がかかりますか?

60分の音声を4分程度で文字起こしが可能です。AWS上に構築したGPUサーバー環境にて、高速の処理を実現します。 文字起こしが完了した発話から順に表示しますので、文字起こし開始直後から処理結果を確認できます。全ての処理が終わるのを待つ必要もありません。

導入実績はありますか?

2024年4月のリリース以降、半年経過時点で1200社超にご利用いただいています。
建設、ITなど幅広い業界の民間企業様や、大学、医療機関、自治体様などにご利用いただいています。

お問い合わせ

および

ユーザー登録(無料)

はこちら