独自音声認識AIshirushiとは

ノイズのある実会議でも、専門用語と話者まで正確に捉える。自社開発の音声認識・話者認識AI「shirushi」

Features

shirushiの特徴

shirushi が実会議の音声を扱ううえで重視している、4つの技術的な強みです。

Feature

技術詳細

shirushiとは

実会議の音声に最適化した、自社開発AI

shirushi は、SecureMemoCloud の文字起こし・話者認識を支える自社開発AIです。

読み上げ音声のような整った音声ではなく、複数人が参加する実際の会議音声を前提に設計しています。

マイクとの距離、周囲の雑音、同時発話、言い直し、専門用語など、ビジネス会議で起こりやすい条件に対応し、会議後に読み返しやすい記録を作成します。

ノイズに強い

雑音や同時発話を含む会議でも、発言を捉える

会議音声には、空調音、キーボード音、紙をめくる音、遠くの発言、複数人の重なりなど、文字起こしを難しくする要素が多く含まれます。

shirushi は、こうした実会議特有のノイズを前提にチューニングされています。

録音環境が常に理想的でなくても、発言内容をできるだけ正確に文字化し、会議後の確認・共有に使いやすいテキストへ変換します。

専門用語対策

業界用語・社内用語まで認識精度を高める

会議で使われる言葉は、一般的な日本語だけではありません。製品名、略語、部署名、顧客名、業界固有の専門用語など、一般的な音声認識では誤変換されやすい言葉が頻繁に登場します。

shirushi は、業界特化型音声認識AI、オリジナル辞書登録、パーソナライズ校正を組み合わせることで、専門用語に強い文字起こしを実現します。

業界特化型音声認識AI

業界ごとの語彙や言い回しに合わせて、専門用語や固有名詞の認識精度を高めます。

オリジナル辞書登録

特許取得

製品名、部署名、顧客名、略語など、社内でよく使う言葉を登録して誤変換を抑えます。

パーソナライズ校正

特許取得

過去の修正傾向をもとに表記ゆれや誤変換を校正し、使うほど業務に合う文字起こしへ近づけます。

話者認識

アカウントではなく、声の特徴で話者を認識

一般的なWeb会議サービスの文字起こしは、アカウント情報をもとに話者を扱うことがあります。しかし、対面会議、共有端末、会議室マイク、ハイブリッド会議では、アカウントと実際の発話者が一致しないケースがあります。

shirushi は、発話そのものの声の特徴をもとに話者を認識します。誰が何を話したかを発言単位で整理できるため、会議後に読み返したときの確認や責任所在の把握がしやすくなります。

声の特徴ベースで自動認識

アカウントやマイクの割り当てではなく、発話そのものの特徴から話者を整理します。

声紋登録でさらに高精度

登録済みの話者はより安定して識別でき、継続利用する会議ほど確認しやすい記録になります。

話者登録人数無制限

部署横断の会議や社外参加者を含む会議でも、人数を気にせず運用できます。

Contact

お気軽にお問い合わせください

SecureMemoCloud導入に関するご相談、見積もりのご依頼、トライアルを受け付けています。