shirushiとは
実会議の音声に最適化した、自社開発AI
shirushi は、SecureMemoCloud の文字起こし・話者認識を支える自社開発AIです。
読み上げ音声のような整った音声ではなく、複数人が参加する実際の会議音声を前提に設計しています。
マイクとの距離、周囲の雑音、同時発話、言い直し、専門用語など、ビジネス会議で起こりやすい条件に対応し、会議後に読み返しやすい記録を作成します。
ノイズのある実会議でも、専門用語と話者まで正確に捉える。自社開発の音声認識・話者認識AI「shirushi」
Features
shirushi が実会議の音声を扱ううえで重視している、4つの技術的な強みです。
Feature
shirushiとは
shirushi は、SecureMemoCloud の文字起こし・話者認識を支える自社開発AIです。
読み上げ音声のような整った音声ではなく、複数人が参加する実際の会議音声を前提に設計しています。
マイクとの距離、周囲の雑音、同時発話、言い直し、専門用語など、ビジネス会議で起こりやすい条件に対応し、会議後に読み返しやすい記録を作成します。
ノイズに強い
会議音声には、空調音、キーボード音、紙をめくる音、遠くの発言、複数人の重なりなど、文字起こしを難しくする要素が多く含まれます。
shirushi は、こうした実会議特有のノイズを前提にチューニングされています。
録音環境が常に理想的でなくても、発言内容をできるだけ正確に文字化し、会議後の確認・共有に使いやすいテキストへ変換します。
専門用語対策
会議で使われる言葉は、一般的な日本語だけではありません。製品名、略語、部署名、顧客名、業界固有の専門用語など、一般的な音声認識では誤変換されやすい言葉が頻繁に登場します。
shirushi は、業界特化型音声認識AI、オリジナル辞書登録、パーソナライズ校正を組み合わせることで、専門用語に強い文字起こしを実現します。
業界ごとの語彙や言い回しに合わせて、専門用語や固有名詞の認識精度を高めます。
製品名、部署名、顧客名、略語など、社内でよく使う言葉を登録して誤変換を抑えます。
過去の修正傾向をもとに表記ゆれや誤変換を校正し、使うほど業務に合う文字起こしへ近づけます。
話者認識
一般的なWeb会議サービスの文字起こしは、アカウント情報をもとに話者を扱うことがあります。しかし、対面会議、共有端末、会議室マイク、ハイブリッド会議では、アカウントと実際の発話者が一致しないケースがあります。
shirushi は、発話そのものの声の特徴をもとに話者を認識します。誰が何を話したかを発言単位で整理できるため、会議後に読み返したときの確認や責任所在の把握がしやすくなります。
アカウントやマイクの割り当てではなく、発話そのものの特徴から話者を整理します。
登録済みの話者はより安定して識別でき、継続利用する会議ほど確認しやすい記録になります。
部署横断の会議や社外参加者を含む会議でも、人数を気にせず運用できます。
Contact
SecureMemoCloud導入に関するご相談、見積もりのご依頼、トライアルを受け付けています。
あなたのお悩みに専門スタッフがお答えします
2週間の無料トライアルで実際の機能をお試しいただけます