近年、生成AIの急速な進化を背景に、会議や商談の議事録作成を自動化するAIツールへの注目が高まっています。単なる書き起こしにとどまらず、要約や分析まで行うツールが登場したことで、業務効率化の手段として、多くの企業が導入を検討するようになりました。

しかし、AIを使った議事録作成ツールには、要約や話者分離の精度、機密情報を含む会議でのセキュリティ面などに不安があるといった声も少なくありません。導入後に「思っていたものと違った」という事態になれば、せっかく費やした時間とコストが無駄になってしまいます。

本記事では、AI議事録自動作成ツールの「YOMEL by PKSHA」を提供する株式会社PKSHA Infinity様に、ツールへのAI実装の背景や議事録の精度、実際の使い勝手やセキュリティ面に関して、詳しくお話を伺いました。実際の導入事例や現場での工夫を通して、AI時代における議事録作成のあり方と、業務改善につなげるためのヒントを紐解いていきます。

ベンダー情報

株式会社PKSHA Infinity 取締役 兼松 崇 氏

生成AIを使った議事録作成ツールでは何ができるようになる?

Q:YOMELの生成AI機能ではどんなことができるようになるのか?

 

兼松氏

A:あらゆるビジネス対話の場面において、質の高い議事録を瞬時に作成できるようになります。複数のLLM(大規模言語モデル)の活用により、一般的なAIツールでは到達できない高品質な議事録を生成できます。

特徴①:ビジネス対話の自動書き起こしと要約

対面での会議や商談にも対応しており、スマートフォンのアプリやPCの内蔵マイクから音声を拾うだけで利用できるため、場所や環境を選びません。また、要約が完成するまでの時間も短く、30分程度の会話であれば、わずか2〜3分で書き起こしと要約が完成します。これまでは会議後に時間を取られていた議事録作成の手間を、大幅に削減することが可能です。

特徴②:アウトプット形式の柔軟なカスタマイズ

YOMELでは、単に会議の要約だけでなく、書き起こした内容を「自分たちが出したい形」に合わせてカスタマイズし、目的に沿った議事録を作成することができます。あらかじめ複数の公式テンプレートが用意されているため、商談用や経営会議用、面接用など、シーンに合わせてテンプレートを選ぶだけで、適切なアウトプットを得ることができるのです。

特徴③:複数のLLMを掛け合わせた高精度な処理

議事録の生成には、システムの裏側で複数の異なるLLMを使用しています。たとえば、文字校正の工程や重要なトピックスを抽出する工程など、それぞれの得意分野を役割分担させることで、単一のLLMでは実現しにくい質の高いアウトプットが実現します。ユーザー側でLLMを選択する必要はなく、あらかじめ設定された複数のLLMを組み合わせてYOMEL側で処理が行われます。

Q:どういったニーズから生成AI機能の実装に踏み切ったのか?

 

兼松氏

A:背景としては「長時間の会話内容を簡単にまとめたい」というお客様からのニーズに応えるため、書き起こしデータをビジネスで活用しやすい形に整える手段として、生成AIの実装に踏み切りました。

もともと私たちは、音声認識のエンジンを持つ会社として、ビジネスにおける対話内容を書き起こすサービスを展開していました。しかし、実際にサービスを提供していくなかで、単なる書き起こしだけでは「お客様が抱えている本当の課題」を解決できないということがわかってきました。

そこで、実際にヒアリングを重ねていくうちに、お客様のニーズは「会議の会話内容を漏らさずに書き起こしたい」ではなく「要点が整理された要約作成サービスを求めている」ということに気が付きました。このときの気付きこそが、今日の生成AI機能の実装につながったといえるでしょう。

AI議事録作成ツール「YOMEL」では、1クリックで要点が整理された議事録を瞬時に作成してくれる

生成AIを使った議事録作成ツールは本当に現場で使える?

Q:音声認識の精度に問題はないのか?

 

兼松氏

A:はい。専門用語の辞書登録や豊富なテンプレートにより、実用に耐える議事録を瞬時に作成できます。

実際の会議では、業界特有の専門用語や社内だけで通じる略語などが頻繁に飛び交います。ツール内には辞書を登録する機能が備わっているため、事前に用語を登録しておけば、特殊な用語であっても正確に認識させることが可能です。

また、議事録の粒度や書式についても柔軟に対応できます。あらかじめ複数の公式テンプレートが用意されており、商談用や経営会議用、面接用など、目的に合わせて選ぶだけで適切な要約の出力が可能です。自社に合った独自の議事録フォーマットがある場合は、カスタム機能を使って新たにテンプレートを作ることもできます。

加えて、プロンプトで「このような要約をしてほしい」という指示を設定しておけば、以降は毎回同じ書式で議事録が生成されます。たとえば、面接用のテンプレートを用意しておいた場合、30分ほどの会話であっても、わずか2〜3分で指定通りの要約が完成します。

複数の公式テンプレートが用意されているうえ、カスタム機能で独自のプロンプトを設定することも可能

Q:複数人が参加する会議でも問題ないのか?

 

兼松氏

A:複数人が参加する会議でも問題なく利用できます。一方で「話者分離(誰が話しているのかを正しく識別して分けること)」の精度は現状「約7割程度」であり、継続的な改善が進んでいます。

話者分離に関しては、現状完璧な精度とは言えないため、音声認識エンジンの開発チームが技術向上に向けて日々研究開発を続けています。おおよそ2か月に1回のペースで定期的なアップデートを行っています。

話者分離は技術的に難易度が高いため、一足飛びに精度を100%にはできません。この点は課題感として捉えています。将来的には個人の声をあらかじめシステムに記憶させる「声紋登録機能」などを追加することによって、技術的な壁をカバーし、最終的には100%の精度を目標に改善を続けています。

生成AIを使った議事録作成ツールのセキュリティは大丈夫?

Q:AIのモデル学習にデータは使われないのか?

 

兼松氏

A:各生成AIサービスのポリシー上、学習に利用されないことが明記されています。

要約処理に利用される会議音声や書き起こしデータは、AIモデルの学習に利用されない運用となっています。利用する生成AIについては、各提供事業者のポリシーを確認したうえで、入力データがモデル学習に使われない条件で運用しています。

また、録音データ自体は、要約処理を行うLLMとは別にAWS上で管理されています。アクセス制御やアクセスログ記録が行われた環境で保存されていますので、外部に自社の機密情報が取り込まれることはありません。ユーザーは手元のブラウザからそのサーバーにアクセスし、内容を確認する仕組みです。

Q:社外秘や機密情報の多い会議でも使えるのか?

 

兼松氏

A:機密性の高い会議でも使いやすいよう、各種セキュリティ機能を備えています。

たとえば、アクセスできるネットワークをIPアドレス単位で制限する「IPアドレス制限」機能や、企業のセキュリティポリシーに合わせた「SSO(シングルサインオン)」でのログイン機能(SSOオプション契約が必須)にも対応しています。

さらに、システム内での閲覧権限も細かく設定することが可能です。特定のグループに入っているメンバーしかログを見られないようにする「シークレットグループ」機能や、自分以外の誰にもログを見られないようにする「プライベートモード」機能も備わっています。議事録を共有する際にパスワードを設定し、閲覧制限をかけることもできるため、機密度の高い経営会議などでも安心して利用できます。

生成AIを使った議事録作成ツールはどこまで自動化してくれる?

Q:人の手直しはどれくらい発生するのか?

 

兼松氏

A:ほとんど手直しは発生しません。音質が安定しており、用語登録やテンプレート設定が行われている環境下においては、修正の手間を最小限に抑えられます。

要約のアウトプット形式も自由に指定できます。テンプレートやプロンプトによってフォーマットを細かく設定することができるので、出力された要約結果はほとんど修正することなく、そのままお客様へ提出したり、社内での情報共有に使ったりする形で活用されています。

生成AIが文脈を読み取り、指定されたテンプレート通りにきれいな文章に整えてくれるため、録音を聞き直して人間が構成を考え、文章を書き直すという議事録作成の負担をゼロに近づけることができます。手直しを前提としない質の高いアウトプットが出るからこそ、業務の大幅な効率化が実現できるのです。

あらかじめアウトプット形式を指定しておくことで、手直しゼロの議事録を作成できる

Q:音声以外のデータも自動抽出できるのか?

 

兼松氏

A:投影されるスライドや画面共有のテキストなどの読み取りには対応していません。現状はあくまで、会議中の「音声・動画データのみ」が書き起こし・要約の対象となります。

ただし、音声や動画データからであれば、多種多様な情報を自動抽出することが可能です。議事録の基本である「ToDo」や「決定事項」「ネクストアクション」の自動抽出はもちろんのこと、プロンプトで指示をしておけば、商談やインタビューにおける「質問に対する回答の的確さ」などを分析し、点数化するといった独自のカスタマイズも実現できます。

また、こうしたプロンプトは一度設定してしまえば、会議のたびに再度手動で指示を入力し直す必要はありません。抽出できる情報の種類や形式の自由度も非常に高く、プロンプトの設定次第で会話以上のアウトプットを出すことも可能です。たとえば「この商談における会話を10段階で採点してほしい」といった指示も、LLMが文脈を読み取った上で対応してくれます。

生成AIを使った議事録作成ツールはどんなシーンで使える?

Q:外部のソフトと連携できるのか?

 

兼松氏

A:外部の会議ツールとAPIで直接連携する仕様ではありません。一方で、Web会議の開始検知による録音開始のポップアップ表示や、Slackへの通知には対応していますので、録音の押し忘れは少ないでしょう。

ツールは主にPCアプリとして稼働する仕様になっており、WEB会議ツールに合わせて連携や特別な設定を行う必要はありません。PC上でオンライン会議が始まると、アプリがそれを「自動検知」し、画面上に「録音を開始しますか?」というアラートの小窓を表示してくれます。わざわざユーザーがツールを立ち上げる必要がないため、録音の押し忘れを防ぐことが可能です。

また、Slackとは通知機能の連携を行っており、会議開始時にアプリのスタートボタンを押し、終了時に終了ボタンを押すと自動的に処理が回ります。要約が完了するとSlackに直接通知が届くようになっているため、シームレスな運用が可能です。

Q:オフライン会議でも使えるのか?

 

兼松氏

A:オンライン会議だけでなく、対面での会議や商談の録音にも対応しています。スマートフォンのアプリを使って録音したり、PCの内蔵マイクから直接参加者の音声を拾って録音したりといった運用も可能です。

現状ではリアルタイム翻訳はできないものの、グローバルなビジネスシーンに対応できる「英語モード」機能もオプションで提供しています。日本語と英語が入り混じるような会議であっても、英語で話された箇所は英語に、日本語で話された箇所は日本語に書き起こしされます。

蓄積された会議のログは自動的に保存される仕様になっているため、後からキーワードで検索したり、ナレッジとして活用したりといったことも可能です。会議履歴から自動でナレッジベースを作成する専用機能は、現在開発を進めている段階です。

生成AIを使った議事録作成ツールは今後どう変化していく?

Q:生成AIの登場によって今後の議事録作成ツールはどう変化していくのか?

 

兼松氏

A:今後の議事録作成ツールは「対話の価値を作ること」に踏み込む存在へと変化していくと考えています。

これまでの議事録作成ツールは、主に会議が終わった後の「事後処理」を効率化することが主な役割でした。しかし、これからのツールは、よりUIやUXが洗練され、誰でも簡単に使えることはもちろん、ツール自体が議事録作成の枠を超え、会議の質を向上させるアシスタントのような存在へと進化していくはずです。

具体的には、会議中に「次にどういう問いを投げかけるべきか」を提案してくれたり、会議をスムーズに進めるための準備をフォローしてくれたりといった機能が実現していくと考えられます。

Q:プロダクトとして今後どのような価値をユーザーに提供していくのか?

 

兼松氏

A:単に会議の記録を残すだけでなく、会議の質そのものを良くしていく価値を提供したいと考えています。

会議の良し悪しは、どのような事前準備があったか、あるいはどのような問いかけが行われたかによって大きく左右されます。

今後は、ツールがそのプロセスに介入し、リアルタイムでのサジェストや会議後のアクションへのつなぎ込みを支援することで、会議をどんどん良くしていく構想を持っています。単に文字を記録するツールから、会議そのものを良くし、対話の価値を最大化するパートナーとして、今後もプロダクトを進化させていきたいです。

まとめ:「書く」から「対話の価値を高める」へ。YOMELが描く議事録の未来

YOMEの生成AI機能の最大の強みは、複数のLLMを掛け合わせた高精度な要約と、カスタムテンプレートによる柔軟なアウトプット設定にあります。加えて、辞書登録機能やセキュリティ設定の充実など、実務での運用を見据えた機能が揃っており「導入してみたものの使いこなせなかった」という事態になりにくい点も特長といえるでしょう。

生成AIの登場によって、議事録ツールの役割は「会議後の記録」から「会議の質そのものを高めるパートナー」へと変わろうとしています。同社はその変化の中で、事前準備のサポートからリアルタイムのファシリテーション支援、会議後の分析や次のアクションへの接続まで、対話のプロセス全体を支えるプラットフォームとしての進化を目指しています。

おすすめ記事