電話自動応答システムのさらなる進化へ!元Google出身のAIエンジニアが語るIVRyの取り組み

花木 健太郎氏|株式会社IVRy Principal AI Engineer

ミシガン大学アナーバー校理論物理学PhD。ニューヨーク大学データサイエンス修士。ニューヨーク大学在学中にGoldman Sachs、Facebook AI Researchなどで機械学習の研究インターンをして経験を積んだ後、ニューヨークのIBM T.J. Watson Research Centerに機械学習エンジニアとして入社。機械翻訳や情報抽出の研究開発やソフトウェア開発に従事する。その後、Google本社に転職し、Google Assistantの自然言語理解チームでテックリードなどを務める。2023年7月IVRy入社。

株式会社IVRy について

現在、IVRyでは電話自動応答サービス(IVRシステム)の事業を展開しております。

今のところ、プッシュ式の電話自動応答がメインです。例えば、何かお店に電話をかけたときに、「予約の場合は1番、営業時間は2番」といった案内がされると思いますが、そのシステムを提供しています。

現在進めているのは、AIによる自動応答システムです。例えば「予約したいんですけど」といった声の入力に対して、AIが応答し、予約を完結させるシステムを開発しています。これにより、さらに便利で効率的なサービスを提供できると考えています。

花木さんのキャリア

そうですね、基本的には割と勉強していたかなと思います。中学受験があったので、小学校2年生から6年生までは塾に通っていました。塾で過ごす時間が多かった気がします。また、いくつかの趣味にも時間を割いていました。例えばテレビゲームですね。小学校を卒業し、中学高校は大阪の進学校に通いましたが、あまり勉強していなかった気がします。中学2年生のときに格闘ゲームの「バーチャファイター」にハマり、放課後はゲームセンターに通っていました。時には学校をサボってまでゲームをしていましたね。でも、大学受験のときにはさすがに勉強しないといけないと思い、真剣に取り組みました。

もちろんです。大学は東京大学の理科二類に入学しました。生物学に興味があったため、生物の勉強をしていました。しかし、3年生のときにもっと基礎的な研究に興味が湧き、物理学に転向しました。東工大の基礎物理学専攻に進み、物理の研究を続けました。

物理学の研究を進める中で、日本国内での競争が非常に厳しいと感じました。優秀な研究者の多くはアメリカにいるため、アメリカでの経験が必要だと考えました。そこで、ミシガン大学に留学し、物理学の博士号を取得しました。しかし、物理学の競争は非常に厳しく、職を得るのが難しかったため、情報系に転向しました。

ニューヨーク大学のデータサイエンス学科で、統計学やコンピュータサイエンスの基礎、機械学習を学びました。その後、Goldman SachsやFacebook AI Researchでインターンを経験し、IBMの研究所で働き始めました。

IBMでは、1年半ほど機械翻訳や情報抽出のチームでエンジニアリング業務を中心に担当していました。しかし、機械学習の分野にもっと興味があったのと、シリコンバレーで働きたいという気持ちがあり、Googleに転職しました。Googleでは、Googleアシスタントの言語理解の部分を担当し、複数のプロジェクトに関わりながら3年半ほど働きました。

その後、2020年3月に転機が訪れました。Googleの内部ワークショップで医療系の研究発表を聞き、医療分野に大きなインパクトを感じました。人命を救うことができる医療分野での仕事に魅力を感じ、Google内部で医療系のチームに移ろうとしましたが、ビザの問題でアメリカに行けなくなりました。そこで、日本国内で医療分野の仕事を探し、医療系スタートアップに転職しました。

医療系の会社にいた頃、多くの難題に直面していたのですが、プロジェクトが一段落したため、一旦辞めることにしました。最初は特に何も考えずに辞めて、自分でプロジェクトを立ち上げようと試みたり、いろいろと模索していました。しかし、働かないと貯金が減っていくことに恐怖を感じ、Facebookで働けるところを探してみたら、声をかけてくれる会社がありました。

最初に働いたのはシェルパ・アンド・カンパニー社で、そこで文書分析などを行っていました。その後、数ヶ月してからIVRyにも声をかけてもらい、IVRyでも働きました。それぞれ週1〜2回程度の働き方で流動的でしたね。

そうですね。最初は特に感情はなく、ただお金が減っていくことに困っていたので、とりあえずやってみようという感じでした。実際に働いてみると、自分の専門分野での経験が生かせることや、面白さを感じることができました。

そうですね。ChatGPTの登場は大きな衝撃でした。以前は、特定のタスクに対して大量のデータを集めてモデルを学習させる必要がありましたが、ChatGPTはそのままタスクを解決できるので、データ収集の手間が省けました。この技術を使い倒せる環境に身を置きたいと思っていたところ、IVRyがChatGPTに適していたため正式に入社することに決めました。

株式会社IVRy 業務委託〜入社

IVRyのサービス動画

最初に担当したのは予約対話システムの開発でした。例えば、お客さんが「予約したいです」と言ったら、「時間を教えてください」といったやり取りをするシステムです。ChatGPTを使ってこのシステムを作ったところ、非常にスムーズに進み、これが自分にとって面白く感じました。

苦労した点は、入社前のことですが、先ほどお話ししたようにChatGPTを使った予約システムの整備でした。最初は数日でサクッと作れたので、順調だと思っていましたが、実際に社内の人に使ってもらうといろいろな問題が発生しました。ChatGPTには「ハルシネーション」という問題があり、適当なことを答えてしまうことがあるんです。例えば、お客さんが「明日の11時に予約したい」と言うと、在庫を確認していないのに「明日の11時は満席です」と答えてしまうことがありました。このような問題の整備が非常に大変でした。

良かった点としては、その他に大きな困ったことがなかったことです。また、会話システムの予約対応以外にも、ChatGPTの活用の幅が広がったことです。例えば、電話の自動応答サービスで集まる大量のデータの分析にもChatGPTが役立つことがわかりました。新しい使い道がどんどん見つかるのは非常に良かったですね。

採用に関しては、AIエンジニアはレアな存在なので、あまり募集が来ることはありません。そのため、採用に割いている時間は少なく、全体の1割程度です。現在、AIチームにはエンジニアが2人しかいないので、基本的には開発を中心に行っています。具体的にはミーティングが全体の2〜3割程度です。残りの時間はコードを書いたり、デザインドキュメントを作成したりしています。基本的に開発に多くの時間を費やしている状況です。

IVRyの事業の魅力の一つは、多くの人に感謝される点です。ユーザーから非常に高く評価されており、多くの方から感謝の言葉をいただけるのが大きな魅力です。

例えば、お店の方々からは「電話が頻繁にかかってくるため、対応に追われて他の業務に支障が出る」という声を聞きます。しかし、IVRyを使うことで、電話の応答が自動化され、業務の負担が大幅に軽減されます。その結果、「電話対応のストレスがなくなり、本当に助かっています」といった感謝の声を多くいただいています。

また、「もうこれがないと生きていけない」とまで言ってくださるお客様もいて、「これがなかった時代には戻れない」という喜びの声を直接聞けるのが非常に嬉しいですね。これがこの仕事の大きなやりがいだと感じています。

現在のエンジニア組織について

エンジニアメンバーは19名(正社員のみ)です。内訳は、- AIエンジニア2名、インフラエンジニア・SRE4名、フロントエンド・アプリエンジニア5名、サーバサイドエンジニア7名、QAエンジニア:1名です。

各チーム、比較的独立して作業していますが、必要なタイミングでシンクすることが重要です。フロントエンドとバックエンドは密にやり取りしていることが多いです。基本的には、必要に応じてハドルで話し合ったり、プロジェクトごとに定例を行ったりしています。

そのほかに毎週金曜日に「サークル会」というミーティングがあります。このミーティングでは、各フロントエンド、バックエンド、AI、インフラのチームが今どんなことをやっているのかを共有します。これにより、全員が他のチームの進捗や取り組みを把握できるようになっています。

一番大きいのは人材の不足です。これを解決するために全力で採用活動を行っています。開発エンジニアだけでなく、会社全体でも人材の確保に力を入れています。例えば、オフィスに候補者や会社に興味のある人を招き、懇親会を開くこともしています。実は今日もこの後、エンジニアのお寿司会を予定していて、お寿司を食べながら談笑し、人材確保の接点を作る場にしています。

旧オフィスでの撮影 ※2024年6月24日に住友不動産東京三田ガーデンタワーに移転

まず良い点としては、優秀な人材が集まっていることです。最近会社が拡大していて、新しく入ってくるエンジニアも非常にレベルが高いです。元々いるエンジニアも高いスキルを持っていますが、新たに加わる人たちと一緒に仕事ができるのは非常に良い点だと思います。

課題点としては、エンジニアの人数分布が偏っていることです。例えば、QAエンジニアが1人しかいないとか、AIエンジニアが2人しかいないといった状況です。AIをこれからの主要な事業として進めていくためには、この偏りを解消することが重要だと思います。つまり、必要な人材をひたすらに採用していくことが最も大切です。

そうですね。優秀な人がさらに優秀な人を呼んでくるという好循環が生まれています。例えば、クックパッド出身の成田がいて、彼が顔が広いので、彼を信頼して受けてくれる人も多いです。これは非常に大きなポイントです。

そうですね、AIエンジニアとしての知名度はある程度あるかもしれませんが、フロントやバックエンドのエンジニアにはまだあまり知られていないかもしれません。ただ、成田は全方位的に知られているので、その存在感は非常に大きいですね。

今後の目標

会社としての目標は、現在取り組んでいる電話の自動応答システムをさらに進化させることです。今はユーザーが電話で何かを質問した際に、レストランの営業時間などを手動で入力して設定する必要がありますが、このプロセスを自動化したいと考えています。

例えば、レストランのオーナーが何もしなくても、Webから情報を自動的に取得したり、通話データから必要な情報を抽出したりすることができるようにしたいと思っています。これが実現すれば、必要な電話以外は人が対応しなくても済む世界を実現できます。設定が難しい部分を自動化することで、より便利で効率的なシステムを提供したいです。

先ほどの話と重複しますがサイエンティストとデリバラーですね。ちゃんと手を動かして成果を出せる人がマッチしますね。反対にセージのようなタイプは合わないと思います。自分の理想というよりは、ユーザーにとって何が良いかを突き詰める必要があります。

二つのポイントがあります。一つは「手が動く人」です。アイデアをたくさん出すだけでなく、実際に行動に移してコードを書ける人が重要です。もう一つは「基礎的な知識を持っている人」です。例えば、大学で習うような基礎的な統計や機械学習の手続きなど、しっかりとした基礎知識がある人が良いです。そういうスキルを持っている人は応用が利くので、チームにとって非常に価値が高いと思います。