Megagon Team Profile : 史 宏杰リサーチエンジニア

Megagon Labs Tokyoのメンバーズ・ボイスへようこそ! 連載4 回目となる今回は、東京オフィスで知的対話システムを担当するリサーチエンジニアの 史 宏杰 さんがMegagon Labsに至るまでのバックグラウンド、興味・関心や現在取り組まれているプロジェクト、そしてリサーチエンジニアとして挑戦し続ける秘訣に迫ります。

これまでの経歴と、Megagon Labsにジョインした理由を教えてください

香港科技大学卒業後に来日し、京都大学にて物理学と情報学の修士号を取得しました。私は子供の頃からウォークマンなどの日本製小型ガジェットが大好きで、自分もガジェットを作り出したい想いを持ち続けていました。その流れから自然と日系電気メーカーを就職先として選び、プロフェッショナルキャリアをスタートさせました。その日系メーカーでは対話システムに関する研究開発にしばらく従事し、対話システムの研究成果を事業化に結びつけました。その後、より大きな顧客接点を持つフィールドで対話システムの応用に挑戦したく、Megagon Labsに参画しました。Megagon Labsを選んだ理由は、優秀なメンバーと豊富な研究資源に惹かれたこと、目指す研究ゴールとアプリケーションに共感できたためです。

現在取り組んでいる仕事・研究を教えてください

現在は主に機械学習ベースの自然言語処理や知的対話システム全般に取り組んでいます。最近は、ユーザーの発話から宿検索の条件を自動的に変換する研究を行い、SIGDIAL 2020でA Sequence-to-sequence Approach for Numerical Slot-filling Dialog Systems、自然言語処理学会2020でEnd-to-end Dialog Systems with Numerical Slot Filling、自然言語処理学会2021ではA Span Extraction Approach for Dialog State Tracking: A Case Study in Hotel Booking Applicationを発表しました。

人が要望を伝えるには様々な方法が考えられますが、その表現は多種多様です。例えば、航空チケット予約やホテル予約などは年齢に応じた価格適用ルールがあり、年齢の特定やその年齢に応じた価格の照合をする必要があります。システムはユーザに完全な回答を期待しますが、ユーザの回答には曖昧さがつきものです。「妻と私です」という単純な表現は大人2名を意味し、「合計4人で、13歳が1人、6歳が1人」の場合は、大人3名、子供1名を意味すると解釈しなければなりません。これらの多様な表現を人が定義していくには膨大な時間を必要とします。この問題に対して、複雑な人手のルールを必要とせず、過去のデータを学習するだけで自動的に推論できるような方法を提案しています。

人が紡ぎ出す自然な会話を実現するには、ドリルダウン質問のようなマルチターン戦略を管理できる対話システムが望まれます。言語理解だけではなく、対話管理についても今まで試したことがない新しいアプローチで、その有効性について確かめながら、人レベルの複雑な対話制御を実現することを目指していきたいですね。

Megagon Labsで働く魅力と、今後の目標を教えてください

Megagon Labs*注)で働く最大の魅力は、少数精鋭で、メンバーの一人一人が持っている切れ味が最大に発揮出来るところだと感じています。私は検証する前にまず手を動かしたいタイプで、以前所属していた組織では、大きな組織特有のリクス取りにくさからよく心配されていました。一方、Megagon Labsでは挑戦を歓迎する雰囲気があり、メンバーと責任者の距離も近いため、試してみたいことや意見などを直接議論でぶつけることができます。そのため、チームからの理解も得やすく、自分だけでなく各々の考えが最大限活かされていると感じています。

今後の目標は、なんと言っても実際の研究成果を実サービスで結実させることです。リスクが大きい研究は、性質上、商品化まで至らず途中で断念することも多いですが、私たちのプロジェクトでは理解のある協力者からの支援や期待を受け、好ましいスタートが切れています。今まで取り組んできた研究成果を価値に結びつけることはメンバー一同の目標だと思っています。

リサーチエンジニアとして活動するにあたりアドバイスなどがあればお願いします

私個人が重視するのは「問題の本質を見つけること」ですね。特に複雑な課題の場合は、問題をシンプル化し、最も本質な課題について取り組むことが重要だと考えています。研究や手法が複雑になればなるほど、本質な部分を見失う可能性が高まると感じています。その際は定期的に自分を第三者に置き換え、第三者視点で課題を俯瞰し整理しています。そうすることで、研究のデバッグもしやすくなりますし、うまくいかないポイントを早期に発見することができます。また、研究途中のプログラムコードも綺麗に保つことを常に心がけています。可読性の高いコードを維持することで、複数の研究課題が並行しても頭の切り替えにかかる負担をかなり軽減させることができるので、結果的には生産性の向上に繋がりますね。

最後に日本のお勧めスポットなどを教えてください

私が日本に来てハマったのは、ずばり、スノーボードです。意外と知られていないのが、日本の単位面積あたりスキー場の数は世界で断トツ1番!、スキー場数が非常に多い国なんです。学生時代から夜行バスで長野や兵庫のゲレンデに足繁く通いましたが、私のお気に入りはやはり北海道のスキー場です。昼は広大な素晴らしいゲレンデで白銀の世界を満喫し、夜はカニ食べ放題で海の幸を堪能することができます。山と海が近いことも日本の特徴ですね。こんなに自然へのアクセスの良い場所に住んでいるので、いつかサーフィンなどにも挑戦してみたいです(冬以外で)!

 (話者:  史 宏杰 / インタビュアー: Megagon Labs Tokyo)

 *注)Megagon Labs Tokyoは株式会社リクルートの研究チームです。


Share:

Share on facebook
Share on twitter
Share on linkedin
Share on reddit
Share on email

More Blog Posts: