KDD (Knowledge Discovery and Data Mining) は、世界で最も歴史があり、間違いなくトップレベルのデータマイニングの国際会議です。サンディエゴで開催される予定だった今年のカンファレンスは、新型コロナウイルス流行の影響で完全オンラインでの開催となりました。私はKDDで古くからの友人と会ったり、新しい友人を作ったりすることをもちろん楽しみにしていました。Zoomやメッセージングアプリは便利ですが、実際に会って交流することには敵いません。誰もがサンディエゴの輝く太陽とビーチを満喫することはできなかったわけですが、それでも組織化されたKDDにはこれまで以上の参加者が集いました。約 210本の研究論文が採択され、32件のワークショップ、40本以上のチュートリアルが行われました。その中には、私たちの素晴らしい同僚である Estevam Hruschka による「Data-Driven Never-Ending Learning Question Answering Systems」というチュートリアルも含まれています。興味のある方は リンク (英語) から視聴してください。カンファレンスの規模を考えると全てを要約することは不可能です。それでも、最新のトレンドをいくらかでも共有し、その過程で私がとても気に入った論文や話題のいくつかをご紹介できるよう最善を尽くそうと思います。
KDDは、グラフマイニング、推薦システム、テキストマイニングの分野の論文を発表する場として、常に人気があります。今年のKDDも例外ではなく、グラフマイニングに関する論文が大半を占め、「推薦システムの評価に関する論文」(私のお気に入りです)が最優秀論文賞を受賞し、テキストマイニングに関する複数のチュートリアルが行われました。KDDコミュニティが関心を寄せる実用的な問題に大きな変化はありませんが、これらの問題に対処する方法には大きな変化があります。機械学習技術、特にディープニューラルネットワークの発展にともない、この分野の基本的な問題の多くをさらに深く掘り下げる試みが明らかに増加しています。ちなみに、今年のKDDではタイトルに ”ディープ” や ”ニューラル” が含まれている論文は全体の16%もありました。5年前のKDD 2016ではその割合はわずか3%でした。
数多くの応用可能なグラフマイニングは、グラフニューラルネットワーク(GNN)の登場により、急速な進歩を遂げています。KDD 2020では、ノード分類、リンク予測、グラフ分類などの古典的な問題に取り組むために、(GNNによる)グラフ表現学習をどのように改善できるかを探る論文が多数発表されています(PolicyGNNとTinyGNNを参照)。今年のお気に入りの1つは「GPT-GNN」と題された論文で、(エッジとノード属性の)生成を通じてGNNを事前に学習させる方法を示しています。この論文は、異なる分野(例えば、コンピュータービジョンとNLP)のアイデアがいかに早く転換されているかを示す明確な例だと思います。
同様に、テキストマイニングにおいても、事前学習や転移学習の技術に基づく手法が一般的になりつつあります。AmazonとCMUによる論文は、マルチラベルのテキスト分類にTransformerベースのモデルを利用した好例です。これらすべてを踏まえると、KDDが2018年以降にDeep Learning Dayを開催するようになったのも不思議ではありません。
KDD 2020では、昨年のカンファレンスと同様にEarth DayとHealth Dayも開催され、これらの分野の研究者や実務担当者が一堂に会しました。Earth Dayのイベントでは、パンデミックの際に報告されていないケースの数をどのようにして推定するかという話が非常に印象的でした。2020年の世界的なパンデミックやカリフォルニアの大規模火災を目の当たりにして、これらの分野の研究にかつてないほど感謝の念を抱いたというのが正直なところです。応用研究に焦点を当てたイベントといえば、KDD 2020では業界から多くの招待講演者が参加しました。その中には、Megagon Labsの研究チームのヘッド・オブ・リサーチによる ”主観的データが持つ力” についての講演も含まれています。興味のある方は、主観的データについてこちらをご覧ください。
KDDのバーチャルカンファレンスポータルは終了しましたが、KDD 2020から得られることはまだたくさんあります。非常に多くの講演やチュートリアルがYouTubeやVimeoで公開されていますし、PaperDigestではあらゆる論文を閲覧してアブストラクトを確認することができます。KDD 2021はシンガポールで開催されますが、次に何が登場するか私も楽しみにしています。
[原文へ]
(筆者: Behzad Golshan / 翻訳:Megagon Labs Tokyo)