Blog

大規模コーパスからセマンティックタイプを検出するための学習

データクリーニング、スキーマ マッチング、データディスカバリー、セマンティック サーチ、データビジュアライゼーションなど、多くのデータ前処理や情報検索タスクではリレーショナルテーブルにおけるデータカラムのセマンティックタイプを検出することで利点が得ることができます。 国際学会 VLDB2020 で発表したMegagon Labsの最新論文では、テーブルのコンテキストを取り入れることにより、表形式のカラムタイプを予測の現状を改善する新たな学習済みモデル、 Sato を紹介しました。 データシステムは、文字列

Read More »

NeurON:QAペアからの情報抽出 (Open-IE)

Open Information Extraction ( Open-IE ) はQAシステムを動かすナレッジベースを構築するための主要な処理の1つです。 しかし、この分野の研究は専らテキスト内の個々のセンテンスから情報 ( 例えば、arg1-rel-arg2

Read More »

Megagon Team Profile : 田中 郁リサーチエンジニア

Megagon Labs Tokyoのメンバーズ・ボイスへようこそ! 連載3 回目となる今回は、東京オフィスで画像認識技術を担当するリサーチエンジニアの 田中 郁 さんがMegagon Labsに至るまでのバックグラウンド、興味・関心や現在取り組まれているプロジェクト、そしてリサーチエンジニアとして走り続ける秘訣に迫ります。 これまでの経歴と、Megagon Labsにジョインした理由を教えてください

Read More »

言語処理学会第27回年次大会 (NLP2021) 研究発表

言語処理学会第27回年次大会 (NLP2021)において、Megagon Labsは3件の発表を行ないました。言語処理学会第27回年次大会のプログラムはこちらから参照いただけます。 言語処理学会での発表予定 P2 : 言語資源・アノテーション(2) / 知識獲得・情報抽出(1) [P2-5]

Read More »

Teddyで実現するユーザーレビュー探索パイプライン

Teddy を用いたユーザーインタラクション ユーザーレビューには、オンラインショッピングサービスのユーザー体験を向上させるのに役立つデータが豊富に含まれています。 しかし、レビューからカスタマーインサイトを引き出すのは容易ではありません。 Megagon Labs による最新の CHI’20の論文 では、レビューマイニングを簡単に実現することを目的としたインタラクティブなシステム Teddy を紹介しました。Teddy を使用することで、データサイエンティストが大規模なカスタマーレビューを探索し、オピニオンマイニングのパイプラインの抽出スキーマを反復的に改良し、迅速にインサイトを得ることが可能になります。Teddy は、レビュー分析のワークフローと課題を理解するために行ったデータサイエンティストとのインタビューから得た知見をもとに設計されました。この研究の結果はTeddyだけではなく、テキストマイニングにおける共通のプラクティスと問題について有用な情報を提供し、ユーザーレビューや一般的なテキスト分析における今後のシステム開発全体に役に立つ情報にも触れていきます。  eコマースの市場規模は米国(左)と世界(右)において急激に拡大している

Read More »

Megagon Team Profile : 叶内 晨 リサーチサイエンティスト

Megagon Labs Tokyo のメンバーズ・ボイスへようこそ!  連載 2 回目となる今回は、東京オフィスで日本語自然言語処理技術の研究を担当し、国内学会をはじめ国際学会でも着々と成果を創出している 叶内 晨 さんがMegagon Labsに至るまでのバックグラウンド、興味・関心や現在取り組まれている研究、そしてトップ研究者として走り続ける秘訣に迫ります。  これまでの経歴と、Megagon

Read More »