Blog

主観的データと体験検索でユーザーレビューから真の価値を引き出す Part 1

カスタマーレビューは今や世界のビジネスを動かす原動力となり、 販売、採用、ホテル運営などの活動において、レビューにおける評価はビジネスの成否を分ける存在です。 その運命を決定づけるのはレビューの質だけではなく、商品やサービスを通して提供される顧客体験が利用者の期待値とどの程度調和しているか、これが非常に重要です。 2つの要因 < 期待と実体験 > の不一致は、 ビジネスに惨憺たる結果を引き起こす可能性があることは言うには及びません。 残念なことに、現状では簡単に実現できる打開策は見当たりません。今日のレビュープラットフォームやオンラインショッピングにおける検索エンジンは客観的な特性による検索しかサポートしていません。例えば、レストラン検索において、「価格」

Read More »

Emu: 意味的類似度による多言語文埋め込みの強化

言語はおそらく人類にとって最大の発明です。言語によって私たちは情報を伝達し、アイデアを発信し、より良い未来を築くために協力し合うことができます。しかし、AI(人工知能)や機械学習などの新しいテクノロジーの場合、言語間の意味の違いが大きな障壁となり、革新的なアプリケーションの可能性が制限されることもあります。この問題を解決するために、Megagon Labsでは意味的類似度を用いることで、より精緻な多言語文埋め込みを学習するフレームワークを開発しました。 我々のEmuに関する研究論文がAssociation for the Advancement of Artificial Intelligence (AAAI)に採択され、2020年2月9日にニューヨークで開催される’世界で最も権威のあるAIの学術会議の1つ’とされる

Read More »

GiNZA version 4.0: 多言語依存構造解析技術への文節APIの統合

Universal Dependenciesのもとで日本語文法に根ざした直感的な統語解析を可能にしたい。GiNZAが目指してきた自然言語処理のゴールにまた一歩近づきました。2020年8月16日にリリースした「GiNZA version 4.0」ですが、日本語の公式サポートが始まったspaCy version 2.3を土台とし、機能と性能を隅々までブラッシュアップしています。これまで以上に日本語の分析が容易になったGiNZA v4の文節APIについて詳しく解説します。 GiNZAでできること NLP(自然言語処理)技術は人が日常的に使う言葉を機械的に分析するための一連の解析処理に用いる技術の総称です。この「一連の解析処理」という部分が非常に重要で、例えば日本語の書き言葉の文であれば、最初に単語を区切ってからそれらを文節にまとめて係り受け関係を解釈する、という流れになります。英語の文の場合、単語はほぼスペースで区切られていますが、”New York”のような複合語をまとめたり、”don’t”を”do”と”not”に分けて解釈する必要があるため、最初にトークナイズ処理を行ってから名詞句・動詞句などの基本句の認識と句の間の依存関係の解釈を行う流れになります。また言語を問わず人名・地名などの固有名詞は複合語で表現されることが多いため、それらの単語をまとめ上げて分類を与える固有表現認識処理も必要となります。

Read More »