Gunosyデータ分析ブログ

Gunosyで働くデータエンジニアが知見を共有するブログです。

#ECIR2023 にて発表を行いました

はじめに

情報検索のカンファレンスであるEuropean Conference on Information Retrieval (ECIR)が2023年の4月2日から4月6日の間にアイルランドのダブリンで開催されました。 Gunosyから投稿した論文がフルペーパーとして採択されたため*1、飯塚が参加・発表してきました。 Gunosyから本学会に参加するのは今回が初めてとなります。

ECIR2023について

ECIRはヨーロッパと名のつく通り、ヨーロッパ各地で毎年開催される学会であり、今年は45回目という歴史のある学会でした。 ヨーロッパ出身の方に加え、インドからの現地参加者も多かったように思います。 研究対象のトピックや運営メンバーなどは情報検索系のトップカンファレンスであるSIGIRと近しく、SIGIRが少し小規模になったようなイベントと言われています*2。 フルペーパーの投稿数は228件で、そのうち66件が採択され、採択率は29%でした。

発表について

ここでは他の参加者の発表内容で気になったものと、我々の発表内容について簡単に紹介します。

Fragmented Visual Attention in Web Browsing: Weibull Analysis of Item Visit Times

  • 著者
    • Aini Putkonen (Aalto University), Aurélien Nioche (University of Glasgow), Markku Laine (Aalto University), Crista Kuuramo (University of Helsinki), Antti Oulasvirta (Aalto University)
  • 概要
    • ユーザーは、特定の目標なしに興味のあるアイテムを調べる探索的な方法でウェブを閲覧することが多い
    • しかし、ユーザーのアイテム間の視線移動の際に現れる視覚的注意の変化についてはまだよく理解されていない
    • シングルカラムとマルチカラムのレイアウトでニュースフィードを探索する際のアイトラッキングデータと行動ログデータによって視覚的注意の分析を行った
    • 具体的には、アイテム(記事)の訪問時間に関するワイブル分析を行い、訪問の期間や頻度などを調査した
    • 分析の結果、視覚的注意は断片化しており(単に上から下に単調に移動しているわけではなく、セグメント化されているという意味)、ビューポートに表示されるアイテムの数、特性、構成に影響を受けることがわかった
  • 所感
    • マルチカラムのニュースUIは弊社でも採用しているため、ユーザーの実際に観測された目線の移動に関する分析は興味深かった
    • アイトラッキングシステムを用いずとも、本研究で検証されたいくつかのモデルを用いることで、ユーザーの目線移動を考慮した分析が行えるので便利

Listwise Explanations for Ranking Models using Multiple Explainers

  • 著者
    • Lijun Lyu (L3S Research Center) , Avishek Anand (Delft University of Technology)
  • 概要
    • ニューラルネットワークをランカーとするような複雑なランキングモデルの解釈は、解釈可能な単一ランカーによってのみ行われてきた
    • しかし、既存の単一ランカーを用いた解釈方法では、適合度の観点を複数考慮できるような複雑なモデル(例えばニューラルネットワークを用いたランカーは、クエリ文書ペアの語句の一致、文脈の類似度などを組み合わせて考慮可能)の近似において、表現力に限界があった
    • そこで、本研究では複数の単純なランカーを組み合わせて、ブラックボックスのランキングモデルをより適切に近似する方法MULTIPLEXを提案
    • MULTIPLEXは、解釈モデルを用いてランキング上でユーザーがもつ嗜好のカバレッジを最大化する整数計画問題(preference coverage problem)を一般化・緩和し、線形計画問題として複数の解釈モデルに対する解を導出
    • 様々なランキングモデルで実験し、既存のベースラインや競合に対して37%から54%の信頼性向上を報告した
  • 所感
    • 複数の解釈モデルを活用してランカーの出力解釈の表現力を高めるという手法は直感的にも理解しやすい上に、発表自体も聞きやすかった
    • 数理最適化の手法を間に挟み、問題を定式化し厳密解を得ることで、手法の説得力が増した印象があった(定式化なしのヒューリスティックに比べて)

Theoretical Analysis on the Efficiency of Interleaved Comparisons

  • 著者
    • Kojiro Iizuka, Hajime Morita (Gunosy) , Makoto P. Kato (University of Tsukuba)
  • 概要
    • インターリービングはオンライン評価の中でも特に評価の効率が良いと知られている一方で、その効率性の起源は明らかではなかった
    • 本研究では、理論的な側面に着目し、どのような状況下で、なぜ効率が良くなるのかを部分的に明らかにした
    • さらに数値実験により、理論的な分析の妥当性の検証を行った

これが今回の我々の発表内容です。 質疑応答は、企業の方からの質問が多く、インターリービングのトピックは実務での関心の高さが伺えました。 発表後も企業の方から声をかけてもらい議論を行うなど、現地開催ならではの交流が行えました。 今回発表した論文は、私が博士論文を執筆していたときに、博論の構成の都合上盛り込めていなかった研究内容でした。 そのため、今回の会議で外部に向けた発表を行うことができてよかったです。

Stat-weight: Improving the Estimator of Interleaved Methods Outcomes with Statistical Hypothesis Testing

  • 著者
    • Alessandro Benedetti, Anna Ruggero (Sease Ltd.)
  • 概要
    • 既存のインターリービング手法のオフライン評価は、クエリセットの中からランダムにクエリが選択されて評価を行うシミュレーションが多い
    • 本研究では、実世界とロングテールな分布を持つ状況下でTeam Draft Interleavingの再現実験を行った(reproduce paperの枠)
    • さらに、統計量をスコアリング関数に組み込むことで精度の改善を行った
  • 所感
    • 我々も過去にインターリービングの再現を検索とは少し状況の異なる推薦のドメインで行ったことがあるので親近感が湧いた
    • 似通ったランキングの評価をインターリービングは苦手とするという実験結果も他の論文と同様に再現されていたので、今後の研究課題として使えそう

発表後には、真の評価値として使っていたnDCGについて、各クエリごとに平均して算出するよりもクエリの分布に応じて重み付けを行うことでより適切な評価が行えるのでは?などの議論を著者のAlessandroとしました。また我々の発表に関してもブログで言及していただきました *3。 Thank you!

ダブリンについて

開催地であるダブリンは地理的に曇りがちな気候らしく、実際に曇りの日が多かったです。 下記は会場付近の聖パトリック大聖堂とダブリンの街並みの写真で、もっとも天気が良かった日の写真です。 このように、晴れていてもところどころ雲が点在していました。

聖パトリック大聖堂
ダブリンの街並み

また日本から直通でダブリンに行くルートは現在ないため、今回はドバイを経由して行き来しました。 ドバイの夜景が綺麗だったのでおまけに置いておきます。

ドバイの夜景

さいごに

検索の分野は弊社のコア技術である推薦分野と関連が強いため、今後も研究開発を通して新規サービスの開発や既存サービスの改善に役立てていきたいと思います。