Gunosyデータ分析ブログ

Gunosyで働くデータエンジニアが知見を共有するブログです。

人工知能学会(JSAI2022)に参加しました

こんにちは GunosyTechLab AdsML チームで広告周りの開発をしている濱下(@m-hamashita) です。なかなか IDE に移行できずに Neovim で開発をし続けているのが最近の悩みのひとつです。 今回の記事は、6/14〜6/17 にかけて開催された人工知能学会の参加レポートになります。

現地会場の看板

今年の人工知能学会は、現地とオンラインのハイブリッド開催でした。 現地会場は国立京都国際会館で、京都駅から電車で 20 分ほどの位置にありました。 Gunosy からは濱下(m-hamashita) 、飯塚(koiizuka)が現地で参加し、大竹(totake)がオンライン聴講をおこないました。 Gunosy は人工知能学会に例年スポンサーとして参加しており、今年もゴールドスポンサーとして参加し、共著での研究発表 1 件と現地での企業展示をおこないました。

研究発表について

ニュースサイトの記事の多様性が継続利用に与える影響の分析

  • 著者:菅沼 修祐(東京大学)、飯塚 洸二郎、関 喜史(Gunosy)、鳥海 不二夫(東京大学)
  • 紹介者:koiizuka
  • 概要
    • 本研究では、ニュースサイト上の推薦ランキングに含まれる記事の多様性が、ユーザーのサービス継続利用にどのように影響を与えるかを分析しました。推薦における多様性の導入は、ユーザーの過去の行動に過度に適合することに起因するフィルターバブル問題への解決法のひとつとして注目されており、さらにユーザーの満足度の向上にもつながるという報告がニュース以外のドメインで報告されていました。本研究では、ニュースのドメインにおいて、多様性がサービスの継続利用傾向に与える影響を分析することを通して、多様性とユーザーの長期的な満足度の関係について議論しました。
  • 今後の課題
    • 本研究では様々ある多様性の指標の中で、1 つのみを用いて分析をおこなっていました。今後は、複数の多様性の指標を用いて分析することで、議論の幅を広げていくと良いのではないかと考えています。

企業展示について

企業展示ブースの様子

企業展示ブースでは、Gunosy の会社概要、推薦システムのアルゴリズム、研究事例について紹介しました。 今回は、久しぶりの現地開催での参加者が多かったからか、以前の人工知能学会や近年のオンライン学会に比べて活発に議論や情報交換がおこなえた印象があります。 企業展示会場がメインの研究発表会場から離れていたこともあり、学生よりも企業ブースを出展している企業の方との交流が多かったです。

実際に展示に利用したポスターはこちら。

展示したポスター

発表紹介

以下では、Gunosy のメンバーの視点から特に印象に残った論文・発表の紹介をしていきたいと思います。

高頻度語の意外な語義を英語学習者が知っているかを典型的な語彙テストへの反応から予測できるか?
  • 著者:江原 遥(東京学芸大学)
  • 紹介者:m-hamashita
  • 概要
    • 人間は未知の問題に対して、既存の問題の知識を転用して対処できる場合が少なからずある。
    • 本研究では身近な英単語の問題で定量的に知識が転用できる度合いを測定するため、語の典型的な語義と学習者にとって意外と思われる語義の難しさの差を測定するためのデータセットを提案。このデータセットは英語の穴埋め問題で、典型的な語義と意外な語義の設問と 235 名による回答によって構成されている。
      • このデータセットにおいて同じ英単語に対して、IRT (Item Response Theory)モデルで算出した問題の困難度(difficulty parameter)による分析をおこなったところ、意外な語義の設問が統計的有意に難しいことがわかった。
    • Transformer モデルに対して、学習者トークンを文頭に追加することで、ある穴埋め問題に対してあるユーザが正解/不正解かどうかを予測できるようにした。また、学習者トークンの分散表現集合に対して PCA で低ランク近似をおこなったところ、第一主成分が IRT モデルで推定した学習者の能力値(英語力)と相関しており、分散表現の中に学習者の能力の情報が含まれていることがわかった。
  • 所感
    • 多義語の難しさの差を定量的に測定するというテーマが非常に面白いと思いました。
    • 全体的に分析が面白く、特に学習者トークンの分散表現の第一主成分が学習者の能力値と相関している部分が面白かったです。
    • 今回の手法でユーザ毎(現実的にはクラスター分けしたり必要があるかもしれませんが)に問題に対して正答率が出せるようになるため、語学学習アプリなどで適度な難易度の問題を出題したりできそうで興味深かったです。
    • bert-large-cased などと比較して bert-base-cased が最も分類性能が高いという結果でしたが、学習データを増やすと、更に性能向上が見られるのか、その場合でも bert-base-cased の性能が最も高くなるのかが気になりました。
ユーザーの長期観察によるハッシュタグの分類と非科学的言説の拡散過程の解明
  • 著者:三浦 大樹、浅谷 公威、坂田 一郎(東京大学)
  • 紹介者:totake
  • 概要
    • Twitter をはじめとした SNS において陰謀論のような非科学的言説が拡散することのリスクは以前から指摘されてきたが、コロナ禍以降いっそう関心が高まっている。こうした陰謀論に関する研究は、陰謀論に巻き込まれた後のユーザの特性や彼らによって形成されたコミュニティを主に扱っており、巻き込まれていくユーザの過去の性質や彼らに生じた変化自体についてはあまり知見が得られていない。本研究では、一年以上の長期的なデータを使用して陰謀論のハッシュタグを使用するユーザの行動の変化を分析し、他の一般的なハッシュタグを使用するユーザと比較した。分析の結果、ユーザの過去とそこからの変化に着目することで、陰謀論を「幅広いユーザを巻き込み孤立化していくタイプ」と「完全に孤立したコミュニティ内でコミュニケーションするタイプ」の2つに類型化することができた。また、前者の代表的なハッシュタグである『コロナはただの風邪』に着目すると、過去に幅広い趣味嗜好を持っていたユーザを巻き込み孤立化する傾向にあることが明らかになった。
  • 所感
    • 「ユーザの所属クラスタの偏り」と 「ユーザのつながりの混合度の変化」(コロナ禍前後でユーザーの混ざり具合がどう変化したか)の 2 軸に注目した可視化で、『コロナはただの風邪』のような非科学的言説のクラスタが『裏垢女子』や『フォローした人全員フォローする』のような不特定多数とのつながりを求めるクラスタと類似していたという分析が興味深く、背後には共通してコロナ禍以降の社会不安と孤独感があるとの考察も説得力がありました。
    • 今回得られた知見の応用先として、陰謀論の拡散や過激化などに対応する SNS のコンテンツフィルタリングやユーザへの注意喚起を挙げており、現実世界のリアルな問題に対処するための手がかりになるという意味でも重要な研究だと感じました。
ニューラル生成文に含まれる事実不整合の検出と修正
  • 著者:森脇 恵太、大野 瞬(東京電機大学)、杉山 弘晃(NTT コミュニケーション科学基礎研究所)、酒造 正樹、前田 英作(東京電機大学)
  • 紹介者:m-hamashita
  • 概要

    • GPT-3 など大規模な文章生成モデルでも外部知識と整合しない文(事実不整合文)が生成されることが知られている。解決方法として文章生成モデルの学習を工夫する方法が考えられるが、パラメータ数が大きいため計算リソースなどの問題で学習が困難である。本研究では外部知識と質問文を入力、それに対する応答を出力とし、生成された文に対して事実不整合を検出/修正する機構を構築した。最終的な出力に事実不整合かどうかを人手で判定する Faithfulness を用いて評価した。
  • 所感

    • 最近文章生成モデルにおける事実整合性(factual consistency)に興味があったため聴講させていただきました。
    • 生成モデルの学習が困難である場合に、検出モデルと修正モデルを分けるというアイデアが面白いと感じました。
    • 正解ラベルと Faithfulness に差異があった部分や、修正モデルがうまくいった場合、うまくいかなかった場合の具体例が見たくなりました。
    • 整合/不整合データセットが不均衡なので、Faithfulness だけで評価することは妥当なのか、また、生成モデルの出力をそのまま評価した場合の Faithfulness が気になりました。
SNS の誹謗中傷抑制に向けた投稿者の意識・行動変容を促す手法の検討 (インタラクティブセッション)
  • 著者:平野 太一、田中 文英(筑波大学)
  • 紹介者: koiizuka
  • 概要
    • SNS 上での誹謗中傷は多くの芸能人や一般人の間で悩みの種となっている。本研究では、誹謗中傷の根本的かつ長期的な抑制するために、投稿者自身の意識・行動変容を促す仕組みの検討をおこなった。提案する研究のプロトタイプは、誹謗中傷の内容を投稿したユーザーに対してエージェントが反応し、誹謗中傷の内容を言い換えたポジティブな内容をユーザーに掲出することで、徐々に意識や行動の変容を促すことを目的としている。今後は実際にユーザー実験をおこない、アンケートなどを通して、提案手法の評価をおこなう。
  • 所感
    • Gunosy の研究開発チームにおいても、誹謗中傷記事に対する対応を検討していたため、興味深く拝聴いたしました。
    • 本研究は、私達がまだ検討できていなかったユーザーの行動変容まで含めた対応を検討していたため、発表で紹介されていた関連研究は今後の研究の参考になりそうです。
    • 本発表の時点では、研究のプロトタイプの段階とのことでしたが、今後の研究の進展を楽しみにしております。

まとめ

今回の記事では、人工知能学会の参加の様子についてご紹介しました。 今後とも弊社としてはこの学会に積極的に参加し、盛り上げていきたい所存ですので、皆さまご参加の際には、ご気軽に訪問、聴講いただければ幸いです。