Gunosyデータ分析ブログ

Gunosyで働くデータエンジニアが知見を共有するブログです。

グノシーの記事リスト品質向上ロジック紹介

こんにちは、Gunosy Tech Labの谷口です。本記事ではグノシーの品質向上施策の一つである「各タブの記事リストの品質向上」についてお話しします。

グノシーの品質向上

当社ではグノシーの長期的なプロダクト価値の向上を目指し、2020年6月よりアプリの品質向上を行っています。*1 詳しくは「東洋経済」の以下の記事や、当社のIR資料をご参照ください。

toyokeizai.net

gunosy.co.jp

これまで品質向上の施策として「『扇情的な記事』の定義」、「プッシュ通知記事の監視の強化」、「トピックタブのユーザーごとのパーソナライズ *2」などを行ってきました。本記事で説明する「記事リストの品質向上」もその施策の一つとなっています。

各タブの記事リスト品質向上

従来は、全タブにわたって同一のロジックが適用されていました。具体的には、まずユーザーをクラスタリングしておき、対象ユーザーが該当するクラスタで人気の記事(CTRが高い記事)を推薦するという仕組みです。

しかしこの従来ロジックには、CTRが高くなりがちな特定のトピックの記事が上部に固まるという問題点がありました。例えば経済タブの上部には「車」に関する記事が、エンタメタブの上部には「芸能ゴシップ」の記事が過剰に出現するという現象が頻繁にみられていました。

各タブでのユーザー体験を改めて検討したところ、カテゴリごとに要件(ユーザーストーリー)が異なることが明らかになりました。各タブのユーザーストーリーの一例として、経済タブならば「金融関係の記事が読みたい」、社会タブならば「現在議論されている社会問題について知りたい」、スポーツタブならば「スポーツの結果が知りたい」といったものが考えられます。各タブのユーザーストーリーを社内で議論を行ったり他メディアの記事リストを参考にしたりすることで策定していきました。また、タブのロジックを提案しオフラインで記事リストを生成する社内コンペを数回行いました。このコンペで提案されたユーザーストーリーや手法がほぼそのままアプリに採用されたケースもあります。

各タブの問題点やユーザーストーリーを解決するために、タブごとに異なるロジックを開発していきます。なお、新しいロジックは既に一部のタブには適用されており、新ロジックが反映された記事リストをアプリから確認することができます。

例:経済タブのロジック

ここで記事リスト品質向上の一例として、経済タブに用いられたロジックの概要を紹介します。主に工夫は二つあります。

一つ目の工夫は、従来と比較して記事の「社会的重要性」や「品質」がより優先されたリストを生成しているという点です。これにより「社会的重要性・話題性が高いトピックについて知りたい」というユーザーストーリーの解決が期待できます。例えば日経平均株価が大きく変動した話題などがリスト上部に掲示されることを想定しています。

二つ目の工夫は、社会的重要性が高いと思われるサブカテゴリに該当する記事を一定割合含めるようにしたという点です。例えば、「金融」に関する記事、「財政」に関する記事といったものです。これにより「金融・財政など、社会カテゴリにおける重要な話題について知りたい」というユーザーストーリーの解決、および従来ロジックでは過剰に表示されていた車関連の記事の表示の抑制が期待できます。各サブカテゴリ該当記事は「1. 特定ワードがタイトルに含まれているか」、「2. 特定フィードの記事であるか」という条件に基づいて選出しています。

例 : エンタメタブのロジック

さらに、エンタメタブのロジックの概要を紹介します。

まずエンタメタブでは、当社で独自定義した「扇情的な記事」への対処が行われています。個人を中傷するような記事・肌の露出が多い画像がサムネイルになっている記事などの表示が抑制されています。扇情的な記事の定義については、私の過去の記事でも言及しているのでそちらもあわせてご覧ください。

data.gunosy.io

それに加え、「映画・ドラマなどのメディアに関連する記事」などが一定の割合で出現するようにするといった工夫を施しました。記事リストや他ニュースサイトを観察することで、エンタメカテゴリのニュースが「1.芸能人に関連する記事」、「2.メディアに関連する記事」に大別できることがわかり、従来ロジックでは前者に大きく偏った記事リストになっていました。そこで後者を差し込む仕組みを導入することでその偏りを抑制しました。

例 : スポーツタブのロジック

スポーツタブのロジックについては、2021年入社新卒の大竹さんによるこちらの記事をご覧ください。

data.gunosy.io

おわりに

本記事では、グノシーの品質向上に伴う「記事リストの品質向上」についてお話ししました。今後はさらに改善するタブの範囲を広げつつ、既に新ロジックを適用したタブについてもさらに問題点を洗い出していく予定です。

当社ではこれからも各タブの記事リスト品質向上を含め、様々な視点からアプリ品質向上に取り組み続けていきます。社会的に価値があり、個人にとって有益な情報を届けられるアプリを目指していきます!

*1:「記事の品質はユーザー体験、長期の継続率に影響を及ぼす」という仮説に基づく。

*2:従来はCTRをベースにしたパーソナライズアルゴリズムだったため、CTRが高くなってしまう扇情的な記事がリスト上部に並びやすくなるという問題点があった。