こんにちは、データ分析部研究開発チームの関です。
2018年6月5日〜6月8日に開催された2018年度人工知能学会全国大会にGunosyから大曽根、米田、山田、関の4名で参加しました。 当社はゴールドスポンサーとして協賛させていただき、主著発表1件, 共著発表1件, インダストリアルセッションでの発表1件, ランチョンセミナーの開催, スポンサー展示を行いました。
今年度の会場は鹿児島県鹿児島市の城山ホテルというところです。 駅からバスやタクシーで15分ぐらい、山の上にあるホテルでした。 晴れていれば桜島がきれいに見えるらしいのですが、残念ながら期間中は天気に恵まれませんでした。
昨年が名古屋という大都市での開催だったのに対して地方での開催ということで、参加人数は減る見込みだったそうなのですが、 約2,500人と過去最高を記録したそうです。人工知能という技術領域に対する社会的関心がますます高まっているのを感じます。
発表について
今回プログラム中に行った3件の発表について紹介します。
[3O2-OS-1b-04] 世代による政治ニュース記事の閲覧傾向の違いの分析
衆議院議員総選挙期間中における世代別の関心の違いをサービスログから分析できないか、という企画で行った分析結果について報告させていただきました。 この企画については、様々な事情によって日の目を見ることがなかったので、今回世に出すことができて良かったと思っています。
内容については詳しくはスライドを参照いただければと思いますが、 世代別に閲覧している政治ニュース記事のランキングを算出して考察しています。 分析といえるかどうかも怪しいところはあるのですが、得られた結果が非常に面白く今回発表させていただくことにしました。 「若者の政治的無関心ではなく政局的無関心ではないか?」という問題提起になっています。 LDAやネットワーク分析なども試してみたのですが、結果の解釈をするのが少し難しく、 政治・メディア研究のバックグラウンドを持った方と共同で今後進めていければより有益な結果を得られるのではないかと期待しています。
計算社会科学のセッションということで、当日会場ではバックグラウンドが政治学の方、経済学の方からコメントをいただくことができ、非常に有益な機会となりました。 興味をもって聴講いただいた方、議論に参加頂いた方にお礼申し上げます。
[2Z3-03] スマートフォンアプリとWikipediaにおけるニュースに関する閲覧行動の予備調査
豊橋技術科学大学の吉田光男助教と行っている共同研究の内容になります。 本共同研究では、コンテンツの人気に関する各種指標がどのように一致し、どのように異なっているのかを分析し、それらの指標をサービスに活用するための方法について検討しています。 コンテンツの人気に関する指標にはGoogle Trendのような検索数、TwitterでのTweet数のようなシェア数、PVといった指標がありますが、 それぞれの指標がどのように関連し、どのように変化していくのかについてはよくわかっていません。 2015年度の人工知能学会においてはグノシー内におけるPV数とSNSへのシェア数を比較し、それらの指標が記事の特性によって大きく異なることを報告しています。 ( 参考: jsai2015:3M4-3 スマートフォンにおけるコンテンツ閲覧と共有行動の分析)
今回はWikipediaのPV数との比較のための予備調査という位置づけです。WikipediaのPV数はGoogle Trendの数値に親しい数値がでることがわかっており、検索数の代理変数としてみなすことができます。
まだインパクトのある結果は出せていませんが、各コンテンツのPVのデータを研究の題材にできる機会は多くないので、 よい研究結果をだせるように吉田先生とともに引き続き頑張っていこうと思います。
インダストリアルセッション
6月6日のインダストリアルセッションに「時系列解析などを用いた分析自動化への取り組み」というタイトルで大曽根が登壇しました。インダストリアルセッションは産業界における人工知能技術の具体的な応用事例・技術やニーズ等をスポンサー企業が発表するセッションになります。
発表では、機械学習を用いた推薦サービスを提供する上での異常検知、オンラインテストの定量評価などを用いた自動化および効率化への取り組みの一部をお話ししました。
ランチョンセミナー
2日目の6月6日にランチョンセミナーを開催しました。ランチョンセミナーは今年度から始まった企画です。 当日は聴講整理券が朝9時にはもう配布終了になるなど、非常に人気だったようです。 一方で開催ホテルに泊まっていた社会人の方が非常に有利だったという側面もあり、 このあたりのオペレーションは来年以降もっと改善いていくといいなと思っています。
当社は「Gunosyにおける記事推薦システムの概要および研究開発への取り組み」と題しまして、2件の発表を行いました。
Gunosyにおける研究開発 @ysekky
まず関からは研究開発の取り組みとして以下の2点についてお話しました。
- 当社がどのような考え方で研究開発をおこなっているか
- 現在とりくんでいるクリックベイトに関する研究開発の紹介
1についてはこれまで話す機会があまりなかったので、はじめてのお話にはなりました。 推薦システムとして閲覧に最適化するためのアルゴリズムとシステムの話と、閲覧をどのように評価すべきかというコンテンツ評価の2軸で取り組んでおり、 前者は短期的な事業メリットが見込めるので業務の中で、後者は中長期的な価値向上の話になるので、論文化を通したブランディング向上と絡めながら行っているという話をしました。 2については昨年から研究会等で話しているのですが、事業の中の課題を機械学習タスクに落とす際の教師データづくりがなかなか難しいよね、という話を事例を交えて行いました。 大量のデータがあればある程度の問題が解けるようになっている現代において、事業課題にマッチしたデータをどのように集めるのかが重要になってくるなぁと感じています。
ニュース推薦システムにおける機械学習の活用事例 - @mathetake
@mathetakeからは弊社の「グノシー」や「ニュースパス」で実際に本番環境で稼働中のアルゴリズムのうち
- ユーザー行動の数理モデル
- 近傍探索アルゴリズム
の2つについて紹介しました。
1.ではニュースアプリケーションにおけるユーザーの行動をどのような数理モデルでモデリングし、かつそれをどうAWS上で実現しているかについてお話しました。この話に加え、ベクトル化されたユーザーをどう実際のニュース記事リスト生成に用いているかについては、先日のAWS Summit Tokyo 2018でより詳しく紹介しましたので、興味ある方はそちらの資料も御覧ください 👉 ユーザー行動が成す力学系の実現と それを用いた推薦システムを支えるAWS アーキテクチャ - Speaker Deck
2.では、ベクトル化されたニュース記事に対して近似近傍探索を行うために実装した、Go言語純製のライブラリである gann (GitHub - mathetake/gann: gann(go-approximate-nearest-neighbor) is a library for Approximate Nearest Neighbor Search written in Go)とそのアルゴリズムについて紹介しました。
スポンサーブース
期間中は企業展示を行っていました。 企業展示では、当社のニュース配信システムについて説明をポスターを用いて行った他、ノベルティの配布などを行っていました。 リアルタイムに配信可能なニュース推薦システムを構築していること、そのシステムを実際に運用することが研究とどのように違うかということを説明させていただきました。 当社はニュースのアプリを作っている会社という印象が強くあるようで、「アプリは使っていたがそのようなことをやっているとは知らなかった」という感想も多く聞かれましたし、 学生や研究者の皆様自身の研究や経験の観点から様々なコメントを頂くことができました。
鹿児島グルメ
鹿児島はとってもごはんが美味しかったので紹介します。
これが2018年の人工知能 #jsai2018 pic.twitter.com/aRq76tdWpi
— マスタケ (@mathetake) 2018年6月4日
ねぎ豚しゃぶさんです。0日目に東北大乾研の方や、NTT研究所の方々といきました。おいしかったです。
人工知能(黒豚ロース) (@ とんかつ川久 in 鹿児島市, 鹿児島県) https://t.co/wvSW1LEPZv pic.twitter.com/6z4gAYGQSu
— マスタケ (@mathetake) 2018年6月7日
とんかつさんです。1週間で2回もとんかつを食べることは今後の人生ではないと思います。宇宙を感じました。
— skさん (@ysekky__) 2018年6月7日
もも焼きとレバー刺しさんです。九州のこの骨ごと出てくるタイプのももやきはもっと東京でも普及してほしいと思います。 やはり地域の力で鳥刺し系の鮮度が宇宙で、最高のUXです。
人生をやりに来た (@ 餃子の王将 中央駅店 in 鹿児島市, 鹿児島県) https://t.co/iIfAw5OzwN pic.twitter.com/WDoBQjYaD2
— マスタケ (@mathetake) 2018年6月8日
餃子の王将、鹿児島だけ運営会社が違うらしく、味が東京のものと違うと聞いたので食べに来ました。 黒酢で作ってる天津飯がすごい美味しかったです。六本木にほしい。