データ分析部研究開発チームの関です。 最近は10月のエビ中とBishの対バンイベントに向けて双方の楽曲の予習を行っています。
この度データ分析部では9月7日, 8日に成蹊大学で行われた第11回テキストアナリティクスシンポジウムに参加し, 7日は招待講演とパネルディスカッション、8日には2件の研究発表を行いました。
テキストアナリティクスシンポジウムとは
テキストアナリティクスシンポジウムは電子情報通信学会の言語理解とコミュニケーション研究会(NLC研)が主催するシンポジウムで、 自然言語処理の結果をどのように分析・解釈・活用するかという点に着目した研究会です。 第10回まではテキストマイニングシンポジウムと呼ばれていましたが、業界全体のトレンドを考慮し、今回からテキストアナリティクスシンポジウムと改称されました。 参加者も学生や研究者だけでなく、企業の実務担当者が多かった印象です。 また自然言語処理を専門にする研究者だけでなく、自然言語処理を活用する他分野の研究者の発表も多くありました。
第11回テキストアナリティクス・シンポジウム:参加募集 - 言語理解とコミュニケーション研究会
参加/発表の目的
データ分析部の人数も増え、中期的なビジョンに沿った研究開発を行うことにリソースを使えるようになってきました。 そんななか発足したGunosyのデータ分析部研究開発チームでは研究成果の外部発表に力を入れており、 将来的にトップカンファレンスへacceptされるような研究を行うことを目標にしています。 そのなかでまず業務の中での外部発表を増やしていくために、国内研究会への定期的な発表参加を行っています。
普段業務の中で様々な問題に取り組んでいるものの、研究発表を行うことを目的とした実験やその結果の整理、原稿の執筆を業務の延長線上で行うことはなかなかに難しいのが現状です。 そこで国内研究会での発表を定期的なマイルストーンにして原稿の執筆を行うことで、定期的に実験や結果の整理を行い、 そこでの議論と結果の蓄積をもって、査読付きジャーナルへの投稿や、国際会議のワークショップへの投稿をまずは目指していくという方針を立てています。
テキストアナリティクスシンポジウムは、特に自然言語処理技術の応用にフォーカスしており、 実務での応用を目指した研究開発を行っている当社の試みとも親和性が高いと判断し、 今回以下2件の発表申込をするに至りました。
- 関 喜史, 潮 旭, 米田 武, 松尾 豊, クリックベイトの特定に向けたユーザ行動分析
- 米田 武, 久保 光証, 関 喜史, ニュース配信システムにおけるパーソナライズの設計と導入
招待講演
また発表参加とは別に招待講演の依頼を頂き、発表をさせていただきました。
今回の招待講演のテーマはウェブ企業におけるテキストアナリティクスの活用ということで、 当社以外にInsightTechさん、SanSanさん、メルカリさんの発表がありました。
当社からは「Gunosyにおけるデータドリブンなサービス開発とテキストアナリティクスの活用」と題して発表させていただきました。
事例よりもデータドリブンな開発体制の話を中心に話しました。 テキストアナリティクスをサービスに活かすという点においては、 テキストアナリティクスがどのような結果をもたらすかという点ももちろん大事ですが、 その結果を活かせるような会社の意思決定の仕組みが非常に大事だと考えています。
データ活用における組織の重要性については中山ところてんさんの資料でも述べられています。
今回は当社が試行錯誤しながら作り上げてきた組織の仕組みについて発表させていただきました。
参加者の方々からは「徹底的なデータドリブンな開発体制は非常に勉強になった」という声を多くいただきましたが、一方で「もう少し具体的な事例を聞きたかった」という意見もいただきました。 今後の発表に活かして行きたいと思います。
また招待講演終了後、他の招待講演者ともにパネルディスカッションが行われました。 各社の持っているデータや、活用方法はそれぞれ多種多様でしたが、「ゴールの設計をしっかりやること」という点がみなさん一致していたのが興味深かったです。
研究発表
2日目には当社から「クリックベイトなニュース記事の特定に向けたユーザ行動分析」と「ニュース配信システムにおけるパーソナライズの設計と導入」の2件の研究発表を行いました。 まだ研究開発段階のためウェブ上での資料の公開は差し控えますが、活発な議論を行うことができました。
おわりに
これまでスポンサーとしての参加は積極的に行ってきましたが、 今回ははじめてのまとまった研究発表を行う研究会の参加でした。 今後もスポンサーとしての学術コミュニティへの貢献は継続しつつ、 発表者としても参加し、研究者の皆様との議論を深めていきたいと考えています。