Gunosyデータ分析ブログ

Gunosyで働くデータエンジニアが知見を共有するブログです。

NLP若手の会 (YANS 2016) に参加 & スポンサーしました

はじめまして。データ分析部の大原です。最近家での作業中は、「雨 強め」などの自然音を聞いています。歌詞も無いので音楽に惑わされることなくリラックスして作業できるので良い感じです。

さて、少し前の事になりますが、8月28日(日)〜8月30日(火)にNLP若手の会 (YANS)に参加しました!

YANSとは

YANSとはYoung Researcher Association for NLP Studiesの頭文字を取ったもので、自然言語処理関連の若手研究者・若手技術者のアクティビティを高めることを目的としたコミュニティで、2006年から毎年この時期に開催されています。 NLP関連の研究をしている多くの大学から、または業務でNLP関連の技術を活用している企業の方が多く集まり、互いに自分の研究の紹介・意見の交換などをでき、有意義な時間を過ごせます。

今年の開催地は、和歌山県白浜で、海沿いで非常に心地良い場所でした。 f:id:gofue0723:20160912115928j:plain 最終日BBQの様子

規模感

今年は過去最大の規模だったようで、運営委員の方々が予定などを立てるのが大変だったようでした。 非常に有意義な3日間だったと感じました。ありがとうございました。

  • 参加者:152名
    • 昨年度: 108名
  • 発表件数:52件(一般発表)
    • 昨年度:28件
  • スポンサー数:23団体
    • 昨年度:14団体

日程

各セッション、1部屋で行っていたので、おおよそ全ての発表を見聞きすることができました。

時間 内容 備考
8/28(日) 13:00 - 13:30 受付
13:30 - 14:00 オープニング
14:00 - 15:50 ポスター・デモ発表 (1) 一般: 13件
スポンサー: 1件
16:00 - 17:00 招待講演 (1)
17:00 - 18:30 交流会企画
夕食・懇親会
8/29(月) 08:50 - 09:35 スポンサー発表 (1) スポンサー: 4件
09:40 - 11:30 ポスター・デモ発表 (2) 一般: 13件
スポンサー: 2件
11:30 - 14:30 昼食 台風でBBQが
最終日に
14:30 - 15:30 招待講演 (2)
15:40 - 16:25 スポンサー発表 (2) スポンサー: 4件
16:30 - 18:20 ポスター・デモ発表 (3) 一般: 13件
スポンサー: 2件
夕食・懇親会
8/30(火) 08:50 - 09:15 スポンサー発表 (3) スポンサー: 3件
09:20 - 11:10 ポスター・デモ (4) 一般: 13件
スポンサー: 2件
11:20 - 11:50 ハッカソン発表会 省略
12:00 - 12:30 国際会議参加報告
12:30 - 13:00 クロージング
昼食(BBQ)

発表内容

今回Gunosyは、自然言語処理や機械学習をどのように活用しているか、ポスターにて発表いたしました。 具体的には、以下のような発表をしました。

  • 地域別記事推薦最適化
    • 地域別に読まれやすいコンテンツの調査・定量化
    • 例:九州ユーザはソフトバンクの記事をクリックしやすい
  • ユーザデモグラフィック推定(性別・年齢)
    • Deep Learningなどを活用して推定精度を高める
    • ユーザが読んだ記事を素性としてCNNで学習、予測
  • クリックベイト判定
    • クリックされやすいがユーザの満足度を伴わないコンテンツの調査・定量化

f:id:gofue0723:20160912120625j:plain

Deep Learningを活用したデモグラフィック推定精度の向上については、こちらもご覧ください。 data.gunosy.io

また、大原個人では、研究室にて先輩と開発したデモの発表をしました。 具体的には、ユーザがモノと形容詞を入力すると、膨大なソーシャルメディアテキストを利用して、モノを形容詞順に並べて表示するというデモです。例をあげますと、モノとして「新幹線、飛行機、自転車」形容詞として「速い」を入力すると、出力では「飛行機、新幹線、自転車」という順が得られます。より安くて美味しい酒を購入したい場合など、ユーザの馴染みが無いモノでも馴染みが有るモノと比較することが可能なので、意思決定をする上で有用だと考えています。 f:id:gofue0723:20160912140751j:plain

感想

同じ研究業界の、研究者と研究者、研究者と企業、企業と企業の関わりが持てること、NLPに関してどんな研究がされているのか雰囲気をつかめること、懇親会が楽しいこと、食事が美味しいこと、講演が興味深いこと等充実した3日間でした。

2日目の招待講演にて、東京大学の中山秀樹先生が「コンピュータビジョンと自然言語処理」という題目で貴重な講演をしてくださいました。全体を通してとても勉強になる講演でした。その中で一つ心に残ったスライドをご紹介します。よい研究をするためには、 先の先を考える こと。 10年先のつもりでようやく2,3年 であること。これらは、どこで何を作るにせよ通ずるのではと感じました。先の先を見据え、10年先のつもりでようやく2,3年なので、目の前だけでなく先のことは当然のこと、更にそのずっと先まで考える姿勢が大切だと学びました。 f:id:gofue0723:20160912145418j:plain

おわりに

YANSはNLP関連の研究をしていれば、学生を含めた研究者にとっても企業にとっても非常に有意義なコミュニティですので、是非参加していただき、NLPのコミュニティを盛り上げていければと思います。

シンポジウムの様子はYANSの開催報告ブログにも載っているので、あわせてご覧ください。 運営委員の皆さん、ありがとうございました。 yans.anlp.jp