Gunosyデータ分析ブログ

Gunosyで働くデータエンジニアが知見を共有するブログです。

より正しい意思決定のための統計的仮説検定とサンプルサイズ計算

はじめに こんにちは、Gunosy Tech LabのBIチームに所属しているクボタです。 Gunosyではアプリ内のロジックやUI等の変更において数値ベースでの意思決定を行なっています。 例えば新たなキャンペーンでのCVR増加やUI変更によるA/Bテストでのクリック数増加…

NLP若手の会第14回シンポジウム(YANS2019) と第241回自然言語処理研究会に参加してきました!

はじめに NLP若手の会第14回シンポジウムと連続開催の第241回自然言語処理研究会に参加してきました。 はじめに YANS2019 タイムテーブル 招待講演 ハッカソン 懇親会 まとめ 大いに蛇足 第241回自然言語処理研究会 概要 発表紹介 鏡映変換に基づく埋め込み…

テンセントの広告技術が未来すぎる!AdKDD2019のテンセントAds招待講演まとめ

研究開発チームインターンの北田 (shunk031) です。アメリカのアラスカにて行われたKDD2019に参加・発表してきました。 www.kdd.org KDD2019の広告分野のワークショップであるAdKDD2019では、世界を牽引するアドテク企業が複数招待講演を行いました。 www.ad…

Gunosy MLチームでのABテストの設計と運用

こんにちは、Gunosy Tech LabのMLチームでマネージャーをしている id:skozawa です。 今日はMLチームで取り組んでいるABテストの設計と運用について紹介したいと思います。 MLチームはプロダクト横断のチームです。メンバーはグノシー、ニュースパス、LUCRA…

画像の認識・理解シンポジウム (MIRU2019)に参加して来ました!

はじめに 7/29~8/1の4日間、MIRU2019に参加してきたので、発表の概要とシンポジウムについて紹介いたします。 私達はこれまで人工知能学会、言語処理学会、データベース学会の関連イベントを中心に参加してきました。 それは私達の技術の注力領域がニュース…

リサーチインターンの成果がトップカンファレンスであるKDD2019に論文として採択されるまで

こんにちは。研究開発チームインターンの北田 (shunk031) です。今回は可愛い我が子(研究のことです)について書きます。 この度、私と研究開発チームの関さんで取り組んでいた研究がデータマイニングに関する国際会議KDD2019のApplied Data Science Track…

双曲空間ではじめるレコメンデーション

はじめに こんにちは、MediaAds ML Teamに所属している飯塚(@zr_4) です。 以前書いたブログ*1をベースに変更を加えた論文がRecSys 2019 *2 に通りました(ヤッター)。 埋め込みベースの推薦は、近年最も成功を収めた推薦手法の一つです。 埋め込みベースの推…

近似近傍探索ライブラリgannによる関連記事推薦方法

こんにちは、データ分析部の川口です。 本日はGunosy社が提供しているニュースパスとLUCRAというニュースアプリケーションの関連記事推薦で用いられている、弊社メンバーが開発したGo言語の近似近傍探索用ライブラリgann github.com とその実装例/方法につい…

人工知能学会(JSAI2019) in 新潟 に参加し、研究発表してきました!

はじめに Gunosyとして、JSAI2019に参加してきたので、発表の概要とイベントについて、紹介いたします。 はじめに JSAI2019について 発表について [インダストリアルセッション] Gunosyにおける研究開発 [1I2-J-5-05] 政治ニュース記事クラスタに対する属性…

Gunosyでのデータ分析 新卒編

はじめに こんにちは、今年の4月に新卒として入社しグノシー事業部に配属されました齊藤です。 自分は現在グノシー事業部でグノシー(アプリ)の分析を専任しています。データ分析部の方はニュースパスやオトクル等複数のアプリを横断的に分析、ロジック開発…

データ分析部で一年仕事をしての学び

こんにちは、去年の4月に新卒としてGunosyに入社し、データ分析部に配属された山田です。 先日、LabBase様からインタビューを受けてこんな記事が公開されたりしました。 labbase.jp また、先週は今年の新卒の片木くんがデータ分析部で何をやっているのかを書…

データ分析部に配属された新卒エンジニアは何をするの?その紹介

はじめに こんにちは、今年の4月に新卒として入社しデータ分析部に配属されました片木です。 この記事は「Gunosyのデータ分析部に配属された新卒エンジニアは何をするのか」を紹介するものです。 以下に同じ部署の先輩方の記事がありますので、そちらも参考…

言語処理学会第25回年次大会(NLP2019)に一般発表とスポンサーで参加しました

こんにちは、研究開発チームの関です。 でんぱ組.incの推しである相沢梨紗さんと、妄キャリの推しだった桜野羽咲さんのコラボユニットが本格的に活動を開始しました。 生きてるといいことありますね。ステージ上の目のやり場に困っています。 今回3/12 ~ 3/1…

DEIM2019で一般発表とスポンサーを行いました

こんにちは、研究開発チームの関です。 ついに今週末はひなフェスですね。当然ながら皆さんご存知だと思いますが鞘師里保さんの復活ステージです。 道重さゆみさんと鞘師里保さんの関係性が好きなので、お二人の共演にも注目したいと思います。 私は残念なが…

Web IntelligenceとIEEE Bigdataで発表してきました

こんにちは、研究開発チームの関です。 夢眠ねむ卒業公演素晴らしかったですね。WWDBestで膝から崩れ落ちました。近年におけるアイドルのあり方として一つの完成形をみた気がします。夢眠ねむさんとでんぱ組さんの今後のご活躍を引き続き応援しています。 今…

DeepなFactorization Machinesの最新動向 (2018)

はじめに こんにちは。研究開発チームの関です。 最近毎週日曜日の恋するワンピースの更新を楽しみに生きています。好きなツッコミは「この船の航海士は誰?」です。 あと虹のコンキスタドールのベストアルバム「THE BEST OF RAINBOW」は皆さん買いましたか…

社内技術ブログのはじめかた

はじめに きっかけ 執筆計画を立てる 1. 分析に興味がある人のペルソナを書く 2. 1が検索するであろうクェリの一覧をつくる 3. 検索ボリュームしらべる 4. カテゴリ分け 5. 作るべき記事のリスト(記事タイトルまでだいたいきめちゃう)をつくる 6. 記事を書…

Prod2Vecの推薦/予測システムのパラメータチューニング提案 [論文紹介]

Gunosy8月入社のshunk(@makuramoto1)です.前職は研究員とマネージャーの間みたいなことをやっておりました.現在は,Gunosyのデータ分析や,どのように記事を出したりするかといったロジックを開発する仕事を担当しています.Web業界に初めて参入して,現在…

A/Bテストよりすごい?はじめてのインターリービング

はじめに こんにちは。メディアデータ分析部の飯塚(@zr_4)です。 弊社では現在、複数のニュース形式のアプリケーションを運用しており、各プロダクトでユーザーの趣向にあうような記事リストのパーソナライズを行っています。 左から:LUCRA、ニュースパス、…

サマーインターンシップ2018開催報告

こんにちは、Gunosyデータ分析部内定者の桾澤と片木です。今年も昨年同様エンジニア向けデータ分析サマーインターンシップを実施しました。 学生に混ざり、メンターアルバイトとして参加したので、その様子や課題に取り組む上での気付きなど実際の写真も交え…

NLP若手の会 (YANS 2018) で発表 & スポンサーしました

こんにちは。データ分析部アルバイトの北田 (shunk031) です。最近よく聞く曲は「高速に回転するGPUファン」の曲です。 8月27日から8月29日の期間で開催されたNLP若手の会 (YANS) @ 香川県高松市に、Gunosyから関、久保、北田の3名で参加してきました。 YANS…

ニュースパスを支える関連記事推薦と近似近傍探索

こんにちは。メディアロジック分析部の米田 (@mathetake) です。 今日はGunosy社とKDDI社が共同で運営するニュースパスというニュースアプリケーションで使われている関連記事推薦のアルゴリズムについて書きたいと思います。 特に、約半年前に私が導入しKPI…

第32回人工知能学会全国大会(jsai2018)に参加し、研究発表を行いました

こんにちは、データ分析部研究開発チームの関です。 2018年6月5日〜6月8日に開催された2018年度人工知能学会全国大会にGunosyから大曽根、米田、山田、関の4名で参加しました。 当社はゴールドスポンサーとして協賛させていただき、主著発表1件, 共著発表1件…

今年は2つのコース!Gunosyサマーインターンシップ募集開始のお知らせ

こんにちは、かとうです。 今日はサマーインターンシップの募集を開始いたしましたのでそのお知らせです。 engineer-intern.gunosy.co.jp スケジュールなどの詳細は上記サイトでご確認ください。 今年のサマーインターンシップでは3年目となりましたデータ分…

Tokyo Editors Labに参加してきました

こんにちは。データ分析部の荻原です。様々な動画を見過ぎて突然思い出し笑いをしてしまう事が最近の悩みです。 普段はグノシー動画におけるデータ分析やロジック開発などをしています。今回は4/21 ~ 22に開催された 「Tokyo Editors Lab」にデータ分析部所…

サムネイル画像に対するテキスト認識の性能比較について (Pytesseract / Google Cloud Vision API / Amazon Rekognition)

こんにちは。データ分析部アルバイトの北田 (@shunk031) です。好きな食べ物は畳み込みニューラルネットワークです。 はじめに Gunosyでは広告を出稿する際に使用するサムネイル画像や広告画像において、テキストが占める割合の多い画像を把握したいといった…

言語処理学会第24回年次大会(NLP2018)に参加 & 論文賞受賞しました

はじめまして、データ分析部の小澤(id:skozawa)です。 3月12日(月)〜3月16日(金)に開催された言語処理学会第24回年次大会(NLP2018) @岡山コンベンションセンターに、Gunosyから、関、久保、茂木、桾澤(インターン生)、小澤の5名で参加しました。 スポン…

RedshiftとBigQueryでよく使うSQLの違いTips

データ分析部インターン生の小川です。インターンでは主に動画収集のロジック実装に取り組んでいました。 Gunosyではログの管理にRedshiftとBigQueryを使用しています。 サービスはAWS上で動いているものも多いので基本はRedshiftで、ログの量が多いものやア…

Facebookの予測ライブラリProphetを用いたトレンド抽出と変化点検知

Gunosyデータ分析部アルバイトの五十嵐です。 Gunosyには大規模なKPIの時系列データがあります。 今回はKPIの時系列分析を行なった際に得た知見についてまとめたいと思います。 具体的にはFacebookが開発した時系列予測ツール Prophetを用いて、KPIのトレン…

アプリログの自動異常検知を試してみた~密度比による異常検知入門~

Gunosyデータ分析部アルバイトの鈴木です。今回は密度比を利用したバージョンリリースにおける異常検知について学んだことをまとめたいと思います。 やりたいこと 超長期的にやりたいこと 密度比を用いた異常検知のイメージ ダミーデータでの実装例1 今回試…