Gunosyデータ分析ブログ

Gunosyで働くデータエンジニアが知見を共有するブログです。

MLOps 海外テック企業の事例とフレームワークの紹介

はじめに こんにちはGunosy Tech Labの森本です。現在MLOps基盤を再整備しています。そこで調査した海外Tech企業の事例やMLOpsのフレームワークを紹介します。 Gunosy Tech LabのMedia MLチームではニュースアプリ(グノシー、ニュースパス、ルクラ)やクー…

ニュース配信におけるAWS Rekognition活用事例の紹介

はじめに こんにちは、Gunosy Tech Labの森本です。 Gunosyではグノシー、ニュースパス、ルクラなどのニュースアプリを開発しています。 私が所属している組織であるGunosy Tech Labではニュース配信の推薦ロジックなどのアルゴリズム改善を主に担当していま…

2019年のGunosy研究開発チームの振り返りとこれから

はじめに こんにちは、研究開発チームの関です。 いつのまにやら年末感が漂ってきましたね。今年もクリスマスは赤レンガ倉庫でカップルたちの中アイドルライブを見て過ごしました。*1 年越しはCDJででんぱ組と年越しを迎えるので、クリスマスも年越しも推し…

Kaggle Days Tokyo 参加レポート

はじめに こんにちは!Gunosy Tech Lab の石川(@takaishikawa42)です。 この記事は Gunosy Advent Calendar 2019、12日目の記事です。 昨日の記事は id:mgi さんによるグノシーにおける AWS Transit Gateway 活用事例 でした。 12月11日・12日の2日間の日…

ウェブにおけるユーザエンゲージメントを計測・予測する研究について。

はじめに みなさんこんにちは、研究開発チームの関です。 先週末はでんぱ組の幕張2daysでしたね。なにを言っても陳腐になってしまうのですが本当に素晴らしい2日間でした。 色々素晴らしいことがあったのですが、推しが作った衣装をきた推しが最高に可愛かっ…

A/Bテストの時間短縮に向けて 〜ベイズ統計によるA/Bテスト入門〜

はじめに こんにちは、19卒でGunosy Tech LabのBIチームの齊藤です。 data.gunosy.io この記事はGunosy Advent Calender 2019の4日目の記事です。昨日の記事は高橋さん(@tkhs0604)によるプロダクトマネージャーカンファレンス2019 参加レポート でした。 は…

Web Intelligence 2019にFull Paperが採択され、発表をしてきました

はじめに みなさんこんにちは、研究開発チームの関です。 今年のクリスマスも横浜赤レンガ倉庫で、カップル大量発生の中ででんぱ組さんのライブを見て過ごすことになりそうです。 10/14~17までギリシャのテッサロニキで開催されていたWeb Intelligence 2019 …

Gunosy Ads の CTR予測のシステムの話

こんにちは,Gunosy Tech Lab の tmotegi です. Gunosy が提供している広告商品の Gunosy Ads では, Gunosy が開発したアプリのユーザ一人一人に対して興味を持つであろう広告を推定してユーザに提示しています. 今回はユーザが興味を持つ広告(=CTR が高…

クーポンを最適に届ける技術〜分析編〜

こんにちは、Gunosy Tech Labの片木(@jkatagi)です。 今回は私が現在取り組んでいるクーポン分析について紹介します。 Gunosyにおけるクーポン クーポンの性質 クーポンの分析 クーポンタブでのユーザー行動 クーポンの時間依存性 ユーザー属性別のクーポ…

RecSys 2019 参加レポート

はじめに 推薦システムのトップカンファレンスであるACM主催のRecSys2019 が9月15日から9月20日の間にコペンハーゲンで開催されました。 Gunosyから投稿した論文がshort paperとして採択され*1、関、飯塚の2名でポスター発表してきました。 はじめに Recsys…

ニュースパスのターゲティングプッシュシステム

こんにちは、Gunosy Tech Lab の山田です。 Gunosy で開発しているニュースアプリ、ニュースパスでは「多くの人が知っておくべき」と判断されるニュースが出た時、即座にそれをユーザにプッシュ通知でお知らせする速報プッシュ機能があります。 例えば誰もが…

WebDB Forum 2019 運営&参加レポート

はじめに みなさんこんにちは、研究開発チームの関です。 2019年9月8, 9日に行われたWebDB Forum 2019に参加してきました。 当社はゴールドスポンサーとして支援したほか、私が去年から産学連携担当委員として運営にも関わりました。 本エントリでは運営とし…

A/Bテストのベストプラクティスと落とし穴 ~KDD2019 レポート~

はじめに 研究開発チームの関です。古川未鈴さんの結婚、ニジマス大門果琳さんの卒業、uijinの解散とアイドル業界も激動の秋を迎えていますね。 2019年8月4日から5日間、アメリカはアラスカ州アンカレッジで開催されたデータマイニング領域のトップカンファ…

BERTによるテキスト分類

はじめに こんにちはGunosy Tech Labの森本です。グノシーのニュース記事を実験的にBERTでテキスト分類しましたので、その結果を共有します。 BERTはご存知の通りGoogle AIが発表した双方向Transformerであり、Pre-trainingできる特徴があります。自然言語処…

サマーインターンシップ2019開催報告

こんにちは、Gunosy Tech Lab内定者の濱下と谷口です。 今年も昨年同様エンジニア向けデータ分析サマーインターンシップを実施しました。 メンターアルバイトとして参加したので,その様子やメンターとしての気付きなど,当日の写真を交えながら紹介します!…

公平性および説明性を考慮した機械学習 in KDD2019

研究開発チームインターンの北田 (shunk031) です。アメリカのアラスカにて行われたKDD2019に参加・発表してきました。 www.kdd.org KDD2019 のチュートリアルやワークショップ、キーノートの中でFairness (公平性) および Explainability (説明性) にフォー…

より正しい意思決定のための統計的仮説検定とサンプルサイズ計算

はじめに こんにちは、Gunosy Tech LabのBIチームに所属しているクボタです。 Gunosyではアプリ内のロジックやUI等の変更において数値ベースでの意思決定を行なっています。 例えば新たなキャンペーンでのCVR増加やUI変更によるA/Bテストでのクリック数増加…

NLP若手の会第14回シンポジウム(YANS2019) と第241回自然言語処理研究会に参加してきました!

はじめに NLP若手の会第14回シンポジウムと連続開催の第241回自然言語処理研究会に参加してきました。 はじめに YANS2019 タイムテーブル 招待講演 ハッカソン 懇親会 まとめ 大いに蛇足 第241回自然言語処理研究会 概要 発表紹介 鏡映変換に基づく埋め込み…

テンセントの広告技術が未来すぎる!AdKDD2019のテンセントAds招待講演まとめ

研究開発チームインターンの北田 (shunk031) です。アメリカのアラスカにて行われたKDD2019に参加・発表してきました。 www.kdd.org KDD2019の広告分野のワークショップであるAdKDD2019では、世界を牽引するアドテク企業が複数招待講演を行いました。 www.ad…

Gunosy MLチームでのABテストの設計と運用

こんにちは、Gunosy Tech LabのMLチームでマネージャーをしている id:skozawa です。 今日はMLチームで取り組んでいるABテストの設計と運用について紹介したいと思います。 MLチームはプロダクト横断のチームです。メンバーはグノシー、ニュースパス、LUCRA…

画像の認識・理解シンポジウム (MIRU2019)に参加して来ました!

はじめに 7/29~8/1の4日間、MIRU2019に参加してきたので、発表の概要とシンポジウムについて紹介いたします。 私達はこれまで人工知能学会、言語処理学会、データベース学会の関連イベントを中心に参加してきました。 それは私達の技術の注力領域がニュース…

リサーチインターンの成果がトップカンファレンスであるKDD2019に論文として採択されるまで

こんにちは。研究開発チームインターンの北田 (shunk031) です。今回は可愛い我が子(研究のことです)について書きます。 この度、私と研究開発チームの関さんで取り組んでいた研究がデータマイニングに関する国際会議KDD2019のApplied Data Science Track…

双曲空間ではじめるレコメンデーション

はじめに こんにちは、MediaAds ML Teamに所属している飯塚(@zr_4) です。 以前書いたブログ*1をベースに変更を加えた論文がRecSys 2019 *2 に通りました(ヤッター)。 埋め込みベースの推薦は、近年最も成功を収めた推薦手法の一つです。 埋め込みベースの推…

近似近傍探索ライブラリgannによる関連記事推薦方法

こんにちは、データ分析部の川口です。 本日はGunosy社が提供しているニュースパスとLUCRAというニュースアプリケーションの関連記事推薦で用いられている、弊社メンバーが開発したGo言語の近似近傍探索用ライブラリgann github.com とその実装例/方法につい…

人工知能学会(JSAI2019) in 新潟 に参加し、研究発表してきました!

はじめに Gunosyとして、JSAI2019に参加してきたので、発表の概要とイベントについて、紹介いたします。 はじめに JSAI2019について 発表について [インダストリアルセッション] Gunosyにおける研究開発 [1I2-J-5-05] 政治ニュース記事クラスタに対する属性…

Gunosyでのデータ分析 新卒編

はじめに こんにちは、今年の4月に新卒として入社しグノシー事業部に配属されました齊藤です。 自分は現在グノシー事業部でグノシー(アプリ)の分析を専任しています。データ分析部の方はニュースパスやオトクル等複数のアプリを横断的に分析、ロジック開発…

データ分析部で一年仕事をしての学び

こんにちは、去年の4月に新卒としてGunosyに入社し、データ分析部に配属された山田です。 先日、LabBase様からインタビューを受けてこんな記事が公開されたりしました。 labbase.jp また、先週は今年の新卒の片木くんがデータ分析部で何をやっているのかを書…

データ分析部に配属された新卒エンジニアは何をするの?その紹介

はじめに こんにちは、今年の4月に新卒として入社しデータ分析部に配属されました片木です。 この記事は「Gunosyのデータ分析部に配属された新卒エンジニアは何をするのか」を紹介するものです。 以下に同じ部署の先輩方の記事がありますので、そちらも参考…

言語処理学会第25回年次大会(NLP2019)に一般発表とスポンサーで参加しました

こんにちは、研究開発チームの関です。 でんぱ組.incの推しである相沢梨紗さんと、妄キャリの推しだった桜野羽咲さんのコラボユニットが本格的に活動を開始しました。 生きてるといいことありますね。ステージ上の目のやり場に困っています。 今回3/12 ~ 3/1…

DEIM2019で一般発表とスポンサーを行いました

こんにちは、研究開発チームの関です。 ついに今週末はひなフェスですね。当然ながら皆さんご存知だと思いますが鞘師里保さんの復活ステージです。 道重さゆみさんと鞘師里保さんの関係性が好きなので、お二人の共演にも注目したいと思います。 私は残念なが…