Gunosyデータ分析ブログ

Gunosyで働くデータエンジニアが知見を共有するブログです。

#NLP2023 で平易な要約の生成について発表しました

こんにちは、GunosyTechLab の濱下、森田、大竹、飯塚、久保です。 今回の記事は、3/13〜3/17 の 5 日間にかけて開催された言語処理学会第 29 回年次大会(NLP2023)の参加レポートになります。 NLP2023 について 言語処理学会は人工知能の一分野である(自…

Gunosyにおけるニュース記事の自動要約システム開発 〜ChatGPTの登場を添えて〜

はじめに 背景とモチベーション ニュースキュレーションサービスとしての自動要約技術の重要性 事前学習済み言語モデルの急速な発展 自動要約モデルの作成 タスク設定 モデル データセット T5 の fine-tune 評価 自動評価 人手評価 推論の高速化 ONNX とモデ…

#DEIM2023 にて技術報告、研究発表、スポンサー展示を行いました

こんにちは、GunosyTechLab の上村、飯塚です。 今回の記事は、3/5〜3/9の5日間にかけて開催された第21回日本データベース学会年次大会(DEIM2023)の参加レポートになります。 DEIM2023 について DEIMはデータ工学と情報マネジメントに関するフォーラム と…

#DEIM2023 & #NLP2023 で発表します!

こんにちは。Gunosy Tech Labの飯塚、森田です。 今回の記事は3月の学会発表予定のお知らせです。 3月5日から3月9日にかけて開催される「第15回データ工学と情報マネジメントに関するフォーラム(DEIM2023)」、および3月13日から3月17日にかけて開催される…

広告レコメンドでIncrementalトレーニングを実践し、学習コストを大幅に削減した話

はじめに 背景 課題 解決策:Incremental Trainingの導入 1, 特徴モジュール 2, モデルの継承 実験結果 まとめ はじめに こんにちは。Gunosy TechLab Ads MLチームのrui.zhongです。 この記事は Gunosy Advent Calendar 2022 の22日目の記事です。 Ads ML側…

dbt snapshot から学ぶ Slowly Changing Dimension

この記事では、ELT パイプラインにおける Transformation ツールである dbt の snapshot という機能について紹介した後、snapshot の手法を一般化したディメンションモデリングにおける概念である Slowly Changing Dimension を包括的に紹介します。

M1 Mac に挫けない!TensorFlow に躓かない開発環境をつくる

MediaML ではニュース記事のパーソナライズシステムの運用をしています。 その一部に記事やユーザーをベクトル化する Python 製の API があり、内部では TensorFlow を利用しています。 今回、その API を新モデルの検証のために新規構築する機会があり、そ…

プッシュ通知にパーソナライズを導入して開封率が 50% 向上したはなし

本記事では、2022 年春頃に auサービスToday のニュース記事プッシュ通知に導入したパーソナライズシステムについてご紹介いたします。

最近のニュース記事推薦手法まとめ 〜固有表現の利用から多様性の向上まで〜

はじめに 他ドメインと比較したニュース記事推薦の特徴 1. ライフサイクルの短さがもたらすコールドスタート問題 2. 深い言語理解の必要性 3. 明示的なフィードバックの利用の難しさ トピック別ニュース記事推薦手法 記事の人気度合い(popularity)の考慮 …

【新卒ブログ】エンジニア1年目が体験した新卒研修とOJT

あいさつ 自己紹介 なんでGunosyに入ったの? 新卒研修 新卒研修 Udemy(動画による研修) OJT 概要 動画記事の利用状況を分析する(SQL) 「動画記事リスト」を作成する(Python) 動画記事の挿入を行う(Golang) ABテスト OJTを振り返って 終わりに あい…