Gunosyデータ分析ブログ

Gunosyで働くデータエンジニアが知見を共有するブログです。

LLM 論文の探し方

こんにちは。R&D の森田です。牛スネ肉のブロックをまるごと炭火で焼いたら美味しかったので、最近のオススメです。 この記事は Gunosy Advent Calendar 2023 の 2 日目の記事です。前回の記事は nagayama さんの Android DataStore の段階導入 でした。 今…

根っこから理解を深める dbt

dbt

はじめに はじめに dbt はそもそもツールとして何を行なうか ELT における Transform について dbt が担っている機能 dbt は技術的にどのようにして Transform を実現しているか Jinja テンプレートによる SQL の生成 各種データ基盤に向けたデータ変換の手…

新卒エンジニアブログ 研修とOJTの振り返り

2023年4月に新卒エンジニアとしてデータサイエンス部MediaMLチームに配属された大城(k.oshiro)です。 普段はauサービスTodayアプリの記事配信システムの開発を行っています。 本記事は、新卒エンジニアとして入社後にやってきたことを簡単にまとめたもので…

#ECIR2023 にて発表を行いました

はじめに 情報検索のカンファレンスであるEuropean Conference on Information Retrieval (ECIR)が2023年の4月2日から4月6日の間にアイルランドのダブリンで開催されました。 Gunosyから投稿した論文がフルペーパーとして採択されたため*1、飯塚が参加・発表…

動画アプリの推薦システムを開発しました @au5Gチャンネル

はじめに こんにちは、Gunosy Tech Lab (GTL) MediaMLチームの上村です。今回のブログでは、先日プレスリリースがあった au 5Gチャンネル へのレコメンド機能の提供についてご紹介したいと思います。 gunosy.co.jp 「au 5Gチャンネル」とは*1 「au 5Gチャン…

#NLP2023 で平易な要約の生成について発表しました

こんにちは、GunosyTechLab の濱下、森田、大竹、飯塚、久保です。 今回の記事は、3/13〜3/17 の 5 日間にかけて開催された言語処理学会第 29 回年次大会(NLP2023)の参加レポートになります。 NLP2023 について 言語処理学会は人工知能の一分野である(自…

Gunosyにおけるニュース記事の自動要約システム開発 〜ChatGPTの登場を添えて〜

はじめに 背景とモチベーション ニュースキュレーションサービスとしての自動要約技術の重要性 事前学習済み言語モデルの急速な発展 自動要約モデルの作成 タスク設定 モデル データセット T5 の fine-tune 評価 自動評価 人手評価 推論の高速化 ONNX とモデ…

#DEIM2023 にて技術報告、研究発表、スポンサー展示を行いました

こんにちは、GunosyTechLab の上村、飯塚です。 今回の記事は、3/5〜3/9の5日間にかけて開催された第21回日本データベース学会年次大会(DEIM2023)の参加レポートになります。 DEIM2023 について DEIMはデータ工学と情報マネジメントに関するフォーラム と…

#DEIM2023 & #NLP2023 で発表します!

こんにちは。Gunosy Tech Labの飯塚、森田です。 今回の記事は3月の学会発表予定のお知らせです。 3月5日から3月9日にかけて開催される「第15回データ工学と情報マネジメントに関するフォーラム(DEIM2023)」、および3月13日から3月17日にかけて開催される…

広告レコメンドでIncrementalトレーニングを実践し、学習コストを大幅に削減した話

はじめに 背景 課題 解決策:Incremental Trainingの導入 1, 特徴モジュール 2, モデルの継承 実験結果 まとめ はじめに こんにちは。Gunosy TechLab Ads MLチームのしょうえいです。 この記事は Gunosy Advent Calendar 2022 の22日目の記事です。 Ads ML側…