Gunosyデータ分析ブログ

Gunosyで働くデータエンジニアが知見を共有するブログです。

自然言語処理

GPT から Claude 3 への移行ガイド

こんにちは。Gunosy R&D チームの森田です。 GPT-4o が発表されたこのタイミングで!?という向きもあるかとおもいますが、LLMの世界は一ヶ月もすればまったく違う状況になっているのが常なので、いずれは GPT-4o を超えるモデルが発表される時も来るでしょ…

NLP2024 参加報告

こんにちは、データサイエンス部の大竹、R&D チームの森田、久保、新規事業開発室の鈴木、岡田です。 今回の記事は 3/11 ~ 3/15 の 5 日間にわたって開催された言語処理学会第 30 回年次大会 (NLP2024) の参加レポートになります。 NLP2024 について 企業ブ…

#NLP2023 で平易な要約の生成について発表しました

こんにちは、GunosyTechLab の濱下、森田、大竹、飯塚、久保です。 今回の記事は、3/13〜3/17 の 5 日間にかけて開催された言語処理学会第 29 回年次大会(NLP2023)の参加レポートになります。 NLP2023 について 言語処理学会は人工知能の一分野である(自…

Gunosyにおけるニュース記事の自動要約システム開発 〜ChatGPTの登場を添えて〜

はじめに 背景とモチベーション ニュースキュレーションサービスとしての自動要約技術の重要性 事前学習済み言語モデルの急速な発展 自動要約モデルの作成 タスク設定 モデル データセット T5 の fine-tune 評価 自動評価 人手評価 推論の高速化 ONNX とモデ…

#DEIM2023 & #NLP2023 で発表します!

こんにちは。Gunosy Tech Labの飯塚、森田です。 今回の記事は3月の学会発表予定のお知らせです。 3月5日から3月9日にかけて開催される「第15回データ工学と情報マネジメントに関するフォーラム(DEIM2023)」、および3月13日から3月17日にかけて開催される…

知識辞書をECS on Fargate上で自動構築してみた

はじめに こんにちは、Gunosy Tech Lab - Media MLの suchida です。 気温の低下とともに起床時間が遅くなってる今日この頃です。 早く春にならないかなぁ(笑)。 さて本記事では、知識辞書構築の自動化について紹介します。 特に記事配信システムの一部で…

テンセントの広告技術が未来すぎる!AdKDD2019のテンセントAds招待講演まとめ

研究開発チームインターンの北田 (shunk031) です。アメリカのアラスカにて行われたKDD2019に参加・発表してきました。 www.kdd.org KDD2019の広告分野のワークショップであるAdKDD2019では、世界を牽引するアドテク企業が複数招待講演を行いました。 www.ad…

NLP若手の会 (YANS 2018) で発表 & スポンサーしました

こんにちは。データ分析部アルバイトの北田 (shunk031) です。最近よく聞く曲は「高速に回転するGPUファン」の曲です。 8月27日から8月29日の期間で開催されたNLP若手の会 (YANS) @ 香川県高松市に、Gunosyから関、久保、北田の3名で参加してきました。 YANS…

NLP若手の会 (YANS 2016) に参加 & スポンサーしました

はじめまして。データ分析部の大原です。最近家での作業中は、「雨 強め」などの自然音を聞いています。歌詞も無いので音楽に惑わされることなくリラックスして作業できるので良い感じです。 さて、少し前の事になりますが、8月28日(日)〜8月30日(火)にNLP若…