PLAY DEVELOPERS BLOG

HuluやTVerなどの日本最大級の動画配信を支える株式会社PLAYが運営するテックブログです。

HuluやTVerなどの日本最大級の動画配信を支える株式会社PLAYが運営するテックブログです。

Observability Conference Tokyo 2025 に現地参加してきました! #o11yconjp

こんにちは、テックリードの丸山 @maruyamaworks です。

弊社が提供しているプラットフォーム PLAY CLOUD では、パフォーマンスの改善や不具合の早期発見等を目的として、昨年 11 月ごろから Observability を高めるためのツールとして New Relic を導入しています。導入からまもなく 1 年を迎えようというタイミングで、ちょうど Observability (o11y) を主題としたカンファレンスが開催されるとのことでしたので、他社様でのノウハウや最新の活用事例等を学ぶため、このたび現地参加してまいりました。今回はそのレポートをお届けしたいと思います。

イベント概要

Observability Conference Tokyo 2025

日時: 2025年10月27日(月)10:00-18:00
場所: 中野セントラルパーク カンファレンス

o11ycon.jp

Observability Conference という名前のカンファレンスは実は今回が初めての開催であり、参加者数は速報値で現地 444 名、オンライン 590 名となりました。O'Reilly 本「オブザーバビリティ・エンジニアリング」の著者である Liz Fong-Jones 氏の基調講演をはじめ、合わせて 25 のセッションが行われました。参加者層としては、SRE エンジニアやアプリケーションエンジニアなど、さまざまな業界から Observability に対して高い関心を持つ人たちが集まっていました。

朝から会場は大盛況でした

セッション紹介

本イベントでは 3 つの会場があり、同時進行でセッションが行われていたためすべてのセッションを聞くことができたわけではありませんが、私が参加したセッションのうち、特に印象に残った 3 つのセッションについて紹介します。

オブザーバビリティが育む開発者のシステム理解と好奇心

▼ 登壇資料

speakerdeck.com

はじめに紹介するのは、LINEヤフー株式会社 Embedded SRE の Toshiya Kato 氏のセッションです。Observability はツールを導入するだけで達成できるものではなく、開発チームがそれを活用してシステムに対する理解度を深めることが必要です。開発者に Observability に対する意識を持ってもらうための取り組みとして、次のようなものが紹介されていました。

  • 開発者が自己完結で観測を行うことができる環境を整えた。
    • そのために、PR を作ったら自動的に専用のプレビュー環境が立ち上がるようにした。
    • プレビュー環境では簡単に負荷テストができ、本番環境に近い状態で観測ができるようにした。
    • 月に 300 回以上負荷試験が行われたチームも(負荷試験を行う文化ができている!)
  • 環境を整えただけじゃ使われない、だから 開発者が負荷試験を「遊べる」ようにした
    • 社内でチューニングコンテストを開催。誰でも挑戦でき、結果について議論できるようにした。
  • 草の根的な活動として、例えば CPU プロファイリング結果の画像などを Slack に貼ってメンバーの議論を誘いつつ、開発者の認知度や関心を高めている。

開発者の関心を高めるためには、コンテストなどゲーム的な要素を導入してみたり、普段から社内 Slack などで関連する情報を発信するなどといった地道な活動はやはり必要なのだなということを感じました。

ゼロコード計装導入後のカスタム計装でさらに可観測性を高めよう

▼ 登壇資料

speakerdeck.com

続いて紹介するのは、Sansan 株式会社テクニカルリードの前田英司氏のセッションです。Observability ツールの計装は、ゼロコード計装、つまりエージェントをインストールするだけでできる計装に加えて、アプリケーションコードに専用のロジックを追加するカスタム計装があります。カスタム計装を行うことで、独自のロジックをもとに任意の情報をトレースに紐づけて管理できるようになり、アプリケーションの可観測性に新たな視野がもたらされます。

本セッションでは以下の 3 つがカスタム計装の例として紹介されていました。

  1. ユーザー情報等の計装
    • ユーザーの識別子やユーザーの種別に関する情報を計装。
    • ただし、氏名やメールアドレスなど個人を特定できる情報は計装していない。
  2. そのサービスにとって 特にクリティカルな機能の詳細な計装
    • 前田氏が担当するサービスでは「検索機能」がこれに該当。どういった検索クエリが投げられているのか、ページ番号は何ページ目まで見られているのか等、ユーザーの検索行動を理解するために必要な情報を取得できるよう、独自の計装コードを書いているとのこと。
  3. 非同期処理の計装
    • Lambda → SQS → Lambda のように、連続する処理の間にキューや Pub/Sub が挟まっているパターン。これはゼロコード計装ではトレースがつながらないため、トレースヘッダの値を受け渡すための追加実装が必要。
    • 全部のマイクロサービスでトレースヘッダの受け渡し(コンテキスト伝搬)を実装した結果、サービスマップでサービス間の関係性が可視化されるようになった。
    • コンテキスト伝搬だけはとにかく早く導入したほうが良い

ちょうど我々も、ゼロコード計装が終わりつつあり、カスタム計装に着手しようかという段階だったので、大変参考になりました。特に、非同期処理の計装は、今まさに作業を進めているところであり、地味な作業ですが複雑なシステムの全体像をつかむためには必要なことですから、引き続き取り組んでいきたいと思います。

オブザーバビリティと共に育てたID管理・認証認可基盤の歩み

▼ 登壇資料

speakerdeck.com

最後に紹介するのは、株式会社カミナシ エンジニアリングマネージャーの高井真人氏のセッションです。チーム体制が弊社と似ている点もあり、非常に参考になりました。また、Observability の活用事例の中で紹介されていた「サービスレビュー」という取り組みについては、弊社でも今週から実践したいと思いました。

サービスレビューは、「パフォーマンス」「エラー」「コスト」という 3 つの観点について、先週との変化はどうか、想定外のことは起きていないか、を確認する週次のミーティングだそうです。これら 3 つの観点は、サービスに関わるすべての開発者が意識するべき基本的なポイント だと思います。本当の意味での Observability を実現する上で、開発者がサービスの状況について高い関心を持つことは不可欠ですが、それを実現するためのフレームワークとして、我々も取り入れたいと思いました。

その他ブース紹介

会場では、スポンサー企業がそれぞれに工夫を凝らしたブースを出展していたほか、書籍販売のブースがあり、定番の O'Reilly 本をはじめとし、Observability や SRE、パフォーマンスチューニングなどに関する書籍が特別価格で販売されていました。

また、メイン会場の隣の部屋では台湾飲茶とお菓子が提供されており、美味しくいただきました。

おわりに

今回、Observability Conference に参加してさまざまな会社の取り組みや事例について話を聞いてきました。結論としては、どんな組織にも絶対的に当てはまるような「正解」というものはなく、みんな同じように悩み、試行錯誤を重ねながら、システム、そして組織に Observability をインストールしていっているのだということを実感しました。今回、現地で聞くことができなかったセッションについても、できる限りアーカイブで視聴しようと思います。

そして、このようなカンファレンスを企画、開催いただいたスタッフや関係者の皆様、スポンサー企業の皆様にも重ねて御礼申し上げます。次回の開催予定が決まりましたら、是非またお邪魔させていただきたいと思います。


最後になりますが、弊社における Observability の活用事例について、来月幕張メッセで開催されるメディア総合イベント Inter BEE 2025 にて New Relic 株式会社様と共同でセッション登壇させていただくことになりました! 弊社が Observability ツールの導入に至った経緯や、実際の活用状況、また今後の展望等についてお話しさせていただく予定ですので、もしご関心のある方は幕張まで足を運んでいただけますと幸いです(弊社のブース展示もございます)。

▼ セッション登壇の詳細についてはこちらをご覧ください

www.inter-bee.com