スマートスピーカーをはじめとする「音声接点」は、ブランド体験を設計するうえでの新しい顧客接点として注目されているが、日本では広告配信の制約や普及率の課題があり、単独施策として機能させるにはまだ難しい面がある。現実的な打ち手は、音声接点をSpotify・ポッドキャスト等のデジタル音声広告から入り、ゲーム内広告など視覚接点と組み合わせた「クロスメディア設計」として捉えることだ。

この記事では以下の内容をまとめている。

  • 音声接点マーケティングが注目される背景と国内市場の実態
  • デジタル音声広告の種類・仕組みと日本での現状制約
  • 音声広告×ゲーム内広告のクロスメディア設計フレームワーク
  • 費用感・CPM比較と国内外の活用事例
  • 自社ブランドに音声接点施策が向いているかを判断する基準

こんな方に向けて書いています: 食品・飲料・日用品・外食チェーン等の生活接点の広いブランドで、TVCMやSNS広告の補完施策を探しているマーケティング担当者・ブランドマネージャー。

音声接点でのブランド体験設計が注目される背景

スマートスピーカーを使う生活者の日常シーン。音声接点がブランド体験の新たな入口として注目されている

視覚広告が飽和するなか、「ながら時間」を占有できる音声接点への関心が高まっている。スマートフォンで音楽やポッドキャストを聴きながら通勤・家事をする生活者に、画面を強制させることなく自然にブランドメッセージを届けられる点が評価されている。

可処分時間の争奪戦という文脈

現代の生活者は1日のなかで複数のデジタルデバイスを並行利用する。スマートフォン・スマートスピーカー・テレビ・PCが同時に稼働する時間帯も珍しくない。こうした「マルチデバイス環境」では、視覚を占有するバナー広告・動画広告が互いに競合し、広告ブロックやスワイプによる回避が起きやすい。

一方、音声広告は「ながら聴き」の性質上、回避しにくい特徴がある。Spotifyの音声広告は完全聴取率96%(イヤホン・ヘッドホン利用者では85%)を記録しており(出典:seikatsusha-ddm.com、確認日2026-04-24)、動画広告より高い到達率を実現している事例がある。

Z世代の音声接点利用状況

Z世代のポッドキャスト利用率は47%にのぼる(出典:日経クロストレンド xtrend.nikkei.com、確認日2026-04-24)。彼らはSNSや動画に慣れ親しむ一方で、「耳だけ」を使うコンテンツ消費の習慣も強く持つ。音声接点は若年層リーチの文脈でも無視できない選択肢になりつつある。

日本の音声広告市場規模

デジタル音声広告の市場規模(日本)は2019年の7億円から2020年には16億円(前年比229%増)に急拡大した(出典:デジタルインファクト、digitalinfact.com)。2025年には420億円規模に達するとの予測が2020年時点で出ていたが、電通「日本の広告費2025」によれば2025年実績ではラジオデジタル広告費が38億円(前年比111.8%増)と記録されており(出典:audiostart.info、確認日2026-04-24)、予測ほどの急成長ではなかったものの着実な拡大が続いている。グローバルでは2016年の11億ドルから2024年には76億ドルへ成長している(出典:IAB、otonal.co.jp経由、確認日2026-04-24)。

スマートスピーカーの国内普及状況と広告活用の現実

スマートスピーカーについては、「普及している」という感覚と実際の数値の間にギャップがある。現時点の国内普及状況を正確に把握したうえで施策を設計することが重要だ。

普及率の実態

日本国内のスマートスピーカー普及率は5.6%(出典:IMARC Group調査、newscast.jp経由、確認日2026-04-24)という調査がある一方、スマートスピーカー所有率を21.6%とする調査も存在する(出典:MMD研究所「スマートスピーカーに関する調査」、2021年10月実施、mmdlabo.jp)。調査機関・時期・質問設計によって数値が大きく異なる点に注意が必要だ。

認知率は約8割弱だが実際の利用者は1割弱とされており(出典:audiostart.info「2023年4月スマートスピーカーに関する調査レポート」)、「知っているが使っていない」層が多いことが読み取れる。導入世帯数は2026年に1,500万世帯超に達するという予測もあり(出典:IMARC Group)、中期的な成長市場として捉える視点が現実的だ。

デバイスシェアはAmazon Echo(Alexa)が国内市場の67%を占め、Google Nest(Googleアシスタント)がそれに続く。

⚠️ スマートスピーカー単独への広告配信は現状ほぼ不可

重要な実態として、スマートスピーカーに対して直接広告を配信する手段は、現時点の日本においてほぼ整備されていない

Amazonの音声広告(Amazon Ads)は2022年時点で日本は配信対象外とされており(出典:otonal.co.jp「Amazonの音声広告とは?」、確認日2026-04-24)、最新の対応状況は要確認だが、現在も日本では米・英・独ほどの展開はされていないとみられる。

現実的な音声接点の活用手段は以下の2つだ。

  1. デジタル音声広告(Spotify・radiko・ポッドキャスト)への出稿 — スマートスピーカーで再生されるコンテンツに広告を組み込む形
  2. Alexaスキル(ブランデッドスキル)の開発・提供 — 独自コンテンツを音声アプリとして提供するブランド体験施策

デジタル音声広告の種類と仕組み

ヘッドホンで音楽を聴きながらポッドキャスト・音声広告を体験するユーザー」width=

音声接点を活用したマーケティング施策は複数の手法に分かれる。自社の目的・予算・ターゲットに合わせて最適な組み合わせを選ぶことが重要だ。

種類

概要

主な媒体

特徴

オーディオアド

音楽・ポッドキャスト再生間に流れる15〜30秒の音声広告

Spotify・radiko

完全聴取率が高い。ながら聴きで接触

ホストリード型

ポッドキャストのパーソナリティが読み上げる広告

ポッドキャスト各番組

親近感・信頼度が高い。ニッチ層へのリーチ

インタラクティブ音声広告

ユーザーが声で反応できる双方向形式

Alexa搭載デバイス(米中心)

日本では対応が限定的

ブランデッドスキル

企業がAlexaスキルを開発・提供するブランド体験

Amazon Echo

継続的な接点構築。開発コスト要

ゲーム内音声広告

スマートフォンゲームのBGM合間に流れる音声広告

モバイルゲームアプリ

プレイ中断なし。ゲームユーザーに直接リーチ

コンパニオンバナー連動型

音声再生と同時に画面にバナーを表示

Spotify・radiko等

視覚×音声の複合接触

Alexaスキルを使ったブランデッドコンテンツ事例(日本)

日本企業のAlexaスキル活用事例として以下が確認されている(出典:headwaters.co.jp、iridge.jp、確認日2026-04-24)。

  • アダストリア(HAREブランド): 季節別コーデ提案・店舗インフォメーションを音声で提供
  • ZOZO: 「コーデ相談 by WEAR」スキルでファッション提案を実施
  • オルビス(ORBIS DEFENCERA): 健康食品の定着プログラムをAlexaスキル化し、継続利用を促進

いずれも「購入後の顧客体験」や「ブランドとの継続接触」を目的としており、新規認知獲得よりもロイヤルティ向上・リテンション施策として設計されている点が特徴だ。

音声広告のブランド効果データ

  • ブランド想起: +24%向上(ウェブサイトのディスプレイ広告比)
  • 購買意欲: 2倍(同比)
  • 広告理解: +28%向上(同比)
  • 出典:Nielsen Media Lab調査(2017年)、otonal.co.jp経由(確認日2026-04-24)。※2017年のデータであり、現在との乖離がある可能性がある
  • 消費者の60%が「ビルボードよりも音声広告・ポッドキャスト広告をよく記憶している」(出典:Veritonic調査2024年、Amazon Ads公式ガイド、確認日2026-04-24)
  • 43%が「テレビ・印刷・オンライン・SNS広告より押し付けがましくない」(出典:Adobe調査2019年、otonal.co.jp経由)

音声接点×ゲーム内広告のクロスメディア設計フレームワーク

スマートフォンでゲームをプレイする若年層。ゲーム内広告と音声広告のクロスメディア設計で多接点ブランド体験を実現

音声接点とゲーム内接触を組み合わせた「クロスメディア設計」が、特に若年層へのブランド体験構築で効果を発揮する。現時点で競合他社の記事には、この2つを統合したフレームワークを論じているものがほぼない。

なぜ「音声+ゲーム内」なのか

Spotifyの事例では、YouTubeとSpotifyを組み合わせた重複認知ユーザーが、単独チャネル認知者と比べて好意度・利用意向・推奨意向のすべてで最も高いブランドリフトを達成している(出典:seikatsusha-ddm.com、確認日2026-04-24)。

複数接点での反復接触がブランド認知・想起の定着を促す構造は、音声×視覚のクロスメディアでも同様に機能すると考えられる。また、ゲームユーザーの約80〜85%が音量10%以上でゲームをプレイしており(出典:Audiomob調査、audio-marketing.jp経由、確認日2026-04-24)、ゲームプレイ中に音声と視覚の両方に接触できる環境が整っている。

若年層の1日における接点設計モデル

時間帯

行動

接点

施策

朝・通勤

スマートスピーカー/イヤホンで音楽・ニュース

音声接点

Spotify・radikoの音声広告

昼・すき間時間

スマートフォンでゲームをプレイ

視覚+音声接点

ゲーム内看板広告・音声広告

夜・帰宅後

スマートスピーカー/Spotify・ポッドキャスト聴取

音声接点

ブランデッドスキル・音声広告

この設計のポイントは「同じブランドメッセージを複数の文脈で反復接触させる」ことだ。朝に音声広告でブランド名を認知し、昼にゲーム内の看板でロゴ・ビジュアルを記憶し、夜に再び音声で想起強化する——この流れでブランドの第一想起定着を狙う。

統合フォーマット:IMASIVE(音声×看板×リワードの統合)

2025年4月、オトナルとARROVAが共同で「IMASIVE(イマシブ)」を提供開始した。ゲーム内音声広告・インゲーム看板広告・ローディングリワード広告の3フォーマットを統合したアドネットワークで、音声とビジュアルの複合接触によるブランド認知・好意形成を目的としている(出典:audio-marketing.jp、確認日2026-04-24)。

現時点で日本国内での公開広告主事例は限定的だが、「音声接点とゲーム内接触を同一キャンペーンで組み合わせる」という方向性が業界として具体化してきている。

費用感・CPM比較:主要音声・デジタル接点の相場

意思決定に使える費用感として、確認できる範囲で整理する。

施策

費用感・CPM

備考

Spotify音声広告

CPM参考値:米国では約18ドル/1,000再生(約2,700円)。日本での公式CPMは非公開

出典:複数専門メディア定性情報(確認日2026-04-24)。実際の入稿時に要見積もり

radikoタイムフリー広告

75社以上の出稿実績。具体的CPMは要見積もり

出典:radiko公式情報(確認日2026-04-24)

ポッドキャスト広告

番組・形式によって大きく異なる。スポンサーシップ型は固定費が多い

ゲーム内音声広告(AdMel/GainAds等)

公式料金体系は非公開。要問い合わせ

ゲーム内看板広告(Ad-Virtua)

1週間30万円〜(推定100万回再生)、CPM約300円(通常500円比)、初期費用なし

出典:ad-virtua.com公式(確認日2026-04-24)

Alexaスキル開発

開発費用50万〜数百万円(規模・機能により)。継続運用コスト別途

音声広告は「競合が少なく低CPM傾向」と言われているが、日本では媒体ごとにCPMが非公開のケースが多く、実際の入稿時に媒体側との見積もりが必要だ。ゲーム内広告との組み合わせで考える場合、ゲーム内看板広告は入稿可能な費用感が明確であり(1週間30万円〜)、音声接点との統合キャンペーンにおける「視覚接点の柱」として検討しやすい。

音声接点・ゲーム内広告の活用事例

アース製薬×Spotifyの音声広告事例

アース製薬は「Damon(デーモン)」ブランドのローンチにあたりSpotifyの音声広告を活用。Z世代向けの新ブランドとして、サウンドロゴや音楽著名人を起用した音の世界観を構築し、ブランド認知・好意度のリフトアップを確認した(出典:Spotify公式ケーススタディ。具体的なリフト率数値は現在リンク切れのため未確認)。

また同社の「アースノーマット」はSpotifyデジタル音声広告アワードの「ベストオーディオキャンペーン」を受賞。小島よしおを起用し、蚊の羽音と組み合わせたクリエイティブで聴覚的な記憶定着を図った。

食品・日用品ブランドに示唆する点

アース製薬の事例は「商品の特性(蚊から守る)を音で表現できる」という音声広告の強みを活かしたものだ。同様に食品のシズル感・日用品の使用シーン音は、音声クリエイティブに落とし込みやすい商品カテゴリと言える。

radiko・ポッドキャストの出稿実績

radikoには化粧品・食品メーカーを含む75社以上の広告主が出稿実績を持つ(出典:radiko公式情報)。ポッドキャストは番組ジャンルによるターゲティングが可能で、ビジネス系・ライフスタイル系番組のリスナーに絞り込んでメッセージを届けられる。

こんな企業に音声接点施策はおすすめ・おすすめしない

マーケティング担当者がデジタル広告の戦略を分析している様子。音声接点施策の適合企業を判断する際の参考シーン

音声接点施策に向いている企業・ブランド

  • 食品・飲料ブランド: シズル感・食べるシーンを「音」で表現できる。料理中・食事中のながら聴きタイミングにリーチできる
  • 日用品・生活雑貨ブランド: 家事中・洗面・入浴タイムなど「手が離せない瞬間」に接触できる。習慣関与度の高い商品はブランデッドスキルとの親和性が高い
  • 外食チェーン・デリバリーサービス: 「今日の夕食何にしようか」と考えるながら通勤時間へのリーチが有効
  • Z世代・若年層がターゲットの商材: ポッドキャスト利用率47%(Z世代)を活かしたアプローチが可能
  • 多接点でのブランド体験設計を目指す企業: TVCM×音声広告×ゲーム内広告のクロスメディアでリーチを補完したい場合

音声接点施策をおすすめしない企業・ブランド

  • 視覚訴求が不可欠な商品(スペック比較が購入動機の商品等): 音声だけでは伝達できる情報量に限界がある。スペック重視の家電・BtoB製品には不向き
  • 複雑なメッセージを15〜30秒で伝えることが難しいブランド: 音声広告の尺では複雑な機能訴求は困難
  • スマートスピーカー単体への直接広告配信を想定している企業: 日本では現状ほぼ配信手段がなく、代替策(Spotify・radiko・ポッドキャスト)への方針転換が必要
  • 予算100万円未満で完結させたい場合: ブランデッドスキル開発には初期費用がかかるため、小規模予算では音声広告出稿(Spotify等)に絞るほうが現実的

よくある失敗とその対策

失敗1: 「スマートスピーカーに広告を出したい」という方針で止まってしまう

日本国内ではAmazonの音声広告の直接配信が現状制限されており、実際に出稿できる手段が限られる。「スマートスピーカー」という機器ではなく「音声で届けられる接点全体」に視野を広げ、Spotify・radiko・ポッドキャストを主軸にした施策設計に切り替えることが重要だ。

失敗2: 音声広告を単独施策として設計してしまう

音声広告単体では視覚情報がなく、ブランドロゴや商品画像を記憶に残しにくい。コンパニオンバナーとの同時配信や、ゲーム内看板広告との組み合わせで視覚記憶を補完する設計が効果的だ。

失敗3: クリエイティブを映像の流用で済ませてしまう

CM動画の音声トラックをそのまま音声広告に転用する事例があるが、映像の補助を前提に作られたナレーションは単独で聴くと意味が伝わりにくい。音声だけで「ブランド名・商品名・ベネフィット・行動喚起」が完結するクリエイティブを別途設計する必要がある。

失敗4: KPIを設定しないまま出稿する

音声広告の完全聴取率・リーチ数・フリークエンシーは数値化できる。ブランドリフト調査が可能な媒体(Spotify等)では、出稿前後のブランド想起率・好意度変化を計測する計画を立てておくことが重要だ。

評価指標(KPI)の考え方

フェーズ

指標

測定方法

認知フェーズ

リーチ数・フリークエンシー・完全聴取率

媒体レポート

記憶・想起フェーズ

ブランド想起率(aided/unaided)・広告認知率

ブランドリフト調査(Spotify Brand Lift等)

好意・意向フェーズ

ブランド好意度・購買意向

ブランドリフト調査

行動フェーズ

サイト流入増・店頭来店数変化

Google Analytics・POSデータ

ロイヤルティフェーズ

第一想起率・NPS

定期的なブランドトラッキング調査

音声広告は「バイラル」や「即時クリック」とは相性が悪い。長期的なブランド想起・好意度の変化を追う指標設計が適切だ。ゲーム内広告と組み合わせた場合は、それぞれの接点での接触回数・完全視聴率を並べて「どの接点が想起に貢献したか」をクロス分析することで、次のメディアプランの最適化に使える。

施策比較表:音声接点×ゲーム内広告×他デジタル施策

施策

リーチ対象

完全視聴率

CPM感

ブランド体験の深さ

日本での実施可能性

TVCM

幅広い全世代

高(スキップ不可)

高コスト

高い

デジタル音声広告(Spotify等)

Z世代〜30代中心

96%(Spotify)

中〜低

ゲーム内看板広告(Ad-Virtua)

10〜30代ゲームユーザー

最大96%(視認率)

約300円/CPM

中〜高(没入感)

YouTube動画広告(スキッパブル)

幅広い

低(スキップされやすい)

低〜中

SNS広告(スワイプ型)

SNS利用者全般

低(流れやすい)

低〜中

スマートスピーカー単体広告

スマートスピーカー所有者

高(ノンスキッパブル想定)

不明

低〜中

△(日本での配信制約あり)

Alexaブランデッドスキル

Alexa所有者

開発費高

高い

○(開発費要)

OOH(デジタルサイネージ)

通行人

低(通過型)

音声×ゲーム内接触でブランド第一想起を獲得するために

最終的に「第一想起」に到達するためのステップ

  1. 接点の数を増やす(リーチ): 音声広告(Spotify等)でZ世代・若年層にリーチする
  2. 視覚記憶を重ねる(記憶定着): ゲーム内看板広告でロゴ・ビジュアルを没入感のある環境で記憶させる
  3. 反復接触で想起を定着させる(ブランドメモリー): 同じブランドメッセージを音声・視覚の異なる文脈で繰り返す
  4. ロイヤルティ層には深い体験を(エンゲージメント): Alexaブランデッドスキルやポッドキャストスポンサーで、すでに認知している層をファン化する

Ad-Virtuaのゲーム内広告が補完する役割

音声接点だけでは視覚的な記憶(ロゴ・カラー・パッケージビジュアル等)を積み上げにくい。ゲーム空間内の看板広告は、プレイに没入している状態で画面内に自然に配置されるため、視認率が最大96%(Web広告平均67%比)に達し、広告想起率が約1.8倍(Web広告比)という効果データがある(出典:TalkTalk調査参照、ad-virtua.com公式情報、確認日2026-04-24)。

Ad-Virtua(アドバーチャ)は国内400タイトル以上のゲームアプリに対応したインゲーム広告ネットワークで、1週間30万円から出稿できる(初期費用なし、最短翌営業日〜)。Z世代の約80%がゲームをプレイし、1日のプレイ時間は約100分とされており(ad-virtua.com公式情報)、音声接点でリーチした層に視覚的な追加接触を重ねるメディアとして機能する。

音声×ゲーム内のクロスメディアが特にハマる企業:

  • 食品・飲料・日用品のナショナルブランドで若年層への認知拡大に課題を持つ企業
  • TVCMは実施しているがデジタル補完施策の多様化を検討している企業
  • 「嫌われない広告体験」でブランド好意度を積み上げたい企業

ゲーム内広告とその費用感の詳細については、「ゲーム内広告の費用・料金相場」も参考にしてほしい。

よくある質問(FAQ)

Q. 日本でスマートスピーカーに広告を直接配信できますか?

A. 現時点では、日本でAmazon Echoなどスマートスピーカー単体への広告配信は制限があり、実際の出稿は困難な状況です(2022年時点でAmazonの音声広告は日本が配信対象外。最新状況は要確認)。現実的な代替手段として、Spotifyやradikoなどのデジタル音声広告プラットフォームへの出稿、またはAlexaスキルの開発によるブランドコンテンツ提供が中心になります。

Q. 音声広告とゲーム内広告を組み合わせる場合、予算はどれくらい必要ですか?

A. ゲーム内看板広告(Ad-Virtua)は1週間30万円から出稿可能です。Spotifyの音声広告は入稿条件・最低出稿費用が媒体側の条件により異なりますが(日本では要見積もり)、組み合わせ予算として月100〜300万円規模から本格的なクロスメディア設計が検討しやすくなります。まずはゲーム内広告単体での効果測定を行ってから音声広告を追加する段階的なアプローチも選択肢です。

Q. Alexaスキルの開発費用はどれくらいかかりますか?

A. スキルの複雑さや機能によって大きく異なりますが、シンプルな情報提供型スキルで50万円〜、継続更新・AIパーソナライゼーション機能を持つ本格型では数百万円規模が一般的です。ランニングコストも別途かかるため、長期的なブランドエンゲージメント施策として設計することが前提になります。

Q. 音声広告の効果測定はどうすればよいですか?

A. SpotifyではBrand Lift調査(ブランド認知・好意度・購買意向の変化測定)を利用できます。ゲーム内広告との組み合わせでは、各接点の接触有無別にブランド想起率を比較する「クロスメディア効果測定」が最も有効です。ABテスト設計(音声単体 vs 音声+ゲーム内)で相乗効果を数値化することで、次回のメディア配分最適化に活用できます。

Q. Z世代に音声広告は有効ですか?

A. Z世代のポッドキャスト利用率は47%(出典:日経クロストレンド)であり、音声コンテンツとの親和性は高いといえます。ただしZ世代はコンテンツスキップにも慣れているため、クリエイティブの質——特にコンテンツ開始数秒でのブランドの刷り込み——が重要です。ゲーム内広告との組み合わせで「音声で認知 → 視覚で記憶」の流れを設計することが若年層への定着には効果的です。

関連記事

本記事に掲載している数値はすべて出典を明記しています。市場調査データは調査時点により変動するため、最新情報は各出典元を直接ご確認ください。