P2Pは停滞/ストリーミングが増加 - 日本のインターネットトラフィック

2009/1/5-2

日本国内でのインターネットトラフィックは徐々に変化してきているようです。 ISP6社でのトラフィックを解析した以下の論文を読みました。

"Observing Slow Crustal Movement in Residential User Traffic", Kenjiro Cho(IIJ), Kensuke Fukuda(NII/PRESTO JST), Hiroshi Esaki(東京大学), Akira Kato(慶応義塾大学), ACM CoNEXT2008, Dec 10-12, 2008, Madrid, SPAIN (PDF)

ISPのトラフィックはP2Pが依然支配的である一方で、YouTubeなどの動画コンテンツが増えていると思われるのに全体としてのトラフィックはさほど増えていないという現象を紹介しています。 この論文では、2004年頃のP2Pファイル共有によるトラフィックの急増を「火山噴火」に、昨今の一般ユーザのトラフィック量の増加を序々に進行する「地殻変動」に例えています。 かなり面白い内容なので、是非原文をご覧下さい。

以下、解説です。 図は論文から引用しています。

データ取得方法

この論文の元となるデータ取得は、総務省データ通信課が事務局になってISP6社がトラフィックデータを提供することによって実現しています。 データ提供者として挙げられているのが以下の6社です。

  • IIJ
  • ソフトバンクテレコム
  • ケイ・オプティコム
  • KDDI
  • NTTコミュニケーションズ
  • ソフトバンクBB

IN/OUTの統計データ

データはISPを中心とした視点でのINとOUTによって扱われています。 INとはISPに流れ込むトラフィックで、OUTはISPから出て行くトラフィックです。 IN/OUTの対象は、以下の図に示す5項目に対して測定が行われています。

B1) external 6IXes : JPNAP/JPIX/NSPIXP
B2) external domestic : local IXes private peering/transit
B3) external international
A1) RBB(Residential BroadBand) customers : DSL/CATV/FTTH
A2) non-RBB customers : leased lines, data centers, dialup

A1とA2がいわゆる「ユーザ」への接続になりますね。 B1,B2,B3がISPから「外へ」の接続ですね。

これらのデータを集めるためにMRTG/RRDtoolのログを収集するツールを開発し、5つのグループに対して2時間の粒度で測定を続けたそうです。 データはSNMPによるルータのインターフェースカウンタ値を取得する形で集められています。 ログの収集は各ISPが独自に行い、全部を集計する作業が後から行われたそうです。 ISPによっては例えば10万個以上のログが存在しており、全部まとめたりするのが大変だったそうです。

このようにして集められたデータは、個別ISPによるシェアがわからないように集計後の結果のみが公表されています。 このような研究では、データを収集する技術よりもむしろ政治的な問題や組織的な問題の解決が困難そうです。

国内ブロードバンド利用者数とトラフィック傾向

国内ブロードバンド利用者数の推移

国内ブロードバンド利用者数の推移を表す図です。 CATV,DSL,FTTHを全て合わせて2930万契約です(2008年6月時点)。 これは全世帯の約56%にあたります。

注目すべきは、DSLの減少とFTTHの増加だと思われます。 ADSLなどのDSL回線が減少する一方で、光ファイバー契約が増加しているのがわかります。 一般ユーザの光ファイバーへの移行が進んでいるのが数値として現れている気がします。

最近は家電量販店での値引き条件に光ファイバー契約が含まれる事も多く、テレビで宣伝も多くされています。 その影響でしょうか?

国内主要IXのピークトラフィック

国内主要IXでのピークトラフィックの推移です。 赤の丸で作られた線がピークトラフィックの値を示しています。 青の×で作られた線が増加率を示しています。

この図を見ると、2005年以降は増加率がほぼ40%で推移しているのがわかります。 トラフィックは増加していますが、爆発的な増加ではなくなってきているのがわかります。 言い方を変えると、トラフィック量の「伸び」に関する天井が近づいているのかも知れません。

トラフィック

A1(IN/OUT)とA2(IN/OUT)の図と、B1〜B3までのIN/OUT図です。 これら2つの図はトラフィック推移を表しています。

一つ目の図を見るとA1 INの増加量よりもA1 OUTの増加量の方が多いのがわかります。 A1とA2はユーザへのトラフィックを表しています。 2004年時点と比較すると、その差は開いて行っています。 これはP2Pによる等価量のデータ交換からダウンロード専用型へと推移している状態が数値として出ているのだと思われます。

さらに、二つ目の図を見るとB3 INが劇的に伸びているのがわかります。 B3は国際線接続を表しているので、図2は海外からの流入トラフィックが増えている事を表しています。 恐らくP2PからYouTubeなどの動画トラフィックへと移行していっているのだろうと思われます。

曜日毎のトラフィック

以下、家庭利用における週間トラフィックの変化を表した図です。 上の図が2005年で下が2008年です。 赤がISPへの流入量で、緑がISPから家庭への流出量です。

2005年と2008年で、どちらもピークが21時から23時頃です。 2005年時点と比べるとユーザへと流れるトラフィックの割合が増えています。 YouTubeなどの動画サービスが人気になって来たことが原因かも知れません。

個人的には2008年データの土日部分が気になりました。 土日の方が一日中動画が見られている状態になっているのでしょうか?

なお、2005年のデータと2008年のデータで縦軸の数値が違うのでご注意下さい。 また、休日は週末のデータに近くなるためデータから除外してあるようです。

ユーザ毎のトラフィック

データ提供を行ったISPの一つがSampled NetFlow形式のデータ提供を行ったそうです。 論文中には「Sampled NetFlow data from 2004 to 2008 were obtained from one of the participating ISPs」と記述されています。 某ISPによるデータ提供という形になっています。 個人情報などに関連して、ここら辺の表現は難しいのだろうと論文を読んで思いました。

トラフィックの偏り

以下の図はユーザ毎のトラフィックIN/OUTを表したものです。 確率密度関数による表現です。 横軸は対数になっています。 CATV,Fiber,DSLの3種類に対して2005年と2008年のデータがあります。 上3つが2005年で下が2008年データです。


(拡大可能)

論文中では、ダウンロードとアップロードの量が等量となるようなP2P型ユーザの増加はあまり多くなく、クライアント型のダウンロード量は2005年から2008年で約3倍に増加したと記述されていました。

利用者間のトラフィック使用量の偏り

ユーザ毎のトラフィック使用量には大きな隔たりがあるようです。 上位10%でOUTの80%、INの95%を占めているのがわかります。

この偏りは2005年から2008年になってもあまり変わっていないようです。 なお、この傾向はインターネットデータに共通な傾向であり、P2Pがなくてもこのようになる傾向があるそうです。

トラフィックの種類

論文中でプロトコル別使用量データと、TCPポートの利用に関するデータが記述されていました。

2005年〜2008年で、TCPデータが95%〜97%ぐらいを占めており続いてUDPが1〜3%ぐらいを占めているようです。 TCPで利用されているポート番号は、全体でみればほとんどは動的ポートであるとのことでした。

一方で、クライアント型のユーザだけみれば80番が多く、その割合は増えてきているそうです。 要はほとんどのクライアント型トラフィックがWebであるということです。 (しかし、ファイアウォール超えのために80番TCPを使っているようなニセWeb通信も含まれているかも知れません。)

まとめ

P2Pトラフィックは支配的な帯域を消費し続けています、全体的なトラフィックとしての成長量は鈍化しているようです。 一方で、一般ユーザのビデオコンテンツによる帯域消費が増加傾向にあります。

なお、この数値は光ファイバーへの移行が全国レベルで進んでいるという日本の特殊事情によるところもあるのかも知れないと論文中に述べられていました。

このような研究をするには実データを解析する必要がありますが、トラフィックデータはISPにとって最高機密の一つなので、このような研究を出来る状況を作るのが非常に難しいのだろうと思いました。

参考文献

もっと詳しく知りたい方は、以下の資料もご覧下さい。

最近のエントリ

過去記事

過去記事一覧

IPv6基礎検定

YouTubeチャンネルやってます!