Mar 23 2008

コンテンツの配信について考える

現在インターネット上でコンテンツを配信する一般的な技術は、HTML を Web サーバにおいて http にのせて配信することです。 で、よりユーザにつかいやすい formated な形式でコンテンツを配信してやろうじゃないか、というのが RSS とか ATOM とかの技術だと思います。

ぼのさんとこで、RSS について盛り上がっていたので、せっかくなのでぼくの思う理想のコンテンツ配信技術を書いてみます。 :-)

RSS や ATOM はそのサイトの”新着”をみる手段として今は主に使われていますが、たぶん本来的にはそのサイトのすべてのドキュメントを決まった形式でとりだすものです。

ただ、RSS の略を見ると Really Simple Syndication と、Rich Site Summary の 2(3)種類あって、Summary の言葉もみえるので RSS はコンテンツ配信の意味合いはやや薄いのかもしれませんが、ATOM の思想は新着配信なんかではなくコンテンツ配信技術です。

たとえば、1サイトを “ドキュメント配信サーバ” と考えます。

HTML と RSS/ATOM のそれぞれはプレゼンテーションレイヤのひとつで、サイトのドキュメントデータベースから外部にデータを渡す役割を持ちます。 HTML はユーザインターフェースを含む HTML ブラウザへの表示。 RSS/ATOM は対応フィードリーダへの配信です。

情報取得する場合、HTML の場合は人の判断によるブラウザ操作が必要で、またフォーマットされたものではないのでデータの扱いが難しく、RSS/ATOM は昨日も書いたようにフォーマットがただの1ファイル。 配信として考えると、この形式は全記事全文をひとつのファイルに収める必要があり、条件抽出とかもできないので現実的ではありません。

コンテンツ配信としてはどっちも技術的にはいけてないのです。

もーしかしてとおもって、ATOM のプロトコルを読んでみたのですが、”必要な情報を必要な部分取り出す” といった API はないようです。 コンテンツを publish する API はあるのですが。

よく映画の中の世界とかで、妙なハイテク OS 画面(?)に調べたいことを入力すると、なにやらネットワークを調べ、たとえば人の情報がびっと表示されるとかあります。 また、「どこそこで情報が遮断された!やばい!」とかそんな場面もよくみられます。

現実をみていると、なんじゃそら(笑) と思ってしまいますが、意外と未来はあたっているのかな、、と思ってみたりすることがありました。

たとえば、いまは検索とかだとクローラが、Web をみてまわりキャッシュしフォーマットされていない HTML データをなんとかタグをたよりに解析し、タンキング集計。 それをもとにユーザに結果をかえす仕組みになっています。

問題は、クロールする時間があってリアルタイムじゃないし、取得できる情報はフォーマットされていないし、検索アルゴリズムをユーザが決められないという問題があります。

たとえば、”ドキュメント配信サーバ” から条件を指定してフォーマットされたデータを取得できるプロトコルがあるとします。

この日付でこの文字列を含んでいてとか条件指定すると、リアルタイムに最新ドキュメントが取得できる。 ”ドキュメント配信サーバ”が他の”ドキュメント配信サーバ”のドキュメントにリンクしていたら、さらに通信に行ったり。 認証があっても面白そうです。

これで、リアルタイムにフォーマットされたデータを取得できます。 また、条件から無関係なものをとりのぞくのは、こちら側の仕事です。 たとえば Google にされなくてすみます。 自由な世界です。

“ドキュメント配信サーバ”同士が、P2Pみたいに有機的にぱ~ってつながっていく様子はさながら SF でかっこいいし、検索や結果表示の UI は好き勝手できるし、 「どこそこで情報が遮断された!やばい!」も実現可能ですね。 :-)

リアルタイム性っていうのは娯楽的にも面白い部分で、またネットワークだと半リアルタイムがつかえて、今もニコニコ動画とか twitter とか人気のあるサービスには”動き”があります。 Microsoft の Live サービスってよく考えた名前だなと思ったことがあります。 たぶん、今後インターネットが発展するのに必要なのはライブ感。

てーーことを数年前に考えてできたサイトが、実は hiromasa.zone です。

WP じゃないところ、Eclipse の解説とかのせているところは自前のアプリなんですが、今は mod_rewrite で .html にごまかしちゃっていますが、ホントは

http://zone.maple4ever.net/document.php?mid=%3C20050807174620.42f5ca5c9be5a.unboard%40hiromasa.zone.ne.jp%3E

こんな引数つけて hiromasa.zone を呼んであげると、情報をかえすようになっています。 簡単な API で、ドキュメント部分だけかえすとかもできるようになっていたりするんですが、まぁ対応アプリなんかあるわけもなく、呼べるのはぼくのつくった管理画面だけです。(笑)

全文、全記事配信可能なプロトコルになっているわけです。 なんかドキュメントID を全世界ユニークにしたかったらしく、メールの message-id みたなのがついているのが見えます。 

まぁまぁ、このようなリアルタイムコンテンツ配信は、ぱっと考えても現在の通信インフラじゃできないかなーって部分もありますが、インターネット2 くらいになったら当然のようにでてきそうな技術ではあります。 プロトコルの名前は Gopher 2 !?(嘘

そーこー相当考えた結果、どうにもいまの RSS/ATOM が気に入らなくて、やれないんならやめちゃえ! というわけもあってぼくのブログは抜粋配信なのです。 単純にただの技術者の頑固です。

かわいそうに、とそっと見守っていただけると幸いです(笑)

ちなみに、このサイトは

<div class="entry" style="">

でエントリの内容がはじまりますので、全文ほしい方は適当に RSS 生成してもらえればとおもいます。

なにを隠そう、ぼくも Yahoo! とかのニュース、勝手に全部全文生成して Google Reader で読んでいます。。 ニュースとかは、ね。 いいのだ。 :-P

 
  • wp-kumonosu.png
    驚きのあるプログラミングとデータ収集趣味
    自分, データ, RSS, 検索, 画像, Google, WordPress, アルゴリズム, コメント, コード, サイト, スパム, プログラミング, 保存, 情報, 操作, 配信, GUI, Gregarius, MySQL
  • datacenter-telecom.jpg
    Web で楽しく遊ぶための知識(1)
    サーバ, インターネット, Web, ネットワーク, 知識, IP, 人, TCP, どこ, プロトコル, ホスト, 接続, 自分, DNS, RSS, hiromasa, http, ぼく, アドレス, センター
  • WordPress サイトの高速化 (JavaScript ロード時間)
    head, JavaScript, サイト, ブラウザ, 表示, js, サーバ, WP, ファイル, 設定, 読み込み, 部分, 高速, HTTP, JS, body, script, セッション, 場合, 自分
  • WordPress + OpenID = wp-dareda
    OpenID, ユーザ, ログイン, 認証, アプリ, 実装, ID, URL, WordPress, サイト, 情報, WP, はてな, プロバイダ, 画面, SNS, 制御, 委託, Blog, delegate
  • rsync01.png
    WordPress のファイルバックアップ
    rsync, バックアップ, ファイル, ディレクトリ, current, WordPress, サーバ, MySQL, コア, データ, 転送, SSH, another, 自動, hiromasa, サバ, ローカル, 差分, 指定, --delete

2 Comments

  1. naoki
    投稿日時: 2008 年 3 月 23 日、Nighttime | パーマリンク

    このコラム読んでふと、以前書かれていた「5年以内にWEBが変わる」
    http://another.maple4ever.net/archives/35/
    を思い出しました。

    インターネットがライブ感が求められているというのはなんとなくわかる様な気がします。
    最近ではflv形式の動画配信がたくさんあったり、部分的にフラッシュを使ってサイトを表示させたり・・。

    ライブ感とは少し違うかもしれませんが、僕はGoogle MapがAjax仕様になったとき感動したのを覚えています。
    ページを切り替えをせずにドラッグだけでその周辺地域のマップを取り出せたとき「おお!」って思いました。
    あの当時は画期的だったと思います。

    こうやって見てもインターネットの世界ってどんどん進んでますね。

    > Microsoft の Live サービスってよく考えた名前だなと思ったことがあります。 たぶん、今後インターネットが発展するのに必要なのはライブ感。

    もしかして「ライブドア」という社名を付けた堀江さんは先取りしてたりして???
    あんまりそんな感じは受けませんけどね(笑)。

  2. ひろまさ
    投稿日時: 2008 年 3 月 23 日、Nighttime | パーマリンク

    naoki さん、こんにちは~ :-)

    そうですね、Google Map とかアプリケーション側もいろいろ発展していきそうですね! アプリケーションも今後どうやってネットワーク対応されていくのか楽しみなところです!

    ライブドア・・・。 たしかに、こちらのほうがずいぶん前でしたね。。(笑) うみを流してがんばってほしいものです。

Post a Comment

メールアドレスから Gravatar が取得されます。(必須ではありません)

次の HTML タグと属性が使用できます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Trackback

http://another.maple4ever.net/archives/178/trackback/