営業・企画職のためのXMLレシピ 第19回:NoSQLとXMLデータベース

XML/XML DBのサイバーテック:連載コラム/営業・企画職のためのXMLレシピ

2012年5月30日
セールス・マーケティング部 部長 小野 雅史

今回はサイバーテックが提供しているXMLデータベースについてのお話をします。

XMLデータベースと言うのは、文字通り「XMLドキュメントをそのまま格納できるXML専用のデータベース」です。データベースと言うと「Oracle」「SQL Server」「Access」「MySQL」などのリレーショナルデータベース(以下、RDB)を思い浮かべる方が多いと思いますが、XMLデータベースも、「大量のデータを格納し管理するための入れ物」という機能面から見た時にはRDBと同じ「データマネジメント製品」に属します。ひと昔前までは、データベースはといえば「RDB」と決まっていましたが、最近はその概念は崩れつつあり、「データベースは適材適所で使われるべき」という考え方が一般的になっています。

NoSQL=「SQLを使わないデータベース」

「NoSQL」と呼ばれるカテゴリの製品がここ数年で登場し、様々な情報システムで活用され、注目を集めています。「SQLを使わないデータベース」の総称として出てきた言葉が広まったものですが、現在は「Not Only SQL」、つまり「SQLだけではない」という意味付けが提唱され、浸透しています。NoSQLには大きく分けるとキーバリューストア(KVS)、列指向DB、ドキュメント指向DBというものが存在し、それぞれ独自の特徴があります。

キーバリューストア Google、amazon、楽天、mixi等大量データを扱うクラウドシステムで利用
列指向DB 大量データの分析・解析処理が得意
ドキュメント指向DB 柔軟でドキュメントの取り扱いが得意

Googleを例にとりましょう。Google検索、GoogleMapなどのデータを全世界のサーバに分散して格納しています。このように毎日増え続ける大量のデータを分散して管理するのに適したデータベースがキーバリューストア(KVS)なのです。また、SNSやECにおけるアクセスログ解析やデータ分析にもNoSQLが活用されています。

※SQL:Structured Query Language(構造化問合せ言語)のことで、データベースの定義や操作などを実現するためのデータベース言語の一つ。(出典:TECHSCORE)

XMLデータベース=「ドキュメント指向データベース」

NoSQLのカテゴリの中に「ドキュメント指向DB」があります。これは文字通り、ドキュメントデータを扱う事が得意な、ドキュメントデータベースの一種です。
ドキュメント指向DBは2つの種類に分類されます。ひとつは「JSON型」。もうひとつが「XML型」です。弊社が提供する代表的なXML DBである「NeoCore」は、このXML型に属するデータベースです。

ここで、 「ドキュメントをわざわざXMLに変換してデータベースに入れて管理するメリットはあるのか?」 という疑問を持たれる方もいらっしゃるでしょう。今、企業が持つ大量のドキュメント、出版社が持つ大量のコンテンツの管理について、いくつか既成概念が存在し、本当の意味でのドキュメント管理やコンテンツ管理の妨げになっていると感じています。

ドキュメント管理の既成概念

  • (ア) ドキュメントデータベースは不要
    → 文書のデータベース化は不要、ファイルサーバに保存して管理するものである。
  • (イ )2重3重管理は当たり前
    → 業務で使うドキュメントであっても個人で管理し、共有するドキュメントだけコピーして保管すれば良い。
  • (ウ) ドキュメントは使い捨て。再利用する時は、再度作り直せばよい。
  • (エ) 「大量ドキュメントを素早く探したければファイルをGoogleで探せば済む。

これから5年10年先には、1企業が取り扱うドキュメントやコンテンツの量はどんどん増加する事は確実です。その時に最も効率良くドキュメントを管理するためにも、今から汎用的なデータフォーマットであるXMLで保管しておく事は決して無駄なことではありません。勿論、企業がこの先使い続ける価値のあるドキュメントに限られますが、それだけでもデータベース化するメリットは十分にあるのではないかと考えます。

XMLデータベースの未来

15年前には、Googleがこれほど多彩なサービスを世界中で展開し、発展するとはだれも考えていなかったでしょう。
10年前には、スマートフォンがこれほどまで普及し、利用者が増えると考える人はほんの一部だったでしょう。
5年前には、Facebookがこれほどまでに急速に利用者を増やし、日本で普及するとは誰も考えていなかったでしょう。

「そんなに大量のデータをインターネット上のサーバに分散させて管理することがあるのか?うちにはそんな大量のデータはないよ。」

そんな声が今は懐かしく感じられるくらい、「インターネットサービスの情報基盤=RDBでないDBの利用」が当たり前になったのです。

現在、ドキュメントやコンテンツデータのデータベース化と再利用に関しては、印刷・出版業界がリードしています。コンテンツを戦略的に活用し、Webサービスや電子書籍に「再利用する」価値が認められているからです。今後は、この動きが一般企業に広がる事でしょう。XMLは、全世界で利用可能な「標準データフォーマット」でもあり、目的に応じて柔軟にその形を拡張する事ができます。5年後には「企業のドキュメント管理・コンテンツ管理といえば、XML」「ドキュメントデータベースを構築するのであれば、XMLデータベース」という時代が訪れる事を期待して、今回のコラムを締めくくりたいと思います。

XMLデータベースとRDB、NoSQLとの比較については、サイバーテックが毎月開催する「XML DB早分かりセミナー」で詳しくご紹介しています。
詳細ページ:https://www.cybertech.co.jp/xml/seminar/

御相談、ご質問はこちら

サービスご案内資料や、特別資料「マニュアル作成の効率化とコストダウンを実現するポイントとは? 」がダウンロードできます。

最新事例の公開情報や、イベント・セミナー情報をお届けします。

pagetop ボタン
サイバーテックお知らせ画像
©2003 CyberTech corporation ltd. All Rights Reserved.