トップQs
タイムライン
チャット
視点
MongoDB
ドキュメント指向データベース ウィキペディアから
Remove ads
MongoDB(モンゴDB)は、ドキュメント指向データベースである。開発とサポートはMongoDB Inc.が行なっている[3]。ソースアベイラブルのServer Side Public License (SSPL) で提供されている。
![]() |
Remove ads
概要
MongoDBはRDBMSではなく、いわゆるNoSQLと呼ばれるデータベースに分類されるものである。RDBMSのようにレコードをテーブルに格納するのではなく、「ドキュメント」と呼ばれる構造的データをJSONライクな形式で表現し、そのドキュメントの集合を「コレクション」として管理する(このデータの物理的な格納はBSONと呼ばれるJSONのバイナリ版といえる形式で行われる)。コレクションはRDBMSのような固定的なスキーマを持たない。ドキュメントには複雑な階層構造を持たせることもでき、それらの構造に含まれるフィールドを指定したクエリやインデクス生成も簡単な指定によって行える。RDBMSのように高度な結合操作を効率的に行うことはできないが、データの追加・更新・削除・クエリは高速に行うことができる。また、アプリケーションは自身の構造やデータ型に合った自然な形でデータを格納することができるため、扱うデータの特性によっては、RDBMSよりも容易かつ迅速に開発を行える可能性がある。
Mongoという名前は、英語で「ばかでかい」を意味する "humongous" に由来する[4]。
MongoDBの開発は10gen(現MongoDB Inc.)によって2007年10月から開始され、最初の公開リリースは2009年2月に行われた[5]。
2014年12月にデータベースストレージエンジンのWiredTigerを買収し[6]、2015年のメジャーアップデートリリースのバージョン3.0より内部に組み込まれた。ドキュメント単位でのロックが可能になったことで特にデータ書き込み時においてのパフォーマンスが改善している[7]。
人気のあるデータベースをランキング形式で公表しているDB-Enginesによると2018年2月の時点でOracle Database、MySQL、Microsoft SQL Server、PostgreSQL等の歴史あるRDBMSプロダクトに続き5位となっており[8]、2000年代後半より多数作られたNoSQLデータベースの中で頭一つ抜けたシェアを占めている。
2019年1月にAWSによってMongoDB互換のAmazon DocumentDBがリリースされた[9]。
Remove ads
特徴
要約
視点
特徴の一部:
- 整合的なUTF-8エンコーディング。非UTF-8データも、特殊なバイナリデータ型によって保存・取得できる。
- クロスプラットフォームのサポート: x86_64アーキテクチャではWindows, Linux, macOSで利用できる。ARM64, PPC64LE, s390xなどのアーキテクチャでもLinuxでサポートされている[10]。SolarisはMongoDB 3.4を最後にサポートが打ち切られた[11]。
- 豊富なデータ型: 日付、正規表現、バイナリ型、コード、など(すべてのBSONデータ型)
- クエリ結果にカーソルが使える
アドホックなクエリ
MongoDBでは、任意のフィールドを好きな時にクエリできる。フィールドの完全一致に加えて、範囲をもつクエリ、正規表現検索など様々な種類のクエリが使える。ユーザ定義のJavaScript関数を述語として使うこともできる(関数がtrueを返したときにドキュメントがマッチする)。
クエリでは、(全フィールドをとりだす代わりに)指定したフィールドだけを取り出せる。また、ソートを行ったり、結果の数を制限したり、一部をスキップすることもできる。
ネストされたフィールドのクエリ
埋め込みオブジェクトおよび配列にも「たどりつく」ことができる。以下のオブジェクトが users コレクションに挿入されているとする:
{
"username" : "bob",
"address" : {
"street" : "123 Main Street",
"city" : "Springfield",
"state" : "NY"
}
}
このドキュメント(およびNYの住所をもつすべてのドキュメント)は、以下のクエリで取得できる:
> db.users.find({"address.state" : "NY"})
配列の要素を指定することもできる:
> db.food.insert({"fruit" : ["peach", "plum", "pear"]})
> db.food.find({"fruit" : "pear"})
インデックス
MongoDBは、追加のインデックスをサポートする。インデックスは、単一キー、複合キー、ユニーク/非ユニーク、地理空間インデクス[12]をサポートする。ネストされたフィールドもインデックスできるし、配列型をインデックスすると配列内の各要素がインデックスされる。
MongoDBのクエリオプティマイザはクエリの実行時にいくつかのクエリ計画を試し、最速のものを選択する。定期的に再サンプリングを行う。開発者は使用されるインデックスを explain
関数で見ることができ、 hint
関数で異なるインデックスを参照できる。
インデックスはいつでも作成・削除できる。
集約
アドホックなクエリに加えて、MongoDBは集約のためのいくつかのツールをサポートしている。これには、SQLのGROUP BYに似たgroup関数や、MapReduce[13]などがある。
ファイルストレージ
MongoDBは、GridFS[14]と呼ばれるプロトコルを実装しており、これを使うことで大きなファイルをデータベースに格納・取得することができる。このファイルストレージ機構はnginx[15]やlighttpd [16]のプラグインからも使用できる。
サーバサイドJavaScript実行
JavaScriptはMongoDBにおけるLingua franca(共通語)であり、クエリや集約関数(MapReduce等)で使用したり、データベースに直接送信して実行できる。
クエリでのJavaScriptの例:
> db.foo.find({$where : function() { return this.x == this.y; }})
データベースに送信して実行させるコードの例:
> db.eval(function(name) { return "Hello, "+name; }, ["Joe"])
これは "Hello, Joe" を返す。
JavaScriptの変数はデータベースに格納でき、他のJavaScriptからグローバル変数として利用できる。関数を含むすべての正当なJavaScript型を格納できるため、JavaScriptを「ストアドプロシージャ」として利用できる。
Cappedコレクション
MongoDBは、Cappedコレクションと呼ばれる固定サイズのコレクションもサポートしている[17]。Cappedコレクションはサイズ(オプションで要素数も使える)を指定して作成される。capped collectionsは、挿入した順にコレクションを管理する: 指定したサイズに到達したら、古いものから順に削除される。
Cappedコレクションでは、tailable cursor[18]と呼ばれる特殊なカーソルを利用できる。このカーソルの名前は tail -f
に由来し、結果を返し終えてもクローズせずに待機し続けて、それ以降に追加されたドキュメントを返却しつづける。
Remove ads
デプロイ
要約
視点
MongoDBはソースファイルからビルドすることもできるが、より一般的にはバイナリパッケージからインストールされる。多くのLinuxパッケージ管理システムはMongoDBのパッケージを含んでいる: CentOSとFedora,[19] DebianとUbuntu,[20][21] Gentoo[22]。 Arch Linuxは以前は公式レポジトリーで提供していたが、MongoDB のライセンス変更により削除された [23]。2022年現在はAUR[24][25]で提供されている。
公式Webサイトから入手することもできる。[26]
MongoDBはメモリマップトファイルを用いるため、32-bitシステムではサイズが2GBに制限される。[27] MongoDBのサーバはリトルエンディアンのシステムのみで動作する。ただし、ほとんどのドライバはビッグエンディアンのシステムでも動作する。
言語サポート
MongoDBは、以下の言語に公式ドライバを提供している:
- C言語[28]
- C++[29]
- C#[30]
- Haskell[31]
- Java[32]
- JavaScript[33]
- Lisp[34]
- Perl[35]
- PHP[36]
- Python[37]
- Ruby[38]
- Scala[39]
- node.js[40]
非公式のドライバも大量に存在する: C#と.NET,[41] ColdFusion,[42] Delphi,[43] Erlang,[44][45] Factor,[46] Fantom,[47] Go,[48] Java VM 言語(Clojure, Groovy,[49] Scala など),[50] Lua,[51] HTTP REST,[52] Ruby,[53] Racket,[54] Smalltalk[55], Rust[56]
レプリケーション
MongoDBは、レプリカセット (Replica Sets) と呼ぶ仕組みによって高い可用性を提供する。1つのレプリカセットはデータの2つ以上のコピーからなる。レプリカセットの各メンバーは、常時、プライマリレプリカもしくはセカンダリレプリカとしての役割を果す。プライマリレプリカはすべての書き込みおよび読み込みを実行する。セカンダリレプリカは、組み込みのレプリケーションを用いて、プライマリにあるデータのコピーを保持する。プライマリレプリカが機能しなくなった時は、レプリカセットが自動的に投票プロセスを開始して、どのセカンダリがプライマリになるべきかを決定する。
シャーディング(Sharding)
MongoDBは、シャーディング(Sharding)[57][58]というシステムによって水平スケーリングが可能である。これはBigTableやPNUTSのスケーリングモデルに非常に良く似ている。開発者はshardキーを選択し、このキーがデータをどのように分散させるかを決める。データ中のキーを元にデータを分散させるshardが決められる。(一つのshardは1つ以上のスレーブを持つマスタである)
アプリケーションはいくつかの操作を行う際に、shardingされたクラスタと対話していることを認識している必要がある。例えば "findAndModify" クエリは、shardされたコレクションからクエリをするときにshardキーを含む必要がある。[59] アプリケーションは、mongos
と呼ばれる特別なルーティングプロセスと対話する。このプロセスは、shardクラスタを単一のMongoDBサーバに見えるようにする。mongos
プロセスはどのデータがどのshardにあるかを知っており、クライアントのリクエストを適切にルーティングする。すべてのリクエストはこのプロセスを通して流れる: リクエストやレスポンスを転送するだけでなく、必要に応じてマージやソートも行う。 mongos
プロセスはいくつでも実行できるが、通常は1つのアプリケーションに対して1つが推奨される。
管理とグラフィカルフロントエンド
公式ツール
最もパワフルで便利な管理ツールはデータベースシェルの mongo
である。このシェルは、データベースの内容を閲覧・挿入・削除・更新する機能を提供すると同時に、レプリケーション情報を取得したり、shadingを設定したり、サーバを停止したり、JavaScriptを実行したりすることができる。mongo
は、SpiderMonkeyの上に構築されているため、MondoDBサーバに接続できると同時に、完全なJavaScriptシェルでもある。
管理情報にはWebベースのadminインタフェースを通してもアクセスできる。これは、現在のサーバ情報を送信するシンプルなHTMLのWebページである。デフォルトでは、このインタフェースにはデータベースのポートの1000番上のポート (http://localhost:28017) からアクセスできる。--norest
オプションによってこの機能を無効化できる。
mongostat
は、直近の統計情報のシンプルな一覧を表示するコマンドラインツールである。挿入された数、更新された数, 削除された数, クエリの数, 実行されたコマンドの数, データベースがロックされた時間のパーセンテージ、メモリの使用状況などを表示する。
mongosniff
は、MongoDBのネットワークトラフィックを覗くツールである。
監視
MongoDBを監視するためのプラグインが存在する:
GUI
データの可視化を助けるいくつかのGUIが開発されている:
- Fang of Mongo[64] - DjangoとjQueryで作られたWebベースのUI
- Futon4Mongo[65] - CouchDBのFuton Webインタフェースのクローン
- Mongo3[66] - Rubyベースのインタフェース
- MongoHub[67] - MongoDBを管理するためのネイティブなmacOSアプリケーション
- Opricot[68] - PHPで書かれたWebベースのMongoDBシェル
- Database Master - WindowsベースのMongoDB管理ツール。RDBMSもサポートする
- BI Studio - WindowsベースのMongoDB管理ツール。RDBMSもサポートする
- RockMongo - PHPベース
- Robo 3T (旧 Robomongo) - mongo shellを内蔵したクロスプラットフォーム(Windows, Mac, Linux)なMongoDB管理ツール
Remove ads
ライセンスとサポート
MongoDB Community Serverは、ソースアベイラブルのServer Side Public License (SSPL) の下で利用できる。[69][70] 元々はオープンソースのGNU Affero General Public License (AGPL) が適用されていたが、クラウド事業者がMongoDBをSaaSとして提供しながらコミュニティに還元しないことが問題となり、2018年10月16日をもってより利用に制限のあるSSPLへと移行した[70]。言語ドライバはオープンソースのApache Licenseライセンスの下で利用できる。[71][72] AGPL ver.3としてライセンスされている最新バージョンは4.0.3(安定)および4.1.4である。
批判
- 過去のバージョンにおいて、設計上の問題によりデータの永続性が保証されないと指摘されたことがある[73]。
有名な利用者
- MTV Networks[74]
- craigslist[75]
- Disney Interactive Media Group[76]
- Wordnik[77]
- diaspora[78]
- Shutterfly[79]
- foursquare[80]
- bit.ly[81]
- The New York Times[82]
- SourceForge[83]
- Business Insider[84]
- Etsy[85]
- CERN LHC[86]
- Thumbtack[87]
- AppScale[88]
- Uber[89]
- Ameba [90]
- MittiLifestyle
- amadeus[91]
- EPIC games (Fortnite)[92][93]
- FANUC (MT-LINK i)[94]
- IIJ[95]
- OPTiM[96]
- 中国東方航空[97]
関連項目
脚注
外部リンク
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads