Mongodb介绍1.1MongoDB(名称来自”humongous”)是一个可扩展的,高性能,开源,模式自由,面向文档的数据库.使用C++编写,MongoDB特点:1.1.1面向集合的存储:适合存储对象及JSON形式的数据。1.1.2动态查询:Mongo支持丰富的查询表达式。查询指令使用JSON形
Mongodb介绍
1.1 MongoDB (名称来自”humongous”) 是一个可扩展的,高性能,开源,模式自由,面向文档的数据库.使用C++编写,MongoDB特点:
1.1.1 面向集合的存储:适合存储对象及JSON形式的数据。
1.1.2 动态查询:Mongo支持丰富的查询表达式。查询指令使用JSON形式的标记,可轻易查询文档中内嵌的对象及数组。
1.1.3 完整的索引支持:包括文档内嵌对象及数组。Mongo的查询优化器会分析查询表达式,并生成一个高效的查询计划。
1.1.4 查询监视:Mongo包含一个监视工具用于分析数据库操作的性能。
1.1.5
复制及自动故障转移:Mongo数据库支持服务器之间的数据复制,支持主-从模式及服务器之间的相互复制。复制的主要目标是提供冗余及自动故障转移。
1.1.6 高效的传统存储方式:支持二进制数据及大型对象(如照片或图片)。
1.1.7 自动分片以支持云级别的伸缩性(处于早期alpha阶段):自动分片功能支持水平的数据库集群,可动态添加额外的机器。
1.2 MongoDB的主要目标是在键/值存储方式(提供了高性能和高度伸缩性)以及传统的RDBMS系统(丰富的功能)架起一座桥梁,集两者的优势于一
身。根据官方网站的描述,
Mongo适合用于以下场景:
1.2.1 网站数据:Mongo非常适合实时的插入,更新与查询,并具备网站实时数据存储所需的复制及高度伸缩性。
1.2.2
缓存:由于性能很高,Mongo也适合作为信息基础设施的缓存层。在系统重启之后,由Mongo搭建的持久化缓存层可以避免下层的数据源过载。
1.2.3
大尺寸,低价值的数据:使用传统的关系型数据库存储一些数据时可能会比较昂贵,在此之前,很多时候程序员往往会选择传统的文件进行存储。
1.2.4
高伸缩性的场景:Mongo非常适合由数十或数百台服务器组成的数据库。Mongo的路线图中已经包含对MapReduce引擎的内置支持。
1.2.5 用于对象及JSON数据的存储:Mongo的BSON数据格式非常适合文档化格式的存储及查询。
1.3 自然,MongoDB的使用也会有一些限制,例如它不适合:
1.3.1 高度事务性的系统:例如银行或会计系统。传统的关系型数据库目前还是更适用于需要大量原子性复杂事务的应用程序。
1.3.2 传统的商业智能应用:针对特定问题的BI数据库会对产生高度优化的查询方式。对于此类应用,数据仓库可能是更合适的选择。
1.3.3 需要SQL的问题。
2. Mongodb安装部署
2.1 建立数据目录和日志目录
mkdir -p /data/
mongodb/datamkdir -p /data/
mongodb/logs
2.2 下载压缩包
下载地址:http://www.mongodb.org/downloads
我测试的主要版本是mongodb-linux-x86_64-1.6.2.tgz
wget
http://downloads.mongodb.org/linux/mongodb-linux-x86_64-v1.6-latest.tgz
2.3 解压缩文件后不用安装
tar -zxvf mongodb-linux-x86_64-v1.6-latest.tgz
2.4 查看命令help
[root@izhoufeng mongodb]# ./bin/mongod --help
** NOTE: when using MongoDB 32 bit, you are limited to about 2
gigabytes of data**
see http://blog.mongodb.org/post/137788967/32-bit-limitations
for more Allowed options: General options:
-h [ --help
]
show this usage information
--version
show version information
-f [ --config ] arg
configuration file specifying additional options
--port
arg
specify port number
--bind_ip
arg
local ip address to bind listener
- all local
ips
bound by default
-v [ --verbose
] be more
verbose (include multiple times for
more
verbosity e.g. -vvvvv)
--dbpath arg (=/data/db/) directory for datafiles
指定数据存放目录
--quiet
quieter output 静默模式
--logpath
arg
file to send all output to instead of stdout
指定日志存放目录
--logappend
appnd to logpath instead of over-writing 指定日志是以追加还是以覆盖的方式写入日志文件
--fork
fork server process 以创建子进程的方式运行
--cpu
periodically show cpu and iowait utilization 周期性的显示cpu和io的使用情况
--noauth
run without security 无认证模式运行
--auth
run with security 认证模式运行
--objcheck
inspect client data for validity on receipt 检查客户端输入数据的有效性检查
--quota
enable db quota management 开始数据库配额的管理
--quotaFiles
arg number of
files allower per db, requires --quota
规定每个数据库允许的文件数
--appsrvpath
arg root
directory for the babble app server
--nocursors
diagnostic/debugging option 调试诊断选项
--nohints
ignore query hints 忽略查询命中率
--nohttpinterface
disable http interface 关闭http接口,默认是28017
--noscripting
disable scripting engine 关闭脚本引擎
--noprealloc
disable data file preallocation 关闭数据库文件大小预分配
--smallfiles
use a smaller default file size 使用较小的默认文件大小
--nssize arg (=16) .ns
file size (in MB) for new databases 新数据库ns文件的默认大小
--diaglog
arg
0=off 1=W 2=R 3=both 7=W+some reads
提供的方式,是只读,只写,还是读写都行,还是主要写+部分的读模式
--sysinfo
print some diagnostic system information 打印系统诊断信息
--upgrade
upgrade db if needed 如果需要就更新数据库
--repair
run repair on all dbs 修复所有的数据库
--notablescan
do not allow table scans 不运行表扫描
--syncdelay arg (=60) seconds between disk
syncs (0 for never) 系统同步刷新磁盘的时间,默认是60s Replication options:
--master
master mode 主复制模式
--slave
slave mode 从复制模式
--source arg
when slave: specify master as
当为从时,指定主的地址和端口
--only
arg
when slave: specify a single database to replicate
当为从时,指定需要从主复制的单一库
--pairwith arg address of
server to pair with
--arbiter arg
address of arbiter server 仲裁服务器,在主主中和pair中用到
--autoresync
automatically resync if slave data is stale 自动同步从的数据
--slavedelay arg specify delay (in
seconds) to be used when applying master ops to slave 指从复制检测的间隔
--oplogSize arg size limit (in
MB) for op log 指定操作日志的大小
--opIdMem arg size
limit (in bytes) for in memory storage of op ids指定存储操作日志的内存大小
Sharding options:
--configsvr
declare this is a config db of a cluster 指定shard中的配置服务器
--shardsvr
declare this is a shard db of a cluster 指定shard服务器
2.5 启动服务
/data/mongodb/mongodb-linux-x86_64-v1.6-latest/bin/mongod
--dbpath=/data/mongodb/data/
--logpath=/data/mongodb/logs/mongod.log --logappend &
2.6 使用自带客户端连接
/data/mongodb/mongodb-linux-x86_64-v1.6-latest/bin/mongo
2.7 关闭Mongod
Killall mongod 或者是 kill [pid]
2.7 体验Mongod
>db.help();
2.7.1 新建集合集
> db.createCollection("user");{ "ok" : 1 }> show
collectionssystem.indexesuser
删除集合:>db.user.drop();
2.7.2 插入数据:
> db.user.insert({uid:1,username:"Falcon.C",age:25});>
db.user.insert({uid:2,username:"aabc",age:24});
2.7.3 查询数据:
> db.user.find();
{ "_id" : ObjectId("4bfcaa62315398de2d288bbd"), "uid" : 1,
"username" : "Falcon.C", "age" : 25 }
{ "_id" : ObjectId("4bfcaa6c315398de2d288bbe"), "uid" : 2,
"username" : "aabc", "age" : 24 }
2.7.4 查询数据的方式很丰富,有类似于SQL的条件查询
如:我想查询UID为1的用户的数据:
> db.user.find({uid:1});
{ "_id" : ObjectId("4bfcaa62315398de2d288bbd"), "uid" : 1,
"username" : "Falcon.C", "age" : 25 }
他还支持丰富的查询还有limit ,sort ,findOne,distinct等
2.7.5 更新数据
> db.user.find();
{ "_id" : ObjectId("4bfcaa62315398de2d288bbd"), "uid" : 1,
"username" : "Falcon.C", "age" : 26 }
{ "_id" : ObjectId("4bfcaa6c315398de2d288bbe"), "uid" : 2,
"username" : "aabc", "age" : 24 }
出了以上的2种用法,更新的条件还有$unset、$push 、$pushAll 、$pop 、$pull
、$pullAll
以上就是MongoDB简单的使用介绍,在以后的文档中将会详细的介绍mongoDB非常酷的CURD方法,mongoDB的
Replication及分布式。
dba 命令:
http://www.mongodb.org/display/DOCS/DBA+Operations+from+the+Shell
> help
HELP
show
dbs
show database names
show
collections
show collections in current database
show
users
show users in current database
show
profile
show most recent system.profile entries with time >= 1ms
use
set curent database to
db.help()
help on DB methods
db.foo.help()
help on collection methods
db.foo.find()
list objects in collection foo
db.foo.find( { a :
1 } ) list objects in foo where a == 1
it
result of the last line evaluated; use to further iterate
> db.help();
DB methods:
db.addUser(username, password) 添加数据库授权用户
db.auth(username,
password)
访问认证
db.cloneDatabase(fromhost) 克隆数据库
db.commandHelp(name) returns the help for the command
db.copyDatabase(fromdb, todb, fromhost) 复制数据库
db.createCollection(name, { size : ..., capped : ..., max : ... } )
创建表
db.currentOp()
displays the current operation in the db
db.dropDatabase()
删除当前数据库
db.eval(func,
args) run code server-side
db.getCollection(cname) same as db['cname'] or db.cname
db.getCollectionNames()
获取当前数据库的表名
db.getLastError()
- just returns the err msg string
db.getLastErrorObj() - return full status object
db.getMongo() get
the server connection object
db.getMongo().setSlaveOk() allow this connection to read from the
nonmaster member of a replica pair
db.getName()
db.getPrevError()
db.getProfilingLevel()
db.getReplicationInfo()
db.getSisterDB(name) get the db at the same server as this onew
db.killOp() kills
the current operation in the db
db.printCollectionStats() 打印各表的状态信息
db.printReplicationInfo()
打印主数据库的复制状态信息
db.printSlaveReplicationInfo()
打印从数据库的复制状态信息
db.printShardingStatus()
打印分片状态信息
db.removeUser(username) 删除数据库用户
db.repairDatabase() 修复数据库
db.resetError()
db.runCommand(cmdObj) run a database command. if cmdObj is a
string, turns it into { cmdObj : 1 }
db.setProfilingLevel(level) 0=off 1=slow 2=all
db.shutdownServer()
db.version()
current version of the server
> db.foo.help(); user为表名
DBCollection help
db.foo.count()
统计表的行数
db.foo.dataSize()
统计表数据的大小
db.foo.distinct(
key ) - eg. db.foo.distinct( 'x'
)
按照给定的条件除重
db.foo.drop() drop
the collection 删除表
db.foo.dropIndex(name) 删除指定索引
db.foo.dropIndexes() 删除所有索引
db.foo.ensureIndex(keypattern,options) - options should be an
object with these possible fields: name, unique, dropDups 增加索引
db.foo.find(
[query] , [fields]) - first parameter is an optional query filter.
second parameter is optional set of fields to return. 根据条件查找数据
e.g. db.foo.find( { x : 77 } , { name : 1 , x : 1 } )
db.foo.find(...).count()
db.foo.find(...).limit(n) 根据条件查找数据并返回指定记录数
db.foo.find(...).skip(n)
db.foo.find(...).sort(...) 查找排序
db.foo.findOne([query]) 根据条件查询只查询一条数据
db.foo.getDB() get
DB object associated with collection 返回表所属的库
db.foo.getIndexes() 显示表的所有索引
db.foo.group( {
key : ..., initial: ..., reduce : ...[, cond: ...] } ) 根据条件分组
db.foo.mapReduce(
mapFunction , reduceFunction , )
db.foo.remove(query) 根据条件删除数据
db.foo.renameCollection( newName ) renames the collection 重命名表
db.foo.save(obj)
保存数据
db.foo.stats()
查看表的状态
db.foo.storageSize() - includes free space allocated to this
collection 查询分配到表空间大小
db.foo.totalIndexSize() - size in bytes of all the indexes
查询所有索引的大小
db.foo.totalSize()
- storage allocated for all data and indexes 查询表的总大小
db.foo.update(query, object[, upsert_bool]) 根据条件更新数据
db.foo.validate()
- SLOW 验证表的详细信息
db.foo.getShardVersion() - only for use with sharding