关于Mongodb4.0上目前遇到的所有坑,写给自己也写给各位看看

最后更新时间2018/10/16  13:47

'文章为原创转载请注明来源,谢谢'
---------------------------------------------
"目前对Mongodb了解的比较少还在持续更新中"

由于自己最近在学习Scrapy框架的东西,考虑到要用什么数据库进行储存,然后在网上翻了大量的文章去选择合适的数据库,翻来翻去都说Mongodb比较好,然后这次就尝试一下Mongodb。

这篇文章将分为两个部分,1.Mongodb的优点,2.我在学习过程中遇到的坑

1.我们先来说一说Mongodb为什么好?好在哪里

假如说我们对同一个网站进行大规模的爬取,或者是说对这个网站进行经常(24h*365day)性的爬取

通过Navicat来设计MySQL表

设计好了就像一个大型的Excel

因为我们爬取网页的数据之前要通过MySQL来设计自己的数据库结构值的类型
网页上的数据字段会经常更新,或者是缺失,这对结构化的MySQL库数据库来说是有点不利的,因为你要经常去调整它(增加或删除它的字段)

下面是我摘抄一句别人说的话

我的数据分析项目要处理的数据集,但它的记录有一个很大的问题:许多字段缺失,很多字段要么格式不一致或者过时了。换句话说,我的数据集非常脏。

接下来我们就要使用到Mongodb的数据库

它写进数据库的语法就像json一样,不存在着你预先去设计数据库的字段或者是它的和数据的类型

  • 不用去预先设置数据库的字段和类型
  • 比如说在爬取数据的时候碰到一个不知道的数据类型或者是说一个新的字段的时候,它会自动拓展到数据库类型里
附上图

举个例子,我们现在有三列的数据,当我们想拓展到第四列的数据的时候,就不需要去数据库表里面重新去写预先设计字段

手上有3列的数据,By.Mongodb Compass

手上有4列的数据,By.Mongodb Compass
可视化工具来自官方的Mongodb Compass

我们可以看到图2的几种变化就是
第一个就是我在price字段里面设置了一个data形式的数据
(
也就是说添加的数据是可以随意变化的,没有MySQL限制的那么死,
如果说我们写入MySQL的数据与当初设定的数据类型不符,
到时候自己得爬虫就会出现莫名其妙的报错,都不知道从哪儿去找
)

第二个就是我增加了一个新的一列"你给我哩GiaoGiao"
如果某一列里面没有任何数据,那么这一列也就会自动消失,假设说我删了图2里面的最后一行,那么他最后一列也就会消失,恢复到图1的状态

下图我们可以看到不按顺序和不按类型的数据插入数据成功了
另外说一点,箭头标注的它生成的id是全局唯一的
全局唯一ID

2.接下来说我在Mongodb上遇到的坑

由于我用的是最新的4.0版本,我最开始以为我遇到的各种问题都是旧版本里面的文章找不到的
比如

我最开始使用Navicat这个软件,去连上Mongodb,一直都是显示连接成功,但就是死活不显示数据表
然后去谷歌和百度上去搜这些文章,有的人说数据库的引擎不对改一下,试过了,什么安装环境不对,我也试过了,什么配置环境不对,我也试过,反正七七八八的问题我都试过了之后?。?!

我就怀疑是不是Navicat的这个软件有问题,随后我转战到了Studio3T

  • 对比三款Mongodb的可视化工具

当我通过Studio3T的时候,去连接数据库,它就弹出了,我数据库里面所有的表。
然后Navicat呢,也就正常显示了(但是还是显示不全)


中间的一款是Mongodb官方可视化工具

最后总结一下,

我最开始学习的时候,以为它要像MySQL一样预先去设计数据库表的结构,然而我并没有找到在哪里去设计数据库表的结构,这是一个很颠覆常识性的东西
并不要对它的数据表进行先任何定义,也就是说可以随意添加,可以随意拓展,是一个高度可拓展的一款数据库,写入数据就像json的语法一样
所以说开始把数据表创建好,直接写入数据就可以了

{
    "title": "苹果",
    "price": "8",
    "data": "甜"
}

这就是我目前的研究结果。
下一步我将去学习如何设置Mongodb数据库的密码和端口号,然后并用Python写入数据

Mongodb4.0启动文档Ubuntu

'Ubuntu每次开机都要,启动Mongodb服务'

sudo service mongod restart
最后编辑于
?著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,100评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,308评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,718评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,275评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,376评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,454评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,464评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,248评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,686评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,974评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,150评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,817评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,484评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,140评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,374评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,012评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,041评论 2 351

推荐阅读更多精彩内容