欢迎光临
我们一直在努力

guoming0000的文章

豆瓣Rotten101————史上烂片101部-小明编程

豆瓣Rotten101————史上烂片101部

昨天发布了口碑最差的50部电影后,有些同学向我点名一些烂片,我想大家对于烂片的记忆可能比佳片的记忆更深刻!经过数据分析发现他们评论人数不到5万。很多烂片实在太烂了,有多少人被恶心后还去打个分呢?我们仔细分析了下豆瓣口碑超级差电影的标签,本着...

赞(0)guoming0000guoming0000公众号 阅读(3484)去评论
豆瓣Bottom50---口碑最差的50部电影-小明编程

豆瓣Bottom50---口碑最差的50部电影

口碑最差的50部电影 豆瓣Top250的评论一般都在五万人以上,因此给出的这个排名也是5万人评论以上,分数从低到高,该列表充分反映了绝大多数人的意志。不能像Top250那般,不断有人看过去评论,评论人数一天比一天高。这些口碑差的片子,后面很...

赞(0)guoming0000guoming0000公众号 阅读(5387)去评论
口碑最好的一百部电影-小明编程

口碑最好的一百部电影

今天是10月24日(程序员节)。经过一周的数据采集,我们终于收集到20W+影视数据。对比对比一年前宇宙苏的文章https://zhuanlan.zhihu.com/p/22561617, 他收集到的8.0+分电影数量是2094部,其中评价人...

赞(0)guoming0000guoming0000公众号 阅读(3951)去评论

继续爬豆瓣电影数据

有经过了一周的奋斗,使用了各种反爬虫办法,爬取到了很多豆瓣数据,目前继续爬豆瓣电影是否能播放的信息。爬豆瓣不是一件简单的事情,需要经历过多个步骤才能爬取到比较完整的电影信息。目前爬取到了20W条电影、电视剧信息(肯定是不完整的),其中有16...

赞(0)guoming0000guoming0000Python 阅读(4393)去评论
爬豆瓣电影真不容易,弄了一天还没成功-小明编程

爬豆瓣电影真不容易,弄了一天还没成功

本来想着花半天时间为自己的公众号“绝对影迷”第二版的需求,爬下豆瓣电影数据。在知乎看到不少大神说自己爬豆瓣电影有多快~于是我周六开始坑爹的爬豆瓣电影数据之旅~ 首先,花了一二个小时定义好数据库结构(大写开头大多是自己定义的,非豆瓣数据),写...

赞(0)guoming0000guoming0000Python 阅读(5647)去评论
聊聊进程守护supervior的使用-小明编程

聊聊进程守护supervior的使用

supervisor是一个进程守护程序,之前搞ubuntu开发时我们也搞过类似的东西,但是很简单,不过是自己写的一个脚本,让一个程序死掉后再重新启动下。而这个supervisor可牛逼了,切看我介绍。 如何使用,有一篇文章(http://w...

赞(0)guoming0000guoming0000(系统 , System) 阅读(6232)去评论

写python代码多了,发现反复打自己脸~

最近用python搞了下数据库,巩固了一下年初时在另一家公司学到的数据库知识,确实不巩固下,肯定又忘了怎么玩sqlite和sql语句。本来是把数据存成json放到文件里,后来发现这样搜索信息以及更新会很麻烦。数据库发明出来就是为了解决这个问...

赞(0)guoming0000guoming0000闲言碎语 阅读(3129)去评论

[转载]Python 中如何防止sql注入

最近在搞爬虫顺便学点相关知识,上一次我完全设计数据库还是研究生时,时隔几年用python搞最简单的sqlite数据库出了一堆问题,囧~很多东西还是要自己动手才知道会有多坑,一行一行bug的找~ KBdancer 发表于 2017-02-15...

赞(0)guoming0000guoming0000Python 阅读(4173)去评论

正在弄一个有关电影的公众号

最近结合爬虫,要弄一个有关电影的公众号,毕竟服务器闲置在那里,总要想办法搞点事情,不然等于每天白白亏三四块钱,囧~ 今天调试一个bug,有关Chrome网页按钮不可点击的(找到了按钮,但是webdriver告诉我不能点),调试了很久,最后发...

赞(0)guoming0000guoming0000闲言碎语 阅读(2579)去评论