当前位置首页 > 百科> 正文

Python数据抓取技术与实战

2021-05-13 01:23:00 百科

Python数据抓取技术与实战

基本信息

Python数据抓取技术与实战
作 译 者:潘庆和,赵星驰
出版时间:2016-08
千 字 数:410
版 次:01-01
页 数:256
开 本:16开
I S B N :9787121298844

内容简介

如何在大数据时代获得实时的数据信息,分析挖掘、提取出有价值的信息,并以直观清晰的图形表示出关键的数量关係和概念,是一个值得研究的问题。本书通过数据抓取篇(如何获得数据信息)、数据分析篇(分析挖掘,提取出有价值的信息)、数据可视化篇(以直观清晰的图形表示出关键的数量关係和概念)详细描述数据抓取、分析、展示的整个流程,每一篇自成一体,可以单独学习掌握。

目录信息

第1章 Python基础1 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!
11 Python安装1 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!
12 安装pip 6 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
13 如何查看帮助7 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
14 第一个程式10 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
15 档案操作25 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!
16 循环28 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
17 异常30 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
18 元组30 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
19 列表32 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
110 字典36 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
111 集合38 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
112 随机数39 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
113 enumerate的使用40 !!!!!!!!!!!!!!!!!!!!!!!!!!
114 第二个例子41 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
第2章 字元串解析46 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!
21 常用函式46 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!
22 正则表达式50 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
23 BeautifulSoup 55 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
24 json结构62 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
第3章 单机数据抓取77 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
31 单机顺序抓取77 !!!!!!!!!!!!!!!!!!!!!!!!!!!
32 requests 107 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
33 并发和并行抓取117 !!!!!!!!!!!!!!!!!!!!!!!!!!
第4章 分散式数据抓取137 !!!!!!!!!!!!!!!!!!!!!!!!!!!
41 RPC的使用138 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
42 Celery系统145 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
第5章 全能的Selenium 159 !!!!!!!!!!!!!!!!!!!!!!!!!!
51 Selenium单机159 !!!!!!!!!!!!!!!!!!!!!!!!!!!
52 Selenium分散式抓取178 !!!!!!!!!!!!!!!!!!!!!!!!
53 Linux无图形界面使用Selenium 188 !!!!!!!!!!!!!!!!!!!
第6章 神秘的Tor 191 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
61 抓取时IP封锁的问题191 !!!!!!!!!!!!!!!!!!!!!!!!
62 Tor的安装与使用192 !!!!!!!!!!!!!!!!!!!!!!!!!
63 Tor多执行绪197 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
64 Tor与Selenium结合205 !!!!!!!!!!!!!!!!!!!!!!!!
第7章 抓取常见问题210 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
71 Flash 210 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
72 桌面程式211 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!
73 随身碟213 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
74 二级三级页面214 !!!!!!!!!!!!!!!!!!!!!!!!!!!
75 图片的处理214 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
76 App数据抓取214 !!!!!!!!!!!!!!!!!!!!!!!!!!!
第8章 监控框架221 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
81 框架说明223 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!
82 监控系统实例225 !!!!!!!!!!!!!!!!!!!!!!!!!!!
第9章 拥抱大数据229 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!
91 Hadoop生态圈229 !!!!!!!!!!!!!!!!!!!!!!!!!!!
92 Cloudera环境搭建231
声明:此文信息来源于网络,登载此文只为提供信息参考,并不用于任何商业目的。如有侵权,请及时联系我们:baisebaisebaise@yeah.net