会员
自己动手写网络爬虫(修订版)
罗刚编著更新时间:2021-04-02 22:21:53
最新章节:本章小结开会员,本书免费读 >
本书介绍了网络爬虫开发中的关键问题与Java实现。主要包括从互联网获取信息与提取信息和对Web信息挖掘等内容。本书在介绍基本原理的同时注重辅以具体代码实现来帮助读者加深理解,书中部分代码甚至可以直接使用。本书适用于有Java程序设计基础的开发人员。同时也可以作为计算机相关专业本科生或研究生的参考教程。
品牌:清华大学
上架时间:2016-09-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
自己动手写网络爬虫(修订版)最新章节
查看全部- 本章小结
- 10.2 网页聚类
- 10.1 网页分类
- 第10章 分类与聚类的应用
- 本章小结
- 9.4 分布式文档排重
- 9.3 SimHash排重
- 9.2 利用“语义指纹”排重
- 9.1 何为“重复”的文档
- 第9章 去掉“重复”的文档
罗刚编著
主页
同类热门书
最新上架
- 会员
Vue.js 3.0源码解析(微课视频版)
本书共分为11章,将从源码角度入手,由浅入深分析Vue3框架的核心逻辑。首先通过极简demo引出Vue3框架核心思想,其次结合源码分析Vue3框架核心逻辑的实现原理,最后介绍Vue3框架常用命令、组件等底层实现逻辑。帮助读者深入理解Vue3框架的内部实现原理与运行逻辑,理解Vue3框架语法,揭开藏在表面的内容,让开发者能知其然还能知其所以然。本书面向有Vue开发经验和熟悉框架开发的前端计算机6.5万字 - 会员
HBase从入门到实战
《HBase从入门到实战》系统介绍HBase基本原理与运行机制,融入了作者多年的开发经验与实践技巧。本书共分为11章,主要内容包括:HBase的体系结构和系统特性、HBase的基础数据结构与算法、RegionServer的核心模块、HBase的读写流程、Compaction实现原理和使用策略、负载均衡的实现与应用、HBase的基础指令(包括DDL指令、DML指令、命名空间指令等)、如何使用Java计算机5.2万字 - 会员
Vue.js光速入门及企业项目开发实战
本书采用简洁直观的方式来讲解Vue2的各方面,并融入了关于Git的基础和进阶的知识,让读者在学习前端框架之余,还能学习到主流的团队代码管理工具和版本控制工具Git的知识应用。本书共11章,分为基础篇和进阶篇和项目实战篇。基础篇(第1~3章)详细讲述Vue框架的基础知识点,并以HTML文件的方式切入,浅显易懂,让你的学习体验达到最好。进阶篇(第4~8章)从webpack起步,系统地讲述webpack计算机4.1万字 - 会员
Spring Cloud Alibaba微服务架构设计与开发实战
本书涵盖了SpringCloudAlibaba框架的八大核心技术主题,分别是注册中心、远程调用、负载均衡、配置中心、服务网关、消息通信、分布式事务和服务可用性。并且,通过一个系统性的项目案例,讲解企业级微服务系统开发的工程实践。其间提供大量的设计图例和示例代码,更提供配套的视频教程。对于每个主题,书中采用“技术概念和特性→框架使用方法→项目案例实战→核心原理和源码剖析”的方式讲解,使读者递进式计算机12.9万字 - 会员
Java项目驱动开发教程
《Java项目驱动开发教程》是一本以项目驱动教学模式理念设计的Java入门书。全书内容以软件项目案例驱动,代码实例丰富,项目实训任务饱满,语言通俗易懂,不仅能够使读者全面掌握Java面向对象编程技术,还能够提升读者使用Java语言开发软件项目的能力。《Java项目驱动开发教程》分为3个专题,共14章,3个专题分别以面向过程版的商超购物管理系统、面向对象版的超市购物系统、端对端聊天系统为贯穿项目,内计算机8.9万字 - 会员
Python应用轻松入门
本书以实战项目为主线,系统介绍了Python在自动化办公、图像处理、控制各种传感器、搭建网络等工作中的实际应用案例,能够让初学者快速入门Python系列知识。全书共分为18章,第一篇为Python基础(第1章~第3章),详细介绍了Python的基础知识;第二篇为自动化办公(第4章~第6章),介绍了Word、Excel、PPT、txt、csv、JSON、图像、声频、视频等各种文件的自动化操作;第三篇计算机12.8万字 - 会员
响应式编程实战:构建弹性、可伸缩、事件驱动的分布式系统
本书展示了如何利用事件驱动和响应式原理来构建健壮的分布式系统,减少延迟并提高吞吐量——特别是在微服务和无服务器应用程序中。本书分为四部分:第一部分介绍响应式的背景、环境和内容;第二部分深入讲解响应式,涵盖分布式系统的弊端、响应式系统和响应式编程;第三部分阐述如何使用Quarkus构建响应式应用程序,涵盖响应式引擎、响应式编程库SmallRyeMutiny、HTTP以及响应式数据访问的相关知识;第计算机11.1万字 - 会员
编程改变生活:用Python提升你的能力(基础篇·微课视频版)
本书以Python的实际应用为主线,以理论基础为核心,引导读者渐进式学习Python的编程基础和实际应用。本书共17章,可分为4部分。第一部分Python编程环境搭建和Python的基础知识(第1~6章)、第二部分数学运算(第7~9章)、第三部分绘制图像(第10~12章)、第四部分办公自动化(第13~17章)。本书示例代码丰富,实用性和系统性较强,并配有视频讲解,助力读者透彻理解书中的重点、难点。计算机15.9万字 - 会员
OpenCV计算机视觉项目实战(Python版)
计算机视觉是在图像处理的基础上发展起来的新兴学科。OpenCV是一个开源的计算机视觉库,可以实现图像处理、模式识别、三维重建、物体跟踪等算法。本书基于Python,从图像基本原理说起,初步讲解计算机视觉所需的OpenCV知识。本书可作为信息处理、计算机、机器人、人工智能、遥感图像处理、认知神经科学等相关专业的教学用书,也可供相关领域的研究工作者参考。计算机10.4万字