专业的编程技术博客社区

网站首页 > 博客文章正文

python入门:爬虫利器Beautiful Soup

baijin 2024-09-27 06:44:31 博客文章 5 ℃ 0 评论

大部分人学习python，都是被爬虫吸引过来的。那么咱们的这个library就要发挥重大作用了。

它是一个优秀的html/xml的解析器，能够帮你快速定位到你需要的元素。形象的比喻来说，有点类似于jQuery对于前端工程师的重要程度。

官方网站(https://www.crummy.com/software/BeautifulSoup/)

英文不好的话也不要紧，汉化版的文档也有：http://beautifulsoup.readthedocs.io/zh_CN/latest/

安装组件：beautifulsoup4、解析器(lxml、html5lib)
使用方法：以访问百度主页的a链接作为例子来说明

代码如下：

import requests

from bs4 import BeautifulSoup

soup = BeautifulSoup(requests.get("http://www.baidu.com").content,"lxml")

print(soup.a)

执行结果如下：

上一篇： Python网络编程之BeautifulSoup库的使用(一)
下一篇：使用 Beautiful Soup 来解析网页并提取感兴趣的信息

猜你喜欢

2024-09-27 蚂蚁SEO的网络蜘蛛如何应用（seo蜘蛛是什么意思）
2024-09-27 10《Python 原生爬虫教程》BeatifulSoup 的使用
2024-09-27 Python代码片段——第三方库自动安装
2024-09-27 「Github一周热点32期」本周最火的5个开源项目
2024-09-27 python爬虫CSS 选择器-BeautifulSoup4
2024-09-27 一篇文章搞定Python爬虫BeautifulSoup解析库
2024-09-27 Python学习——网络爬虫-下载小说
2024-09-27 python爬虫07 | 有了BeautifulSoup，妈妈不担心我的正则表达式
2024-09-27 使用 Python 的 Requests 和 BeautifulSoup 库爬取网站视频
2024-09-27 Python爬虫利器(1)Beautiful Soup

本文暂时没有评论，来添加一个吧(●'◡'●)

取消回复欢迎你发表评论:

最近发表