网站首页 > 博客文章 正文
回顾python学习历程,感慨良多,这门语言实在是太强了,当然,分支也很多,有的在做安全,有的在做数据,有的在做爬虫,本文就笔者本身的爬虫入门的小经验分享给读者,期待各位在学习python的路上披荆斩棘,取得更好的发展。
文章主要是利用requests,爬取500彩票网的大乐透数据(注:偶尔娱乐一下),然后利用csv写入表格文件,让大家对爬虫的过程进行简单的了解,废话不多说,直接上代码。
# -*- coding: UTF-8 -*-
import requests #引入,安装直接命令行pip install requests
from bs4 import BeautifulSoup as bs
from collections import Counter
import csv
import os
# 发起请求
lst=[]
#获取url ,如何获取,另文介绍
url = 'http://datachart.500.com/dlt/history/newinc/history.php?start=07001'
#得到数据
data = requests.get(url).text
#解析
data = bs(data,'lxml')
data = data.find('tbody').find_all('tr')
for content in data:
row_tds = content.find_all('td')
lst.append([row_tds[14].string,row_tds[0].string,row_tds[1].string,row_tds[2].string,row_td s[3].string,row_tds[4].string,row_tds[5].string,row_tds[6].string,row_tds[7].string])
#写入表格
with open("Lottery_data.csv",'w') as csvfile:
writer = csv.writer(csvfile)
writer.writerow(['日期','期号','红球1', '红球2', '红球3', '红球4', '红球5', '蓝球1', '蓝球2'])
writer.writerows(lst)
csvfile.close()
复制执行一下吧,原来python这么简单,是不是小有成就感,关注不走失,带你更多的了解python。
猜你喜欢
- 2024-12-18 轻松解析数据!你不可不知的Python宝藏库——parser模块
- 2024-12-18 基于Google Gemini的网页抓取 谷歌怎么抓取网页里的图片
- 2024-12-18 使用Python抓取欧洲足球联赛数据 python 竞彩
- 2024-12-18 网络爬虫——从网站中提取有用的数据
- 2024-12-18 网上售卖几百一月的微信机器,Python几十行代码就能搞定
- 2024-12-18 一个Python编写的小说下载器 用python写小说
- 2024-12-18 LangChainV0.2-进阶教程:构建一个RAG应用
- 2024-12-18 Python应用短文,如何自制一个简易的网络爬虫
- 2024-12-18 机器学习第五发:BS教你如何解析网页,规整数据?
- 2024-12-18 python3的bs4模块的安装、介绍 python中bs4模块
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- ifneq (61)
- 字符串长度在线 (61)
- messagesource (56)
- aspose.pdf破解版 (56)
- promise.race (63)
- 2019cad序列号和密钥激活码 (62)
- window.performance (66)
- qt删除文件夹 (72)
- mysqlcaching_sha2_password (64)
- ubuntu升级gcc (58)
- nacos启动失败 (64)
- ssh-add (70)
- jwt漏洞 (58)
- macos14下载 (58)
- yarnnode (62)
- abstractqueuedsynchronizer (64)
- source~/.bashrc没有那个文件或目录 (65)
- springboot整合activiti工作流 (70)
- jmeter插件下载 (61)
- 抓包分析 (60)
- idea创建mavenweb项目 (65)
- vue回到顶部 (57)
- qcombobox样式表 (68)
- tomcatundertow (58)
- pastemac (61)
本文暂时没有评论,来添加一个吧(●'◡'●)