网站首页 > 博客文章 正文
实现了对一个 CSV 文件的数据读取和基本分析。首先,导入了多个标准库、第三方库以及自定义模块,为后续的数据处理和分析提供支持。然后,使用 pandas 的 read_csv 函数读取 dat/iris.csv 文件,将其存储为 DataFrame 对象 df。接着,打印出 df 的最后几行数据和基本统计描述信息,帮助了解数据的大致情况。之后,对 df 中 xname 列进行计数统计,统计每个不同值出现的次数并打印出来。最后,程序输出 ok! 表示执行完毕。通过这些操作,对数据文件进行了初步的探索性分析。
# 导入 os 模块,用于与操作系统进行交互,如文件和目录操作
import os
# 导入 sys 模块,提供对 Python 解释器相关的操作和参数
import sys
# 导入 re 模块,用于处理正则表达式,可进行字符串的匹配、查找和替换等操作
import re
# 导入 arrow 模块,用于处理日期和时间,提供更便捷的日期时间操作功能
import arrow
# 导入 bs4 模块,BeautifulSoup 库的一部分,用于解析 HTML 和 XML 文档
import bs4
# 导入 pandas 库,别名为 pd,用于数据处理和分析,提供了 DataFrame 等数据结构
import pandas as pd
# 导入 requests 模块,用于发送 HTTP 请求,方便获取网页内容
import requests
# 从 bs4 模块中导入 BeautifulSoup 类,用于解析 HTML 或 XML 文档
from bs4 import BeautifulSoup
# 导入自定义模块 zsys,推测包含系统相关的配置或常量
import zsys
# 导入自定义模块 ztools,别名为 zt,可能包含一些通用工具函数
import ztools as zt
# 导入自定义模块 ztools_str,别名为 zstr,可能包含字符串处理的工具函数
import ztools_str as zstr
# 导入自定义模块 ztools_web,别名为 zweb,可能包含网络相关的工具函数
import ztools_web as zweb
# 导入自定义模块 ztools_data,别名为 zdat,可能包含数据处理的工具函数
import ztools_data as zdat
# 导入自定义模块 zpd_talib,别名为 zta,可能包含与 pandas 和 TA-Lib 相关的工具函数
import zpd_talib as zta
#
# 导入自定义模块 tfb_sys,别名为 tfsys,推测与某个系统的配置或设置相关
import tfb_sys as tfsys
# 导入自定义模块 tfb_tools,别名为 tft,可能包含特定任务的工具函数
import tfb_tools as tft
# 导入自定义模块 tfb_strategy,别名为 tfsty,可能包含策略相关的函数
import tfb_strategy as tfsty
# 导入自定义模块 tfb_backtest,别名为 tfbt,可能包含回测相关的函数
import tfb_backtest as tfbt
#
#-----------------------
#1
# 定义一个字符串变量 fss,存储要读取的 CSV 文件的路径
fss = 'dat/iris.csv'
# 使用 pandas 的 read_csv 函数读取 CSV 文件,index_col=False 表示不将任何列作为索引列
df = pd.read_csv(fss, index_col=False)
# 打印提示信息,表示下面输出的是 #1 部分关于 df 的信息
print('\n#1 df')
# 打印 DataFrame 的最后几行数据,方便查看数据的末尾情况
print(df.tail())
# 打印 DataFrame 的基本统计描述信息,如计数、均值、标准差等
print(df.describe())
#2
# 对 DataFrame 中 'xname' 列进行计数统计,统计每个不同值出现的次数
d10 = df['xname'].value_counts()
# 打印提示信息,表示下面输出的是 #2 部分关于 'xname' 列的计数信息
print('\n#2 xname')
# 打印 'xname' 列每个不同值出现的次数
print(d10)
#-----------------------
# 打印提示信息,表示程序正常执行完毕
print('\nok!')
runfile('D:/zwPython/zwrk/4_零起点Python机器学习快速入门/zai101_iris01.py', wdir='D:/zwPython/zwrk/4_零起点Python机器学习快速入门')
#1 df
x1 x2 x3 x4 xname
145 6.7 3.0 5.2 2.3 virginica
146 6.3 2.5 5.0 1.9 virginica
147 6.5 3.0 5.2 2.0 virginica
148 6.2 3.4 5.4 2.3 virginica
149 5.9 3.0 5.1 1.8 virginica
x1 x2 x3 x4
count 150.000000 150.000000 150.000000 150.000000
mean 5.843333 3.054000 3.758667 1.198667
std 0.828066 0.433594 1.764420 0.763161
min 4.300000 2.000000 1.000000 0.100000
25% 5.100000 2.800000 1.600000 0.300000
50% 5.800000 3.000000 4.350000 1.300000
75% 6.400000 3.300000 5.100000 1.800000
max 7.900000 4.400000 6.900000 2.500000
#2 xname
versicolor 50
virginica 50
setosa 50
Name: xname, dtype: int64
ok!
d:\zwpython\py37\python-3.7.6.amd64\lib\site-packages\sklearn\externals\joblib\__init__.py:15: FutureWarning:
sklearn.externals.joblib is deprecated in 0.21 and will be removed in 0.23. Please import this functionality directly from joblib, which can be installed with: pip install joblib. If this warning is raised when loading pickled models, you may need to re-serialize those models with scikit-learn 0.21+.
- 上一篇: 读写 CSV 数据
- 下一篇: Jmeter和Postman测试工具的区别
猜你喜欢
- 2025-04-26 R数据分析:如何计算问卷的组合信度,实例操练
- 2025-04-26 零起点Python机器学习快速入门-6-1-逻辑回归算法
- 2025-04-26 外婆都能学会的Python教程(十九):Python读写CSV文件
- 2025-04-26 python爬虫25 | 爬取的数据怎么保存?CSV了解一下
- 2025-04-26 R语言描述统计第一弹 | 计算泰坦尼克号不同舱位的存活率
- 2025-04-26 Python 数据可视化:使用 Matplotlib 和 Pandas 实现动态数据分析
- 2025-04-26 使用python把csv汇总成excel
- 2025-04-26 matlab读取表格数据以固定周期通过串口发送
- 2025-04-26 Pandas读取CSV文件
- 2025-04-26 Jmeter和Postman测试工具的区别
你 发表评论:
欢迎- 07-08Google Cloud Platform 加入支持 Docker 的容器引擎
- 07-08日本KDDI与Google Cloud 签署合作备忘录,共探AI未来
- 07-08美国Infoblox与Google Cloud合作推出云原生网络和安全解决方案
- 07-08GoogleCloud为Spanner数据库引入HDD层,将冷存储成本降低80%
- 07-08谷歌推出Cloud Dataproc,缩短集群启动时间
- 07-08Infovista与Google Cloud携手推进射频网络规划革新
- 07-08比利时Odoo与Google Cloud建立增强合作,扩大全球影响力
- 07-08BT 和 Google Cloud 通过 Global Fabric 加速 AI 网络
- 最近发表
-
- Google Cloud Platform 加入支持 Docker 的容器引擎
- 日本KDDI与Google Cloud 签署合作备忘录,共探AI未来
- 美国Infoblox与Google Cloud合作推出云原生网络和安全解决方案
- GoogleCloud为Spanner数据库引入HDD层,将冷存储成本降低80%
- 谷歌推出Cloud Dataproc,缩短集群启动时间
- Infovista与Google Cloud携手推进射频网络规划革新
- 比利时Odoo与Google Cloud建立增强合作,扩大全球影响力
- BT 和 Google Cloud 通过 Global Fabric 加速 AI 网络
- NCSA和Google Cloud合作开发AI驱动的网络防御系统,加强泰国网络空间的安全性
- SAP将在沙特阿拉伯 Google Cloud 上推出BTP服务
- 标签列表
-
- ifneq (61)
- 字符串长度在线 (61)
- googlecloud (64)
- messagesource (56)
- promise.race (63)
- 2019cad序列号和密钥激活码 (62)
- window.performance (66)
- qt删除文件夹 (72)
- mysqlcaching_sha2_password (64)
- ubuntu升级gcc (58)
- nacos启动失败 (64)
- ssh-add (70)
- jwt漏洞 (58)
- macos14下载 (58)
- yarnnode (62)
- abstractqueuedsynchronizer (64)
- source~/.bashrc没有那个文件或目录 (65)
- springboot整合activiti工作流 (70)
- jmeter插件下载 (61)
- 抓包分析 (60)
- idea创建mavenweb项目 (65)
- vue回到顶部 (57)
- qcombobox样式表 (68)
- tomcatundertow (58)
- pastemac (61)
本文暂时没有评论,来添加一个吧(●'◡'●)