Python 数据应用基础记录

释放双眼,带上耳机,听听看~!

python 学习
IPython Shell
文件.py

list 操作
list 分正向索引和反向索引
正向 是0开头指向第一个数值
反向是-1开头指向最后一个数值
list[X:Y] X 为包括,Y不是包括
[0:3] 从0值到2这个值
不指定X 则从第一个值开始取到Y-1
不指定Y 则从第X值到最后一个值
del(list[X])删除LIST值
创建新的List
y= list(x) 或者 y=x[:]
如果y=x 就类似其他语言中的指向同一个内存地址

函数
type()查看变量值
max()查看list 中的最大值
round() 数值截取四舍五入
round(number[,ndigits]) 后值默认为0,可以不输入
python 还有一种方式设置函数中可选的参数
len() 长度

方法
str 方法 capitalize() 首字母大写
replace(X,Y) 替换
int 方法 bit_length()
conjugate()
list 方法 index(X) 找X对应的索引
count(X) X出现的次数
append(x) 添加x的数值


Numpy 数组 Matplotlib 数据可视化
Scikit-learn 机器学习

import numpy as np 重命名np
np.array([1,2,3])
from numpy import array
array([1,2,3])
一般我个人建议 直接import 整个包

NUMPY 介绍
numpy 中的 array 可以对整个数组计算
a = np.array([1,2,3])
b = np.array([1,2,3])
a+b
array([2,4,6])
numpy 中元素只有一种,如果里面有bool 和str 和INT 都会变str
另外 2个list 相加是以str 方式,numpy 以int为主
in bmi>23
out array([false,false,false,true,false],dtype=bool)
in bmi[bmi>23]
out array([24.747])
二位数组
np.shape 打印 arraylist 几行几列
np[0][2] 这种获取数值,或者np[0,2]
np[:,1:3] 所有行,1~2列
统计分析
np.mean(np_city[:,0]) 0列为身高
5000人平均升高
np.median(np_city[:,0])
5000人中位数
corrcoef std sum sort (四个函数 自学一下)
产生5000人的方法
height = np.round(np.random.normal(1.75,0.20,5000),2)
weight = np.round(np.random.normal(60.32,15,5000),2)
np_city = np.column_stack((height, weight))

Matplotlib数据可视化

pop 单位十亿
plt.plot(X,Y)
plt.show() 展现图
散点图
plt.scatter(X,Y)
直方图
hist方法,中x 第一个参数是list,第二个参数是bins
(直方图需要自己再看资料)
个性化
plt.xlabel
put.ylabel 加标签
plt.title 加标题
plt.yticks 加y轴刻度
yticks([0,1,2],[‘0b’,’1b’,’2b’]) 第一个刻度,第二个可以理解为展现
fill_between(x,y,0,color=‘green’) 替换plot 其实就是面积图

bool逻辑和控制流
else if 可以写成 elif ?

Pandas 包
dataframe 数据结构 brics

第0列为行标

列获取
brics.country 或者brics[country]
添加列的各种方法
brics[“x”]=brics[“Y”]/brics[“Z”] 这样增加列,通过内部YZ 相除得到新的X列
brics[“X”]=[1,2,3,4,5]

行的获取
brics.loc[“BR”] 以列表示

元素的获取
brics.loc[“X”,”Y”]
brics.loc[“X”][“Y”]
brics[“Y”].loc[“X”]

【转自慕课】https://www.imooc.com

Python

python的顺序程序设计

2022-3-3 12:42:09

Python

【慕星人征文】向梦想出发

2022-3-3 12:44:47

搜索