python 数据类型-白红宇

python 数据类型

阅读量：7044 次

发布时间：2019-06-28

本文共 10275 字，大约阅读时间需要 34 分钟。

一、数据

　　1.1 什么是数据

　　　　x=10，10是我们要存储的数据

　　1.2 为何数据要分不同的类型

　　　　数据是用来表示状态的，不同的状态就应该用不同的类型的数据去表示

　　1.3 数据类型

　　　　数字（整形，长整形，浮点型，复数）

　　　　字符串

　　　　字节串：在介绍字符编码时介绍字节bytes类型

　　　　列表

　　　　元组

　　　　字典

　　　　集合

　　　　布尔（任何属性都自带布尔类型） True False bool()

　　1.4 按照以下几个点展开数据类型的学习

# 基本使用    1 用途    2 定义方式        3 常用操作+内置的方法# 类型总结1 存一个值or存多个值    只能存一个值    可以存多个值，值都可以是什么类型2 有序or无序3 可变or不可变    ！！！可变：值变，id不变。可变==不可hash    ！！！不可变：值变，id就变。不可变==可hash

二、数字

　　2.1 整型与浮点型

#整型int　　作用：年纪，等级，身份证号，qq号等整型数字相关　　定义：　　　　age=10 #本质age=int(10)#浮点型float　　作用：薪资，身高，体重，体质参数等浮点数相关    salary=3000.3 #本质salary=float(3000.3)#二进制，十进制，八进制，十六进制

　　2.2 其他数字类型（了解）

#长整形（了解）    在python2中（python3中没有长整形的概念）：　　　　　　    >>> num=2L    >>> type(num)    
     
      #复数（了解）　　    >>> x=1-2j    >>> x.real    1.0    >>> x.imag    -2.0

三、字符串

#作用：名字，性别，国籍，地址等描述信息#定义：在单引号\双引号\三引号内，由一串字符组成name='egon' # name = str('egon')#优先掌握的操作：#1、按索引取值(正向取+反向取) ：只能取#2、切片(顾头不顾尾，步长)#3、长度len#4、成员运算in和not in#5、循环 #6、移除空白strip #7、切分split

# 必须掌握print(str[4])   # 返回4下标print(str[-2])    # -2下标print(str[222])    # 保错，超出下标print(str[2:])  # 切片返回下标2之后的所有print(str[-2:])   # 从-2下标至最后print(str[-2::-1])  # 反向不长为-1  也就是从下标-2 一直倒序取到最后print(len(str))   # 内置函数len 取 字符串的长度print(not str)   # 任何数据类型都自带boolean 类型， 有为真无为假for s in str:    print(s)strip(去除两边的指定字符)  lstrip(去除左边的指定字符)   rstrip(去除右边的指定字符)print(str.strip('h'))  # 去除左右两边的'h'  ，不填写则默认去除两边的' '字符print('   aaa   '.strip())

实例

　　优先掌握

# 优先掌握#1、strip,lstrip,rstrip#2、lower,upper#3、startswith,endswith#4、format的三种玩法#5、split,rsplit#6、join#7、replace

# 优先掌握# lower(转小写方法)  upper(转大写方法)# print('ASS'.lower())   # 返回小写# print('aaa'.upper())   # 返回大写# print(str.startswith('jmz'))   # 判断是否已'jmz'开头# print(str.endswith('ah'))      # 判断是否已'ah'结尾# format 三种玩法# print('{} {} {}'.format('jmz',18,'man'))# print('{1}{0}{1}'.format('jmz','---'))# print('{name} {age} {name}-{sex}'.format(name='jmz',age=18,sex='man'))'''jmz 18 man---jmz---jmz 18 jmz-man'''# split rsplit# print('jmz 18 man'.split())   # split 已什么方式分割字符串 并转成列表  默认从左切割，一直切到最后# print('jmz 18 man'.rsplit( 'm',1))   # split 已什么方式分割字符串 并转成 列表， 从右切割，只切一次# 将 列表类型装字符串类型# print(''.join(['jmz','18', 'man']))  # 可迭代对象必须都是字符串# print('this is a world'.replace('a','a beatiful',1))   # replace(self,old,new,count) 旧的字符转新字符，count 换几个# 没有找到就旧字符就不转换

是咧

了解

# 1、find rfind index rindex count# 2、center,ljust,rjust,zfill# 3、expandtabs# 4、capitalize# 5、swapcase# 6、title# 7、is 数字系列（isdigit 必须掌握）# 8、is其他系列

# 了解find rfind index rindex countprint('shanghai shi yi ge hao di fan'.find('q',2,10))    # 找到 放回下标 ，没找到返回 -1print('shanghai shi yi ge hao di fan'.rfind('f'))    # 从右开始找 找到 放回下标 ，没找到返回 -1print('shanghai shi yi ge hao di fan'.index('q'))    # 有则返回下标 没找到则报错print('shanghai shi yi ge hao di fan'.index('q'))    # 有则返回下标 没找到则报错print('shanghai shi yi ge hao di fan'.rindex('f'))    # 从右开始  有则返回下标 没找到则报错print('shanghai shi yi ge hao di fan'.count('q'))    # 返回字符串的个数# center,ljust,rjust,zfillprint('jmz'.center(20,'-'))  # 共20个字符空间，'jmz' 居中。  如果'jmz'字符个数大于给定的字符个数则只显示jmz# --------jmz---------name='egon\thello\tnight'  # \t 表示一个tab的缩进print(name)print(name.expandtabs(0))   # str.expandtabs(tabsize=8)  tabsize 表示代表几个字符，默认8个字符print('jmz is beatiful'.capitalize())   # 语句开头字母转大写# Jmz is beatifulprint('jmz IS Beatiful'.swapcase())   # 字母大小写反转#JMZ is bEATIFULprint('jmz is beatiful'.title())    # 每一个单词的开头都是大写#Jmz Is Beatiful# is 数字系列# isdigit isnumeric isdecimalnum1 = b'4' # bytes asciinum2 = u'4' # unicode python3 默认unicodenum3 = '四'num4 = 'Ⅳ'# isdigit  只对unicode  和bytes  有用print(num1.isdigit())  # Trueprint(num2.isdigit())  # Trueprint(num3.isdigit())  # Falseprint(num4.isdigit())  # False# isnumeric 能够识别除bytes 意外的类型# # print(num1.isnumeric())  # 报错print(num2.isnumeric())  # Trueprint(num3.isnumeric())  # Trueprint(num4.isnumeric())  # True# isdecimal 最严格 只对unicode 有效# # print(num1.isdecimal())  # 报错print(num2.isdecimal())  # Trueprint(num3.isdecimal())  # Falseprint(num4.isdecimal())  # False# is其他系列name = 'jmz'print(name.isalpha())   # 是否由字母组成print(name.isalnum())   # 是否由字母或数字组成name = 'Jmz Is Cool'print('dobi_123'.isidentifier()) # 判断是否为Python中的标识符  合法的变量名+关键字print(name.islower())  # 是否是小写print(name.isupper()) # 是否都大写print(name.isspace()) # 检测字符串是否由空格组成print('     '.isspace()) # Trueprint(name.istitle())  # 是否 单词开头大写

实例

四、列表

#作用：多个装备，多个爱好，多门课程，多个女朋友等#定义：[]内可以有多个任意类型的值，逗号分隔my_girl_friends=['alex','wupeiqi','yuanhao',4,5] #本质my_girl_friends=list([...]) 或 l=list('abc')#优先掌握的操作：#1、按索引存取值(正向存取+反向存取)：即可存也可以取      #2、切片(顾头不顾尾，步长)#3、长度#4、成员运算in和not in#5、追加#6、删除#7、循环

# 必须掌握names = ['jmz','qqc','llx','dd']print(names[1:]) #['qqc', 'llx', 'dd']print(names[:3]) # ['jmz', 'qqc', 'llx']print(names[:-3:-1]) # ['dd', 'llx']   -1 反向步长print(names[-2::-1]) #['llx', 'qqc', 'jmz']     -1 反向步长print(len(names))for name in names:    print(name)for k,v in enumerate(names):    print('%s   %s'%(k,v))if 'jjj' not in names:    print('True')    #True# 列表的增删改# 增names = []print(id(names))    # id() 函数用于获取对象的内存地址。names.append('kkk')names.insert(2,'aa')names.extend(['a','b','c'])   # 列表扩展print(names)print(id(names))# 内存地址没有改变 ，说明值是可变的，也就是可变类型 == 不可hash# 改names[2] = 'eee'print(names)# 删names.pop()   # 默认删除最后一个print(names)print(names.count('aa'))   # 查看 在里面的个数names.clear()

实例

五、元组

#作用：存多个值，对比列表来说，元组不可变（是可以当做字典的key的），主要是用来读#定义：与列表类型比，只不过[]换成()age=(11,22,33,44,55) #本质 age=tuple((11,22,33,44,55))#优先掌握的操作：#1、按索引取值(正向取+反向取)：只能取   #2、切片(顾头不顾尾，步长)#3、长度#4、成员运算in和not in#5、循环

names = ('jmz',)  # names = tuple(('jmz',))ages = (11,22,33,44)print(names,type(names))# 注意：# 元组内只有一个数据时需要这样写  （一个数据,）   一定要加",", 如果没有则会时str类型# 切片与列表一样# 元组与列表很相似,只是不能像列表那样对数据进行增删改的操作.

实例

六、字典

#作用：存多个值,key-value存取，取值速度快#定义：key必须是不可变类型，value可以是任意类型info = {
   'name':'jmz','age':25,'sex':'man'}# 与一下定义一样# info = dict({'name':'jmz','age':25,'sex':'man'})# info = dict(name='jmz',age=25,sex='man')# info = dict([['name','jmz'],('age',25),['sex','man']])#优先掌握的操作：#1、按key存取值：可存可取#2、长度len#3、成员运算in和not in# #4、增删改   setdefault update get pop popitem #5、键keys()，值values()，键值对items()#6、循环

#!/usr/bin/env python# -*- coding:utf-8 -*-# Author Jmzinfo = {
    'name':'jmz','age':25,'sex':'man'}# info = dict({'name':'jmz','age':25,'sex':'man'})# info = dict(name='jmz',age=25,sex='man')# info = dict([['name','jmz'],('age',25),['sex','man']])# print(info,type(info))for k in info:    # 循环key    print(k,info[k])'''name jmzage 25sex man'''for k in info.keys():    print(k)'''nameagesex'''for v in info.values():    print(v)'''jmz25man'''for v in info.items():    print(v)'''('name', 'jmz')('age', 25)('sex', 'man')'''for k,v in info.items():    print(k,v)'''name jmzage 25sex man'''print('和平的分割线'.center(100,'-'))# 判断是否存在某个key,    in  | not inif 'name' in info:    print('存在name 这个key ')print(len(info))print('增删改    和平的分割线'.center(100,'-'))# 增info['school'] = '上海啦啦啦'info.setdefault('obj','上海华为')    # 无责增加 ，有则不改print(info)#{'name': 'jmz', 'age': 25, 'sex': 'man', 'school': '上海啦啦啦', 'obj': '上海华为'}# 改info['school'] = '南京理工'dic = {    'name':'陌语',    'age':18,    'addr':'北京'}info.update(dic)   #    有则改之，无则增加print(info)#{'name': '陌语', 'age': 18, 'sex': 'man', 'school': '南京理工', 'obj': '上海华为', 'addr': '北京'}# 删info.pop('name')  # 知道删info.popitem()    # 随机删print(info)# {'age': 18, 'sex': 'man', 'school': '南京理工', 'obj': '上海华为'}# 查if 'sex' in info:    print('键存在')print(info.get('obj'))   # 有则返回， 无则None

实例

七、集合

#作用：去重，关系运算，#定义：　　info = {'jmz',12,('pinpan','biubiubiu')}   # 元素必须是不可变类型   　　# info = set(['jmz',12,('pinpan','biubiubiu')]) #知识点回顾     可变类型是不可hash类型     不可变类型是可hash类型#定义集合:            集合：可以包含多个元素，用逗号分割，            集合的元素遵循三个原则：             1：每个元素必须是不可变类型(可hash，可作为字典的key)             2: 没有重复的元素             3：无序注意集合的目的是将不同的值存放到一起，不同的集合间用来做关系运算，无需纠结于集合中单个值 #优先掌握的操作：#1、长度len#2、成员运算in和not in#3、|合集#4、&交集#5、-差集#6、^对称差集#7、==#8、父集：>,>= #9、子集：<,<=

names1 = {
    'jmz','joe','jack','ming'}# 集合不可变类型。for name in names1:    print(name)'''# 字典和集合一样都是无序的，所以出来的结果也是无序的mingjackjoejmz'''if 'jmz' in names1:    print('jmz 在names1 中')names2 = {
    'jmz','jack','vavain','king'}print('集合运算'.center(100,'-'))#3、|合集#4、&交集#5、-差集#6、^对称差集#7、==  等于#8、父集：>,>=#9、子集：<,<=print(names1|names2)  # 两者的合集# {'joe', 'ming', 'vavain', 'king', 'jack', 'jmz'}print(names1&names2)  # 连个的交集# {'jack', 'jmz'}print(names1-names2)  # 去除names1 中含有names2 的数据# {'ming', 'joe'}print(names1^names2)  # 合集-交集# {'vavain', 'joe', 'ming', 'king'}print(names1 == names2)print({
    'jmz','qqc'} > {
    'qqc'})   # 前者是后者的父集# Trueprint({
    'jmz','qqc'} < {
    'qqc'})   # 前者不是后者的子集#False

实例

names = "jmz joe kitty nask egon jmz kitty qqc kitty vavian vavian"# 方法一name_l = names.split()name_dic = {}for name in name_l:    if name in name_dic:        name_dic[name] += 1    else:        name_dic[name] = 1print(name_dic)# 方法二name_l = names.split()name_dic = {}for name in set(name_l):    name_dic[name] = name_l.count(name)print(name_dic)

去重

八、运算符

is 与 == 的区别is 比较的是数据的内存地址== 比较的是数据是否相同

x = ['jmz','egon','vivian']y = ['jmz','egon','vivian']if x == y:    print("x 与 y 的数据是相等的")if x is y:    print("x 与 y 的内存地址指向的是同一个地方")print(id(x)) # id函数用于获取数据的内存地址print(id(y))# x，y 的内存地址是不一样的，但是数据确实相同的

特殊:相同的两个变量,内存地址一样?

x = 'jmz'# 原理： 申请一个内存空间 用于保存'jmz' 数据，再申请一个名称空间用来保存变量名和数据的内存地址y = 'jmz'if x is y:    print('x 与 y的内存地址是一样的')# 造一个数据 赋值给 变量，应该每造一个数据就应该是另一个内存地址了，为什么上面的内存地址是一样的？# 原因： python 内部机制的优化，如果重复造相同的小而短的数据，python 会自动指向同一个内存地址

九、总结

两大类型　　1、可变类型:   　　 在内存地址不变的情况下,可修改内部数据,即可变类型,目前有列表,字典　　2、不可变类型:   　　 在内存地址不变的情况下,不可修改内部数据,即不可变类型.目前有:整型,浮点型,字符串,元组,集合,复数有序无序　　1、有序:　　　　字符串: 有序,自带有索引的　　　　元组：有序，需要存索引相关信息，不可变　　　　列表：有序，需要存索引相关信息，可变，需要处理数据的增删改　　2、 无序 (循环打印时,顺序是乱的)　　　　集合：无序，即无序存索引相关信息　　　　字典：无序，需要存key与value映射的相关信息，可变，需要处理数据的增删改

info = bool('1')print(info,type(info))info1 = set(['jmz',12,('11',23,1)])    # set([元素])   每一个元素都必须是不可变类型，即可hash类型print(info1,type(info1))info2 = str(123.1)    # 集合类型内部必须是可hash 类型，即不可变类型print(info2,type(info2))info3 = int("1231")   # 内部必须是可以转化成整型的其他类型print(info3,type(info3))info4 = list([1,23,34,(1,2,3)])print(info4,type(info4))info5 = dict([('name','jmz'),('age',13)])# info5 = dict(name='jmz',age=12)# info5 = dict([['name','jmz'],['age',12]])# info5 = dict({'name':'jmz','age':12})print(info5,type(info5))info6 = tuple((1,2,3))# info6 = tuple([1,2,3])# info6 = tuple({1,2,3})print(info6,type(info6))info7 = float(12)# info7 = float('12')print(info7,type(info7))

数据类型内置函数运用

本文取自:

转载于:https://www.cnblogs.com/xiaobaiskill/p/9415696.html

你可能感兴趣的文章

第九篇：随机森林(Random Forest)