因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理。最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表示的最大的整数就是255(二进制11111111=十进制255),0-255被用来表示大小写英文字母、数字和一些符号,这个编码表被称为ASCII编码,比如大写字母A的编码是65,小写字母z的编码是122。
如果要表示中文,显然一个字节是不够的,至少需要两个字节,而且还不能和ASCII编码冲突,所以,中国制定了GB2312编码,用来把中文编进去。
类似的,日文和韩文等其他语言也有这个问题。为了统一所有文字的编码,Unicode应运而生。Unicode把所有语言都统一到一套编码里,这样就不会再有乱码问题了。
Unicode通常用两个字节表示一个字符,原有的英文编码从单字节变成双字节,只需要把高字节全部填为0就可以。
Python在后来添加了对Unicode的支持,以Unicode表示的字符串用u'...'表示,比如:
printu'中文'Unicode字符串除了多了一个u之外,与普通字符串没啥区别,转义字符和多行表示法仍然有效:
printu'中文\n日文\n韩文'多行:
u'''第一行第二行'''raw+多行:
ur'''Python的Unicode字符串支持"中文","日文","韩文"等多种语言'''
如果中文字符串在Python环境下遇到UnicodeDecodeError,这是因为.py文件保存的格式有问题。可以在第一行添加注释
#-*-coding:utf-8-*-目的是告诉Python解释器,用UTF-8编码读取源代码。然后用Notepad++另存为...并选择UTF-8格式保存。
Python支持对整数和浮点数直接进行四则混合运算,运算规则和数学上的四则运算规则完全一致。
基本的运算:
1+2+3#==>64*5-6#==>147.5/8+2.1#==>3.0375(1+2)*3#==>9(2.2+3.3)/(1.5*(9-0.3))#==>0.42145593869731807使用括号可以提升优先级,这和数学运算完全一致,注意只能使用小括号,但是括号可以嵌套很多层:
和数学运算不同的地方是,Python的整数运算结果仍然是整数,浮点数运算结果仍然是浮点数:
1+2#==>整数31.0+2.0#==>浮点但是整数和浮点数混合运算的结果就变成浮点数了:
1+2.0#==>浮点数3.0为什么要区分整数运算和浮点数运算呢?这是因为整数运算的结果永远是精确的,而浮点数运算的结果不一定精确,因为计算机内存再大,也无法精确表示出无限循环小数,比如0.1换成二进制表示就是无限循环小数。
那整数的除法运算遇到除不尽的时候,结果难道不是浮点数吗?
11/4#==>2令很多初学者惊讶的是,Python的整数除法,即使除不尽,结果仍然是整数,余数直接被扔掉。不过,Python提供了一个求余的运算%可以计算余数:
11%4#==>3如果我们要计算11/4的精确结果,按照“整数和浮点数混合运算的结果是浮点数”的法则,把两个数中的一个变成浮点数再运算就没问题了:
11.0/4#==>2.75三、Python中布尔类型
#与运算TrueandTrue#==>TrueTrueandFalse#==>FalseFalseandTrue#==>FalseFalseandFalse#==>False#或运算TrueorTrue#==>TrueTrueorFalse#==>TrueFalseorTrue#==>TrueFalseorFalse#==>False#非运算notTrue#==>FalsenotFalse#==>Truea=Trueprintaand'a=T'or'a=F'#计算结果不是布尔类型,而是字符串'a=T',这是为什么呢?#因为Python把0、空字符串''和None看成False,其他数值和非空字符串都看成True,所以:Trueand'a=T'#计算结果是'a=T'#继续计算'a=T'or'a=F'计算结果还是'a=T'要解释上述结果,又涉及到and和or运算的一条重要法则:短路计算。
1.在计算aandb时,如果a是False,则根据与运算法则,整个结果必定为False,因此返回a;如果a是True,则整个计算结果必定取决与b,因此返回b。
2.在计算aorb时,如果a是True,则根据或运算法则,整个计算结果必定为True,因此返回a;如果a是False,则整个计算结果必定取决于b,因此返回b。
所以Python解释器在做布尔运算时,只要能提前确定计算结果,它就不会往后算了,直接返回结果。
Python内置的一种数据类型是列表:list。list是一种有序的集合,可以随时添加和删除其中的元素。
比如,列出班里所有同学的名字,就可以用一个list表示:
>>>['Michael','Bob','Tracy']['Michael','Bob','Tracy']list是数学意义上的有序集合,也就是说,list中的元素是按照顺序排列的。
构造list非常简单,按照上面的代码,直接用[]把list的所有元素都括起来,就是一个list对象。通常,我们会把list赋值给一个变量,这样,就可以通过变量来引用list:
classmates=['Michael','Bob','Tracy']classmates#打印classmates变量的内容>>>['Michael','Bob','Tracy']由于Python是动态语言,所以list中包含的元素并不要求都必须是同一种数据类型,我们完全可以在list中包含各种数据:
L=['Michael',100,True]一个元素也没有的list,就是空list:
empty_list=[]#打印成绩表L=['adam',95.5,'lisa',85,'bart',59]printL
由于list是一个有序集合,所以,我们可以用一个list按分数从高到低表示出班里的3个同学:
L=['Adam','Lisa','Bart']那我们如何从list中获取指定第N名的同学呢?方法是通过索引来获取list中的指定元素。
需要特别注意的是,索引从0开始,也就是说,第一个元素的索引是0,第二个元素的索引是1,以此类推。
因此,要打印第一名同学的名字,用L[0]:
但使用索引时,千万注意不要越界,所以没有L[3]。
L=['Adam','Lisa','Bart']printL[-1]>>>Bart七、Python之list添加新元素L=['Adam','Lisa','Bart']
把新同学Paul添加到现有的list中
第一个办法是用list的append()方法,把新同学追加到list的末尾:
L=['Adam','Lisa','Bart']L.append('Paul')printL>>>['Adam','Lisa','Bart','Paul']append()总是把新的元素添加到list的尾部。
用list的insert()方法,它接受两个参数,第一个参数是索引号,第二个参数是待添加的新元素:
L=['Adam','Lisa','Bart']L.insert(0,'Paul')printL>>>['Paul','Adam','Lisa','Bart']L.insert(0,'Paul')的意思是,'Paul'将被添加到索引为0的位置上(也就是第一个),而原来索引为0的Adam同学,以及后面的所有同学,都自动向后移动一位。
L=['Adam','Lisa','Bart','Paul']L.pop()>>>'Paul'printL>>>['Adam','Lisa','Bart']pop()默认删除最后一个,当让也可以指定
L=['Adam','Lisa','Paul','Bart']L.pop(2)>>>'Paul'printL>>>['Adam','Lisa','Bart']九、Python之List中替换元素L=['Adam','Lisa','Paul','Bart']L[2]='Paul'#或者L[-1]='Paul'printL>>>L=['Adam','Lisa','Paul']十、Python之创建tupletuple是另一种有序的列表,中文翻译为“元组”。tuple和list非常类似,但是,tuple一旦创建完毕,就不能修改了。
同样是表示班里同学的名称,用tuple表示如下:
t=('Adam','Lisa','Bart')
创建tuple和创建list唯一不同之处是用()替代了[]。
现在,这个t就不能改变了,tuple没有append()方法,也没有insert()和pop()方法。所以,新同学没法直接往tuple中添加,老同学想退出tuple也不行。
获取tuple元素的方式和list是一模一样的,我们可以正常使用t[0],t[-1]等索引方式访问元素,但是不能赋值成别的元素
tuple和list一样,可以包含0个、1个和任意多个元素。
包含多个元素的tuple,前面我们已经创建过了。
包含0个元素的tuple,也就是空tuple,直接用()表示:
t=()printt>>>()
t=(1)printt>>>1#???这是为什么,因为()既可以表示tuple,又可以作为括号表示运算时的优先级,结果(1)被Python解释器计算出结果1,导致我们得到的不是tuple,而是整数1。
正是因为用()定义单元素的tuple有歧义,所以Python规定,单元素tuple要多加一个逗号“,”,这样就避免了歧义:
t=(1,)printt>>>(1,)Python在打印单元素tuple时,也自动添加了一个“,”,为了更明确地告诉你这是一个tuple。
多元素tuple加不加这个额外的“,”效果是一样的。
t=('a','b',['A','B'])#t=('a','b',('A','B'))的话就是不可变的注意到t有3个元素:'a','b'和一个list:['A','B']。list作为一个整体是tuple的第3个元素。list对象可以通过t[2]拿到: