Learning Python

— layout: doc title: Learning Python subtitle: 学习Python的小型笔记 categories: note tags: python —

1 前言

这个仅仅是一个开始。是的，这个仅仅是一个开始。

为何学习python？因为

life is short - you need Python!

From http://love-python.blogspot.com/

还有就是下面一个项目需要使用python¹和tornado²来开发项目，一个上位机吧。我们小组主要负责数据展示这个部分。硬件部分，也就是实际数据采集那个部分由企业来负责。

等待学习记录中…

2 2013-04-13 土曜日<2013-04-13 Sat>

Tips: How to run Python in Emacs org-mode? Below is the answer Just input below into .emacs:
```
(org-babel-do-load-languages
  'org-babel-load-languages '((python . t) (R . t)))
    
```
From: Running Python and R inside Emacs

python的一个切片操作：将字符串倒序输出

s = 'abcdefgh'
a = s[::-1]
print a  #a : hgfedcba

每次把最后的一个字符砍掉

s = 'abcde'
i = -1
for i in [None]+range(-1, -len(s), -1):
  print s[:i]

浅拷贝：只拷贝了对对象的索引，而不是重新建立了一个对象。P162
basestring() 抽象工厂函数，作用仅仅是为str和unicode函数提过父类。所有不能被实例化，也不能被调用。
在一个对象上使用dir()来查看它所有的方法和属性

おやすみなさい

3 2013-04-14 日曜日<2013-04-14 Sun>

Write a test code to test

#!/usr/bin/env python                                                          
import string                                                                  

alphas = string.letters + '_'                                                  
nums = string.digits                                                           
                                                  
print 'Welcome to the Idetifier Checket v1.0'                                  
print 'Testees must be at least 2 chars long'                                  

# 我知道为何这里不行了，在org-mode中无法从标准输入读取数据
# myInput = raw_input("Identifier to test?")                                   
myInput = "abcdefgh"
                                                 
if len(myInput) > 1:               
    if myInput[0] not in alphas:    
        print '''invalid: first symbol must be                                 
        alphabetic'''                                                          
    else:                                         
        for otherChar in myInput[1:]:                                          
            if otherChar not in alphas + nums:   
                print '''invalid: remaining      
                symbols must be alphanumeric'''  
                break                            
            else:                                
                print "Okay as an identifier"
else:
    print "Here is 404"

Operational:

# 接收一个可迭代的对象，返回一个有序列表
sorted(iter, func=None, key=None, reverse=False)

# 返回一个列表,
# 其第一个元素是 it0,it1,...
# 这些元素的第一个元素组成的一个元组,第二个...,类推.
zip([it0, it1,...,itN])

s, t = 'foa', 'obr'
print zip(s, t)

字符串格式化符号： P175
格式化操作符辅助指令 : P176
Template and substitute
string
From: 7.1.6. Deprecated string functions

三引号

hi = '''hi there'''
hi # 'hi\nhere' 
print hi

Codecs
COder/DECoder

UTF-16: 单独的一个16位字，两个字节。 BOM(Byte Order Mark)
把Unicode应用到实际应用中：
- 程序中出现字符串时一定要加个前缀*u*.
- 不要用str()函数,用unicode()代替.
- 不要用过时的 string 模块 – 如果传给它的是非 ASCII 字符,它会把一切搞砸。
- 不到必须时不要在你的程序里面编解码*Unicod*字符. 只在你要写入文件或数据库或者网络时,才调用 encode()函数;相应地, 只在你需要把数据读回来的时候才调用decode()函数.
pickle
从现实中得来的教训
- 失误 #1: 你必须在一个极有限的时间内写出一个大型的应用, 而且需要其他语言的支持, 但是产品经理并没有明确定义这一点。你并没有考虑 Unicode 的兼容, 直到项目快要结束… , 这时候再添加 Unicode 的支持几乎不太可能,不是吗?
  结果 #1: 没能预测到最终用户对其他语言界面的需求, 在集成他们用的面向其他语种的应用时又没有使用 Unicode 支持.更新整个系统既让让人觉得枯燥和更是浪费时间。
- 失误 #2:在源码中到处使用 string 模块或者 str()和 chr()函数.
  结果 #2:通过全局的查找替换把 str()和 chr()替换成 unicode()和 unichr(), 但是这样一来很可能就不能再用 pickle 模块, 要用只能把所有要 pickle 处理的数据存成二进制形式,这样一来就必须修改数据库的结构,而修改数据库结构就意味着全部推倒重来.
- 失误 #3: 不能确定所有的辅助系统都完全地支持 Unicode.
  结果 #3: 不得不去为那些系统打补丁,而其中有些系统可能你根本就没有源码.修复对 Unicode 支持的 bug 可能会降低代码的可靠性,而且非常有可能引入新的 bug.
- 总结: 使应用程序完全支持 Unicode,兼容其他的语言本身就是一个工程. 它需要详细的考虑、计划.所有涉及到的软件、系统都需要检查,包括 Python 的标准库和其他将要用到的第三方扩展模块.你甚至有可能需要组建一个经验丰富的团队来专门负责国际化 (I18N)问题.
列表：切片: ([] and [:])
还有一点要注意,如果你想以子列表的形式得到一个列表中的一个切片,那需要确保在赋值时等号的左边也是一个列表而不是一个列表的元素.
列表：连接接操作符( + )
- 运算符两边必须是列表
- 比 extend() 低效
在使用可变对象的方法如 sort(),extend()和 reverse()的时候要注意, 这些操作会在列表中原地执行操作,也就是说现有的列表内容会被改变, 但是没有返回值!是的,与之相反,字符串方法确实有返回值
温习一下,字符串是不可变的 – 不可变对象的方法是不能改变它们的值的, 所以它们必须返回一个新的对象.如果你确实需要返回一个对象, 那么我们建议你看一下 Python2.4 以后加入的 reversed()和 sorted()内建函数. 它们像列表的方法一样工作,不同的是它们可以用做表达式,因为它们返回一个对象.同时原来的那个列表还是那个列表,没有改变,而你得到的是一个新的对象.
sort() -> 归并排序的衍生算法
工厂方法
元组可以使用 + 运算，两边都是元组即可。
元组本身不可以修改，但是她包含的元组可以修改。
由圆括号包裹的一个单一元素首先被作为分组操作,而不是作为元组的分界符。一个变通的方法是在第一个元素后面添一个逗号(,)来表明这是一个元组而不是在做分组操作.
list() and tuple()

浅拷贝和深拷贝

浅拷贝：内容是原来对象元素的引用
可以以下几种方式实施:
  (1)完全切片操作[:],
  (2)利用工厂函数,比如 list(),dict()等,
  (3)使用 copy 模块的 copy 函数.
注意：当进行浅拷贝时,字符串被显式的拷贝,并新创建了一个字符串对象,而列
表元素只是把它的引用复制了一下,并不是它的成员.

深拷贝：
copy.deepcopy()函数
  import copy
  wifey = copy.deepcopy(person)

以下有几点关于拷贝操作的警告:
第一,非容器类型(比如数字,字符串和其他”原子”类型的对象,像代码,类型和 xrange 对象等)没有被拷贝一说, 浅拷贝是用完全切片操作来完成的.

第二,如果元组变量只包含原子类型对象, 对它的深拷贝将不会进行.如果我们把账户信息改成元组类型,那么即便按我们的要求使用深拷贝操作也只能得到一个浅拷贝:
核心模块: copy
我们刚才描述的浅拷贝和深拷贝操作都可以在 copy 模块中找到. 其实 copy 模块中只有两个函数可用:

copy()进行浅拷贝操作,

deepcopy()进行深拷贝操作.

4 2013-04-15 月曜日<2013-04-15 Mon>

字典 dict() fromkeys()
所有不可变的类型都是可哈希的
解释器调用哈希函数,根据字典中键的值来计算存储你的数据的位置。

集合可变集合： set() 不可变集合： frozenset()

s = set('cheeseshop')
print s
# below fun will delete 'p'
s -= set('pypi')
print s

queue.py P227

5 2013-04-16 火曜日<2013-04-16 Tue>

使用映射对象（比如字典）搜索比类似的if-elif-else或者for块.

Attention: else 也可以使用在 while and for 这些循环中。具体操作如下：只要不是被 break 打断的循环，意思就是正常结束的都会去执行跟在下面的 else ，另外的说法就是： break 会跳过 else 代码区.

疑问：msgs.get(user.cmd, default) P290

	 解答：	 
	 dict.get(key, default=None)

From: http://www.tutorialspoint.com/python/dictionary_get.htm

一个hack的做法：

	   smaller = (x < y and [x] or [y])[0]

与序列相关的内建函数

sorted()
reversed()
enumerate()
for i, album in enumerate(albums):
    pirnt i, album
zip()

break 语句：

结束当前循环，然后跳转到下一个语句

itet()创建它的迭代器

iter(obj)
iter(func, sentinel)            # 反复调用func，直到迭代器的下一个值为sentinel

[expr for iter_var in iterable if cond_expr]
我敬爱的矩阵：

list = [(x+1, y+1) for x in range(3) for y in range(5)]
print list

列表解析：[expr for iter\_var in iterable if cond\_expr] PEP 202 From: http://www.python.org/dev/peps/pep-0202/
生成器表达式：(expr for iter\_var in iterable if cond\_expr) PEP 289 From: http://www.python.org/dev/peps/pep-0289/

惰性求值：lazy evaluation

交叉配对的例子：

rows = [1, 2, 3, 17]
def cols():
    yield 56
    yield 2
    yield 1
x_product_pairs = ((i, j) for i in rows for j in cols())
for pair in x_product_pairs:
    print pair

RESULTS:

	  (1, 56)
	  (1, 2)
	  (1, 1)
	  (2, 56)
	  (2, 2)
	  (2, 1)
	  (3, 56)
	  (3, 2)
	  (3, 1)
	  (17, 56)
	  (17, 2)
	  (17, 1)

6 2013-04-18 木曜日<2013-04-18 Thu>

try-except-else-finally P367
with语句

with context\_expr [as var]: with\_suite

先搁置with中上下文管理协议 P369
raise

raise [SomeException [, args, [, traceback]]]

assert expression[, arguments]

AsserionError

标准异常 P375

7 2013-04-19 金曜日<2013-04-19 Fri>

7.0.1 可变长度的参数 P411

11.2.4 使用元组（非关键字参数）和字典（关键字参数） port=8080这叫关键字参数
func(*tuple-grp-nonkw-args, **dict-grp-kw-args)
带元组的函数普通语法：

def function_name([formal_args,] *vargs_tuple):
    "function_documentation_string"
    function_body_suite

实例：

def tupleVarArgs(arg1, arg2='defaultB', *theRest):
    print 'formal arg 1:', arg1 
    print 'formal arg 2:', arg2
    for eachXtrArg in theRest:
        print 'another arg:', eachXtrArg

tupleVarArgs('abc', 123, 'xyz', 456.789)

RESULTS:

formal arg 1: abc
formal arg 2: 123
another arg: xyz
another arg: 456.789

字典函数普通用法：

def function_name([formal_args,][*vargst,] **vargsd):
    function_documentation_string
    function_body_suite

实例：

def dictVarArgs(arg1, arg2='defaultB', **theRest):
    print 'formal arg1:', arg1
    print 'formal arg2:', arg2
    for eachXtrArg in theRest.keys():
        print 'Xtra arg %s: %s' % \
        (eachXtrArg, str(theRest[eachXtrArg]))

dictVarArgs('one', d=10, e='zoo', men=('freud', 'gaudi'))

RESULTS:

formal arg1: one
formal arg2: defaultB
Xtra arg men: ('freud', 'gaudi')
Xtra arg e: zoo
Xtra arg d: 10

lambda表达式:

lambda [arg1[, arg2, ... argN]]: expression

8 2013-04-20 土曜日<2013-04-20 Sat>

8.0.1 内建函数apply(), fliter(), map(), reduce()

玩一下：

print 'the total is:', reduce((lambda x,y: x+y), range(5))

8.0.2 偏函数(Partial Application)和柯里化Currying

functional模块中的partial()函数创建PFA:

from functools import partial
basetwo = partial(int, base=2)
basetwo.__doc__ = 'Convert base 2'
print basetwo('10010')

RESULTS:

from operator import add, mul
from functools import partial

add1 = partial(add, 1)
mul100 = partial(mul, 100)

print add1(10)
print mul100(1)

RESULTS:

11
100

Reference:

9 2013-04-21 日曜日<2013-04-21 Sun>

9.0.1 作用域和lambda

x = 10
def foo():
    y = 5
    bar = lambda : x + y
    print bar()
foo()

RESULTS:

9.0.2 生成器

协同程序的概念：可以运行的独立函数调用，可以暂停或者挂起，并从程序离开的地方继续或者重新开始。

资料参考:

PEP 255: http://www.python.org/dev/peps/pep-0255/
Python yield 使用浅析: http://www.ibm.com/developerworks/cn/opensource/os-cn-python-yield/

第9章 Lua协同程序http://blog.csdn.net/andylin02/article/details/2185367

def simpleGen():
    yield 1
    yield '2 --> punch!'
myG = simpleGen()
myG.next()

另外一个例子，求解fib：

def fib():
    a, b = 0, 1
    while 1:
        yield b
        a, b = b, a + b

# Test
f = fib()
for i in xrange(5):
    print f.next()

RESULTS:

如果函数有return的话，会立即终止迭代。貌似yield的出现简化程序，但是可以达到节省内存的作用，如同下面的一句话。

8.13生成器

使用生成器的地方：迭代穿越一个巨大的数据集合。到时就知道怎么用了。呵呵。

9.0.3 模块：模块是组织python代码的方法，包是组织模块的。

9.0.4 名称空间与变量作用域比较 12.3.1

名称空间是纯粹意义上的名字和对象间的映射关系，作用域还指出从用户代码的哪些物理位置可以访问到这些名字。
from module import * 的使用要限制
about =__future__: PEP 236
绝对导入：
相对导入：
如果你不想导入某个模块，你可以属性名称前加 _ 例如：
```
import foo._bar
    
```

一个UTF-8编码文件可以这样指示：

#!/usr/bin/env python
#-*- coding: UTF-8 -*-

循环导入：
解决方法：
1. 将import语句移动到cli4vof
2. 将import语句移动到最后

13.4.2方法下面这段代码究竟是什么意思呢？ P486

class MyClass(object):
    def myNoActionMethod(self):
        pass

mc = MyClass()
mc.myNoActionMethod();

9.0.5 面向对象

__init__() 应当返回None

特殊的实例属性

	   I.__class__   实例化I的类
	   
	   I.__dict__    I的属性

实现 __setattr__() 本身就是一个冒险的经历，满是圈套和陷阱，例如：无穷递归和破坏实例对象。

classmethod

class TestClassMethod:
    @classmethod
    def foo(cls):
        print 'calling class method foo()'
        print 'foo() is part of class: ', cls.__name__

TestClassMethod.foo()

10 2013-04-22 月曜日<2013-04-22 Mon>

疑问：

P545中， __XXX(parent) and __XXX(child)

难道是Python2.2之前，从Python标准类型子类化或派生类都是不允许的。

于是出现了包装？？？？？？？？？？？？？？

_bulitin_ and _builtins_

11 2013-04-23 火曜日<2013-04-23 Tue>

exec eval() and compile()

# -*-coding: utf-8 -*-
# 'eval' 可求值的表达式[和eval()一起使用]
# 'single' 单一可执行语句[和exec 一起使用]
# 'exec' 可执行语句组[和exec 一起使用]
eval_code = compile('100+300', '', 'eval')
print eval(eval_code)

single_code = compile('print "icecream!"', '', 'single')
print single_code
exec single_code

RESULTS:

400
<code object <module> at 0000000002553F30, file "", line 1>
icecream!

exec 还可以接受有效的python文件对象。意思就是你将代码写在一个icecream.py的

文件中，然后在解释器中写入:

f = open('icecream.py')
exec f

Attention: 再次执行exec时，文件已经到达EOF。如果想再次执行，需要如下操作：

f.seek(0)
exec f

input() = eval() + raw\_input() = eval(raw\_input())

	   aList = input('Enter a list:') #Enter a list: [123, 'abc']
	   aList                          # [123, 'abc']

11.1 11.3.6 *函数（与方法）装饰器

装饰器在函数调用之上的装饰，装饰器可以如图函数调用一样“堆叠”起来。装饰器实际就是函数，他们接受函数对象。本质上：java’s AOP(Aspect Oriented Progrmming)

函数组合数学定义：

(g · f)(x) = g(f(x))
@g
@f
def foo():
    ......
与foo=g(f(foo))相同

一个小列子：

@deco1(deco_arg)
@deco2
def func(): pass

This is equivalent to:这等价于：
func = deco1(deco_arg)(deco2(func))

一个较大的例子：

#!/usr/bin/env python
#-*- coding: utf-8 -*-

from time import ctime, sleep

def tsfunc(func):
    def wrappedFunc():
        print '[%s] %s() called' % (ctime(), func.__name__)
        return func;
    return wrappedFunc;

@tsfunc
def foo():
    pass

foo()
sleep(2)

for i in range(2):
    sleep(1)
    foo()

RESULTS:

[Tue Apr 23 14:37:08 2013] foo() called
[Tue Apr 23 14:37:11 2013] foo() called
[Tue Apr 23 14:37:12 2013] foo() called

Reference: From: http://docs.python.org/2/library/functools.html

11.2 Random - Generate pseudo-random numbers

import random

print 'random:', random.random()
print 'uniform:', random.uniform(1, 10)
print 'randint:', random.randint(1, 10)
print 'randrange:', random.randrange(0, 101, 2)
print 'choice:', random.choice('abcd')

items = [1,2,3,4,5,6]
random.shuffle(items)
print 'items:', items

print 'sample:', random.sample([1,2,3,4,5], 3)   # choose 3 elements

RESULTS:

random: 0.624959723641
uniform: 4.2231135682
randint: 7
randrange: 56
choice: b
items: [2, 4, 6, 1, 5, 3]
sample: [5, 2, 3]

From: http://docs.python.org/2/library/random.html#random.gammavariate

11.3 `builtins` and `builtin`

P454

__builtins__ 包含 __builtin__ 所有的名字

__builtins__ 模块和 __builtin__ 模块不能混淆。虽然它们的名字相似——尤其对于新手来说。 __builtins__ 模块包含内建名称空间中内建名字的集合。其中大多数(如果不是全部的话)来自 __builtin__ 模块, 该模块包含内建函数, 异常以及其他属性。在标准 Python 执行环境下, __builtins__ 包含 __builtin__ 的所有名字。 Python 曾经有一个限制执行模式, 允许你修改 __builtins__ , 只保留来自 __builtin__ 的一部分, 创建一个沙盒（sandbox）环境。但是, 因为它有一定的安全缺陷, 而且修复它很困难, Python 已经不再支持限制执行模式。(如版本2.3 )

12 2013-04-24 水曜日<2013-04-24 Wed>

1.正则表达式：

#-*-coding: utf-8 -*-

import re
data = 'Thu Feb 15 17:46:04 2007::creamidea@icecream.com::1171590364-8-8'

patt = '^(Mon|Tue|Wed|Thu|Fri|Sat|Sun)'
m = re.match(patt, data)
print 'm.group():', m.group()
print 'm.group(1):', m.group(1)
print 'm.groups():', m.groups()

print '-'*20
patt = '^((\w){3})'
m = re.match(patt, data)
print 'm.group():', m.group()
print 'm.group(1):', m.group(1)
print 'm.groups():', m.groups()

print '-'*20
patt = '^(\w){3}'
m = re.match(patt, data)
print 'm.group():', m.group()
print 'm.group(1):', m.group(1)
print 'm.groups():', m.groups()

print '-'*20
patt = '\d+-\d+-\d+'
m = re.search(patt, data)
print 'm.group():', m.group()

print '-'*20
patt = '.+?(\d+-\d+-\d+)'       # ？ 取消系统的贪婪匹配
m = re.match(patt, data)        # 使用匹配函数
print 'm.group():', m.group()
print 'm.group(1):', m.group(1)

13 2013-05-13 月曜日<2013-05-13 Mon>

解决 error: Unable to find vcvarsall.bat 问题：

If you have Visual Studio 2010 installed, execute

SET VS90COMNTOOLS=%VS100COMNTOOLS%

or with Visual Studio 2012 installed

SET VS90COMNTOOLS=%VS110COMNTOOLS%

Reference:

14 Footnotes

¹ http://www.python.org/

² http://www.tornadoweb.org/en/stable/

³ http://www.python.org/dev/peps/pep-0008/

⁴ Imports: Multi-Line and Absolute/Relative: http://www.python.org/dev/peps/pep-0328/

⁵ http://docs.python.org/2/tutorial/modules.html#packages

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Learning Python

1 前言

2 2013-04-13 土曜日<2013-04-13 Sat>

3 2013-04-14 日曜日<2013-04-14 Sun>

4 2013-04-15 月曜日<2013-04-15 Mon>

5 2013-04-16 火曜日<2013-04-16 Tue>

6 2013-04-18 木曜日<2013-04-18 Thu>

7 2013-04-19 金曜日<2013-04-19 Fri>

7.0.1 可变长度的参数 P411

8 2013-04-20 土曜日<2013-04-20 Sat>

8.0.1 内建函数apply(), fliter(), map(), reduce()

8.0.2 偏函数(Partial Application)和柯里化Currying

9 2013-04-21 日曜日<2013-04-21 Sun>

9.0.1 作用域和lambda

9.0.2 生成器

9.0.3 模块：模块是组织python代码的方法，包是组织模块的。

9.0.4 名称空间与变量作用域比较 12.3.1

9.0.5 面向对象

10 2013-04-22 月曜日<2013-04-22 Mon>

11 2013-04-23 火曜日<2013-04-23 Tue>

11.1 11.3.6 *函数（与方法）装饰器

11.2 Random - Generate pseudo-random numbers

11.3 `builtins` and `builtin`

12 2013-04-24 水曜日<2013-04-24 Wed>

13 2013-05-13 月曜日<2013-05-13 Mon>

14 Footnotes

FilesExpand file tree

2013-04-08-Learning-Python.org

Latest commit

History

2013-04-08-Learning-Python.org

File metadata and controls

Learning Python

1 前言

2 2013-04-13 土曜日<2013-04-13 Sat>

3 2013-04-14 日曜日<2013-04-14 Sun>

4 2013-04-15 月曜日<2013-04-15 Mon>

5 2013-04-16 火曜日<2013-04-16 Tue>

6 2013-04-18 木曜日<2013-04-18 Thu>

7 2013-04-19 金曜日<2013-04-19 Fri>

7.0.1 可变长度的参数 P411

8 2013-04-20 土曜日<2013-04-20 Sat>

8.0.1 内建函数apply(), fliter(), map(), reduce()

8.0.2 偏函数(Partial Application)和柯里化Currying

9 2013-04-21 日曜日<2013-04-21 Sun>

9.0.1 作用域和lambda

9.0.2 生成器

9.0.3 模块：模块是组织python代码的方法，包是组织模块的。

9.0.4 名称空间与变量作用域比较 12.3.1

9.0.5 面向对象

10 2013-04-22 月曜日<2013-04-22 Mon>

11 2013-04-23 火曜日<2013-04-23 Tue>

11.1 11.3.6 *函数（与方法）装饰器

11.2 Random - Generate pseudo-random numbers

11.3 __builtins__ and __builtin__

12 2013-04-24 水曜日<2013-04-24 Wed>

13 2013-05-13 月曜日<2013-05-13 Mon>

14 Footnotes

11.3 `builtins` and `builtin`