算术最基本的操作符,是小学数学的+ - * / ,对于整数,还可以用+=,*=的操作符,对自身的值进行改变(对象引用)。以下是小编为你整理的python入门级开源项目案例
对于整数的加减乘除,但需要注意的是,整数相除的结果是小数
PS:在一些其他语言,比如c语言,java,两个整数相除,如果产生小数,直接把小数给忽略掉,而Python刚刚相反,比如1/3,在其他语言的结果是0,在Python则是0.......
如果需要把整数相除的商作为int类型整数结果,需要转化,int(小数值)
PS:直接把小数忽略掉,不会进行四舍五入的运算
列表的相加
[图片0]
2个列表相加之后,元素进行合并
需要注意的是,不能直接用运算符进行减法,乘法,除法运算
str类型相加(连接符)
数值相加的数学运算,字符串相加是连接
比如:'abc'+'def',结果是'abcdef'
需要注意的是,字符串只能用+号连接,不能用乘除减符号
+=,-=,*=,/=
需要注意的是,这种赋值不是改变原本的数据,而且进行运算之后产生一个新的数据,然后a重新指向新数据,原来的数据如果没有被任何标识符引用,那么会进入等待垃圾回收器清理
另外,这类操作符的左边是一个集合的时候,右边也需要是集合
有一个需要注意的是
字符串集合与字符串相加
比如,['abc']与'def'相加,不能用a = a + b,要用a += b
解析:直接相加,相当于用列表与字符串相加,如果用+=,会默认把后面的字符串转成列表
注释是什么?
我们写程序的时候,是否要标明程序的作用。例如函数、对象、方法的作用、源代码的作者等。
也就是说python解释器不解释的部分,用来我们开发时可以一目了然的功能标明,就是注释。
怎么注释呢?
这里分单行注释和多行注释。
什么是单行注释?
也就是说单行注释,标识符为#
什么是多行注释?
多行注释一般用于作者、版本标明。标识符为3个'''或者"""
当然你也可以用单行注释来实现多行注释。
例如:
#!/usr/bin/python
# 这是一个python程序
# 作者 binn louis zeng
# 版本:
# 功能:
#
import sys
......
但是多行的情况是这样的:
#!/usr/bin/python
'''
这是一个python程序
作者 binn louis zeng
版本:
功能:
'''
import sys
......
或者把'''替换成"""
跟着我做一遍你就完全能理解啦。
首先touch
新建一个py文件。
vim打开它。
然后按a插入。
输入以下代码:
#!/usr/bin/python
#print 'test'
print 'test'
先来看看我们的代码
#!/usr/bin/python
这个是声明解释器路径
#print 'test'
这个是注释,不起作用的注释
print 'test'
这是一个打印test这个字符串的操作。
如果#注释生效的话,那么只会打印一个test对不对?
也就是只执行print 'test'这一条语句
我们:wq保存退出,然后python 看看结果?
二进制的实用方法
0b是二进制,比如a = 0b
注意:无论几进制,打印出来的都是十进制
0o表示八进制
注意:前面是数字0,后面是小写字母x
0x表示十六进制
注意:前面的是数字0,后面的是小写字母x,数值用大写字母,A~E
/与//
[图片1]
a/b,带小数的结果
a//b,忽略小数的结果
注意:带不带小数,它的结果都是小数
%取模(余数)
比如,10/3,正常结果的3.
如果需要小学算术那样,10/3,求余数
可以用10 % 3
divmod(x,y)
如果需要同时求商与余数,可以用这个函数,这个函数是返回一个元组的
abs(x)
获取某个数的绝对值,这个计算比较常用
采集图片
首先介绍采集图片的步骤。
采集图片和采集文本内容的配置方法类似。区别在于需要将存储图片的字段的取值类型设置为“原始数据流”,以及需要填写“链接额外标签”。
以“凤凰网()”为例,采集新闻内的图片。
配置频道,创建模板
第一个模板对应新闻的链接列表,第二个模板对应新闻的正文内容,第三个模板对应新闻正文里链接到的图片。
配置新闻列表页模板
模板1用于过滤新闻的链接。
配置新闻正文页模板
模板2用于采集新闻的内容数据,以及链接到图片的地址。
(1)链接抽取
该链接抽取需要关联模板3(图片),并在“链接额外标签”处填写“src”(图片链接的属性)。地址过滤一般不需要再填写过滤串。
(2)数据抽取
数据抽取新闻页的数据内容。关联新闻表单,分别配置各字段的取值。
配置图片页模板
(1)创建图片表单
首先在“表单”选项卡中创建一个用于存储图片的数据表单,设置一个主键字段,一个图片字段。图片字段的变量类型必须是“stream”类,取值类型须为“原始数据流”,扩展主类型为“图片”。这样设置后才能正确的在软件中预览图片,并存入数据库中。
如果不预先在“表单”选项卡中设置好该数据表单,也可以在模板3中右键创建字段,存储图片的字段的取值类型必须选择“原始数据流”。这样设置也可以采集到图片,但无法在软件中提前预览到图片。
(2)关联表单
在模板3中创建数据抽取,关联图片表单,关联后无需进行其他配置操作,即可采集到图片数据了。
