图像基本知识
图像是由像素组成的,而像素实际上就是带有坐标位置和颜色信息的点。我们把图片想象成由若干行,若干列的点组成的,
现实中有RGB颜色系统,我们可以把图中任意一点(位置在第m行,第n列)的点A表示为
A[m,n] = [blue,green,red]
图片数据解读
A[m,n] = [blue,green,red]
参数 | 解读 |
---|---|
m | A点在图像中的第m行 |
n | A点在图像中的第n列 |
blue | 表示蓝色,三原色(RGB)的第一个数值 |
green | 表示绿色,三原色(RGB)的第二个数值 |
red | 表示红色,三原色(RGB)的第一个数值 |
一、OpenCV-python基本操作
1.1读入图像文件
import cv2
img_path = 'test.jpg'
image = cv2.imread(filename=img_path)
#winname弹出窗口的名字,mat为传入的图片对象
cv2.imshow(winname='show the image',mat=image)
#窗口默认一直处于弹出窗状态
cv2.waitKey()
#按任意键盘,销毁窗口
cv2.destroyAllWindows()
1.2我们先检验下图片数据类型
在一开始我们说图片是由像素组成的,我们可以先检验下读入的图片数据是什么类型数据,长什么样?
其实读入的是数组,不信你看下面
>>>import cv2
>>>img_path = 'test.jpg'
>>>image = cv2.imread(filename=img_path)
>>>print(type(image)) #
>>><class 'numpy.ndarray'>
image这个数据是三维的
>>>print(image.ndim)
>>>3
image的shape
800行,480列的点组成的图片,RGB三色,图片为彩色
>>>print(image.shape)
>>>(800,480,3)
我们检查下第5行,第6列像素的值
>>>print(image[4,5])
>>>[161 185 221]
>>>print(type(image[4,5]))
>>><class 'numpy.ndarray'>
好像很复杂,但实际上就是ndarray数组,对此有疑惑的可以看看我公众号的numpy基本知识。
1.3获取图片尺寸
首先我们查看测试图片的详情
这个图片选自iphone7壁纸,最大数800肯定是高,宽是480。
那么问题来了,我们如何通过程序运行获得图片的尺寸?
>>>import cv2
>>>img_path = '/test.jpg'
>>>image = cv2.imread(filename=img_path)
>>>print(image.shape)
(800, 480, 3)
程序返回(800, 480, 3),说明image.shape返回的元组中第一个参数是高,第二个是宽。请记??!
1.4图像亮度
blue,green,red分别代表蓝绿红,每个数值代表的原色的亮度大小。
blue,green,red值越大,图像越亮,当[255,255,255]时,图像为纯白色。越小,图像越黑暗,当[0,0,0]时,图像为纯黑。
搞明白这点,我们把原图分别调亮50%,调黑50%如图。即将green,blue,red数值乘以1.5或0.5 。
import cv2
import os
img_path = 'test.jpg'
image = cv2.imread(filename=img_path)
cv2.imshow(winname='raw image',mat=image)
#获取图片像素数组的行数和列数
row_num = image.shape[0]
column_num = image.shape[1]
#对image数据进行复制
bright_image = image.copy()
#对像素blue/green/red值整体变为原来的1.5倍,图片变亮
for row in range(row_num):
for column in range(column_num):
bright_image[row, column, 0] = bright_image[row, column, 0]* 1.5
bright_image[row, column, 1] = bright_image[row, column, 1] * 1.5
bright_image[row, column, 2] = bright_image[row, column, 2] * 1.5
cv2.imshow(winname='show bright image',mat=bright_image)
black_image = image.copy()
#对像素blue/green/red值整体变为原来的0.5倍,图片变黑暗
for row in range(row_num):
for column in range(column_num):
black_image[row, column, 0] = black_image[row, column, 0]* 0.5
black_image[row, column, 1] = black_image[row, column, 1] * 0.5
black_image[row, column, 2] = black_image[row, column, 2] * 0.5
cv2.imshow(winname='show black image',mat=black_image)
cv2.waitKey()
cv2.destroyAllWindows()
中间为原图,左侧为调亮30%后的效果,右侧为调黑30%的效果。
1.5 制作日落效果图
观看了《机器学习实践指南》,里面有个将图片制作成日落效果的案例。只需要把blue、green值变为原来的70%即可实现日落效果。
import cv2
img_path = 'test.jpg'
image = cv2.imread(filename=img_path)
#显示原图
cv2.imshow(winname='raw image',mat=image)
row_num = image.shape[0]
column_num = image.shape[1]
#日落效果,将蓝色与绿色调整为原来的70%
for row in range(row_num):
for column in range(column_num):
image[row, column, 0] = image[row, column, 0]* 0.7
image[row, column, 1] = image[row, column, 1] * 0.7
#显示日落效果图
cv2.imshow(winname='show sunload image',mat=image)
cv2.waitKey()
cv2.destroyAllWindows()
左侧为原图,右侧为日落效果图。
1.6在图片上输出文本
使用cv2.putText即可在图片中添加文字。
cv2.putText(img,text,org,fontFace,fontScale,color)
参数 | 解读 |
---|---|
img | cv2读入的图片数据 |
txt | 要写入的文本 |
org | 文字在图片中的坐标。坐标原点位于图片左上角。如org=(100,400),从图片最左边起100,从最最上面往下400。 |
fontFace | 字体。如cv2.FONT_HERSHEY_TRIPLEX、cv2.FONT_HERSHEY_PLAIN |
color | 颜色,三原数组,使用RGB模式编码。如白色为(255,255,255) |
import cv2
import os
import numpy as np
img_path = os.getcwd()+'/test.jpg'
image = cv2.imread(filename=img_path)
cv2.imshow(winname='raw image',mat=image)
#文字在图中的坐标(注意:这里的坐标原点是图片左上角)
x, y = 100, 400
cv2.putText(img = image, text = 'Beautiful Scene!',
org = (x, y), fontFace = cv2.FONT_HERSHEY_TRIPLEX,
fontScale = 1, color = (255,255,255))
cv2.imshow(winname='add text on image',mat=image)
cv2.waitKey()
cv2.destroyAllWindows()
左侧为原图,右侧为加文字的图片效果。Beautiful Scene
1.7缩放图片
使用下面方法缩放图片
resize(src, dsize, fx, fy)
参数 | 解读 |
---|---|
src | 读入的图片数据 |
dsize | 输出图片的尺寸。如果dsize为None(或0),程序会默认执行disze=(fx*src*cols,fy*src*rows) |
fx | 图片水平方向的缩放比例(倍数) |
fy | 图片垂直方向的缩放比例(倍数) |
import cv2
import os
img_path = 'test.jpg'
image = cv2.imread(filename=img_path)
#显示原图
cv2.imshow(winname='raw image',mat=image)
#更改fx,fy即可改变图片比例。垂直方向fy大小不变,水平方向fx变为原来的0.5倍。
smaller_image = cv2.resize(src=image,dsize=None,fx=0.5,fy=1)
cv2.imshow(winname='smaller image',mat=smaller_image)
cv2.waitKey()
cv2.destroyAllWindows()
右侧为原图,左侧为缩小后的图片(水平变原图的0.5倍,垂直方向保持不变。)
图像的旋转
getRotationMatrix2D(center, angle, scale),这个函数需要三个参数,旋转中心,旋转角度,旋转后图像的缩放比例
import cv2
image_path = 'test.jpg'
image = cv2.imread(filename=image_path)
rows,cols = image.shape[:2]
#第一个参数旋转中心,第二个参数旋转角度,第三个参数:缩放比例
M = cv2.getRotationMatrix2D((cols/2,rows/2), 10, 0.4)
#第三个参数:变换后的图像大小
new_image = cv2.warpAffine(image,M,(rows,cols))
cv2.imshow('raw image',image)
cv2.imshow('new_image',new_image)
cv2.waitKey()
cv2.destroyAllWindows()
左侧为原图,右侧为以图片中心旋转10,尺寸为原图0.4倍,操作后的图片