图像

Image

计算机视觉中,图像是现实世界场景的二维(或多维)表示,由离散的像素 (Pixel) 组成。每个像素都包含颜色或强度信息,共同构成了我们所看到的视觉内容。图像是计算机视觉系统最基础的输入数据。

图像的表示

图像在计算机中通常被表示为一个多维数组或矩阵,其维度取决于图像的类型。

  1. 像素 (Pixel):
  1. 分辨率 (Resolution):
  1. 颜色深度 (Color Depth):
  1. 通道 (Channels):

grayscale 灰度
decomposition
pixels 像素
每个像素为 8bit 的值

compression 压缩
the nearby pixels generally have similar grayscales

edges in the image are hard parts to compress

帧 frames
对于视频而言,在帧和帧之间其实没有很大的变化
只需要传输 small changes difference coding
compress change matrix by linear algebra

图像的格式

svg
png

图像的数学表示

从数学上讲,图像可以被视为一个函数 I(x,y),其中 (x,y) 是图像中的坐标,函数值 I(x,y) 代表该坐标处的像素强度或颜色。

graph TD
    subgraph 图像表示
        A[图像] --> B{像素网格};
        B --> C["宽度 x 高度 (分辨率)"];
        B --> D[每个像素的颜色/强度];
        D --> E{通道 Channels};
        E -- 1通道 --> F(灰度图);
        E -- 3通道 --> G(RGB彩色图);
    end

    style A fill:#fff,stroke:#333,stroke-width:2px
    style B fill:#fff,stroke:#333,stroke-width:2px
    style C fill:#fff,stroke:#333,stroke-width:2px
    style D fill:#fff,stroke:#333,stroke-width:2px
    style E fill:#fff,stroke:#333,stroke-width:2px
    style F fill:#9f9,stroke:#333,stroke-width:2px
    style G fill:#9f9,stroke:#333,stroke-width:2px

图像处理基础

图像处理是计算机视觉的基础,涉及对图像进行各种操作以改善其质量、提取信息或准备用于进一步分析。

图像工具

两图对比 https://imgsli.com/