您好,
会员登录 快速注册
退出 ( 条未读消息)
关于本站 意见反馈 首页

公告:小宅博客网可以开发票了,需要发票的,去群里找群主哈!!
全部文章分类
  • 人工智能 >

  • 编程语言 >

  • WPF系列 >

  • ASP.NET系列 >

  • Linux >

  • 数据库 >

  • 嵌入式 >

  • WEB技术 >

  • PLC系列 >

  • 微服务与框架 >

  • 小宅DIY >

  • 学习资料 >

OpenCv基础 ANN车牌识别 yolov5车牌识别 指针式仪表识别 ROS系列 YOLO Halcon Detectron2 昇腾AI ChatGPT在线体验 英伟达JETSON ChatGLM ChatTTS FunASR 地平线 ByteTrack 魔搭社区 LangChain
C C# C++ Python Java Go
WPF
ASP.NET小功能 GPS定位系统-MVC GPS定位系统-VUE ASP.NET WebRTC
Linux Linux内核 Shell MakeFile
MySql SqlServer Oracle
STM8 STM32 51单片机
VUE入门 HTML JavaScript CSS layui镜像网站 ElementUi中文官网 element-plus 图标
三菱 欧姆龙 西门子 施耐德 松下 台达
IOTSharp IOTGateway ABP FRAMEWORK Docker
亚克力音响 编程仙途:智驭万法
面试题与技巧 Python入门技能树 微软C#教程
首页 编程之美 工具下载 全国就业 流量地图 文心一言
OpenCv基础
内容介绍与资料分享 C# OpenCv环境搭建 C++ OpenCv环境搭建 Python OpenCv环境搭建 Java OpenCv环境搭建 OpenCv组件结构解析 OpenCv命名规范 OpenCv基本专业术语与方法 OpenCV 常用函数与构造体详细说明 创建画布 打开一张图片 利用imwrite生成透明png图像 图像打开、混合显示和输出 图像腐蚀 blur图像模糊(均值滤波) sobel边缘检测 canny边缘检测 Scharr滤波器 程序性能检测及优化 视频播放 摄像头录像与播放 双摄像头操作与图像相似度检测 颜色空间转换与物体追踪 彩色目标追踪 光流法运动目标检测 OpenCV中的稠密光流 背景减除 点追踪 人脸识别 支持向量机之SVM引导 支持向量机之处理线性不可分数据 ROI矩形截取 鼠标绘制矩形 用OpenCV进行基本绘图 绘图函数(python中文显示) 把鼠标当画笔 用滑动条做调色板 图像的基础操作 图像上的算术运算 多通道图像混合 图像的亮度、对比度调整 XML和YAML文件的写入 XML和YAML文件的读取 卷积操作 三种线性滤波 两种非线性滤波 7种图像处理形态学(1) 7种图像处理形态学(2) 漫水填充 图像缩放与图像金字塔 二值化基本阈值操作 图像阈值 Laplacian图像变换(拉普拉斯算子) 霍夫变换HoughLines边缘检测与线性矢量 霍夫变换HoughLinesP边缘检测与线性矢量 霍夫变换HoughCircles边缘检测与线性矢量 LSD快速直线检测 几何变换 remap重映射 remap实现多种重映射 仿射变换综合示例 直方图均衡化 CLAHE有限对比适应性直方图均衡化 draw最大的轮廓 轮廓的性质 点到多边形的最短距离 形状匹配 椭圆拟合与直线拟合 基础轮廓查找 查找并绘制轮廓综合示例 凸缺陷/凸包检测 凸包检测 创建包围轮廓的矩形边界 创建包围轮廓的圆形边 创建包围轮廓的矩形和圆形边界框 查找和绘制图片轮廓矩 分水岭算法 图像修补 H-S二维直方图的绘制/2D直方图 一维直方图的绘制 RGB三色直方图的绘制 直方图对比 使用掩膜绘制直方图 直方图反向投影 模板匹配 多对象模板匹配 cornerHarris角点检测 cornerHarris角点检测综合示例 Shi-Tomasi角点检测 亚像素级角点检测 角点检测的FAST算法(FAST特征检测器) 颜色识别 warpPerspective透视变换 SURF/SIFT特征点检测 SURF/SIFT特征描述 使用FLANN进行特征点匹配 FLANN结合SURF/SIFT进行关键点的描述和匹配 寻找已知物体(一) 寻找已知物体(二) 目标查找与跟踪 - Meanshift与CamShift BRIEF描述符 ORB ORB算法描述与匹配 LUT 图像灰度调整 离散傅里叶变换 双目摄像头与图像拼接 环境亮度检测 stitching 全景拼接 Maze-Solver迷宫解密 使用Haar分类器之面部检测 使用Haar分类器之行人检测 OpenCv Haar/LBP/HOG分类器-人脸识别 斑点检测 使用GrabCut算法进行交互式前景提取 对极几何 摄像机标定 姿势估计 立体图像中的深度地图 OpenCv中的KNN KNN手写数字识别 ​SVM手写数字识别(使用SVM进行手写数据OCR) 英文字母的OCR 预测手写数字(预测不准) K值聚类(一) K值聚类(二) 计算摄影学-图像去噪 高动态范围成像(HDRI或HDR) MSER区域检测 二维码、条形码识别 删除图像中的水印 OpenCv深度学习dnn Kinect-深度相机 OpenCv常用数学算法 360度旋转直线绘制 向量延长线上的像素扫描 Tools工具包-窗体分配
KNN手写数字识别
英文字母的OCR
激萌の小宅 小宅博客 OpenCv基础

文章作者:激萌の小宅

促销:¥0

价格:¥0

配送方式: 购买后立即生效(如购买异常,请联系站长)
付款之后一定要等待自动跳转结束,否则购买可能会失败
  • 0 天

    有效期

  • 0

    总销量

  • 0

    累计评价

SVM手写数字识别(使用SVM进行手写数据OCR)

下面这段代码是 OpenCV-Python-Tutorial-中文版.pdf (P273)中的实现

当前系列所有demo下载地址:

https://github.com/GaoRenBao/OpenCv4-Demo

https://gitee.com/fuckgrb/OpenCv4-Demo

不同编程语言对应的OpenCv版本以及开发环境信息如下: 

语言

OpenCv版本

IDE

C#

OpenCvSharp4.4.8.0.20230708

Visual Studio 2022

C++

OpenCv-4.5.5-vc14_vc15

Visual Studio 2022

Python

OpenCv-Python (4.6.0.66)

PyCharm Community Edition 2022.1.3


备注:PDF中提供的Python代码无法运行,当前的Python代码是CSDN上找的

https://blog.csdn.net/JJSXBL/article/details/127924492


测试原图

digits.png


C#版本代码如下:

GitHub上的一个demo

https://github.com/shimat/opencvsharp_samples/tree/master/SamplesLegacy/Samples/SVMSample.cs

using OpenCvSharp;
using OpenCvSharp.ML;
using System;
using System.Collections.Generic;
using System.Linq;

namespace demo
{
    internal class Program
    {
        #region GitHub上的一个demo
        private static double Function(double x)
        {
            return x + 50 * Math.Sin(x / 15.0);
        }

        /// <summary>
        /// GitHub上的一个demo
        /// https://github.com/shimat/opencvsharp_samples/tree/master/SamplesLegacy/Samples/SVMSample.cs
        /// </summary>
        public static void RunTest()
        {
            // Training data          
            var points = new Point2f[500];
            var responses = new int[points.Length];
            var rand = new Random();
            for (int i = 0; i < responses.Length; i++)
            {
                float x = rand.Next(0, 300);
                float y = rand.Next(0, 300);
                points[i] = new Point2f(x, y);
                responses[i] = (y > Function(x)) ? 1 : 2;
            }

            // Show training data and f(x)
            using (Mat pointsPlot = Mat.Zeros(300, 300, MatType.CV_8UC3))
            {
                for (int i = 0; i < points.Length; i++)
                {
                    int x = (int)points[i].X;
                    int y = (int)(300 - points[i].Y);
                    int res = responses[i];
                    Scalar color = (res == 1) ? Scalar.Red : Scalar.GreenYellow;
                    pointsPlot.Circle(x, y, 2, color, -1);
                }
                // f(x)
                for (int x = 1; x < 300; x++)
                {
                    int y1 = (int)(300 - Function(x - 1));
                    int y2 = (int)(300 - Function(x));
                    pointsPlot.Line(x - 1, y1, x, y2, Scalar.LightBlue, 1);
                }
                Cv2.ImShow("pointsPlot", pointsPlot);
            }

            // Train
            var dataMat = new Mat(points.Length, 2, MatType.CV_32FC1, points);
            var resMat = new Mat(responses.Length, 1, MatType.CV_32SC1, responses);
            var svm = SVM.Create();
            // normalize data
            dataMat /= 300.0;

            // SVM parameters
            svm.Type = SVM.Types.CSvc;
            svm.KernelType = SVM.KernelTypes.Rbf;
            svm.TermCriteria = TermCriteria.Both(1000, 0.000001);
            svm.Degree = 100.0;
            svm.Gamma = 100.0;
            svm.Coef0 = 1.0;
            svm.C = 1.0;
            svm.Nu = 0.5;
            svm.P = 0.1;

            svm.Train(dataMat, SampleTypes.RowSample, resMat);

            // Predict for each 300x300 pixel
            Mat retPlot = Mat.Zeros(300, 300, MatType.CV_8UC3);
            for (int x = 0; x < 300; x++)
            {
                for (int y = 0; y < 300; y++)
                {
                    float[] sample = { x / 300f, y / 300f };
                    var sampleMat = new Mat(1, 2, MatType.CV_32FC1, sample);
                    int ret = (int)svm.Predict(sampleMat);
                    var plotRect = new Rect(x, 300 - y, 1, 1);
                    if (ret == 1)
                        retPlot.Rectangle(plotRect, Scalar.Red);
                    else if (ret == 2)
                        retPlot.Rectangle(plotRect, Scalar.GreenYellow);
                }
            }
            Cv2.ImShow("retPlot", retPlot);
        }
        #endregion

        #region SVM手写数字识别
        /// <summary>
        /// 切图
        /// </summary>
        /// <returns></returns>
        static List<List<Mat>> RoiImages(string path)
        {
            Mat img = Cv2.ImRead(path);
            Mat gray = new Mat();
            Cv2.CvtColor(img, gray, ColorConversionCodes.BGR2GRAY);

            List<List<Mat>> cells = new List<List<Mat>>();
            int w = gray.Width / 100; // 每行100个字符
            int h = gray.Height / 50; // 共50行
            Mat roi = new Mat();
            for (int i = 0; i < 10; i++) // 数字0~9
            {
                cells.Add(new List<Mat>());
                for (int j = 0; j < 5; j++) // 每组数字有5行
                {
                    for (int n = 0; n < 100; n++) // 每行100个字符
                    {
                        Rect rect = new Rect()
                        {
                            X = n * w,
                            Y = h * ((i * 5) + j),
                            Width = w,
                            Height = h
                        };
                        roi = new Mat(gray, rect);
                        cells[i].Add(roi);

                        //Console.WriteLine(rect);
                        //Cv2.ImShow("roi", roi);
                        //Cv2.WaitKey(1);
                    }
                }
            }
            return cells;
        }

        /// <summary>
        /// SVM手写数字识别
        /// </summary>
        static void demo()
        {
            // 切图
            var cells = RoiImages("../../../images/digits.png");

            // 训练数据数量,前400张图片用来训练
            int train_sample_count = 400 * 10;
            // 声明训练数据集合 mat,图像尺寸:20*20
            Mat trainData = new Mat(train_sample_count, 20 * 20, MatType.CV_32FC1);
            // 声明训练数据标签 mat
            Mat trainLabel = new Mat(train_sample_count, 1, MatType.CV_32SC1);

            // 组织训练数据,循环训练文件夹内所有图片。
            int trainNum = 0;
            for (int i = 0; i < 10; i++)
            {
                var cell = cells[i].Take(400);
                foreach (Mat temp in cell)
                {
                    // 转换CV_32FC1,因为下面训练函数需要这个格式
                    temp.ConvertTo(temp, MatType.CV_32FC1);
                    // 写入到训练数据集合的mat内,注意reshape的用法。
                    /*
                    reshape有两个参数:
                    其中,参数:cn为新的通道数,如果cn = 0,表示通道数不会改变。
                    参数rows为新的行数,如果rows = 0,表示行数不会改变。
                    注意:新的行* 列必须与原来的行*列相等。就是说,如果原来是5行3列,新的行和列可以是1行15列,3行5列,5行3列,15行1列。
                          设置行数后,列数会自动调整。比如此处 调整为 1行784列。
                    */
                    temp.Reshape(0, 1).CopyTo(trainData.Row(trainNum));
                    // 写入到训练标签集合的mat内
                    // 这个必须是int类型,不能用float,和knn的操作有点差异
                    trainLabel.Set<int>(trainNum, i);
                    trainNum++;
                }
            }

            // 实例化对象
            SVM svm = SVM.Create();
            // 设置核函数
            svm.KernelType = SVM.KernelTypes.Linear;
            // 设置训练类型
            svm.Type = SVM.Types.CSvc;
            svm.C = 2.67;
            svm.Gamma = 5.383;
            // 输入样本,进行训练
            svm.Train(trainData, SampleTypes.RowSample, trainLabel);
            // 存储训练结果
            //svm.Save("svm_data.dat");

            /**************  Now testing ***************/
            // 测试数据数量,后100张图片用来测试
            int test_sample_count = 100 * 10;
            // 声明测试数据集合 mat
            Mat testData = new Mat(test_sample_count, 20 * 20, MatType.CV_32FC1);
            // 声明测试数据标签 mat
            Mat testLabel = new Mat(test_sample_count, 1, MatType.CV_32FC1);
            // 组织测试数据
            int testNum = 0;
            for (int i = 0; i < 10; i++)
            {
                var cell = cells[i].Skip(400);
                foreach (Mat temp in cell)
                {
                    temp.ConvertTo(temp, MatType.CV_32FC1);
                    temp.Reshape(0, 1).CopyTo(testData.Row(testNum));
                    testLabel.Set<float>(testNum, i);
                    testNum++;
                }
            }

            Mat result = new Mat();
            svm.Predict(testData, result);
            int t = 0;
            int f = 0;
            for (int i = 0; i < test_sample_count; i++)
            {
                int predict = (int)result.At<float>(i);
                int actual = (int)testLabel.At<float>(i);
                if (predict == actual)
                {
                    Console.WriteLine("正确:" + predict + "-" + actual);
                    t++;
                }
                else
                {
                    Console.WriteLine("错误------:" + predict + "-" + actual);
                    f++;
                }
            }

            double accuracy = (t * 1.0) / (t + f);
            Console.WriteLine("准确率:" + accuracy); // 准确率:0.908
            Console.Read();
        }
        #endregion

        static void Main(string[] args)
        {
            //RunTest();
            //Cv2.WaitKey();

            demo();
        }
    }


C++版本代码如下:

#include <opencv2/opencv.hpp>
#include <opencv2/ml/ml.hpp>
#include <iostream>

using namespace cv;
using namespace cv::ml;
using namespace std;

// 切图
vector<vector<Mat>> RoiImages(string path)
{
    Mat img = cv::imread(path);
    Mat gray;
    cv::cvtColor(img, gray, COLOR_BGR2GRAY);

    vector<vector<Mat>> cells;
    int w = gray.cols / 100; // 每行100个字符
    int h = gray.rows / 50; // 共50行
    for (int i = 0; i < 10; i++) // 数字0~9
    {
        vector<Mat> imgs;
        for (int j = 0; j < 5; j++) // 每组数字有5行
        {
            for (int n = 0; n < 100; n++) // 每行100个字符
            {
                Rect rect(n * w, h * ((i * 5) + j), w, h);
                Mat roi = gray(rect);
                imgs.push_back(roi);
                //cv::imshow("roi", roi);
                //cv::waitKey(1);
            }
        }
        cells.push_back(imgs);
    }
    return cells;
}

int main()
{
    // 切图
    vector<vector<Mat>> cells = RoiImages("../images/digits.png");

    // 训练数据数量,前400张图片用来训练
    int train_sample_count = 400 * 10;
    // 声明训练数据集合 mat,图像尺寸:20*20
    Mat trainData(train_sample_count, 20 * 20, CV_32FC1);
    // 声明训练数据标签 mat
    Mat trainLabel(train_sample_count, 1, CV_32SC1);

    // 组织训练数据,循环训练文件夹内所有图片。
    int trainNum = 0;
    for (int i = 0; i < 10; i++)
    {
        for (int j = 0; j < 400; j++)
        {
            Mat temp = cells[i][j];
            // 转换CV_32FC1,因为下面训练函数需要这个格式
            temp.convertTo(temp, CV_32FC1);
            // 写入到训练数据集合的mat内,注意reshape的用法。
            /*
            reshape有两个参数:
            其中,参数:cn为新的通道数,如果cn = 0,表示通道数不会改变。
            参数rows为新的行数,如果rows = 0,表示行数不会改变。
            注意:新的行* 列必须与原来的行*列相等。就是说,如果原来是5行3列,新的行和列可以是1行15列,3行5列,5行3列,15行1列。
                  设置行数后,列数会自动调整。比如此处 调整为 1行784列。
            */
            temp.reshape(0, 1).copyTo(trainData.row(trainNum));
            // 写入到训练标签集合的mat内
            trainLabel.at<int>(trainNum) = i;
            trainNum++;
        }
    }


    // 实例化对象
    Ptr<SVM> svm = SVM::create();
    // 设置核函数
    svm->setKernel(SVM::LINEAR);  //核函数
    // 设置训练类型
    svm->setType(SVM::C_SVC);
    svm->setC(2.67);
    svm->setGamma(5.383);
    // 输入样本,进行训练
    svm->train(TrainData::create(trainData, ROW_SAMPLE, trainLabel));
    // 存储训练结果
    svm->save("svm_data.dat");

    /**************  Now testing ***************/
    // 测试数据数量,后100张图片用来测试
    int test_sample_count = 100 * 10;
    // 声明测试数据集合 mat
    Mat testData(test_sample_count, 20 * 20, CV_32FC1);
    // 声明测试数据标签 mat
    Mat testLabel(test_sample_count, 1, CV_32FC1);
    // 组织测试数据
    int testNum = 0;
    for (int i = 0; i < 10; i++)
    {
        for (int j = 400; j < cells[i].size(); j++)
        {
            Mat temp = cells[i][j];
            temp.convertTo(temp, CV_32FC1);
            temp.reshape(0, 1).copyTo(testData.row(testNum));
            testLabel.at<float>(testNum) = i;
            testNum++;
        }
    }

    Mat result;
    svm->predict(testData, result);
    int t = 0;
    int f = 0;
    for (int i = 0; i < test_sample_count; i++)
    {
        int predict = (int)result.at<float>(i);
        int actual = (int)testLabel.at<float>(i);
        if (predict == actual)
        {
            cout << "正确:" << predict << "-" << actual << endl;
            t++;
        }
        else
        {
            cout << "错误------:" << predict << "-" << actual << endl;
            f++;
        }
    }

    double accuracy = (t * 1.0) / (t + f);
    cout << "准确率:" << accuracy << endl; // 准确率:0.908
}


Python版本代码如下:

PDF中的原始代码我在Git上有提供,需要的,可以去下载

import cv2 as cv
import numpy as np

SZ = 20
bin_n = 16  # Number of bins
affine_flags = cv.WARP_INVERSE_MAP | cv.INTER_LINEAR


# 这个函数用来给手写体做一个变形,变成正体
def deskew(img):
    m = cv.moments(img)
    if abs(m['mu02']) < 1e-2:
        return img.copy()
    skew = m['mu11'] / m['mu02']
    M = np.float32([[1, skew, -0.5 * SZ * skew], [0, 1, 0]])
    img = cv.warpAffine(img, M, (SZ, SZ), flags=affine_flags)
    return img


# 这个函数把图片分成四部分,分别成生成方向直方图,然后返回,用来作为SVM的输入,这点可K近邻算法是不一样的
def hog(img):
    gx = cv.Sobel(img, cv.CV_32F, 1, 0)
    gy = cv.Sobel(img, cv.CV_32F, 0, 1)
    mag, ang = cv.cartToPolar(gx, gy)
    bins = np.int32(bin_n * ang / (2 * np.pi))  # quantizing binvalues in (0...16)
    bin_cells = bins[:10, :10], bins[10:, :10], bins[:10, 10:], bins[10:, 10:]
    mag_cells = mag[:10, :10], mag[10:, :10], mag[:10, 10:], mag[10:, 10:]
    hists = [np.bincount(b.ravel(), m.ravel(), bin_n) for b, m in zip(bin_cells, mag_cells)]
    hist = np.hstack(hists)  # hist is a 64 bit vector
    return hist


# 样本读取
img = cv.imread(cv.samples.findFile('../images/digits.png'), 0)
if img is None:
    raise Exception("we need the digits.png image from samples/data here !")

# 把整张图片分成单独的图片,原数据是50行,100列
cells = [np.hsplit(row, 100) for row in np.vsplit(img, 50)]
# First half is trainData, remaining is testData
train_cells = [i[:50] for i in cells]
test_cells = [i[50:] for i in cells]

######################## Now training ########################

# 使用deskew函数,把倾斜的字体矫正
deskewed = [list(map(deskew, row)) for row in train_cells]
# 生成图像的HOG图
hogdata = [list(map(hog, row)) for row in deskewed]
# 序列化,变成输入数据
trainData = np.float32(hogdata).reshape(-1, 64)
# 把与图片对应的数字生成出来
responses = np.repeat(np.arange(10), 250)[:, np.newaxis]

# 实例化对象
svm = cv.ml.SVM_create()
# 设置核函数
svm.setKernel(cv.ml.SVM_LINEAR)
# 设置训练类型
svm.setType(cv.ml.SVM_C_SVC)
svm.setC(2.67)
svm.setGamma(5.383)

# 输入样本,进行训练
svm.train(trainData, cv.ml.ROW_SAMPLE, responses)
# 存储训练结果
svm.save('svm_data.dat')

######     Now testing      ########################

# 对检验样本的手写体进行矫正
deskewed = [list(map(deskew, row)) for row in test_cells]
# 生成检验样本的HOG图
hogdata = [list(map(hog, row)) for row in deskewed]
# 检验样本序列化
testData = np.float32(hogdata).reshape(-1, bin_n * 4)
# 生成识别结果
result = svm.predict(testData)[1]

#######   Check Accuracy   ########################
mask = result == responses
correct = np.count_nonzero(mask)
print(correct * 100.0 / result.size)
# 输出:93.8


KNN手写数字识别
英文字母的OCR

友情链接: CSDN激萌の小宅 95知识库 自考题库 罗分明个人网络博客 精益编程leanboot

小宅博客  www.bilibili996.com All Rights Reserved. 备案号: 闽ICP备2024034575号

网站经营许可证  福建省福州市 Copyright©2021-2025 版权所有

小宅博客
首页 智能家居 地图定位
公告:小宅博客网可以开发票了,需要发票的,去群里找群主哈!!

文章作者:激萌の小宅

促销:¥0

价格:¥0

配送方式: 购买后立即生效(如购买异常,请联系站长)
付款之后一定要等待自动跳转结束,否则购买可能会失败
  • 0 天

    有效期

  • 0

    总销量

  • 0

    累计评价

SVM手写数字识别(使用SVM进行手写数据OCR)

下面这段代码是 OpenCV-Python-Tutorial-中文版.pdf (P273)中的实现

当前系列所有demo下载地址:

https://github.com/GaoRenBao/OpenCv4-Demo

https://gitee.com/fuckgrb/OpenCv4-Demo

不同编程语言对应的OpenCv版本以及开发环境信息如下: 

语言

OpenCv版本

IDE

C#

OpenCvSharp4.4.8.0.20230708

Visual Studio 2022

C++

OpenCv-4.5.5-vc14_vc15

Visual Studio 2022

Python

OpenCv-Python (4.6.0.66)

PyCharm Community Edition 2022.1.3


备注:PDF中提供的Python代码无法运行,当前的Python代码是CSDN上找的

https://blog.csdn.net/JJSXBL/article/details/127924492


测试原图

digits.png


C#版本代码如下:

GitHub上的一个demo

https://github.com/shimat/opencvsharp_samples/tree/master/SamplesLegacy/Samples/SVMSample.cs

using OpenCvSharp;
using OpenCvSharp.ML;
using System;
using System.Collections.Generic;
using System.Linq;

namespace demo
{
    internal class Program
    {
        #region GitHub上的一个demo
        private static double Function(double x)
        {
            return x + 50 * Math.Sin(x / 15.0);
        }

        /// <summary>
        /// GitHub上的一个demo
        /// https://github.com/shimat/opencvsharp_samples/tree/master/SamplesLegacy/Samples/SVMSample.cs
        /// </summary>
        public static void RunTest()
        {
            // Training data          
            var points = new Point2f[500];
            var responses = new int[points.Length];
            var rand = new Random();
            for (int i = 0; i < responses.Length; i++)
            {
                float x = rand.Next(0, 300);
                float y = rand.Next(0, 300);
                points[i] = new Point2f(x, y);
                responses[i] = (y > Function(x)) ? 1 : 2;
            }

            // Show training data and f(x)
            using (Mat pointsPlot = Mat.Zeros(300, 300, MatType.CV_8UC3))
            {
                for (int i = 0; i < points.Length; i++)
                {
                    int x = (int)points[i].X;
                    int y = (int)(300 - points[i].Y);
                    int res = responses[i];
                    Scalar color = (res == 1) ? Scalar.Red : Scalar.GreenYellow;
                    pointsPlot.Circle(x, y, 2, color, -1);
                }
                // f(x)
                for (int x = 1; x < 300; x++)
                {
                    int y1 = (int)(300 - Function(x - 1));
                    int y2 = (int)(300 - Function(x));
                    pointsPlot.Line(x - 1, y1, x, y2, Scalar.LightBlue, 1);
                }
                Cv2.ImShow("pointsPlot", pointsPlot);
            }

            // Train
            var dataMat = new Mat(points.Length, 2, MatType.CV_32FC1, points);
            var resMat = new Mat(responses.Length, 1, MatType.CV_32SC1, responses);
            var svm = SVM.Create();
            // normalize data
            dataMat /= 300.0;

            // SVM parameters
            svm.Type = SVM.Types.CSvc;
            svm.KernelType = SVM.KernelTypes.Rbf;
            svm.TermCriteria = TermCriteria.Both(1000, 0.000001);
            svm.Degree = 100.0;
            svm.Gamma = 100.0;
            svm.Coef0 = 1.0;
            svm.C = 1.0;
            svm.Nu = 0.5;
            svm.P = 0.1;

            svm.Train(dataMat, SampleTypes.RowSample, resMat);

            // Predict for each 300x300 pixel
            Mat retPlot = Mat.Zeros(300, 300, MatType.CV_8UC3);
            for (int x = 0; x < 300; x++)
            {
                for (int y = 0; y < 300; y++)
                {
                    float[] sample = { x / 300f, y / 300f };
                    var sampleMat = new Mat(1, 2, MatType.CV_32FC1, sample);
                    int ret = (int)svm.Predict(sampleMat);
                    var plotRect = new Rect(x, 300 - y, 1, 1);
                    if (ret == 1)
                        retPlot.Rectangle(plotRect, Scalar.Red);
                    else if (ret == 2)
                        retPlot.Rectangle(plotRect, Scalar.GreenYellow);
                }
            }
            Cv2.ImShow("retPlot", retPlot);
        }
        #endregion

        #region SVM手写数字识别
        /// <summary>
        /// 切图
        /// </summary>
        /// <returns></returns>
        static List<List<Mat>> RoiImages(string path)
        {
            Mat img = Cv2.ImRead(path);
            Mat gray = new Mat();
            Cv2.CvtColor(img, gray, ColorConversionCodes.BGR2GRAY);

            List<List<Mat>> cells = new List<List<Mat>>();
            int w = gray.Width / 100; // 每行100个字符
            int h = gray.Height / 50; // 共50行
            Mat roi = new Mat();
            for (int i = 0; i < 10; i++) // 数字0~9
            {
                cells.Add(new List<Mat>());
                for (int j = 0; j < 5; j++) // 每组数字有5行
                {
                    for (int n = 0; n < 100; n++) // 每行100个字符
                    {
                        Rect rect = new Rect()
                        {
                            X = n * w,
                            Y = h * ((i * 5) + j),
                            Width = w,
                            Height = h
                        };
                        roi = new Mat(gray, rect);
                        cells[i].Add(roi);

                        //Console.WriteLine(rect);
                        //Cv2.ImShow("roi", roi);
                        //Cv2.WaitKey(1);
                    }
                }
            }
            return cells;
        }

        /// <summary>
        /// SVM手写数字识别
        /// </summary>
        static void demo()
        {
            // 切图
            var cells = RoiImages("../../../images/digits.png");

            // 训练数据数量,前400张图片用来训练
            int train_sample_count = 400 * 10;
            // 声明训练数据集合 mat,图像尺寸:20*20
            Mat trainData = new Mat(train_sample_count, 20 * 20, MatType.CV_32FC1);
            // 声明训练数据标签 mat
            Mat trainLabel = new Mat(train_sample_count, 1, MatType.CV_32SC1);

            // 组织训练数据,循环训练文件夹内所有图片。
            int trainNum = 0;
            for (int i = 0; i < 10; i++)
            {
                var cell = cells[i].Take(400);
                foreach (Mat temp in cell)
                {
                    // 转换CV_32FC1,因为下面训练函数需要这个格式
                    temp.ConvertTo(temp, MatType.CV_32FC1);
                    // 写入到训练数据集合的mat内,注意reshape的用法。
                    /*
                    reshape有两个参数:
                    其中,参数:cn为新的通道数,如果cn = 0,表示通道数不会改变。
                    参数rows为新的行数,如果rows = 0,表示行数不会改变。
                    注意:新的行* 列必须与原来的行*列相等。就是说,如果原来是5行3列,新的行和列可以是1行15列,3行5列,5行3列,15行1列。
                          设置行数后,列数会自动调整。比如此处 调整为 1行784列。
                    */
                    temp.Reshape(0, 1).CopyTo(trainData.Row(trainNum));
                    // 写入到训练标签集合的mat内
                    // 这个必须是int类型,不能用float,和knn的操作有点差异
                    trainLabel.Set<int>(trainNum, i);
                    trainNum++;
                }
            }

            // 实例化对象
            SVM svm = SVM.Create();
            // 设置核函数
            svm.KernelType = SVM.KernelTypes.Linear;
            // 设置训练类型
            svm.Type = SVM.Types.CSvc;
            svm.C = 2.67;
            svm.Gamma = 5.383;
            // 输入样本,进行训练
            svm.Train(trainData, SampleTypes.RowSample, trainLabel);
            // 存储训练结果
            //svm.Save("svm_data.dat");

            /**************  Now testing ***************/
            // 测试数据数量,后100张图片用来测试
            int test_sample_count = 100 * 10;
            // 声明测试数据集合 mat
            Mat testData = new Mat(test_sample_count, 20 * 20, MatType.CV_32FC1);
            // 声明测试数据标签 mat
            Mat testLabel = new Mat(test_sample_count, 1, MatType.CV_32FC1);
            // 组织测试数据
            int testNum = 0;
            for (int i = 0; i < 10; i++)
            {
                var cell = cells[i].Skip(400);
                foreach (Mat temp in cell)
                {
                    temp.ConvertTo(temp, MatType.CV_32FC1);
                    temp.Reshape(0, 1).CopyTo(testData.Row(testNum));
                    testLabel.Set<float>(testNum, i);
                    testNum++;
                }
            }

            Mat result = new Mat();
            svm.Predict(testData, result);
            int t = 0;
            int f = 0;
            for (int i = 0; i < test_sample_count; i++)
            {
                int predict = (int)result.At<float>(i);
                int actual = (int)testLabel.At<float>(i);
                if (predict == actual)
                {
                    Console.WriteLine("正确:" + predict + "-" + actual);
                    t++;
                }
                else
                {
                    Console.WriteLine("错误------:" + predict + "-" + actual);
                    f++;
                }
            }

            double accuracy = (t * 1.0) / (t + f);
            Console.WriteLine("准确率:" + accuracy); // 准确率:0.908
            Console.Read();
        }
        #endregion

        static void Main(string[] args)
        {
            //RunTest();
            //Cv2.WaitKey();

            demo();
        }
    }


C++版本代码如下:

#include <opencv2/opencv.hpp>
#include <opencv2/ml/ml.hpp>
#include <iostream>

using namespace cv;
using namespace cv::ml;
using namespace std;

// 切图
vector<vector<Mat>> RoiImages(string path)
{
    Mat img = cv::imread(path);
    Mat gray;
    cv::cvtColor(img, gray, COLOR_BGR2GRAY);

    vector<vector<Mat>> cells;
    int w = gray.cols / 100; // 每行100个字符
    int h = gray.rows / 50; // 共50行
    for (int i = 0; i < 10; i++) // 数字0~9
    {
        vector<Mat> imgs;
        for (int j = 0; j < 5; j++) // 每组数字有5行
        {
            for (int n = 0; n < 100; n++) // 每行100个字符
            {
                Rect rect(n * w, h * ((i * 5) + j), w, h);
                Mat roi = gray(rect);
                imgs.push_back(roi);
                //cv::imshow("roi", roi);
                //cv::waitKey(1);
            }
        }
        cells.push_back(imgs);
    }
    return cells;
}

int main()
{
    // 切图
    vector<vector<Mat>> cells = RoiImages("../images/digits.png");

    // 训练数据数量,前400张图片用来训练
    int train_sample_count = 400 * 10;
    // 声明训练数据集合 mat,图像尺寸:20*20
    Mat trainData(train_sample_count, 20 * 20, CV_32FC1);
    // 声明训练数据标签 mat
    Mat trainLabel(train_sample_count, 1, CV_32SC1);

    // 组织训练数据,循环训练文件夹内所有图片。
    int trainNum = 0;
    for (int i = 0; i < 10; i++)
    {
        for (int j = 0; j < 400; j++)
        {
            Mat temp = cells[i][j];
            // 转换CV_32FC1,因为下面训练函数需要这个格式
            temp.convertTo(temp, CV_32FC1);
            // 写入到训练数据集合的mat内,注意reshape的用法。
            /*
            reshape有两个参数:
            其中,参数:cn为新的通道数,如果cn = 0,表示通道数不会改变。
            参数rows为新的行数,如果rows = 0,表示行数不会改变。
            注意:新的行* 列必须与原来的行*列相等。就是说,如果原来是5行3列,新的行和列可以是1行15列,3行5列,5行3列,15行1列。
                  设置行数后,列数会自动调整。比如此处 调整为 1行784列。
            */
            temp.reshape(0, 1).copyTo(trainData.row(trainNum));
            // 写入到训练标签集合的mat内
            trainLabel.at<int>(trainNum) = i;
            trainNum++;
        }
    }


    // 实例化对象
    Ptr<SVM> svm = SVM::create();
    // 设置核函数
    svm->setKernel(SVM::LINEAR);  //核函数
    // 设置训练类型
    svm->setType(SVM::C_SVC);
    svm->setC(2.67);
    svm->setGamma(5.383);
    // 输入样本,进行训练
    svm->train(TrainData::create(trainData, ROW_SAMPLE, trainLabel));
    // 存储训练结果
    svm->save("svm_data.dat");

    /**************  Now testing ***************/
    // 测试数据数量,后100张图片用来测试
    int test_sample_count = 100 * 10;
    // 声明测试数据集合 mat
    Mat testData(test_sample_count, 20 * 20, CV_32FC1);
    // 声明测试数据标签 mat
    Mat testLabel(test_sample_count, 1, CV_32FC1);
    // 组织测试数据
    int testNum = 0;
    for (int i = 0; i < 10; i++)
    {
        for (int j = 400; j < cells[i].size(); j++)
        {
            Mat temp = cells[i][j];
            temp.convertTo(temp, CV_32FC1);
            temp.reshape(0, 1).copyTo(testData.row(testNum));
            testLabel.at<float>(testNum) = i;
            testNum++;
        }
    }

    Mat result;
    svm->predict(testData, result);
    int t = 0;
    int f = 0;
    for (int i = 0; i < test_sample_count; i++)
    {
        int predict = (int)result.at<float>(i);
        int actual = (int)testLabel.at<float>(i);
        if (predict == actual)
        {
            cout << "正确:" << predict << "-" << actual << endl;
            t++;
        }
        else
        {
            cout << "错误------:" << predict << "-" << actual << endl;
            f++;
        }
    }

    double accuracy = (t * 1.0) / (t + f);
    cout << "准确率:" << accuracy << endl; // 准确率:0.908
}


Python版本代码如下:

PDF中的原始代码我在Git上有提供,需要的,可以去下载

import cv2 as cv
import numpy as np

SZ = 20
bin_n = 16  # Number of bins
affine_flags = cv.WARP_INVERSE_MAP | cv.INTER_LINEAR


# 这个函数用来给手写体做一个变形,变成正体
def deskew(img):
    m = cv.moments(img)
    if abs(m['mu02']) < 1e-2:
        return img.copy()
    skew = m['mu11'] / m['mu02']
    M = np.float32([[1, skew, -0.5 * SZ * skew], [0, 1, 0]])
    img = cv.warpAffine(img, M, (SZ, SZ), flags=affine_flags)
    return img


# 这个函数把图片分成四部分,分别成生成方向直方图,然后返回,用来作为SVM的输入,这点可K近邻算法是不一样的
def hog(img):
    gx = cv.Sobel(img, cv.CV_32F, 1, 0)
    gy = cv.Sobel(img, cv.CV_32F, 0, 1)
    mag, ang = cv.cartToPolar(gx, gy)
    bins = np.int32(bin_n * ang / (2 * np.pi))  # quantizing binvalues in (0...16)
    bin_cells = bins[:10, :10], bins[10:, :10], bins[:10, 10:], bins[10:, 10:]
    mag_cells = mag[:10, :10], mag[10:, :10], mag[:10, 10:], mag[10:, 10:]
    hists = [np.bincount(b.ravel(), m.ravel(), bin_n) for b, m in zip(bin_cells, mag_cells)]
    hist = np.hstack(hists)  # hist is a 64 bit vector
    return hist


# 样本读取
img = cv.imread(cv.samples.findFile('../images/digits.png'), 0)
if img is None:
    raise Exception("we need the digits.png image from samples/data here !")

# 把整张图片分成单独的图片,原数据是50行,100列
cells = [np.hsplit(row, 100) for row in np.vsplit(img, 50)]
# First half is trainData, remaining is testData
train_cells = [i[:50] for i in cells]
test_cells = [i[50:] for i in cells]

######################## Now training ########################

# 使用deskew函数,把倾斜的字体矫正
deskewed = [list(map(deskew, row)) for row in train_cells]
# 生成图像的HOG图
hogdata = [list(map(hog, row)) for row in deskewed]
# 序列化,变成输入数据
trainData = np.float32(hogdata).reshape(-1, 64)
# 把与图片对应的数字生成出来
responses = np.repeat(np.arange(10), 250)[:, np.newaxis]

# 实例化对象
svm = cv.ml.SVM_create()
# 设置核函数
svm.setKernel(cv.ml.SVM_LINEAR)
# 设置训练类型
svm.setType(cv.ml.SVM_C_SVC)
svm.setC(2.67)
svm.setGamma(5.383)

# 输入样本,进行训练
svm.train(trainData, cv.ml.ROW_SAMPLE, responses)
# 存储训练结果
svm.save('svm_data.dat')

######     Now testing      ########################

# 对检验样本的手写体进行矫正
deskewed = [list(map(deskew, row)) for row in test_cells]
# 生成检验样本的HOG图
hogdata = [list(map(hog, row)) for row in deskewed]
# 检验样本序列化
testData = np.float32(hogdata).reshape(-1, bin_n * 4)
# 生成识别结果
result = svm.predict(testData)[1]

#######   Check Accuracy   ########################
mask = result == responses
correct = np.count_nonzero(mask)
print(correct * 100.0 / result.size)
# 输出:93.8