您好,
会员登录 快速注册
退出 ( 条未读消息)
关于本站 意见反馈 首页

公告:小宅博客网可以开发票了,需要发票的,去群里找群主哈!!
全部文章分类
  • 人工智能 >

  • 编程语言 >

  • WPF系列 >

  • ASP.NET系列 >

  • Linux >

  • 数据库 >

  • 嵌入式 >

  • WEB技术 >

  • PLC系列 >

  • 微服务与框架 >

  • 小宅DIY >

  • 学习资料 >

OpenCv基础 ANN车牌识别 yolov5车牌识别 指针式仪表识别 ROS系列 YOLO Halcon Detectron2 昇腾AI ChatGPT在线体验 英伟达JETSON ChatGLM ChatTTS FunASR 地平线 ByteTrack 魔搭社区 LangChain
C C# C++ Python Java Go
WPF
ASP.NET小功能 GPS定位系统-MVC GPS定位系统-VUE ASP.NET WebRTC
Linux Linux内核 Shell MakeFile
MySql SqlServer Oracle
STM8 STM32 51单片机
VUE入门 HTML JavaScript CSS layui镜像网站 ElementUi中文官网 element-plus 图标
三菱 欧姆龙 西门子 施耐德 松下 台达
IOTSharp IOTGateway ABP FRAMEWORK Docker
亚克力音响 编程仙途:智驭万法
面试题与技巧 Python入门技能树 微软C#教程
首页 编程之美 工具下载 全国就业 流量地图 文心一言
C#
内容简介 1、C#环境下使用EF操作MySql 2、实现串口通信 3、TCP通信 4、读写SqlServer数据库 5、读写ini配置文件 6、实现远程升级 7、调用打印机 8、AES数据加密与解密 AES加解密(RijndaelManaged版) 9、FTP的上传和下载 10、封装dll到exe 11、重写Button控件 12、重写Labeld控件 13、重写DataGridView控件 14、重写TabControl控件 15、重写ProgressBar控件 16、加载状态弹窗设计 17、模拟按键精灵 18、24种数据校验算法 19、C#如何调用opencv 20、地图上显示GPS坐标 21、使用EPPlus导出/导入xlsx格式的Excel报表和曲线图 22、exe程序生成安装包 23、DataGridView控件列控制 24、json解析 25、自定义委托事件 26、xml文件的生成与读取 27、DataGridView实现翻页效果 28、如何实现CAD dxf文件的读取 29、StopWatch的使用 30、Async与Await 同步与异步操作 31、关闭登录窗体打开主窗体的方法 32、SQLite数据库的操作 33、MD5数据加密 34、DES数据加密与解密 35、获取本地IP地址 36、打开与保存文件 37、静态图表显示(曲线图) 38、动态图表显示(曲线图) 39、根据公网IP获取地址信息 40、List转DataTable 41、C#下实现Ping操作 42、父窗体中嵌入子窗体 43、获取MySql数据库列表 44、WebSocket通讯 45、Mqtt客户端与服务端通讯 46、使用QRCode生成二维码 47、AForge调用摄像头 48、Emgu.CV调用摄像头 49、获取以太网网卡IP 50、DataGridView全选与定位 51、如何获取系统中所有程序的句柄 遍历指定目录下的所有文件 ​NPOI Excel报表的导入与导出 常用正则表达式字符串格式判断 Task和Thread的启停操作 C# 一些常用小功能1 C# 一些常用小功能2 如何使用C#来发送QQ邮件 Aspose.Slides文档格式转换 C# GDI+ 画心形 跳动动画 使用Remoting实现RPC RabbitMQ.消息发布与订阅 .Net Core 微信/支付宝 官方Demo C# OCR图片文字识别 Quartz 计划任务 文字语音播报 winform基于百度地图的电子围栏、路径规划、小车导航实现 Visual Studio C盘数据迁移,解决C盘空间不足的问题 Kafka通讯(Kafka-Net版) Kafka通讯(Confluent.Kafka版) 获取变量Description描述 C# 将PDF文档转换为Word文档 C# MVC 多图片上传预览
获取变量Description描述
C# MVC 多图片上传预览
黄瓜炒鸡蛋 CSDN C#

文章作者:黄瓜炒鸡蛋

促销:¥0

价格:¥0

配送方式: 购买后立即生效(如购买异常,请联系站长)
付款之后一定要等待自动跳转结束,否则购买可能会失败
  • 0 天

    有效期

  • 0

    总销量

  • 0

    累计评价

C# 将PDF文档转换为Word文档

CSDN原文章链接:https://blog.csdn.net/wuyanEdwardElrid/article/details/134383379


一.开发框架:

.NetCore6.0 工具:Visual Studio 2022


二.思路:

1.使用SHA256Hash标识文档转换记录,数据库已经存在对应散列值,则直接返还已经转换过的文档

2.数据库没有对应散列值记录的话,则保存上传PDF文档,并进行文档转换,保留Word

3.转换成功,则在数据库记录对应文档的转换记录,用散列值做标识


三.C#后台包:

1.方法一:Spire.PDF转换包(免费的只能一次转换10页)

4232ceb54e074c0e9f6f61b4d71c2af1.png

2.方法二:iTextSharp包,没有10页转换限制

d68d4360e1bd43179f04f390ed6aa9a4.png

3.mssql数据库连接包

13815176b5734436bf8267f41bdbe23c.png

4.iTextSharp包转换Word文档时,文档格式包

8e80a8857ee84a188fa6f097f1e91bca.png


四:C#代码案例:

1.PDF转Word方法: a.方法一:Spire.PDF包,PDF转Word方法(旧版,有页码限制):

/// <summary>
/// PDF文件转化为Word文件
/// </summary>
/// <param name="pdfFilePath"></param>
/// <param name="wordFilePath"></param>
public static void ConvertPdfToWord(string pdfFilePath, string wordFilePath)
{
    try
    {
        Spire.Pdf.PdfDocument pdfDoc = new Spire.Pdf.PdfDocument();
        pdfDoc.LoadFromFile(pdfFilePath);
        pdfDoc.SaveToFile(wordFilePath, Spire.Pdf.FileFormat.DOCX);
        pdfDoc.Close();
    }
    catch (Exception ex)
    {
        Console.WriteLine("Error converting PDF to Word: " + ex.Message);
    }
}


b.iTextSharp包,没有页码限制:

/// <summary>
/// iTextSharp库PDF文件转Word文件
/// </summary>
/// <param name="pdfFilePath"></param>
/// <param name="wordFilePath"></param>
public static void ConvertPdfToWordByText(string pdfFilePath, string wordFilePath)
{
    
    using (iText.Kernel.Pdf.PdfReader reader = new iText.Kernel.Pdf.PdfReader(pdfFilePath))
    {
        using (iText.Kernel.Pdf.PdfDocument pdfDoc = new iText.Kernel.Pdf.PdfDocument(reader))
        {
            Spire.Doc.Document doc = new Spire.Doc.Document();
            for (int i = 1; i <= pdfDoc.GetNumberOfPages(); i++)
            {
                iText.Kernel.Pdf.PdfPage page = pdfDoc.GetPage(i);
                var strategy = new iText.Kernel.Pdf.Canvas.Parser.Listener.LocationTextExtractionStrategy();
                PdfCanvasProcessor parser = new PdfCanvasProcessor(strategy);
                parser.ProcessPageContent(page);
                string textFromPage = strategy.GetResultantText();
                var paragraph = doc.AddSection().AddParagraph();
                paragraph.AppendText(textFromPage);
            }
            doc.SaveToFile(wordFilePath, Spire.Doc.FileFormat.Docx);
        }
    }

}


2.获取文件散列值方法(两种):

a.根据上传文件,获取散列值

/// <summary>
/// 根据上传文件获取文件散列值
/// </summary>
/// <param name="file"></param>
/// <returns></returns>
public string CalculateSHA256Hash(IFormFile file)
{
    try
    {
        using (var sha256 = SHA256.Create())
        {
            using (var stream = file.OpenReadStream())
            {
                byte[] hashBytes = sha256.ComputeHash(stream);
                string hashString = BitConverter.ToString(hashBytes).Replace("-", String.Empty);
                return hashString;
            }
        }
    }
    catch (Exception ex)
    {
        Console.WriteLine("Error calculating SHA256 hash: " + ex.Message);
        return null;
    }
}


b.根据文件路径,获取散列值

/// <summary>
/// 根据文件路径获取文件散列值
/// </summary>
/// <param name="filePath"></param>
/// <returns></returns>
public string CalculateSHA256Hash(string filePath)
{
    try
    {
        using (FileStream stream = System.IO.File.OpenRead(filePath))
        {
            SHA256 sha = SHA256.Create();
            byte[] hash = sha.ComputeHash(stream);
            string hashString = BitConverter.ToString(hash).Replace("-", String.Empty);
            return hashString;
        }
    }
    catch (Exception ex)
    {
        Console.WriteLine("Error calculating SHA256 hash: " + ex.Message);
        return null;
    }
}


3.上传PDF文件,转化为Word文件方法:

/// <summary>
/// 文件上传
/// </summary>
/// <returns></returns>
public ActionResult UploadFile()
{
    var files = HttpContext.Request.Form.Files;
    if (files == null || files.Count <= 0)
    {
        return Json(new { code = -1, msg = "请上传文件!" });
    }
    var file = files[0];
    if (file.ContentType != "application/pdf")
    {
        return Json(new { code = -1, msg = "不是PDF文件!" });
    }
    var SHA256Hash = CalculateSHA256Hash(file);
    long fileSize = file.Length;
    if (new FileConversionBll().ExistsSHA256Hash(SHA256Hash, fileSize))
    {
        var model = new FileConversionBll().GetFileBySHA256HashAndSize(SHA256Hash, fileSize);
        return Json(new { code = 0, msg = "",data = model.WordFilePath }); 
    }
    else
    {
        string fileName = DateTime.Now.ToString("yyyyMMddHHmmssfff");
        //var filePath = $@"~/File/Pdf/{fileName}";
        string pdfFilePath = System.IO.Path.Combine("PDF文档路径", fileName + ".pdf");
        using (var fileStream = new FileStream(pdfFilePath, FileMode.Create))
        {
            file.CopyTo(fileStream);
        }
        string wordFilePath = System.IO.Path.Combine("Word文档路径", fileName + ".docx");
        //ConvertPdfToWord(pdfFilePath, wordFilePath);
        ConvertPdfToWordByText(pdfFilePath, wordFilePath);
        var res = new FileConversionBll().AddFileConversion(
            new FileConversion()
            {
                PdfFilePath = pdfFilePath,
                WordFilePath = wordFilePath,
                PdfSHA256Hash = SHA256Hash,
                FileSize = fileSize
            }
        ) ;
        if (res)
        {
            return Json(new { code = 0, msg = "",data = wordFilePath });
        }
    }
    
    return Json(new {code = -2,msg = "出错了!"});
}


五.效果图:

旧版Spire.PDF包,只转化了10页:

7d08121976444a39a55500c5d003c279.png

新版iTextSharp包,全部转化完成(但是去除了原本的Word文档格式): 

e39098bfc14543f685fd201220916b37.png












获取变量Description描述
C# MVC 多图片上传预览

友情链接: CSDN激萌の小宅 95知识库 自考题库 罗分明个人网络博客 精益编程leanboot

小宅博客  www.bilibili996.com All Rights Reserved. 备案号: 闽ICP备2024034575号

网站经营许可证  福建省福州市 Copyright©2021-2025 版权所有

小宅博客
首页 智能家居 地图定位
公告:小宅博客网可以开发票了,需要发票的,去群里找群主哈!!

文章作者:黄瓜炒鸡蛋

促销:¥0

价格:¥0

配送方式: 购买后立即生效(如购买异常,请联系站长)
付款之后一定要等待自动跳转结束,否则购买可能会失败
  • 0 天

    有效期

  • 0

    总销量

  • 0

    累计评价

C# 将PDF文档转换为Word文档

CSDN原文章链接:https://blog.csdn.net/wuyanEdwardElrid/article/details/134383379


一.开发框架:

.NetCore6.0 工具:Visual Studio 2022


二.思路:

1.使用SHA256Hash标识文档转换记录,数据库已经存在对应散列值,则直接返还已经转换过的文档

2.数据库没有对应散列值记录的话,则保存上传PDF文档,并进行文档转换,保留Word

3.转换成功,则在数据库记录对应文档的转换记录,用散列值做标识


三.C#后台包:

1.方法一:Spire.PDF转换包(免费的只能一次转换10页)

4232ceb54e074c0e9f6f61b4d71c2af1.png

2.方法二:iTextSharp包,没有10页转换限制

d68d4360e1bd43179f04f390ed6aa9a4.png

3.mssql数据库连接包

13815176b5734436bf8267f41bdbe23c.png

4.iTextSharp包转换Word文档时,文档格式包

8e80a8857ee84a188fa6f097f1e91bca.png


四:C#代码案例:

1.PDF转Word方法: a.方法一:Spire.PDF包,PDF转Word方法(旧版,有页码限制):

/// <summary>
/// PDF文件转化为Word文件
/// </summary>
/// <param name="pdfFilePath"></param>
/// <param name="wordFilePath"></param>
public static void ConvertPdfToWord(string pdfFilePath, string wordFilePath)
{
    try
    {
        Spire.Pdf.PdfDocument pdfDoc = new Spire.Pdf.PdfDocument();
        pdfDoc.LoadFromFile(pdfFilePath);
        pdfDoc.SaveToFile(wordFilePath, Spire.Pdf.FileFormat.DOCX);
        pdfDoc.Close();
    }
    catch (Exception ex)
    {
        Console.WriteLine("Error converting PDF to Word: " + ex.Message);
    }
}


b.iTextSharp包,没有页码限制:

/// <summary>
/// iTextSharp库PDF文件转Word文件
/// </summary>
/// <param name="pdfFilePath"></param>
/// <param name="wordFilePath"></param>
public static void ConvertPdfToWordByText(string pdfFilePath, string wordFilePath)
{
    
    using (iText.Kernel.Pdf.PdfReader reader = new iText.Kernel.Pdf.PdfReader(pdfFilePath))
    {
        using (iText.Kernel.Pdf.PdfDocument pdfDoc = new iText.Kernel.Pdf.PdfDocument(reader))
        {
            Spire.Doc.Document doc = new Spire.Doc.Document();
            for (int i = 1; i <= pdfDoc.GetNumberOfPages(); i++)
            {
                iText.Kernel.Pdf.PdfPage page = pdfDoc.GetPage(i);
                var strategy = new iText.Kernel.Pdf.Canvas.Parser.Listener.LocationTextExtractionStrategy();
                PdfCanvasProcessor parser = new PdfCanvasProcessor(strategy);
                parser.ProcessPageContent(page);
                string textFromPage = strategy.GetResultantText();
                var paragraph = doc.AddSection().AddParagraph();
                paragraph.AppendText(textFromPage);
            }
            doc.SaveToFile(wordFilePath, Spire.Doc.FileFormat.Docx);
        }
    }

}


2.获取文件散列值方法(两种):

a.根据上传文件,获取散列值

/// <summary>
/// 根据上传文件获取文件散列值
/// </summary>
/// <param name="file"></param>
/// <returns></returns>
public string CalculateSHA256Hash(IFormFile file)
{
    try
    {
        using (var sha256 = SHA256.Create())
        {
            using (var stream = file.OpenReadStream())
            {
                byte[] hashBytes = sha256.ComputeHash(stream);
                string hashString = BitConverter.ToString(hashBytes).Replace("-", String.Empty);
                return hashString;
            }
        }
    }
    catch (Exception ex)
    {
        Console.WriteLine("Error calculating SHA256 hash: " + ex.Message);
        return null;
    }
}


b.根据文件路径,获取散列值

/// <summary>
/// 根据文件路径获取文件散列值
/// </summary>
/// <param name="filePath"></param>
/// <returns></returns>
public string CalculateSHA256Hash(string filePath)
{
    try
    {
        using (FileStream stream = System.IO.File.OpenRead(filePath))
        {
            SHA256 sha = SHA256.Create();
            byte[] hash = sha.ComputeHash(stream);
            string hashString = BitConverter.ToString(hash).Replace("-", String.Empty);
            return hashString;
        }
    }
    catch (Exception ex)
    {
        Console.WriteLine("Error calculating SHA256 hash: " + ex.Message);
        return null;
    }
}


3.上传PDF文件,转化为Word文件方法:

/// <summary>
/// 文件上传
/// </summary>
/// <returns></returns>
public ActionResult UploadFile()
{
    var files = HttpContext.Request.Form.Files;
    if (files == null || files.Count <= 0)
    {
        return Json(new { code = -1, msg = "请上传文件!" });
    }
    var file = files[0];
    if (file.ContentType != "application/pdf")
    {
        return Json(new { code = -1, msg = "不是PDF文件!" });
    }
    var SHA256Hash = CalculateSHA256Hash(file);
    long fileSize = file.Length;
    if (new FileConversionBll().ExistsSHA256Hash(SHA256Hash, fileSize))
    {
        var model = new FileConversionBll().GetFileBySHA256HashAndSize(SHA256Hash, fileSize);
        return Json(new { code = 0, msg = "",data = model.WordFilePath }); 
    }
    else
    {
        string fileName = DateTime.Now.ToString("yyyyMMddHHmmssfff");
        //var filePath = $@"~/File/Pdf/{fileName}";
        string pdfFilePath = System.IO.Path.Combine("PDF文档路径", fileName + ".pdf");
        using (var fileStream = new FileStream(pdfFilePath, FileMode.Create))
        {
            file.CopyTo(fileStream);
        }
        string wordFilePath = System.IO.Path.Combine("Word文档路径", fileName + ".docx");
        //ConvertPdfToWord(pdfFilePath, wordFilePath);
        ConvertPdfToWordByText(pdfFilePath, wordFilePath);
        var res = new FileConversionBll().AddFileConversion(
            new FileConversion()
            {
                PdfFilePath = pdfFilePath,
                WordFilePath = wordFilePath,
                PdfSHA256Hash = SHA256Hash,
                FileSize = fileSize
            }
        ) ;
        if (res)
        {
            return Json(new { code = 0, msg = "",data = wordFilePath });
        }
    }
    
    return Json(new {code = -2,msg = "出错了!"});
}


五.效果图:

旧版Spire.PDF包,只转化了10页:

7d08121976444a39a55500c5d003c279.png

新版iTextSharp包,全部转化完成(但是去除了原本的Word文档格式): 

e39098bfc14543f685fd201220916b37.png