Html转Word文档,解决无法保存网络图片的问题

  最近项目中需要这个功能,网上有很多word转html的方法,但是html转word的方法很少,因为html中的图片转换到本地比较麻烦;

  开始的时候只能转换不带图片的html内容,但是不符合要求,将html页面中的图片改成绝对路径后在断网之后无法查看,将图片下载下来改成绝对路径后,换台机器无法观看,问题干扰了一天;

  当然有一种实现方式是将外链样式和外链图片全部一个个请求下来再放到word中排版,这个貌似非常麻烦,跟做一个浏览器一样。

  后来发现,在网站中直接复制网页然后到word文档中粘贴,可以把图片和样式全部拿过来,于是想到一种方法是否可以利用剪切板来取数据,模拟复制粘贴,最终发现可行,唯一的不足是由于宽度原因,拿来的东西在word中呈现会把格局变掉。

  代码还是非常简单,比较好理解的,下面上代码:

  

 1      public void HtmlToWordByUrl(string url)
 2         {
 3             WebBrowser WB = new WebBrowser();//新建内置浏览
 4             WB.Navigate(url);//加载页面
 5             //加载完成
 6             while (WB.ReadyState != WebBrowserReadyState.Complete)
 7             {
 8                 System.Windows.Forms.Application.DoEvents();
 9             }
10             //对加载完成的页面进行全选和复制操作
11             HtmlDocument doc = WB.Document;
12             doc.ExecCommand("SelectAll", false, "");//全选
13             doc.ExecCommand("Copy", false, "");//复制
14             //放入剪切板
15             IDataObject iData = Clipboard.GetDataObject();
16             SaveWord();//保存为word文档
17             //读取文档,下载文档
18             FileStream fs = new FileStream(Server.MapPath("~/UploadFile/test.doc"), FileMode.Open);
19             byte[] bytes = new byte[(int)fs.Length];
20             fs.Read(bytes, 0, bytes.Length);
21             fs.Close();
22             Response.ContentType = "application/octet-stream";
23             //通知浏览器下载文件而不是打开 
24             Response.AddHeader("Content-Disposition", "attachment; filename=htmlfile.doc");
25             Response.BinaryWrite(bytes);
26             WB.Dispose();
27             Response.Flush();
28             Response.End();
29 
30         }
31 
32         public void SaveWord()
33         {
34             object path;                      //声明文件路径变量
35             //string wordstr = wdstr;                   //声明word文档内容
36             MSWord.Application wordApp;       //声明word应用程序变量
37             MSWord.Document worddoc;          //声明word文档变量    
38 
39             //初始化变量
40             object Nothing = Missing.Value;                       //COM调用时用于占位
41             object format = MSWord.WdSaveFormat.wdFormatDocument; //Word文档的保存格式
42             wordApp = new MSWord.ApplicationClass();              //声明一个wordAPP对象
43             worddoc = wordApp.Documents.Add(ref Nothing, ref Nothing,
44                 ref Nothing, ref Nothing);
45 
46             //页面设置
47             worddoc.PageSetup.PaperSize = Microsoft.Office.Interop.Word.WdPaperSize.wdPaperA4;//设置纸张样式
48             worddoc.PageSetup.Orientation = Microsoft.Office.Interop.Word.WdOrientation.wdOrientPortrait;//排列方式为垂直方向
49 
50 
51             //向文档中写入内容(直接粘贴)
52             worddoc.Paragraphs.Last.Range.Paste();
53 
54             //保存文档
55             path = Server.MapPath("~/UploadFile/test.doc");          //设置文件保存路劲
56             worddoc.SaveAs(ref path, ref format, ref Nothing, ref Nothing,
57                 ref Nothing, ref Nothing, ref Nothing, ref Nothing, ref Nothing,
58                 ref Nothing, ref Nothing, ref Nothing, ref Nothing);
59 
60             //关闭文档
61             worddoc.Close(ref Nothing, ref Nothing, ref Nothing);  //关闭worddoc文档对象
62             wordApp.Quit(ref Nothing, ref Nothing, ref Nothing);   //关闭wordApp组对象
63 
64         }

其中要注意的一点是,因为在webform页面调用webbrowser,需要引入以下引用

 1 using System.Windows.Forms; 

前端页面引用,需要加入AspCompat="true"

1 <%@ Page Language="C#" AutoEventWireup="true" AspCompat="true" CodeBehind="HtmlToWord.aspx.cs" Inherits="NurseManage.Export.HtmlToWord" %>

最后引用了微软的操作类库

 1 using MSWord = Microsoft.Office.Interop.Word; 

方法引用:

1      protected void Page_Load(object sender, EventArgs e)
2         {
3             HtmlToWordByUrl("http://www.cnblogs.com/Kuleft/p/5010636.html");
4 
5         }

效果图:

 

关于word内容排版的问题希望大家能不吝赐教,对于word的操作确实不太清楚。

还有一个就是不知道是不是百度首页(http://www.baidu.com)防盗爬,暂时转化不了。

转载于:https://www.cnblogs.com/Kuleft/p/5010636.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/374074.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

一不小心就掉大啦《数组使用注意》

今天程序提交答案总是不对&#xff0c;调试半天才发现本定义的是char s[4]{1,2,3,4} ; 程序运行过程中输出才发现多了一个字符 printf("%s\n"); //结果12349 思前想后觉得可能是没有字符数组结束符 (\0); 特别注意&#xff1a; 定义使用字符型数组时&#xff0c;应…

Java并发教程–阻塞队列

如第3部分所述&#xff0c;Java 1.5中引入的线程池提供了核心支持&#xff0c;该支持很快成为许多Java开发人员的最爱。 在内部&#xff0c;这些实现巧妙地利用了Java 1.5中引入的另一种并发功能-阻塞队列。 队列 首先&#xff0c;简要回顾一下什么是标准队列。 在计算机科学…

json和字符串/数组/集合的互相转换の神操作总结

一:前端字符串转JSON的4种方式 1&#xff0c;eval方式解析&#xff0c;恐怕这是最早的解析方式了。 function strToJson(str){var json eval(( str ));return json; } 2&#xff0c;new Function形式&#xff0c;比较怪异哦。 function strToJson(str){var json (new Funct…

python 修改array_python 基础_ 数组的 增删改查3

数组是运用在多个数据存在一个变量中的&#xff0c;而在调用的时候可以调用所需要的数组。创建数组a [a,b,c,d,f]   #创建一个数组a其中有5个元素分别是abcdf1.查询。所谓的查询就是显示变量a中一个或是一些元素print (a[1])  #打印出a变量中的序列1的元素&#xff0c;我们…

Android实现推送方式解决方案

Android实现推送方式解决方案 本文介绍在Android中实现推送方式的基础知识及相关解决方案。推送功能在手机开发中应用的场景是越来起来了&#xff0c;不说别的&#xff0c;就我们手机上的新闻客户端就时不j时的推送过来新的消息&#xff0c;很方便的阅读最新的新闻信息。这种推…

NYOJ 2 括号配对问题

括号配对问题 时间限制&#xff1a;3000 ms | 内存限制&#xff1a;65535 KB难度&#xff1a;3描述 现在&#xff0c;有一行括号序列&#xff0c;请你检查这行括号是否配对。 输入第一行输入一个数N&#xff08;0<N<100&#xff09;,表示有N组测试数据。后面的…

您应该对什么进行单元测试? –测试技术3

昨天我在办公室里&#xff0c;和我的一位同事谈论测试&#xff0c;他对编写单元测试有些不服气。 他使用的原因之一是有些测试似乎毫无意义&#xff0c;这使我想到了什么是单元测试&#xff0c;什么也不需要打扰。 考虑下面一个简单的不可变的Name Bean&#xff0c;其中包含一…

java基础知识系列---垃圾收集

1 为什么要使用垃圾回收机制&#xff1f; “垃圾收集”暗示程序不再需要的对象就是垃圾&#xff0c;可以被丢弃。更精确&#xff0c;更新的说法是“内存回收”。 1.1 新对象的使用 当一个对象不再被程序所引用时&#xff0c;他所使用的堆空间可以被回收&#xff0c;以便于被后续…

经济

联合国&#xff0c;美苏英法中 国家要外汇储备干什么&#xff1f; 01年加入WTO &#xff0c;美国躲开 WTO 另起炉灶 TPP 诺贝尔经济学奖得主 克鲁格蛮 触动利益比触动灵魂还困难 SDR IMF 转载于:https://www.cnblogs.com/zrui513/p/5014593.html

wxpython的sizer_wxPython BoxSizer布局

Box wx.BoxSizer(wxHORIZONTAL) Box wx.BoxSizer(wxVERTICAL)Add() 方法(从wxSizer继承)它附加到sizer的下一行/列。Box.Add(control, proportion, flag, border)proportion 参数控制的控件响应于所述容器的尺寸改变其大小。各种flag 参数的组合决定控件在sizer的外观。下面是…

NYOJ 6 喷水装置(一)

喷水装置&#xff08;一&#xff09; 时间限制&#xff1a;3000 ms | 内存限制&#xff1a;65535 KB 难度&#xff1a;3描述 现有一块草坪&#xff0c;长为20米&#xff0c;宽为2米&#xff0c;要在横中心线上放置半径为Ri的喷水装置&#xff0c;每个喷水装置的效果都会让以它为…

如何部署Zabbix服务端

部署环境 RHEL 6.7 Zabbix-server 2.2.14 安装zabbix官方源 # wget http://repo.zabbix.com/zabbix/2.2/rhel/6/x86_64/zabbix-release-2.2-1.el6.noarch.rpm # rpm -ivh zabbix-release-2.2-1.el6.noarch.rpm 安装zabbix-server # yum install zabbix zabbix-server-mysql zab…

Google App Engine上的Spring MVC和REST

前段时间&#xff0c;我写了一篇关于如何使用Spring MVC实现Restful Web API的文章 。 阅读我以前的文章以了解它。 在那篇文章中&#xff0c;开发了一个简单的Rest示例。 为了测试该应用程序&#xff0c;将文件复制到Web服务器&#xff08;例如Tomcat &#xff09;中&#xff…

SALT+HASH撒盐加密

#region 撒盐加密string salt Guid.NewGuid().ToString();byte[] passwordAndSaltBytes System.Text.Encoding.UTF8.GetBytes(model.Password salt);byte[] hashBytes new System.Security.Cryptography.SHA256Managed().ComputeHash(passwordAndSaltBytes);string hashStr…

python 子串是否在字符串中_python七种方法判断字符串是否包含子串

1. 使用 in 和 not inin 和 not in 在 Python 中是很常用的关键字&#xff0c;我们将它们归类为 成员运算符。使用这两个成员运算符&#xff0c;可以很让我们很直观清晰的判断一个对象是否在另一个对象中&#xff0c;示例如下&#xff1a;>>> "llo" in &quo…

NYOJ 8 一种排序

一种排序 时间限制&#xff1a;3000 ms | 内存限制&#xff1a;65535 KB难度&#xff1a;3描述现在有很多长方形&#xff0c;每一个长方形都有一个编号&#xff0c;这个编号可以重复&#xff1b;还知道这个长方形的宽和长&#xff0c;编号、长、宽都是整数&#xff1b;现在要…

css3中的background

对background的两种运用&#xff1a;一是background中的线性渐变&#xff0c;background: linear-gradient(to bottom,#0e7bef,#0d73da);这个是对背景颜色从上到下的一种线性渐变&#xff08;linear-gradient&#xff09;&#xff0c;两个颜色参数是从第一个颜色参数渐变到第二…

Oracle JRockit Mission Control 4.1发布

Oracle发布了以前的仅JRockit专用工具Mission Control Suite&#xff08;JRMC&#xff09;的新版本。 4.1版本是次要版本升级&#xff0c;直接遵循4.0.1&#xff08;该版本发布于2010年中期&#xff09;。 但是&#xff0c;即使版本号表明是次要的升级&#xff0c;您仍然可以在…

pe安装usb3.0驱动_电脑店U盘启动盘制作工具下载安装须知

电脑店U盘启动盘制作工具集成最全面的硬件驱动&#xff0c;精心挑选的系统维护工具&#xff0c;加上独有人性化的设计&#xff0c;具备较强的兼容性、稳定性和安全性。能够完美兼容台式机、品牌机及笔记本等新老机型&#xff0c;且安全无毒&#xff0c;电脑店一键U盘启动盘制作…

Webwork【02】前端OGNL试练

1.OGNL 出现的意义 在mvc中&#xff0c;数据是在各个层次之间进行流转是一个不争的事实。而这种流转&#xff0c;也就会面临一些困境&#xff0c;这些困境&#xff0c;是由于数据在不同世界中的表现形式不同而造成的&#xff1a; a. 数据在页面上是一个扁平的&#xff0c;不带数…