最近,领导又让我发挥余热,开发些网页操作工具。其中涉及到需要下载文件,以前也研究过webbrower截获下载并接管下载,不过太麻烦了,而且我只是针对特定网页拦截下载,重新刮资料,从这里(使用没有 url 的 WebBrowser 自动下载文件)获得启发:
--------------------------------------------------------------------------------------------------------------------------
我认为你甚至应该阻止下载对话框的显示。 这可能是一种方法:
-
Javascript 代码使您的 WebBrowser 控件导航到特定的 Url(这会导致下载对话框出现)
-
为了防止 WebBrowser 控件实际导航到此 Url,请将事件处理程序附加到导航事件。
-
在您的导航事件中,您必须分析这是否是您想要停止的实际导航操作(这是下载 URL,也许检查文件扩展名,必须有可识别的格式)。 使用 WebBrowserNavigatingEventArgs.Url 来执行此操作。
-
如果这是正确的 Url,请通过设置 WebBrowserNavigatingEventArgs.Cancel 属性停止导航。
-
使用 HttpWebRequest 或 WebClient 类继续自行下载
查看此页面以获取有关该事件的更多信息:
http://msdn.microsoft.com/en -us/library/system.windows.forms.webbrowser.navigating.aspx
=========================================================================
实现了拦截下载触发并获得了下载url,通过url及Webclient就可以下载文件了,但无法通过ResponseHeaders获取下载文件名,原因是无法获取响应标头Content-Disposition,相关的原因是
------------------------------------------------------------------------------------------------------------------------------
Access-Control-Expose-Headers
响应标头 Access-Control-Expose-Headers
允许服务器指示那些响应标头可以暴露给浏览器中运行的脚本,以响应跨源请求。
默认情况下,仅暴露 CORS 安全列表的响应标头 (en-US)。如果想要让客户端可以访问到其他的标头,服务器必须将它们在 Access-Control-Expose-Headers
里面列出来。
CORS-safelisted response header
A CORS-safelisted response header is an HTTP header in a CORS response that it is considered safe to expose to client scripts. Only safelisted response headers are made available to web pages.
By default, the safelist includes the following response headers:
- Cache-Control
- Content-Language
- Content-Length
- Content-Type
- Expires
- Last-Modified
- Pragma
=========================================================================
无奈的解决办法:文件名随便定了,关键是文件后缀(也就是文件类型),这涉及到文件的打开方式,可以通过Content-Type获取文件类型,下载完成后修改文件的后缀即可。