我试图从以下链接中获取以下svg:
我要刮的部分如下:
我不需要图表中的文字(只需要图表本身)。但是,我以前从来没有抓取过svg图像,我不确定这是否可能。我环顾四周,但找不到任何有用的python包来直接执行此操作。在
我知道我可以用python使用selenium截图图像,然后使用PIL裁剪它并将其保存为svg,但我想知道是否有更直接的方法从页面上获取这些图表。任何有用的包或实现都会很有帮助。谢谢您。在
编辑:得到了一些反对票,但不确定为什么我会以我的方式来实施它。。在import sys
import time
from PyQt4.QtCore import *
from PyQt4.QtGui import *
from PyQt4.QtWebKit import *
class Screenshot(QWebView):
def __init__(self):
self.app = QApplication(sys.argv)
QWebView.__init__(self)
self._loaded = False
self.loadFinished.connect(self._loadFinished)
def capture(self, url, output_file):
self.load(QUrl(url))
self.wait_load()
# set to webpage size
frame = self.page().mainFrame()
self.page().setViewportSize(frame.contentsSize())
# render image
image = QImage(self.page().viewportSize(), QImage.Format_ARGB32)
painter = QPainter(image)
frame.render(painter)
painter.end()
print 'saving', output_file
image.save(output_file)
def wait_load(self, delay=0):
# process app events until page loaded
while not self._loaded:
self.app.processEvents()
time.sleep(delay)
self._loaded = False
def _loadFinished(self, result):
self._loaded = True
s = Screenshot()
s.capture('https://finance.yahoo.com/quote/AAPL/analysts?p=AAPL', 'yhf.png')
然后我将使用PIL中的crop函数将图像从图表中取出。在