以下是一个简单的Swift爬虫程序,用于从前程无忧深圳地区招聘财务、会计的数据爬取数据:
import Foundation
import SwiftSoup// 创建一个请求对象,指定代理信息
var request = URLRequest(url: URL(string: "https://www.51job.com/zh/campus/zs.html")!)
request.httpProxyHost = "jshk.com.cn"// 创建一个请求任务对象
var task = URLSession.shared.dataTask(with: request) { data, response, error in// 检查是否有错误发生if let error = error {print("Error: \(error.localizedDescription)")return}// 检查请求是否成功guard let data = data else {print("Error: No data received")return}// 使用SwiftSoup解析HTML数据let doc = try! SwiftSoup.parse(data)// 获取招聘财务、会计的所有列表项let elements = doc.select("li[data-type='job']")// 遍历列表项,获取每个列表项的数据for element in elements {// 获取列表项的标题let title = element.select("a").text()// 获取列表项的链接let link = element.select("a").attribute("href")// 打印标题和链接print("Title: \(title)")print("Link: \(link)")}
}// 发送请求
task.resume()
注意:这个程序只是一个基本的示例,可能需要根据实际情况进行修改。例如,可能需要处理更复杂的HTML结构,或者需要从网页中提取更复杂的数据。此外,爬虫程序可能需要遵守网站的使用协议,并且应该尽量减少对网站服务器的负载。在进行爬虫操作时,应该尊重网站的版权和隐私权,不应滥用爬虫程序进行非法或不道德的操作。