当前位置: 首页 > news >正文

开发公司工程管理中心管理制度诊断网站seo现状的方法

开发公司工程管理中心管理制度,诊断网站seo现状的方法,石家庄建设网站公司,wordpress主题是什么对于爬虫,Java并不是最擅长的,但是也可以实现,此次主要用到的包有hutool和jsoup。 hutool是一个Java工具包,它简化了Java的各种API操作,包括文件操作、类型转换、HTTP、日期处理、JSON处理、加密解密等。它的目标是使…

对于爬虫,Java并不是最擅长的,但是也可以实现,此次主要用到的包有hutooljsoup

  • hutool是一个Java工具包,它简化了Java的各种API操作,包括文件操作、类型转换、HTTP、日期处理、JSON处理、加密解密等。它的目标是使Java的常见操作更简单,提供一个简洁易用的API,让开发者更高效地编写代码。
  • jsoup是一个用于处理HTML的Java库,它提供了非常方便的API来解析HTML文档,并进行文档操作。它可以用来提取HTML中的数据,进行HTML到XML的转换,清理不安全的HTML标签等。

代码实现

import cn.hutool.core.io.FileUtil;
import cn.hutool.http.HttpResponse;
import cn.hutool.http.HttpUtil;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;import java.io.BufferedWriter;
import java.io.FileWriter;
import java.io.IOException;/*** @author BXB*/
public class DoubanFilm250 {public static void main(String[] args) {for (int i = 0; i < 226; i += 25) {String url = String.format("https://movie.douban.com/top250?start=%d&filter=", i);String request = request(url);select(request);}}public static String request(String url) {// 发送 GET 请求HttpResponse response = HttpUtil.createGet(url).timeout(5000)  // 设置超时时间.header("User-Agent", "Mozilla/5.0")  // 设置请求头.execute();return response.body();}public static void select(String body) {Document parse = Jsoup.parse(body);Element gridView = parse.getElementsByClass("grid_view").get(0);Elements children = gridView.children();try (BufferedWriter bufferedWriter = new BufferedWriter(new FileWriter("C:/path/to/save/movieTop250.md", true));  // 修改为自己的地址) {bufferedWriter.write("| 电影名称 | 详情页地址  | 评分+金句    |\n");bufferedWriter.write("|:--------:|:--------:|:--------:|");bufferedWriter.newLine();for (Element child : children) {// 获取电影名称String movieName = child.select("div.info div.hd span.title").text();System.out.println("电影名称: " + movieName + "写入成功");bufferedWriter.write("| " + movieName + " | ");// 获取海报链接String posterUrl = child.select("div.pic img").attr("src");saveImage(posterUrl, movieName);// 获取详情页链接String movieUrl = child.select("div.info a").attr("href");bufferedWriter.write(  movieUrl + " | ");
//// 评分 金句String text = child.select("div.bd span").text();bufferedWriter.write(text + " | ");bufferedWriter.newLine();}} catch (IOException e) {throw new RuntimeException(e);}}public static void saveImage (String imageUrl, String movieName) {String savePath = "C:/path/to/save/" + movieName.split("[/]")[0] + ".jpg"; // 修改为你要保存的路径和文件名byte[] imageBytes = HttpUtil.downloadBytes(imageUrl); // 下载图片字节数组FileUtil.writeBytes(imageBytes, savePath); // 将字节数组写入到本地文件}
}
http://www.khdw.cn/news/55994.html

相关文章:

  • wordpress进入数据库广州seo做得比较好的公司
  • 买域名自己做网站百度推广如何获取精准的客户
  • 企业网站模板专业网全国最大的关键词挖掘
  • 什么网站容易做百度权重教育培训机构加盟
  • 卫计委网站建设工作扎实推进搜索引擎有哪些种类
  • 学生网站开发大赛2023广东又开始疫情了吗
  • 湖南省网站备案百度官方营销推广平台加载中
  • 视频课程网站建设软文怎么写吸引人
  • 网站备案域名还是空间百度热词搜索指数
  • WordPress+百度+主动seo81
  • 阿里云的网站接入方式全国网站排名
  • 网站三级栏目影响恶意点击竞价时用的什么软件
  • 不喜欢做政府网站运营营销策划公司的经营范围
  • 门户网站模式网络推广专员岗位职责
  • 推广网站wap端怎么做水果营销软文
  • 哈尔滨网络公司网站建设百度指数在线查询工具
  • 用6数字域名做网站的是百度电脑版官网入口
  • 现在网站建设用什么软件营销咨询公司经营范围
  • seo优化排名易下拉程序鹤壁seo
  • 怎么利用wordpress管理站点百度助手app下载
  • 如何做网站seo四川聚顺成网络科技有限公司
  • 模板网站制作时间百度seo关键词排名查询
  • 门户网站阳光警务执法办案查询头条搜索
  • h5网站设计欣赏西安网站制作推广
  • ecshop做门户网站百度可以发布广告吗
  • 潍坊网站建设案例2023年的新闻十条
  • 做公司的宣传网站需要注意什么网站申请流程
  • 做门户网站cms免费企业网站建设
  • 电商商城网站开发网站排名优化培训哪家好
  • 做外贸网站平台有哪些内容百度推广的费用