当前位置: 首页 > news >正文

网站服务空间网站开发合同

网站服务空间,网站开发合同,哪些网站首页做的好,权威的手机网站建设最近我在捣鼓一个PDF文件,想把它里面的文字和文字颜色给提取出来。后来发现有个叫pymupdf的库能搞定这事儿。操作起来挺简单的,pymupdf的示例文档里就有现成的代码可以参考。 how-to-extract-text-with-color 我本地的测试代码如下: impor…

最近我在捣鼓一个PDF文件,想把它里面的文字和文字颜色给提取出来。后来发现有个叫pymupdf的库能搞定这事儿。操作起来挺简单的,pymupdf的示例文档里就有现成的代码可以参考。
how-to-extract-text-with-color
在这里插入图片描述

我本地的测试代码如下:

import pymupdf
import sys# sys.argv[1] 为文件名!
doc = pymupdf.open(sys.argv[1])
page = doc[0]for page in doc:text_blocks = page.get_text("dict", flags=pymupdf.TEXTFLAGS_TEXT)["blocks"]for block in text_blocks:for line in block["lines"]:for span in line["spans"]:text = span["text"]color = pymupdf.sRGB_to_rgb(span["color"])print(f"Text: {text}, Color: {color}")

运行效果如下:
在这里插入图片描述
我弄的那个文档里,有一块内容是这样的,项目里的文字被标成橙色,就是那种选中后的样子,所以我特别留意了它的颜色提取。
在这里插入图片描述
所以我需要抽取出文字的同时,还需要文字的颜色
在这里插入图片描述
在这里插入图片描述

推荐相关的文章 PymuPDF4llm:PDF 提取的革命

http://www.khdw.cn/news/54009.html

相关文章:

  • 如何开展网站建设windows7优化大师下载
  • 怎么自己做时时彩网站电商网站建设报价
  • wordpress链接调用北京seo诊断
  • 微信公众号模板哪里找seo搜索引擎优化总结报告
  • 免费网站模板mbxzb搜狗推广登录平台官网
  • 建俄语网站seo免费优化
  • 哪里有免费网站可以看上海哪家seo好
  • wordpress主机在哪里看seo技术助理
  • 河北省住房建设厅网站今日热点新闻事件摘抄50字
  • 一般网站空间多大搜狗链接提交入口
  • 课程设计代做网站在线培训网站
  • 怎么设置网站标题线上运营推广
  • 泊头做网站找哪家好百度发广告需要多少钱
  • 网站模板有后台seo资讯
  • 影院网站如何做seo服务是什么意思
  • 时尚flash网站网站seo优化方案策划书
  • 免费网站站长推广优化系统
  • 如何建设简易网站大数据是干什么的
  • 南京网站网站建设学校微博推广平台
  • 东营外贸型网站设计站长工具在线免费
  • 安宁市建设厅网站海外广告联盟平台推广
  • 黑河做网站的百度开户推广
  • 做类似58同城的网站服装市场调研报告
  • 株洲网站建设技术托管淄博seo网站推广
  • css网站建设模板站长之家收录查询
  • 国外网站的建设百度联盟推广
  • 佛山市建设企业网站服务机构实体店怎么推广引流
  • 连云港网站开发网络媒体发稿平台
  • 做网站的公司需要哪些资质搜索引擎广告优化
  • 做网站属于技术开发吗深圳互联网公司50强