当前位置: 首页 > news >正文

网站建设 主机选择山东网站seo推广优化价格

网站建设 主机选择,山东网站seo推广优化价格,自己制作一个简单的app,软件开发专业名词有n组标本(1, 2, 3, 4), 每组由m个( , , ...)元素( , )组成(m值不定), . 各组样本的分布 曲线如下图所示. 通过程序近似实现各曲线与oc, cd直线围成的⾯积. 思路 可以将图像分成若干个梯形,每个梯形的底边长为(Xn1 - Xn-1),面积为矩形的一半&#xff0c…

有n组标本(1, 2, 3, 4), 每组由m个( , , ...)元素( , )组成(m值不定), . 各组样本的分布 曲线如下图所示. 通过程序近似实现各曲线与oc, cd直线围成的⾯积.

在这里插入图片描述

思路

  1. 可以将图像分成若干个梯形,每个梯形的底边长为(Xn+1 - Xn-1),面积为矩形的一半,其面积 = (底边长 X 高)/2,即S = (Xn+1 - Xn-1) * (Yn+1 + Yn+2),对于整个图形,面积为所有梯形面积之和。
    [图片]
  2. 求曲线与其下方x轴的面积,本质上是一个求积分的过程。可以对所有点进行积分,可以调用np.tapz(x, y)来求

代码

"""Calculate the area between the coordinates and the X-axis
"""import typing
from pandas import read_parquetdef calc_area(file_name: str) -> typing.Any:"""⾯积计算.Args:file_name: parquet⽂件路径, eg: data.parquetReturns:计算后的结果"""res = []# Load data from .parquetinitial_data = read_parquet(file_name)# Get number of groupsgroup_numbers = initial_data["gid"].drop_duplicates().unique()# Loop through the results for each groupfor i in group_numbers:data = initial_data[initial_data["gid"] == i]data = data.reset_index(drop=True)# Extract the list of x\yx_coordinates = data["x"]y_coordinates = data["y"]# Calculate area between (x[i], y[i]) and (x[i+1], y[i+1])rect_areas = [(x_coordinates[i + 1] - x_coordinates[i])* (y_coordinates[i + 1] + y_coordinates[i])/ 2for i in range(len(x_coordinates) - 1)]# Sum the total arearesult = sum(rect_areas)res.append(result)# Also we can use np for convenience# import numpy as np# result_np = np.trapz(y_coordinates, x_coordinates)return rescalc_area("./data.parquet")

或者使用pyspark

"""Calculate the area between the coordinates and the X-axis
"""import typing
from pyspark.sql import Window
from pyspark.sql.functions import lead, lit
from pyspark.sql import SparkSessiondef calc_area(file_name: str) -> typing.Any:"""⾯积计算.Args:file_name: parquet⽂件路径, eg: data.parquetReturns:计算后的结果"""res = []# Create a session with sparkspark = SparkSession.builder.appName("Area Calculation").getOrCreate()# Load data from .parquetinitial_data = spark.read.parquet(file_name, header=True)# Get number of groupsdf_unique = initial_data.dropDuplicates(subset=["gid"]).select("gid")group_numbers = df_unique.collect()# Loop through the results for each groupfor row in group_numbers:# Select a set of datadata = initial_data.filter(initial_data["gid"] == row[0])# Adds a column of delta_x to the data frame representing difference# from the x value of an adjacent data pointwindow = Window.orderBy(data["x"])data = data.withColumn("delta_x", lead("x").over(window) - data["x"])# Calculated trapezoidal areadata = data.withColumn("trap",(data["delta_x"]* (data["y"] + lit(0.5) * (lead("y").over(window) - data["y"]))),)result = data.agg({"trap": "sum"}).collect()[0][0]res.append(result)return rescalc_area("./data.parquet")

提高计算的效率

  • 可以使用更高效的算法,如自适应辛普森方法或者其他更快的积分方法
  • 可以在数据上进行并行化处理,对pd DataFrame\spark DataFrame进行分区并使用分布式计算
  • 在使用spark的时候可以为window操作制定分区来提高性能
  • 以下为与本例无关的笼统的提高效率的方法:
  1. 并行计算:使用多核CPU或分布式计算系统,将任务分解成多个子任务并行处理。
  2. 数据压缩:压缩大数据以减少存储空间和带宽,加快读写速度。
  3. 数据分块:对大数据进行分块处理,可以减小内存需求并加快处理速度。
  4. 缓存优化:优化缓存策略,减少磁盘访问和读取,提高计算效率。
  5. 算法优化:使用高效率的算法,比如基于树的算法和矩阵算法,可以提高计算效率。
http://www.khdw.cn/news/9209.html

相关文章:

  • 建自己博客网站惠州seo关键字优化
  • 网站视频弹窗广告代码qq引流推广软件免费
  • 临淄网站建设多少钱网站关键词排名如何提升
  • asp.net做动态网站怎么做手机百度关键词优化
  • wordpress RSS怎么用株洲企业seo优化
  • 闲置电脑做网站服务器什么是seo优化?
  • 阿里云1核2g服务器能建设几个网站宁波好的seo外包公司
  • 自建网站步骤旅游最新资讯
  • 电商网站建设基础ppt域名批量查询
  • 十大房产网站排行榜竞价托管哪家公司好
  • 上海的外贸网站建设公司排名百度推广业务员电话
  • 商标号在线查询北京网站优化效果
  • 中国建设工程造价管理协会登录网站网页制作成品
  • 深圳罗湖网站制作手机免费发布信息平台
  • 网站空间不支持phpip域名查询地址
  • 高端网站建设哪家更专业设计模板网站
  • 石家庄网站制作机构广东疫情中高风险地区最新名单
  • 大型多媒体网站建设工具软文写作实训总结
  • 截获网站流量怎么做seo网站推广软件排名
  • 做新闻网站用什么程序seo图片优化
  • 动态网站开发技术 百度百科网站搜索引擎
  • 公司网页下载西安seo优化公司
  • 自己的网站如何让百度收录网络营销广告名词解释
  • 自己做采集电影网站超级外链
  • 医生做学分在哪个网站网络推广怎么学
  • 自己做的网站本地调试今天百度数据
  • 2017免费网站空间网络营销方法有哪些举例
  • 监控网站建设需要多少钱短视频培训学校
  • 网站不会更新文章seo网站关键词优化报价
  • 建设银行网站点不进去怎么做网站赚钱