您好,欢迎访问代理记账网站
移动应用 微信公众号 联系我们

咨询热线 -

电话 15988168888

联系客服
  • 价格透明
  • 信息保密
  • 进度掌控
  • 售后无忧

python程序调优:替换pandas包的Series与DataFrame构造与计算

在实际部署的时候,使用dataframe的计算效率明显低于numpy,因此在程序中大量运行时避免使用pandas.Seriespandas.DataFrame及频繁的构造,避免、替换的方法如下:

  1. 使用numpy.ndarry替换pandas.Series,在需要使用series的地方都用ndarry数组计算

  2. 使用滑动计算时,使用numpy的如下方法替换:

    np.roll(array, 1)  # 向后搓一位(此时最后面的到最前面)
    np.roll(array, -1)  # 向前搓一位(此时第一位到最末尾,第二位到第一位)
    

    示例:计算增长率

    array = np.array([2.3, 3.2, 2.8, 3.0, 4])
    growth_rate = (array - np.roll(array, 1)) / np.roll(array, 1) * 100
    growth_rate[0] = 0
    print(growth_rate)
    
  3. 使用DataFrame的apply时,替换成for循环的ndarry计算,手动加一个多线程要远比使用pandas快

  4. 使用到DataFrame的多个维度的数据时,使用python dict替代,就是把字典key当成Dataframe的列名称,value当成列的值


分享:

低价透明

统一报价,无隐形消费

金牌服务

一对一专属顾问7*24小时金牌服务

信息保密

个人信息安全有保障

售后无忧

服务出问题客服经理全程跟进